lc222 / seq2seq_chatbot_new

基于seq2seq模型的简单对话系统的tf实现,具有embedding、attention、beam_search等功能,数据集是Cornell Movie Dialogs
143 stars 64 forks source link

结果全是一模一样的重复字段 #15

Open thormacy opened 6 years ago

thormacy commented 6 years ago

用了自己的单轮QA训练数据,大概10W条,跑了一天只跑2个ep,对不同问题的回答是一模一样的,不知道是为什么

arcral commented 6 years ago

解决了吗?我也是这样,结尾的几个字全是一样的

thormacy commented 6 years ago

你是说前面都一样还是只是末尾几个字符一样?

lc222 commented 6 years ago

是所有query回复都一样嘛??还是说有的query回复的是一堆没有意义的话。如果是后者我也是这样,只有部分query恢复效果较好。另外像你们这种情况应该是没有训练吧,我之前也是,好像并没有进入训练阶段,有点记不清了。。

thormacy commented 6 years ago

回复一样一开始是因为学习率太大了,batch size又小,但后来还是有很多问题学习不到,可能还是数据或者batch size的问题

zwt0204 commented 5 years ago

请问这个问题解决了吗,还有预测的时候beam_size=5吗