GaoQ1 / rasa_chatbot_cn

building a chinese dialogue system based on the newest version of rasa(基于最新版本rasa搭建的对话系统)
965 stars 288 forks source link

关于nlu.json数据格式的两点问题。 #84

Open YYGe01 opened 4 years ago

YYGe01 commented 4 years ago

作者您好,关于数据格式有几个疑问,希望能帮忙看下,谢谢! 1、data/nlu/nlu.json 数据中有很大一部分样本存在空格现象,不知道会不会对训练有影响。 如 "喂 请 看下 四月 流量 多少流量"。 chatito_gen_nlu_data代码仓库增强数据集的方式里发现可以取消空格。 如:~[greet] ~[greet?]可以改成~[greet]~[greet?],生成的样本不会有空格。

2、data/nlu/nlu.json 数据中我看定义了很多的From intent。 intent:inform_item intent:inform_current_phone intent:inform_other_phone intent:inform_package intent:inform_time 我想问的是,这是5个intent,还是只有1个intent呢。 我认为如果这样定义名字训练的时候当作5个不同的intent单独训练了。 另外,我看rasa官方文档里的案例,是把一个intent里所有的样本都放在一起了。examples/formbot

非常感谢作者提供的项目,谢谢!