brightmart / nlp_chinese_corpus

大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP
MIT License
9.41k stars 1.54k forks source link

社区问答数据,答案被截断 #28

Open Dongfeng-He opened 5 years ago

Dongfeng-He commented 5 years ago

短答案没什么问题,长答案几乎全部在200字左右被截断。我随机看了几十个例子,并且在网上对照了一下,基本上没有完整的长答案。

brightmart commented 5 years ago

是的,确实如此。对后续应用有什么影响呢?