brightmart / nlp_chinese_corpus

大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP
MIT License
9.41k stars 1.54k forks source link

wiki数据,括号中的内容丢失 #14

Open ss433s opened 5 years ago

ss433s commented 5 years ago

也不是都丢失了,好像括号中包含了英文的话,就会丢失,能否修复下这个问题呢?

shanghai-Jerry commented 5 years ago

也不是都丢失了,好像括号中包含了英文的话,就会丢失,能否修复下这个问题呢?

为何不自己使用的时候处理一下,找到问题然后提pr