duterscmy / ccks2019-ckbqa-4th-codes

中文知识库问答代码,CCKS2019 CKBQA评测第四名解决方案
476 stars 91 forks source link

SogouLabDic.dic #23

Open zhengxiaoxuer opened 4 years ago

zhengxiaoxuer commented 4 years ago

请问有没有SogouLabDic.dic的下载地址?在entity_extractor.py中用到了SogouLabDic.dic

Rilzob commented 4 years ago

csdn可以下载

1234560o commented 4 years ago

我是在这下面免费下载的http://www.sogou.com/labs/resource/w.php

hahlw commented 4 years ago

我是在这下面免费下载的http://www.sogou.com/labs/resource/w.php

请问你在读取这个文件的时候有没有遇到bug-->:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb8 in position 2: invalid start byte

duterscmy commented 4 years ago

没有遇到过诶,或者可以试试先手动把文件转换成utf8编码?

yuanhuachao commented 4 years ago

我是在这下面免费下载的http://www.sogou.com/labs/resource/w.php

请问你在读取这个文件的时候有没有遇到bug-->:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb8 in position 2: invalid start byte

我也遇到这个问题了,请问解决了吗?如解决了,请问是怎么解决的,感谢。

hahlw commented 4 years ago

遇到了,转一下编码就可以了~尝试专成GBK UTF

------------------ Original ------------------ From: yuanhuachao <notifications@github.com> Date: Mon,Aug 10,2020 0:14 PM To: duterscmy/ccks2019-ckbqa-4th-codes <ccks2019-ckbqa-4th-codes@noreply.github.com> Cc: 李威 <1031087290@qq.com>, Comment <comment@noreply.github.com> Subject: Re: [duterscmy/ccks2019-ckbqa-4th-codes] SogouLabDic.dic (#23)

kkk39 commented 1 year ago

现在在这个地址找不到了,有没有别的地方有啊