blmoistawinde / HarvestText

文本挖掘和预处理工具(文本清洗、新词发现、情感分析、实体识别链接、关键词抽取、知识抽取、句法分析等),无监督或弱监督方法
MIT License
2.43k stars 330 forks source link

请问新词发现不支持文件,只能是字符串么,支持字符串 list 么? #13

Closed shenxuhui closed 4 years ago

shenxuhui commented 4 years ago

如题。

blmoistawinde commented 4 years ago

目前不支持字符串list,但是把字符串list转化为单独字符串是很容易的。一般如果你的列表每个元素是一句句子或者段落,你就可以用"\n".join(str_list)把列表拼接成单个字符串,然后再用新词发现