shibing624 / similarities

Similarities: a toolkit for similarity calculation and semantic search. 相似度计算、匹配搜索工具包,支持亿级数据文搜文、文搜图、图搜图,python3开发,开箱即用。
https://pypi.org/project/similarities/
Apache License 2.0
687 stars 68 forks source link

literal_text_semantic_search_demo.py知网HownetSimilarity字面匹配搜索找不到hownet.txt #35

Open NLear opened 1 month ago

NLear commented 1 month ago

Question

您好,我在使用HownetSimilarity中遇到了问题,请求帮助,十分感谢。

文件examples/literal_text_semantic_search_demo.py https://github.com/shibing624/similarities/blob/1fa48d30a1a20939f857bae99186e3cf2183f8ab/examples/literal_text_semantic_search_demo.py#L76 运行报错, https://github.com/shibing624/similarities/blob/1fa48d30a1a20939f857bae99186e3cf2183f8ab/similarities/literal_similarity.py#L729 找不到data/hownet.txt文件,可否增加文件或提供下载链接。

HowNet.txt核心数据文件(HowNet.txt)格式不正确,无法使用


W_C=贷 #中文词
G_C=verb [9MustObj] [dai4] #中文词词性
S_C=PlusFeeling|正面情感 #情感倾向
E_C=定斩不~,严惩不~  #中文词例句
W_E=forgive #英文词 
G_E=verb [7 forgiveverb-0vt,sobj,ofnpa22    ]  #英文词词性
S_E=PlusFeeling|正面情感 #情感倾向
E_E=    #英文词例句
DEF={forgive|原谅} # 基于义原的定义
RMK=```
shibing624 commented 1 month ago

pip install similarities