hiDaDeng / cntext

文本分析包,支持字数统计、可读性、文档相似度、情感分析在内的多种文本分析方法。chinese text sentiment analysis
MIT License
271 stars 28 forks source link

效价函数测试中concreteness.pkl文件不存在,核实下载1.7.6版本对应的文件夹无此文件 #6

Open Muzi828 opened 2 years ago

Muzi828 commented 2 years ago

如题

Muzi828 commented 2 years ago

在进行简介时提到的sentiws.pkl和ANEW.pkl都有效价信息,但是测试输出的结果中并没有valence字段,此外想了解一下对于中文cntext中有进行效价分析的词典吗?给出的列表中都是英文的词典,但是目前英文词典暂无法跑通代码

hiDaDeng commented 2 years ago

sentiws和ANEW是我整理自R的quanteda包资源,quanteda中也没有这两个字典的出处,所以暂时也没找到字典的valence信息。中文暂时我还没找到,如果各位有谁发现,欢迎issue里留言留下资源链接,我有时间就会更新cntext库。

你提的这个issue,让我发现concreteness.pkl没有在cntext里,这个包有concreteness具体性的valence。介绍及用法参考

https://hidadeng.github.io/blog/jcr_concreteness_computation/

更新至1.7.7

pip3 install cntext==1.7.7

如果没有pkl文件,可以整理成类似于dataframe样式数据。

用法如下

import cntext as ct

# load the concreteness.pkl dictionary file
concreteness_df = ct.load_pkl_dict('Concreteness.pkl')['Concreteness']
concreteness_df.head()
Muzi828 commented 2 years ago

好的,多谢,对于词典表中的介绍可以更新一下,测试结果已经出来了,后续持续关注。

hiDaDeng commented 2 years ago

好的,谢谢提醒,已更新词表介绍