-
您好,请问pretrained的词表(https://cloud.tsinghua.edu.cn/d/76ab4a71efa541bd8eb3/)有475500个中文单词,而HowNet里貌似只有210000左右。请问不在HowNet里的中文单词是如何处理的?另外,请问有预训练的英文词表吗?期待你的回复,非常谢谢。
-
你好,我注意到Word_Sense_Sememe_File.txt文件里的词都是多义词,每个都有多组义元。请问hownet中单义词的义元标注信息是没有用到吗?如果把这个也用上去,模型的性能会有所提高吗? 毕竟,hownet中大部分的词都是单义词。
-
Hi, I am pretty interested in looking into the synonym extractions based on the sememe tree similarity using HowNet. I am wondering whether you or the original authors of the HowNet have benchmarked t…
-
您好!请问苹果、戴尔、ipad,这些现在HowNet中存在的词,是不是通过这种义原预测的方式加入的?
-
請問有已經訓練好的lcqmc with HowNet 模型可以公開嗎?
因為我嘗試利用KG HowNet 做在lcqmc 資料集上都無法訓練得跟論文中的數據一樣好
謝謝
-
Word_Sense_Sememe_File里面只有一个sense的词没有标注对应的sememe,请问可以得到吗?
-
各位老师好!
我的研究课题是汉语及中介语里介词“对”和“向”及其搭配的动词的使用情况。目前,我已经将动词从语料库中提取出来了,每个语料库提取出有效动词的数量大概有在3、4千左右。接下来,我希望可以做到的是把动词按照语义和功能分类。
虽然这些动词的数量并不多,我本可以人工进行分类,可是我想让自己的研究少一些人为的主观干涉,并建立在更科学的研究方法上。因此,我想使用OpenH…
-
您好!
我在follow您的工作的过程中遇到了一些问题。
在复现了您的所有工作以后,我考虑使用其他的语料进行词向量的训练。在处理好语料集和vocab文件之后,接着生成自己的Word_Sense_Sememe_File时遇到了困难。
1.首先我在您的提供的代码中找到了data process的代码,在运行后得到的是空文件,自己仔细研读之后发现代码可能是不完整的,我猜想是缺少了sense级的处理…
-
UnicodeDecodeError Traceback (most recent call last)
in ()
----> 1 hownet_dict.get_all_sememes()
~\Anaconda3\envs\tensorflow\lib\site-packages\OpenHowNet\Standards.py in g…
-
Hi, I have carefully read your implementation of "gen_candidates.py". I have one question: the basic approach to get synonym candidates based on Hownet is that two words having the same POS and the sa…