hankcs / hanlp-lucene-plugin

HanLP中文分词Lucene插件,支持包括Solr在内的基于Lucene的系统
http://www.hankcs.com/nlp/segment/full-text-retrieval-solr-integrated-hanlp-chinese-word-segmentation.html
Apache License 2.0
296 stars 99 forks source link

hanlp里面有关于tf-idf的内容吗?我想判断下文章相似性。 #11

Open drmam opened 8 years ago

drmam commented 8 years ago

或者跟我说下你统计词语频率的类是那个

hankcs commented 8 years ago

统计词频 com.hankcs.demo.DemoOccurrence 老实说tf-idf太低级了,没有做。