Open chen3feng opened 2 years ago
把单词的各种时态人称单复数的变形转为原形,比如:
calls
called
calling
call
cats
hardest
hard
pyhton:
Javascript:
提高生词发现的准确度,比如在单词发现者中,生词识别和基于白名单的去除不太准确,如果支持 Lemmatization,就会好很多。
谢谢, helpful!
英语单词的词形还原(Lemmatization)
定义
把单词的各种时态人称单复数的变形转为原形,比如:
calls
,called
,calling
->call
cats
-> cathardest
->hard
可用的库:
pyhton:
Javascript:
用途
提高生词发现的准确度,比如在单词发现者中,生词识别和基于白名单的去除不太准确,如果支持 Lemmatization,就会好很多。
参考资料