Describe the current behavior
对‘血洗天安门广场’进行分词,得到结果是[血洗/v, 天安门广场/nz],经debug发现是自定义词典中存在‘天安门广场 nz 36’,这里为啥jar包中的CustomDictionary.txt和data-for-1.7.5.zip中的CustomDictionary.txt不一致?
Expected behavior
预期分词结果:[血洗/v, 天安门/ns, 广场/n]
同时我对比了演示地址的分词结果:
System information
window11
HanLP version:portable-1.8.4
Other info / logs
粗分词网:
0:[ ]
1:[血, 血洗]
2:[洗]
3:[天, 天安, 天安门]
4:[安]
5:[门]
6:[广, 广场]
7:[场]
8:[ ]
粗分结果[血洗/v, 天安门广场/nz]
人名角色观察:[ K 1 A 1 ][血洗 A 20833310 ][天安门广场 A 20833310 ][ K 1 A 1 ]
人名角色标注:[ /K ,血洗/A ,天安门广场/A , /A]
[血洗/v, 天安门广场/nz]
[x] I've completed this form and searched the web for solutions.
Describe the bug jar包中的CustomDictionary.txt和data-for-1.7.5.zip中的CustomDictionary.txt不一致
Code to reproduce the issue
Describe the current behavior 对‘血洗天安门广场’进行分词,得到结果是[血洗/v, 天安门广场/nz],经debug发现是自定义词典中存在‘天安门广场 nz 36’,这里为啥jar包中的CustomDictionary.txt和data-for-1.7.5.zip中的CustomDictionary.txt不一致?
Expected behavior 预期分词结果:[血洗/v, 天安门/ns, 广场/n]
同时我对比了演示地址的分词结果:
System information
Other info / logs 粗分词网: 0:[ ] 1:[血, 血洗] 2:[洗] 3:[天, 天安, 天安门] 4:[安] 5:[门] 6:[广, 广场] 7:[场] 8:[ ]
粗分结果[血洗/v, 天安门广场/nz]
人名角色观察:[ K 1 A 1 ][血洗 A 20833310 ][天安门广场 A 20833310 ][ K 1 A 1 ] 人名角色标注:[ /K ,血洗/A ,天安门广场/A , /A] [血洗/v, 天安门广场/nz]