Closed heyoma closed 2 years ago
文档示例是早期版本的分析结果,在支持了更多语种之后,一些小语种的某些任务可能的确性能有所下降。建议使用单语种模型,比多语种模型效果好很多:https://colab.research.google.com/drive/1KPX6t1y36TOzRIeB4Kt3uJ1twuj6WuFv#scrollTo=zp9MLAErwx2-
Token PoS 3 4 5 6 7 8
───────── ────────────────────────────────────────────────────
2021 NUM──┐
年 CL ──┴►NUMCLP────────────────────────────►NP ───┐
、 PU ─────────────────────────────────────────────┤
HanLPv2.1 NPR───►NP ─────┐ │
は P ─────────────┴─────────────────────────►PP────┤
次 N ───┐ │
世代 N ───┴►NP ─────┐ │
の P ─────────────┴►PP ────┐ │
最 N ──────────────────────┤ │
先端 N ────►NP ──────►CONJP──┤ │
多 NUM─────────────────────┼►NML ──┐ │
言語 N ──────────────────────┤ │ ├►IP
NLP N ──────────────────────┘ ├►NP ───┐ │
技術 N ──────────────────────────────┘ ├►PP────┤
を P ──────────────────────────────────────┘ │
本番 N ───┐ │
環境 N ───┴►NP ─────┐ │
に P ─────────────┴─────────────────────────►PP────┤
導入 VB ─────────────────────────────────────────────┤
し VB0─────────────────────────────────────────────┤
ます AX ─────────────────────────────────────────────┤
。 PU ─────────────────────────────────────────────┘
Toke PoS 3 4 5 6 7 8 9 10 11
──── ───────────────────────────────────────────────────────────────────────────
奈須 NPR──┐
きのこ NPR──┴►NP ─────┐
は P ─────────────┴────────────────────────────────────────────────►PP ───┐
1973 NUM──┐ │
年 CL ──┴►NUMCLP──┐ │
11 NUM──┐ │ │
月 CL ──┴►NUMCLP──┼►NP ───┐ │
28 NUM──┐ │ │ │
日 CL ──┴►NUMCLP──┘ ├►PP ───┐ │
に P ─────────────────────┘ │ │
千葉 NPR──┐ │ │
県 NPR──┴►PP ─────┐ │ │
円空 NPR────────────┼►NP ───┐ ├────────────────────────────────►IP────┤
山 NPR────────────┘ ├►PP────┤ │
で P ─────────────────────┘ │ │
生まれ VB ────────────────────────────┘ ├►IP
、 PU ────────────────────────────────────────────────────────────────────┤
ゲーム N ───┐ │
制作 N ───┴►NP ──────►PRN ──┐ │
会社 N ─────────────────────┴►NP ────►PRN ──┐ │
「 PUL────────────────────────────────────┤ │
ノーツ NPR────────────────────────────────────┼►NP ───┐ │
」 PUR────────────────────────────────────┘ ├►PP ───┐ │
の P ─────────────────────────────────────────────┘ ├►IP ───┐ │
設立 N ─────────────────────────────────────────────────────┘ ├►NP────┤
者 N ─────────────────────────────────────────────────────────────┘ │
だ AX ────────────────────────────────────────────────────────────────────┤
。 PU ────────────────────────────────────────────────────────────────────┘
感谢!
Describe the bug A clear and concise description of what the bug is. 在使用hanlp_restful或hanlp时,使用示例代码无法复刻doc中日语文本的成分句法分析结果,且结果大部分都是错的,英文中文正常。 麻烦开发者大大看一下,谢谢!
Code to reproduce the issue Provide a reproducible test case that is the bare minimum necessary to generate the problem. 代码
目标日语文本
Describe the current behavior A clear and concise description of what happened. 文档中描述的该示例中日语文本的成分句法分析结果应为:
实际运行结果为:
Expected behavior A clear and concise description of what you expected to happen.
System information
Other info / logs Include any logs or source code that would be helpful to diagnose the problem. If including tracebacks, please include the full traceback. Large logs and files should be attached. 本人主要用于分析日语中的名词短语(NP)。 上面描述的示例日语文本分析出的结果为:
只有两条正确。是不是模型版本迭代时,日语句法成分分析任务漏掉了?麻烦开发者大大看一下,谢谢!