yzhangcs / parser

:rocket: State-of-the-art parsers for natural language.
https://parser.yzhang.site/
MIT License
832 stars 141 forks source link

需要您的帮助 #126

Closed Lj4040 closed 1 year ago

Lj4040 commented 1 year ago

您好,我在其他论文中看到了您的工作,觉得您的工作非常棒!对此非常感兴趣,我想问您几个问题,如果我想用您的解析器parser = Parser.load('dep-biaffine-en')这样的,解析我自己的数据,我是否需要重新在我的数据上进行解析,我简单举了几个例子,我发现有的句子解析的也还行,有的解析的有偏差。还有我看您给的例子当中,可以选择分词,也可以选择不分词进行解析,是否分词解析的结果是更好?

yzhangcs commented 1 year ago

@Lj4040 感谢青睐

我是否需要重新在我的数据上进行解析,我简单举了几个例子,我发现有的句子解析的也还行,有的解析的有偏差

需要parse一下,保证效果可以使用roberta模型

可以选择分词,也可以选择不分词进行解析,是否分词解析的结果是更好

不tokenize输入的话会采用stanza进行内部tokenize,如果自己有gold分词结果当然是gold的效果更好

Lj4040 commented 1 year ago

非常感谢你的回复!您说的parser就是指的parser.predict(句子)把?,使用的是中文,我看见中文好像没有roberta,最好的好像就是这个dep-biaffine-electra-zh。

yzhangcs commented 1 year ago

是的,electra是目前已有最佳的

Lj4040 commented 1 year ago

非常感谢您的回答