crownpku / Rasa_NLU_Chi

Turn Chinese natural language into structured data 中文自然语言理解
Apache License 2.0
1.51k stars 423 forks source link

有关spaCy + sklearn与mitie+sklearn的问题 #36

Open nacyzhaomin opened 6 years ago

nacyzhaomin commented 6 years ago

您好~ 最近看rasa_nlu官方文档,上面写pipline有多种选择方式,除了作者您描述的两种以外,有一种推荐是: Best for most: spaCy + sklearn 问题是:这个组合+jieba能用来处理中文吗?不了解spaCy,所以想问问作者,当初为什么选择jieba+mitie+sklearn。而不是上面这种组合呢?谢谢

crownpku commented 6 years ago

这个项目做的时候,spacy是不支持中文的。spacy 2.0加入了对word embedding和深度学习模型的支持,但应该也仍然不支持中文。使用MITIE的原因是可以比较方便自己生成支持中文的embedding.

luolitao commented 6 years ago

rasa_nlu在12.0开始取消MITIE了,本项目下一步计划怎么办?

HCIS2020 commented 6 years ago

https://github.com/howl-anderson/Chinese_models_for_SpaCy

有位兄弟在搞SpaCy的中文模型,目前使用的是维基中文语料,不过目前还不支持NER, 但是RASA_NLU的pipline: spaCy + sklearn,测试中文是可以的。

zymprogramer commented 6 years ago

@HCIS2020 你是说用这个spaCy的中文模型可以运行rasa_nlu吗?

howl-anderson commented 6 years ago

https://github.com/howl-anderson/Chinese_models_for_SpaCy 已经支持 NER, 同时也支持在 Rasa NLU 中使用。 @HCIS2020 @zymprogramer

howl-anderson commented 4 years ago

@jingj5 SpaCy 官方已经支持了中文模型,直接使用官方的就好了