GaoQ1 / rasa_chatbot_cn

building a chinese dialogue system based on the newest version of rasa(基于最新版本rasa搭建的对话系统)
964 stars 288 forks source link

rasa.nlu.extractors.crf_entity_extractor WARNING #49

Closed nghuyong closed 5 years ago

nghuyong commented 5 years ago

非常感谢您的贡献! 我尝试将您的系统迁移到我自己的项目中,具体步骤如下: 在nlu.md中添加了训练数据,其中有一条如下: - 麻烦帮我发布条[通告](chat)说[国庆节](date)[下午2点](time)[张三的家长](name)来学校[教室](address)参加[毕业典礼](acticities) 但是当我执行 rasa train nlu -u data/nlu -c config.yml --out models/nlu 出现了下面的警告信息: image

我的配置文件如下:

language: "zh"

pipeline:
- name: "JiebaTokenizer"
- name: "CRFEntityExtractor"

- name: "rasa_nlu_gao.extractors.jieba_pseg_extractor.JiebaPsegExtractor"
  part_of_speech: ["nr"]

- name: "rasa_nlu_gao.featurizers.bert_vectors_featurizer.BertVectorsFeaturizer"
  ip: '127.0.0.1'
  port: 8001
  port_out: 8002
  show_server_config: True
  timeout: 10000
  check_version: False
- name: "rasa_nlu_gao.classifiers.embedding_bert_intent_classifier.EmbeddingBertIntentClassifier"

看到您主页上写到 find-a-part-time job,欢迎联系我👏,可远程,待遇丰厚! 我的邮箱是 nghuyong@163.com 期待您的解答与合作!!

GaoQ1 commented 5 years ago

这里官网的CRFEntityExtractor对中文的支持不行,如果想用的话需要自己做一些修改。可以试试我的bilstm+crf,如果你训练数据多的话。