sgccnlp / ecws

电力领域中文分词模型 R3.0
http://sgccnlp.com
MIT License
24 stars 9 forks source link

Documentation Status CODE SIZE Build status PyPI Downloads

电力领域中文分词模型

ecws 是面向电力领域的基础中文分词模型组件,目标是打造电力领域的自然语言处理基础能力

安装指南

ecws 依赖以下包:

版本号

R3.0.5

模型命名

NLP-ECWS-R3.0.5

安装

使用 pip 安装

pip install ecws

或从源代码安装

git clone https://github.com/sgccnlp/ecws.git
cd NLP-ECWS
pip install -e .
Model Name Download Link
ecws.v3.model BaiduPan 提取码:ecws
vocab -

from ecws.segment import Segmenter

model_path = 'ecws.model'
vocab_path = 'vocab_dir'  # 指向下载的vocab文件夹

predict = Segmenter(model_path, vocab_path)

d = predict.seg(sent)
def webservice_ecws(sentence):
  data = {'sent': sentence}
  url = 'http://120.27.25.150:8082/predict'
  r = requests.post(url, json=data)
  data = json.loads(r.text)
  seg = data['spans']
  return seg

其中返回的结果是一个字典,字段'sent'中包含分词结果。

http://sgccnlp.com

开发者

@ 张强<[alxor@live.cn](alxor@live.cn)> @ 宋博川<[abc_hhhh@163.com](abc_hhhh@163.com)>