baidu / lac

百度NLP:分词,词性标注,命名实体识别,词重要性
Apache License 2.0
3.86k stars 597 forks source link

扩展标签体系 #87

Open zhouzusheng opened 4 years ago

zhouzusheng commented 4 years ago

我要训练我的领域数据, 请问如何扩展标签体系 我直接在tag.dic 中添加新的 tag 是不行的

Bond-H commented 4 years ago

目前该库下的训练接口只提供增量训练的模式,因模型参数的原因,目前还不能扩展标签数量,只能替换原有的一些标签,可在release下载模型后,修改lac_model/conf/q2b.dic,将其中部分标签替换为自己领域数据的标签,即可使用该模型训练。若是无需增量训练的模式,可参考https://github.com/PaddlePaddle/models/tree/release/1.8/PaddleNLP/lexical_analysis 进行模型训练,训练结束后替换相应的文件即可