Cyberbolt / Cemotion

A Chinese NLP library based on BERT for sentiment analysis and general-purpose Chinese word segmentation. | 基于 BERT 的中文 NLP 库,用于中文情感倾向分析、通用领域中文分词。
MIT License
187 stars 22 forks source link

数据集和训练策略 #12

Open Lwzzzzzz opened 8 months ago

Lwzzzzzz commented 8 months ago

感谢您的工作,方便的话能说明一下使用的数据集吗?都包含哪方面的文本

另外是在bert基础上finetune的还是一起训的啊?

Baileyswu commented 7 months ago

应该是基于bert训练的模型。但是使用下来有一个问题,比较中性的句子也被打标为消极,可能是数据集的问题?希望作者可以提供下数据集和训练方式哈,感谢~