chinese_sentiment
用Tensorflow进行中文自然语言处理分类实践
- 词向量下载地址:
链接: https://pan.baidu.com/s/1GerioMpwj1zmju9NkkrsFg
提取码: x6v3
请下载之后在项目根目录建立"embeddings"文件夹, 将下载的文件放入(不用解压), 即可运行代码.
- 很多同学遇到乱码等bug, 很抱歉没能及时回复, 现已重新处理了语料和代码, 已经没有了乱码的问题.
- 修改了bug后, 可能是数据的顺序变了, 结果模型训练的效果相比去年差了一些, 有兴趣的同学可以调整一下模型参数, 看看会不会有更好的结果.
- 代码写的比较早, 有些地方可能有坑, 现在先不重写了, 因为LSTM实在是属于比较老的模型, 近期会发布transformer语言模型的教程, 请大家关注.
- 注意, debug之后的代码在"2019新版debug之后--中文自然语言处理--情感分析.ipynb"里, 对应的语料文件是"negative_samples.txt", "positive_samples.txt"这两个.
- 如果有问题请在视频评论区留言, 这样各位学习的同学可以互相帮助解决问题, 或者在项目里提issue, 尽量不要给我写邮件, 因为可能回复不及时.
教学视频地址:
youtube:
https://www.youtube.com/watch?v=-mcrmLmNOXA&t=991s
bilibili:
https://www.bilibili.com/video/av30543613?from=search&seid=74343163897647645
老版本中pos和neg中的语料不全,请解压“语料.zip”覆盖