CSDN,52账号:灵海之森
微信公众号:西书北影。欢迎关注
目前在做大模型,开源仓库见:https://github.com/stay-leave/enhance_llm
震惊,有人请我付费指导结果不给钱!!!最后一句话是我接个电话。现在联系不上你,只能是希望你能看到,让你知道我在电脑前等待了你半个小时。以前从来没有收定金的习惯,感谢你让我知道了大学生的险恶。都是男生,有啥直接说呗,搞这一套。
包含微博爬虫、LDA主题分析、情感分析、时空协同分析四个部分。
流程图
1.微博爬虫
实现微博评论爬取和微博用户信息爬取,一天大概十万条。
2.LDA主题分析
实现文档主题抽取,包括数据清洗及分词、主题数的确定(主题一致性和困惑度)和最优主题模型的选择(暴力搜索)。
3.情感分析
实现评论文本的情感值计算,准确率超过97%,处于0到1之间。
4.话题热度计算
实现话题的热度的计算,同一时间内总和为1.
5.主题相似度计算
实现两个相邻时间片的话题的演化探测,以判断主题演化情况。
6.地图绘制
实现分省市情感均值、评论总数、新增确诊人数的地图可视化。