Gxy-2001 / DataScienceAssignment

数据科学基础大作业:实现的技术包括利用python爬虫,爬取关键词搜索的微博正文,特定微博下的评论;预处理微博文本;手写textRank;聚类,kmeans,DBSCAN,层次聚类;情感词典情感分析;pyecharts可视化绘图
65 stars 14 forks source link

数据科学大作业

具体内容见pdf

这个是我在20年下学期的作业,有人提issue说运行不了,结果是

不仅fake useragent挂了,连weibo.cn的关键词搜索接口都失效了(2021.6.6)

只要把爬虫文件里的cookie换成你的应该就跑的起来

当然还要改日期和关键词