stay-leave / weibo-public-opinion-analysis

基于微博数据的舆情分析项目,包括微博爬虫、LDA主题分析和情感分析。
649 stars 101 forks source link

微博文件的爬取后的分布 #20

Open Kedreamix opened 1 year ago

Kedreamix commented 1 year ago

你好,我想咨询一下,就是在爬取了所有的评论的文件以后,后续又对其进行了操作么,我看到了一个excel分月和正文分月类似的操作,想问一下这些文件夹的构造大概是如何的,能够大概讲一讲做了什么样的操作吗,我好像在爬取部分没有看到

Kedreamix commented 1 year ago

顺便再问一个问题,在爬取的代码里面,为什么一开始就有正文的xlsx文件,这个是怎么来的呀

stay-leave commented 1 year ago

正文的爬虫是用的别的,有链接。分月只是将其按照时间弄个切片,先用Excel操作,然后将其转为TXT即可