stay-leave / weibo-public-opinion-analysis

基于微博数据的舆情分析项目,包括微博爬虫、LDA主题分析和情感分析。
658 stars 101 forks source link

主题重要性区分 #17

Closed 2871858184 closed 1 year ago

2871858184 commented 1 year ago

请问楼主为什么可视化之后左边的圆圈会一样大呢?即每个主题都一样重要。

2871858184 commented 1 year ago

我在计算过程中发现有些主题的文本数量存在差异,可是并没有在可视化中体现出来。

stay-leave commented 1 year ago

可视化代码在lda.py的107行,我直接用了pyLDAvis.gensim.prepare,我发现我之前做的也是一样大。你可以查下还有别的更好的可视化方法可以处理这一问题吗。

2871858184 commented 1 year ago

您每一个主题的文本数量很相近吗

2871858184 commented 1 year ago

我在想除了可视化这里,别的地方会不会也存在问题

stay-leave commented 1 year ago

可以检查下lda文件,找找里面有哪些问题,我最近没时间

Lan-ce-lot commented 1 year ago

我查看了每个圆的CSS

image image

他们的大小是不一样的,只是r差距太小,看起来一样。。。

Lan-ce-lot commented 1 year ago

请问楼主为什么可视化之后左边的圆圈会一样大呢?即每个主题都一样重要。

你可以看看是不是这样🦄

stay-leave commented 1 year ago

image 确实是这样