iMoonLab / DHGNN

DHGNN source code for IJCAI19 paper: "Dynamic Hypergraph Neural Networks"
MIT License
238 stars 32 forks source link

关于微博推文情感分析任务的一些疑问 #43

Open issac1zj opened 2 years ago

issac1zj commented 2 years ago

作者你好,阅读论文后发现你们关于动态构建超图网络的想法非常酷,也很受启发。特别是论文中谈到的关于微博推文情感分析任务,我觉得用超图网络来做情感分析任务很有意思。 我想问一下关于使用动态超图网络来做情感分析任务的一些细节问题,因为我没有从代码里找到关于情感分析任务相关的代码或者微博推文数据处理的代码。

  1. 不同于cora数据,情感分析任务中的数据本身不存在图结构(把每一篇推文看作一个节点的话,节点之间是没有关联的)。所以我很好奇,针对情感分析任务,输入数据是不存在结构(edge_dict节点仅自相关),还是说对数据做了预处理,节点之间构建了关联并将其作为先验知识输入模型。如果做了预处理,是怎么样做的?
  2. 关于训练数据,不知道我理解有没有偏差,我没有在代码中看到batch_size的设置,模型似乎是针对所有训练数据进行建模的。我看到论文里介绍的推文数据量是5550条,如果数据量较大,例如有20万条推文,该方法是否可行?有哪些应对方法?(我看到代码中有矩阵H和G计算,节点数量到十万量级那么矩阵计算代价会非常恐怖)
weiyx15 commented 2 years ago

您好,非常感谢您对我们工作的关注!关于您的问题,我尝试回答一下:

  1. 对于情感分析任务,由于数据集本身没有图结构,所以我们通过预处理构造了超图进行计算。我们把每一条博文看作一个节点,根据特征的knn得到每个节点的k个近邻,这些k近邻的团簇看作超边,由此构造超图,从而以该超图结构作为初始结构进行计算。这部分内容在文章中也介绍过,更加具体的信息可以参考文章。
  2. DHGNN目前没有提供分batch的实现方式,在目前的条件下,确实无法胜任特别大规模数据的计算。针对超图神经网络的分batch计算,我们正在研究,相关工作不久将投稿,到时欢迎关注。 不知道上述回复能否解决您的疑问,再次感谢!
weiyx15 commented 2 years ago

您好,非常感谢您对我们工作的关注!关于您的问题,我尝试回答一下:

  1. 对于情感分析任务,由于数据集本身没有图结构,所以我们通过预处理构造了超图进行计算。我们把每一条博文看作一个节点,根据特征的knn得到每个节点的k个近邻,这些k近邻的团簇看作超边,由此构造超图,从而以该超图结构作为初始结构进行计算。这部分内容在文章中也介绍过,更加具体的信息可以参考文章。

  2. DHGNN目前没有提供分batch的实现方式,在目前的条件下,确实无法胜任特别大规模数据的计算。针对超图神经网络的分batch计算,我们正在研究,相关工作不久将投稿,到时欢迎关注。 不知道上述回复能否解决您的疑问,再次感谢!

从 Windows 版邮件https://go.microsoft.com/fwlink/?LinkId=550986发送

发件人: @.> 发送时间: 2022年3月18日 16:01 收件人: @.> 抄送: @.***> 主题: [iMoonLab/DHGNN] 关于微博推文情感分析任务的一些疑问 (Issue #43)

作者你好,阅读论文后发现你们关于动态构建超图网络的想法非常酷,也很受启发。特别是论文中谈到的关于微博推文情感分析任务,我觉得用超图网络来做情感分析任务很有意思。 我想问一下关于使用动态超图网络来做情感分析任务的一些细节问题,因为我没有从代码里找到关于情感分析任务相关的代码或者微博推文数据处理的代码。

  1. 不同于cora数据,情感分析任务中的数据本身不存在图结构(把每一篇推文看作一个节点的话,节点之间是没有关联的)。所以我很好奇,针对情感分析任务,输入数据是不存在结构(edge_dict节点仅自相关),还是说对数据做了预处理,节点之间构建了关联并将其作为先验知识输入模型。如果做了预处理,是怎么样做的?
  2. 关于训练数据,不知道我理解有没有偏差,我没有在代码中看到batch_size的设置,模型似乎是针对所有训练数据进行建模的。我看到论文里介绍的推文数据量是5550条,如果数据量较大,例如有20万条推文,该方法是否可行?有哪些应对方法?(我看到代码中有矩阵H和G计算,节点数量到十万量级那么矩阵计算代价会非常恐怖)

― Reply to this email directly, view it on GitHubhttps://github.com/iMoonLab/DHGNN/issues/43, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AHPOLD4MX5ISI3AFOX5ZSCLVAQZ35ANCNFSM5RBDDJJQ. Triage notifications on the go with GitHub Mobile for iOShttps://apps.apple.com/app/apple-store/id1477376905?ct=notification-email&mt=8&pt=524675 or Androidhttps://play.google.com/store/apps/details?id=com.github.android&referrer=utm_campaign%3Dnotification-email%26utm_medium%3Demail%26utm_source%3Dgithub. You are receiving this because you are subscribed to this thread.Message ID: @.***>

issac1zj commented 2 years ago

首先,非常感谢作者在百忙之中来解答我的疑惑,使用K近邻预先构建超图结构印证了我之前的想法,我觉得在使用先验知识预先构建图结构方面还有很多技巧可以探索。然后,当我在研究代码时,我又产生了疑问,想和作者探讨一下:

  1. 关于使用K-Means和KNN来构建超边,不知道是否是我理解有误,我发现在代码中,K-Means聚类簇数量、每个聚类簇内节点数量、K近邻数量都是在config文件中预先定义好的。这是否意味着超图结构其实是固定的,只是节点的表征信息在更新。我对动态超图的理解是超图结构随着不断学习迭代应该是自适应更新其结构和表征的。
  2. 针对大数量下超图模型的训练和应用,目前我依然没有清晰的解决思路,也非常期望在不久的未来看到作者新的研究成果,我也会持续进行关注。
shuqincao commented 2 years ago

你好,请问generate_G_from_H"中“G = DV2 H W invDE HT * DV2“这行代码表示的什么意思呢

shuqincao commented 2 years ago

代码中有矩阵H和G计算,请问代码中的矩阵G是什么意思呢

KaetheFu commented 2 years ago

您好,我想问下,您关于情感分析部分的代码和数据集方便公开吗? 关于Microblog这个Dataset并没有找到相关的数据公开渠道.

280777510 commented 1 year ago

作者你好,阅读论文后发现你们关于动态构建超图网络的想法非常酷,看了文章后深受启发。有两个问题 1.在微博情感分析任务中,有三个模态,分别是文本,图像和表情,文中你您提出构建三个超边集来对应三个模态构成的超边,然后再merge这个三个超边集,这个merge是指在列维度上concate起来吗?例如第一模态超边集大小为10,第二模态20,第三模态30,最后形成的大超边集是,N个结点*60超边? 2.如果按1的想法,后面的特征聚合该如何实现?