yaozengzhang / How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy

The main project code for one study
2 stars 0 forks source link

虚拟语料库编码 #1

Open Decade-rider opened 5 months ago

Decade-rider commented 5 months ago

这篇论文中使用虚拟语料库构建的意见交互机制很新颖,引起我极大的兴趣,其中通过构建虚拟语料库将意见映射到[0,1]区间的形式,比起很多文献中只将意见或态度分为正面、负面以0、1的形式进行处理,是一种非常棒的处理方法,我本人在做观点动力学模型相关的研究,也正苦恼于意见的处理形式,相信这种意见处理形式对我的研究很有帮助。有个问题想请教,就是请问在构建虚拟语料库时,有提到是通过one-hot的方法编码实现,这种编码方式也是通过MATLAB实现的嘛,您在处理初始评论数据的时候还用到了别的工具方法嘛,希望您能进一步分享虚拟语料库的相关工作。

yaozengzhang commented 5 months ago

本工作所做的内容没有涉及到具体的真实数据,仅提供了一种可参考的意见衡量方法。之所以使用独热编码(one-hot encoding)方法,是因为其为NLP中处理文本的常用方法。独热编码的相关工作,已经广泛使用在基于深度学习进行文本处理的方法中。在基于深度学习处理文本的方法中,独特编码的方法会使得文本数据变得稀疏,为减少内存占用通常会将独热编码后的数据继续处理再次转换为token(深度学习文本预处理中的常用方法)。若想使用真实数据进行分析,一般情况下使用python会比较便利,相关方法也在各开源论坛有广泛讨论。

---原始邮件--- 发件人: "kamen @.> 发送时间: 2024年3月19日(周二) 上午9:43 收件人: @.>; 抄送: @.***>; 主题: [yaozengzhang/How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy] 虚拟语料库编码 (Issue #1)

这篇论文中使用虚拟语料库构建的意见交互机制很新颖,引起我极大的兴趣,其中通过构建虚拟语料库将意见映射到[0,1]区间的形式,比起很多文献中只将意见或态度分为正面、负面以0、1的形式进行处理,是一种非常棒的处理方法,我本人在做观点动力学模型相关的研究,也正苦恼于意见的处理形式,相信这种意见处理形式对我的研究很有帮助。有个问题想请教,就是请问在构建虚拟语料库时,有提到是通过one-hot的方法编码实现,这种编码方式也是通过MATLAB实现的嘛,您在处理初始评论数据的时候还用到了别的工具方法嘛,希望您能进一步分享虚拟语料库的相关工作。

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you are subscribed to this thread.Message ID: @.***>

Decade-rider commented 5 months ago

非常感谢您的回复,解答了我关于虚拟语料库的一些问题,作为一个研一小白,真诚感谢您的建议。我会认真思考这些建议希望能做出一点自己的工作。手动比心~

------------------ 原始邮件 ------------------ 发件人: @.>; 发送时间: 2024年3月19日(星期二) 中午1:28 收件人: @.>; 抄送: @.>; @.>; 主题: Re: [yaozengzhang/How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy] 虚拟语料库编码 (Issue #1)

本工作所做的内容没有涉及到具体的真实数据,仅提供了一种可参考的意见衡量方法。之所以使用独热编码(one-hot encoding)方法,是因为其为NLP中处理文本的常用方法。独热编码的相关工作,已经广泛使用在基于深度学习进行文本处理的方法中。在基于深度学习处理文本的方法中,独特编码的方法会使得文本数据变得稀疏,为减少内存占用通常会将独热编码后的数据继续处理再次转换为token(深度学习文本预处理中的常用方法)。若想使用真实数据进行分析,一般情况下使用python会比较便利,相关方法也在各开源论坛有广泛讨论。

---原始邮件--- 发件人: "kamen @.> 发送时间: 2024年3月19日(周二) 上午9:43 收件人: @.>; 抄送: @.***>; 主题: [yaozengzhang/How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy] 虚拟语料库编码 (Issue #1)

这篇论文中使用虚拟语料库构建的意见交互机制很新颖,引起我极大的兴趣,其中通过构建虚拟语料库将意见映射到[0,1]区间的形式,比起很多文献中只将意见或态度分为正面、负面以0、1的形式进行处理,是一种非常棒的处理方法,我本人在做观点动力学模型相关的研究,也正苦恼于意见的处理形式,相信这种意见处理形式对我的研究很有帮助。有个问题想请教,就是请问在构建虚拟语料库时,有提到是通过one-hot的方法编码实现,这种编码方式也是通过MATLAB实现的嘛,您在处理初始评论数据的时候还用到了别的工具方法嘛,希望您能进一步分享虚拟语料库的相关工作。

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you are subscribed to this thread.Message ID: @.> — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.>

yaozengzhang commented 5 months ago

感谢您的提问,期待后续有机会更多的讨论交流。

---原始邮件--- 发件人: "kamen @.> 发送时间: 2024年3月19日(周二) 下午3:38 收件人: @.>; 抄送: @.**@.>; 主题: Re: [yaozengzhang/How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy] 虚拟语料库编码 (Issue #1)

非常感谢您的回复,解答了我关于虚拟语料库的一些问题,作为一个研一小白,真诚感谢您的建议。我会认真思考这些建议希望能做出一点自己的工作。手动比心~

------------------ 原始邮件 ------------------ 发件人: @.>;
发送时间: 2024年3月19日(星期二) 中午1:28 收件人:
@.>;
抄送: @.>; @.>;
主题: Re: [yaozengzhang/How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy] 虚拟语料库编码 (Issue #1)

本工作所做的内容没有涉及到具体的真实数据,仅提供了一种可参考的意见衡量方法。之所以使用独热编码(one-hot encoding)方法,是因为其为NLP中处理文本的常用方法。独热编码的相关工作,已经广泛使用在基于深度学习进行文本处理的方法中。在基于深度学习处理文本的方法中,独特编码的方法会使得文本数据变得稀疏,为减少内存占用通常会将独热编码后的数据继续处理再次转换为token(深度学习文本预处理中的常用方法)。若想使用真实数据进行分析,一般情况下使用python会比较便利,相关方法也在各开源论坛有广泛讨论。

---原始邮件---
发件人: "kamen @.>
发送时间: 2024年3月19日(周二) 上午9:43
收件人:
@.>;
抄送: @.***>;
主题: [yaozengzhang/How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy] 虚拟语料库编码 (Issue #1)

这篇论文中使用虚拟语料库构建的意见交互机制很新颖,引起我极大的兴趣,其中通过构建虚拟语料库将意见映射到[0,1]区间的形式,比起很多文献中只将意见或态度分为正面、负面以0、1的形式进行处理,是一种非常棒的处理方法,我本人在做观点动力学模型相关的研究,也正苦恼于意见的处理形式,相信这种意见处理形式对我的研究很有帮助。有个问题想请教,就是请问在构建虚拟语料库时,有提到是通过one-hot的方法编码实现,这种编码方式也是通过MATLAB实现的嘛,您在处理初始评论数据的时候还用到了别的工具方法嘛,希望您能进一步分享虚拟语料库的相关工作。


Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you are subscribed to this thread.Message ID: @.>
— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID:
@.> — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

Decade-rider commented 5 months ago

hhhh,很荣幸和您讨论,向您学习

------------------ 原始邮件 ------------------ 发件人: @.>; 发送时间: 2024年3月19日(星期二) 下午4:05 收件人: @.>; 抄送: @.>; @.>; 主题: Re: [yaozengzhang/How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy] 虚拟语料库编码 (Issue #1)

感谢您的提问,期待后续有机会更多的讨论交流。

---原始邮件--- 发件人: "kamen @.> 发送时间: 2024年3月19日(周二) 下午3:38 收件人: @.>; 抄送: @.**@.>; 主题: Re: [yaozengzhang/How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy] 虚拟语料库编码 (Issue #1)

非常感谢您的回复,解答了我关于虚拟语料库的一些问题,作为一个研一小白,真诚感谢您的建议。我会认真思考这些建议希望能做出一点自己的工作。手动比心~

------------------ 原始邮件 ------------------
发件人: @.>;
发送时间: 2024年3月19日(星期二) 中午1:28
收件人:
@.>;
抄送: @.>; @.>;
主题: Re: [yaozengzhang/How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy] 虚拟语料库编码 (Issue #1)

本工作所做的内容没有涉及到具体的真实数据,仅提供了一种可参考的意见衡量方法。之所以使用独热编码(one-hot encoding)方法,是因为其为NLP中处理文本的常用方法。独热编码的相关工作,已经广泛使用在基于深度学习进行文本处理的方法中。在基于深度学习处理文本的方法中,独特编码的方法会使得文本数据变得稀疏,为减少内存占用通常会将独热编码后的数据继续处理再次转换为token(深度学习文本预处理中的常用方法)。若想使用真实数据进行分析,一般情况下使用python会比较便利,相关方法也在各开源论坛有广泛讨论。

---原始邮件---
发件人: "kamen @.>
发送时间: 2024年3月19日(周二) 上午9:43
收件人:
@.>;
抄送: @.***>;
主题: [yaozengzhang/How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy] 虚拟语料库编码 (Issue #1)

这篇论文中使用虚拟语料库构建的意见交互机制很新颖,引起我极大的兴趣,其中通过构建虚拟语料库将意见映射到[0,1]区间的形式,比起很多文献中只将意见或态度分为正面、负面以0、1的形式进行处理,是一种非常棒的处理方法,我本人在做观点动力学模型相关的研究,也正苦恼于意见的处理形式,相信这种意见处理形式对我的研究很有帮助。有个问题想请教,就是请问在构建虚拟语料库时,有提到是通过one-hot的方法编码实现,这种编码方式也是通过MATLAB实现的嘛,您在处理初始评论数据的时候还用到了别的工具方法嘛,希望您能进一步分享虚拟语料库的相关工作。


Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you are subscribed to this thread.Message ID: @.>

Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you authored the thread.Message ID:
@.>
— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.> — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.>