虚拟语料库编码 - Githubissues

Decade-rider commented 5 months ago

这篇论文中使用虚拟语料库构建的意见交互机制很新颖，引起我极大的兴趣，其中通过构建虚拟语料库将意见映射到[0,1]区间的形式，比起很多文献中只将意见或态度分为正面、负面以0、1的形式进行处理，是一种非常棒的处理方法，我本人在做观点动力学模型相关的研究，也正苦恼于意见的处理形式，相信这种意见处理形式对我的研究很有帮助。有个问题想请教，就是请问在构建虚拟语料库时，有提到是通过one-hot的方法编码实现，这种编码方式也是通过MATLAB实现的嘛，您在处理初始评论数据的时候还用到了别的工具方法嘛，希望您能进一步分享虚拟语料库的相关工作。

yaozengzhang commented 5 months ago

本工作所做的内容没有涉及到具体的真实数据，仅提供了一种可参考的意见衡量方法。之所以使用独热编码（one-hot encoding）方法，是因为其为NLP中处理文本的常用方法。独热编码的相关工作，已经广泛使用在基于深度学习进行文本处理的方法中。在基于深度学习处理文本的方法中，独特编码的方法会使得文本数据变得稀疏，为减少内存占用通常会将独热编码后的数据继续处理再次转换为token（深度学习文本预处理中的常用方法）。若想使用真实数据进行分析，一般情况下使用python会比较便利，相关方法也在各开源论坛有广泛讨论。

---原始邮件--- 发件人: "kamen @.> 发送时间: 2024年3月19日(周二) 上午9:43 收件人: @.>; 抄送: @.***>; 主题: [yaozengzhang/How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy] 虚拟语料库编码 (Issue #1)

这篇论文中使用虚拟语料库构建的意见交互机制很新颖，引起我极大的兴趣，其中通过构建虚拟语料库将意见映射到[0,1]区间的形式，比起很多文献中只将意见或态度分为正面、负面以0、1的形式进行处理，是一种非常棒的处理方法，我本人在做观点动力学模型相关的研究，也正苦恼于意见的处理形式，相信这种意见处理形式对我的研究很有帮助。有个问题想请教，就是请问在构建虚拟语料库时，有提到是通过one-hot的方法编码实现，这种编码方式也是通过MATLAB实现的嘛，您在处理初始评论数据的时候还用到了别的工具方法嘛，希望您能进一步分享虚拟语料库的相关工作。

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you are subscribed to this thread.Message ID: @.***>

Decade-rider commented 5 months ago

非常感谢您的回复，解答了我关于虚拟语料库的一些问题，作为一个研一小白，真诚感谢您的建议。我会认真思考这些建议希望能做出一点自己的工作。手动比心~

------------------ 原始邮件 ------------------ 发件人: @.>; 发送时间: 2024年3月19日(星期二) 中午1:28 收件人: @.>; 抄送: @.>; @.>; 主题: Re: [yaozengzhang/How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy] 虚拟语料库编码 (Issue #1)

本工作所做的内容没有涉及到具体的真实数据，仅提供了一种可参考的意见衡量方法。之所以使用独热编码（one-hot encoding）方法，是因为其为NLP中处理文本的常用方法。独热编码的相关工作，已经广泛使用在基于深度学习进行文本处理的方法中。在基于深度学习处理文本的方法中，独特编码的方法会使得文本数据变得稀疏，为减少内存占用通常会将独热编码后的数据继续处理再次转换为token（深度学习文本预处理中的常用方法）。若想使用真实数据进行分析，一般情况下使用python会比较便利，相关方法也在各开源论坛有广泛讨论。

---原始邮件--- 发件人: "kamen @.> 发送时间: 2024年3月19日(周二) 上午9:43 收件人: @.>; 抄送: @.***>; 主题: [yaozengzhang/How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy] 虚拟语料库编码 (Issue #1)

这篇论文中使用虚拟语料库构建的意见交互机制很新颖，引起我极大的兴趣，其中通过构建虚拟语料库将意见映射到[0,1]区间的形式，比起很多文献中只将意见或态度分为正面、负面以0、1的形式进行处理，是一种非常棒的处理方法，我本人在做观点动力学模型相关的研究，也正苦恼于意见的处理形式，相信这种意见处理形式对我的研究很有帮助。有个问题想请教，就是请问在构建虚拟语料库时，有提到是通过one-hot的方法编码实现，这种编码方式也是通过MATLAB实现的嘛，您在处理初始评论数据的时候还用到了别的工具方法嘛，希望您能进一步分享虚拟语料库的相关工作。

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you are subscribed to this thread.Message ID: @.> — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.>

yaozengzhang commented 5 months ago

感谢您的提问，期待后续有机会更多的讨论交流。

---原始邮件--- 发件人: "kamen @.> 发送时间: 2024年3月19日(周二) 下午3:38 收件人: @.>; 抄送: @.**@.>; 主题: Re: [yaozengzhang/How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy] 虚拟语料库编码 (Issue #1)

非常感谢您的回复，解答了我关于虚拟语料库的一些问题，作为一个研一小白，真诚感谢您的建议。我会认真思考这些建议希望能做出一点自己的工作。手动比心~

------------------ 原始邮件 ------------------ 发件人: @.>;
发送时间: 2024年3月19日(星期二) 中午1:28 收件人: @.>;
抄送: @.>; @.>;
主题: Re: [yaozengzhang/How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy] 虚拟语料库编码 (Issue #1)

本工作所做的内容没有涉及到具体的真实数据，仅提供了一种可参考的意见衡量方法。之所以使用独热编码（one-hot encoding）方法，是因为其为NLP中处理文本的常用方法。独热编码的相关工作，已经广泛使用在基于深度学习进行文本处理的方法中。在基于深度学习处理文本的方法中，独特编码的方法会使得文本数据变得稀疏，为减少内存占用通常会将独热编码后的数据继续处理再次转换为token（深度学习文本预处理中的常用方法）。若想使用真实数据进行分析，一般情况下使用python会比较便利，相关方法也在各开源论坛有广泛讨论。

---原始邮件---
发件人: "kamen @.&gt;
发送时间: 2024年3月19日(周二) 上午9:43
收件人: @.&gt;;
抄送: @.***&gt;;
主题: [yaozengzhang/How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy] 虚拟语料库编码 (Issue #1)

这篇论文中使用虚拟语料库构建的意见交互机制很新颖，引起我极大的兴趣，其中通过构建虚拟语料库将意见映射到[0,1]区间的形式，比起很多文献中只将意见或态度分为正面、负面以0、1的形式进行处理，是一种非常棒的处理方法，我本人在做观点动力学模型相关的研究，也正苦恼于意见的处理形式，相信这种意见处理形式对我的研究很有帮助。有个问题想请教，就是请问在构建虚拟语料库时，有提到是通过one-hot的方法编码实现，这种编码方式也是通过MATLAB实现的嘛，您在处理初始评论数据的时候还用到了别的工具方法嘛，希望您能进一步分享虚拟语料库的相关工作。

—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you are subscribed to this thread.Message ID: @.&gt;
— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.> — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

Decade-rider commented 5 months ago

hhhh，很荣幸和您讨论，向您学习

------------------ 原始邮件 ------------------ 发件人: @.>; 发送时间: 2024年3月19日(星期二) 下午4:05 收件人: @.>; 抄送: @.>; @.>; 主题: Re: [yaozengzhang/How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy] 虚拟语料库编码 (Issue #1)

感谢您的提问，期待后续有机会更多的讨论交流。

---原始邮件--- 发件人: "kamen @.> 发送时间: 2024年3月19日(周二) 下午3:38 收件人: @.>; 抄送: @.**@.>; 主题: Re: [yaozengzhang/How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy] 虚拟语料库编码 (Issue #1)

非常感谢您的回复，解答了我关于虚拟语料库的一些问题，作为一个研一小白，真诚感谢您的建议。我会认真思考这些建议希望能做出一点自己的工作。手动比心~

------------------&nbsp;原始邮件&nbsp;------------------
发件人: @.&gt;;
发送时间: 2024年3月19日(星期二) 中午1:28
收件人: @.&gt;;
抄送: @.&gt;; @.&gt;;
主题: Re: [yaozengzhang/How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy] 虚拟语料库编码 (Issue #1)

本工作所做的内容没有涉及到具体的真实数据，仅提供了一种可参考的意见衡量方法。之所以使用独热编码（one-hot encoding）方法，是因为其为NLP中处理文本的常用方法。独热编码的相关工作，已经广泛使用在基于深度学习进行文本处理的方法中。在基于深度学习处理文本的方法中，独特编码的方法会使得文本数据变得稀疏，为减少内存占用通常会将独热编码后的数据继续处理再次转换为token（深度学习文本预处理中的常用方法）。若想使用真实数据进行分析，一般情况下使用python会比较便利，相关方法也在各开源论坛有广泛讨论。

---原始邮件---
发件人: "kamen @.&amp;gt;
发送时间: 2024年3月19日(周二) 上午9:43
收件人: @.&amp;gt;;
抄送: @.***&amp;gt;;
主题: [yaozengzhang/How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy] 虚拟语料库编码 (Issue #1)

这篇论文中使用虚拟语料库构建的意见交互机制很新颖，引起我极大的兴趣，其中通过构建虚拟语料库将意见映射到[0,1]区间的形式，比起很多文献中只将意见或态度分为正面、负面以0、1的形式进行处理，是一种非常棒的处理方法，我本人在做观点动力学模型相关的研究，也正苦恼于意见的处理形式，相信这种意见处理形式对我的研究很有帮助。有个问题想请教，就是请问在构建虚拟语料库时，有提到是通过one-hot的方法编码实现，这种编码方式也是通过MATLAB实现的嘛，您在处理初始评论数据的时候还用到了别的工具方法嘛，希望您能进一步分享虚拟语料库的相关工作。

—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you are subscribed to this thread.Message ID: @.&amp;gt;
—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you authored the thread.Message ID: @.&gt;
— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.> — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.>

yaozengzhang / How-social-bots-can-influence-public-opinion-more-effectively-right-connection-strategy

虚拟语料库编码 #1