yangheng95 / LCF-ATEPC

codes for paper A Multi-task Learning Model for Chinese-oriented Aspect Polarity Classification and Aspect Term Extraction
MIT License
191 stars 45 forks source link

用我的数据集做预测时,遇到了一个问题 #48

Closed 64rmb closed 1 year ago

64rmb commented 2 years ago

我有一个只有正负情感标注的数据集,在模型预测情感时常常结果完全相反: image 正向的句子argmax后结果总是0(负向),而负向的结果总是1,然而我的数据集正向的样本远多于负向。

列举几个改动: 数据标注: image 同中文的几个数据集,做0/2标注。训练测试八二分,训练行数33w行左右。

模型保存与加载: image image

预测输出: image

在用公开数据集的时候,预测结果比较正常,然而换成我自己的数据集,情感预测非常不正常。困扰了几天,没想出来是哪里出了问题,请教您一下。

64rmb commented 2 years ago

另外,我的gpu服务器是局域网的,尝试过pysbsa这个库,无论我是否导入预训练checkpoint都会报无法联网下载的错,所以如果您能对以上问题做回复的话,非常感谢!

64rmb commented 2 years ago

我又看了半天,原来我polarity没有传入lcf_atepc的时候,声明了一个同大小的zeros tensor当作polarity,改成全-1就正常了。。但是为什么公开数据集没这个问题呢??未解之谜

yangheng95 commented 2 years ago

你好,可以引用一下有问题的代码吗,这个库很久没有维护过了,印象不深

yangheng95 commented 2 years ago

另外,我的gpu服务器是局域网的,尝试过pysbsa这个库,无论我是否导入预训练checkpoint都会报无法联网下载的错,所以如果您能对以上问题做回复的话,非常感谢!

请问报错的代码是哪里,我看后面有没有时间改成离线可用

DorisFangWork commented 2 years ago

你好,可以引用一下有问题的代码吗,这个库很久没有维护过了,印象不深

请问最新的代码是移到了这里吗?https://github.com/yangheng95/PyABSA/blob/release/pyabsa/core/atepc/models/lcf_atepc.py

yangheng95 commented 2 years ago

是的

DorisFangWork commented 2 years ago

是的

我看到lcf_atepc.py最新的代码里去掉了BertSelfAttention。 因为我正在学习您的论文《A multi-task learning model for Chinese-oriented aspect polarity classification and aspect term extraction》,我想复现并引用的话,以哪个版本的代码为准呢?谢谢

yangheng95 commented 2 years ago

学术研究的话都可以,如果是做落地运用请以最新为准,兼顾了效率和效果,并且PyABSA中的新版模型的ATE效果超出paper上的结果。具体数据可以在PyABSA的readme中查看

DorisFangWork commented 2 years ago

非常感谢解答。

DorisFangWork commented 2 years ago

最近在写毕业论文,导师推荐用你们的模型,请问可以加你的微信请教吗?🙈

On 4 May 2022 18:44, "H, Yang" @.***> wrote:

学术研究的话都可以,如果是做落地运用请以最新为准,兼顾了效率和效果,并且PyABSA中的新版模型的ATE效果超出paper上的结果。具体数据可以在PyABSA的readme中查看

— Reply to this email directly, view it on GitHubhttps://github.com/yangheng95/LCF-ATEPC/issues/48#issuecomment-1117167931, or unsubscribehttps://github.com/notifications/unsubscribe-auth/ARKZSUTP3AVFHNF6RZJFQILVIJIHHANCNFSM5TMJS36Q. You are receiving this because you commented.Message ID: @.***>

yangheng95 commented 2 years ago

你可以邮箱联系我,我给你联系方式

DorisFangWork commented 2 years ago

你可以邮箱联系我,我给你联系方式

好的,谢谢。

DorisFangWork commented 1 year ago

好的,谢谢。


From: H, Yang @.> Sent: Thursday, 5 May 2022 4:09 pm To: yangheng95/LCF-ATEPC @.> Cc: Doris Fang @.>; Comment @.> Subject: Re: [yangheng95/LCF-ATEPC] 用我的数据集做预测时,遇到了一个问题 (Issue #48)

你可以邮箱联系我,我给你联系方式

― Reply to this email directly, view it on GitHubhttps://github.com/yangheng95/LCF-ATEPC/issues/48#issuecomment-1118282122, or unsubscribehttps://github.com/notifications/unsubscribe-auth/ARKZSUUNVU3DYVUBSHVOCOTVIN63XANCNFSM5TMJS36Q. You are receiving this because you commented.Message ID: @.***>

wwwstudyeveryday commented 1 year ago

我有一个只有正负情感标注的数据集,在模型预测情感时常常结果完全相反: image 正向的句子argmax后结果总是0(负向),而负向的结果总是1,然而我的数据集正向的样本远多于负向。

列举几个改动: 数据标注: image 同中文的几个数据集,做0/2标注。训练测试八二分,训练行数33w行左右。

模型保存与加载: image image

预测输出: image

在用公开数据集的时候,预测结果比较正常,然而换成我自己的数据集,情感预测非常不正常。困扰了几天,没想出来是哪里出了问题,请教您一下。

你好,想问下先运行哪个再运行哪个呀

wwwstudyeveryday commented 1 year ago

我只有一个正负情感标签的数据集,在模型预测情感时通常结果完全正确: 正向的句子argmax后结果总是0(负向),而负向的结果总是1,但是我的数据集合正向的样本远多于负向。 图像

列举几个标签: 数据标注: 同中文训练的几个数据集,做0/2标注。训练测试八二分,行数33w行左右。 图像

模型保存与加载: 图像 图像

预测输出: 图像

在使用公开数据集的时候,预测结果比较正常,但是换成我自己的数据集,情感预测非常不正常。困扰了几天,突然出现了哪里生长问题,请教您一下。

请问模型保存和预测是自己写的吗

64rmb commented 1 year ago

是自己写的,这个问题其实是embedding初始化的问题,已经解决了 ---- 回复的原邮件 ---- | 发件人 | @.> | | 发送日期 | 2023年08月17日 18:37 | | 收件人 | yangheng95/LCF-ATEPC @.> | | 抄送人 | 64rmb @.>, Author @.> | | 主题 | Re: [yangheng95/LCF-ATEPC] 用我的数据集做预测时,遇到了一个问题 (Issue #48) |

我只有一个正负情感标签的数据集,在模型预测情感时通常结果完全正确: 正向的句子argmax后结果总是0(负向),而负向的结果总是1,但是我的数据集合正向的样本远多于负向。

列举几个标签: 数据标注: 同中文训练的几个数据集,做0/2标注。训练测试八二分,行数33w行左右。

模型保存与加载:

预测输出:

在使用公开数据集的时候,预测结果比较正常,但是换成我自己的数据集,情感预测非常不正常。困扰了几天,突然出现了哪里生长问题,请教您一下。

请问模型保存和预测是自己写的吗

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

wwwstudyeveryday commented 1 year ago

是自己写的,这个问题其实是embedding初始化的问题,已经解决了 ---- 回复的原邮件 ---- | 发件人 | @.> | | 发送日期 | 2023年08月17日 18:37 | | 收件人 | yangheng95/LCF-ATEPC @.> | | 抄送人 | 64rmb @.>, Author @.> | | 主题 | Re: [yangheng95/LCF-ATEPC] 用我的数据集做预测时,遇到了一个问题 (Issue #48) | 我只有一个正负情感标签的数据集,在模型预测情感时通常结果完全正确: 正向的句子argmax后结果总是0(负向),而负向的结果总是1,但是我的数据集合正向的样本远多于负向。 列举几个标签: 数据标注: 同中文训练的几个数据集,做0/2标注。训练测试八二分,行数33w行左右。 模型保存与加载: 预测输出: 在使用公开数据集的时候,预测结果比较正常,但是换成我自己的数据集,情感预测非常不正常。困扰了几天,突然出现了哪里生长问题,请教您一下。 请问模型保存和预测是自己写的吗 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

请问可以求一下您的代码吗😢自己学习使用,真的打扰了