yangheng95 / PyABSA

Sentiment Analysis, Text Classification, Text Augmentation, Text Adversarial defense, etc.;
https://pyabsa.readthedocs.io
MIT License
909 stars 153 forks source link

多观点的抽出是否支持? #27

Closed LangDaoAI closed 3 years ago

LangDaoAI commented 3 years ago

确认一下多观点的抽出是否支持, 或者提供一些参考,以及一些ideas。

yangheng95 commented 3 years ago

支持,readme有示例

LangDaoAI commented 3 years ago

支持,readme有示例

image

还请更新一下readme, 目前readme示例支持aspect和极性, opinion观点并没有显示出来

yangheng95 commented 3 years ago

你指的opinion是怎么样的,能举个例子吗

LangDaoAI commented 3 years ago

你指的opinion是怎么样的,能举个例子吗

比方说: 这款手机的大小真的很薄,但是颜色不太好看, 总体上我很满意啦。

这句评论我来做细粒度的情感分析, 那么我的目标就是: 1 Aspect Term + 观点opinion + 极性 1)大小 + (很)薄 + 正面 2)颜色 + 不好看 + 负面

2 总体情感 因为我刻意写了总体的满意程度, 所以这里总体是正面, 当然有些没有明显写出来是隐式的,所以存在局部情感分类后进行程度上的比较进而做概率分析总体是正向还是负向或者各自的概率比例都给出来。

因此,这里的opinion是非常重要的, 1 它解释了局部情感的极性 2 它可以和Aspect形成热词标签做统计,便于后续上游系统的改进和提升,用于更精细化决策。

yangheng95 commented 3 years ago

抱歉,这么精细的任务现在还不支持的,看后续有没有时间更新了

yangheng95 commented 3 years ago

没有opinion数据的标注也是一个问题

LangDaoAI commented 3 years ago

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

yangheng95 commented 3 years ago

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

你的这个需求更贴近实际应用层次,理论上是可以的,单需要更改模型结构的。我映像中应该有观点-情感对联合抽取研究的论文,但代码是否开源我就不清楚了

yangheng95 commented 3 years ago

例如 https://arxiv.org/abs/2103.15255 https://arxiv.org/abs/2102.08549

LangDaoAI commented 3 years ago

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

你的这个需求更贴近实际应用层次,理论上是可以的,单需要更改模型结构的。我映像中应该有观点-情感对联合抽取研究的论文,但代码是否开源我就不清楚了

你说的很对,应用场景非常大

LangDaoAI commented 3 years ago

例如 https://arxiv.org/abs/2103.15255 https://arxiv.org/abs/2102.08549

我先把LCF测试完并且分析完, 然后再看这些

LangDaoAI commented 3 years ago

三元组以上同时抽出,无论模型是怎么样的,不是为了增加一个维度而去创新性的做抽出,最终性能比较还是要退化到二元组甚至一元组来比较局部的性能,准确性, 例如, 再多维度的同时抽出如果在Aspect方面准确性都不如二元组抽出,那么肯定不是正确方向

yangheng95 commented 3 years ago

是的,但是我现在有其他工作安排,所以这个特性不会很快添加,如果你有该模型的想法可以与我讨论

LangDaoAI commented 3 years ago

理解

Get Outlook for Androidhttps://aka.ms/AAb9ysg


From: YangHeng @.> Sent: Thursday, June 3, 2021 11:44:30 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27)

是的,但是我现在有其他工作安排,所以这个特性不会很快添加,如果你有该模型的想法可以与我讨论

― You are receiving this because you authored the thread. Reply to this email directly, view it on GitHubhttps://github.com/yangheng95/pyabsa/issues/27#issuecomment-853970727, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWLTZCS3OIEEAECCDWTTQ6PN5ANCNFSM46AW7SCQ.

LangDaoAI commented 3 years ago

刚刚已经跑出来了结果,看一下如下:

image

LangDaoAI commented 3 years ago

想问一下, 该LCF模型是基于Bert做Fine-tuning, Fine-tuning的部分在哪里请告知一下, 今天想理解一下这个模型架构, 您时间空了回复就可以,感谢!

LangDaoAI commented 3 years ago

出现一个问题请看一下,我加了一句‘这款手机的大小真的很薄,但是颜色不太好看,总体上我很满意啦。’做测试,没有被识别出来,请看一下下面测试的结果,红色标记

image

yangheng95 commented 3 years ago

好的,我先看一下如何修复

LangDaoAI commented 3 years ago

好的,我先看一下如何修复

OK

LangDaoAI commented 3 years ago

调试发现大的问题出在all_tokens,也就是分词没有分出来,见下图:

screenshot_20210604091849419

yangheng95 commented 3 years ago

知道的,我抽时间修复

yangheng95 commented 3 years ago

你可以先手动把中文用空格分开测试一下

yangheng95 commented 3 years ago

修复完通知你更新

LangDaoAI commented 3 years ago

image

嗯,我debug确实是这个函数中的切分单词出错了,我来试一下你的方式啊

LangDaoAI commented 3 years ago

image

嗯,可以了

yangheng95 commented 3 years ago

原先的中文数据集一直是单子分开的,分布分开做情感那分类没有影响,做这个的时候没有考虑中文切分的问题

LangDaoAI commented 3 years ago

image

我做了一个测试,看一下是否可以,

import re

def spliteKeyWord(str): regex = r"[\u4e00-\ufaff]|[0-9]+|[a-zA-Z]+\'[a-z]" matches = re.findall(regex, str, re.UNICODE) return matches

print(spliteKeyWord("Testing English text我爱Python123")) print(spliteKeyWord("Testing English text")) print(spliteKeyWord("这 款 手 机 的 大 小 真 的 很 薄,但 是 颜 色 不 太 好 看,总 体 上 我 很 满 意 啦。"))

LangDaoAI commented 3 years ago

本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下,

image

有空格和没有空格都是一样的。

ScottishFold007 commented 3 years ago

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

image 是这样的结果吗?情感根据观点很容易得到

yangheng95 commented 3 years ago

本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下,

image

有空格和没有空格都是一样的。

这属应该是训练数据不足导致的结果

LangDaoAI commented 3 years ago

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

image 是这样的结果吗?情感根据观点很容易得到

是这个意思,你的代码是其他模型的吧

LangDaoAI commented 3 years ago

本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下, image 有空格和没有空格都是一样的。

这属应该是训练数据不足导致的结果

嗯这个问题我先记下来

LangDaoAI commented 3 years ago

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

image 是这样的结果吗?情感根据观点很容易得到

但是你这个效果和我想要的还不一样, 我想的是精细化aspects-sentiment-opinion配对输出

ScottishFold007 commented 3 years ago

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

image 是这样的结果吗?情感根据观点很容易得到

但是你这个效果和我想要的还不一样, 我想的是精细化aspects-sentiment-opinion配对输出

一一对应的三元组是吧,也可以的 image

LangDaoAI commented 3 years ago

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

image 是这样的结果吗?情感根据观点很容易得到

但是你这个效果和我想要的还不一样, 我想的是精细化aspects-sentiment-opinion配对输出

一一对应的三元组是吧,也可以的 image

嗯,很棒, 用哪个模型做的?有参考project或者资料吗

ScottishFold007 commented 3 years ago

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

image 是这样的结果吗?情感根据观点很容易得到

是这个意思,你的代码是其他模型的吧

是其他模型做的

ScottishFold007 commented 3 years ago

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

image 是这样的结果吗?情感根据观点很容易得到

但是你这个效果和我想要的还不一样, 我想的是精细化aspects-sentiment-opinion配对输出

一一对应的三元组是吧,也可以的 image

嗯,很棒, 用哪个模型做的?有参考project或者资料吗

没有,生产用的,不开源

LangDaoAI commented 3 years ago

是哪家公司的产品?

Get Outlook for Androidhttps://aka.ms/AAb9ysg


From: Scottish_Fold007 @.> Sent: Friday, June 4, 2021 12:00:27 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27)

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

[image]https://user-images.githubusercontent.com/36957508/120736717-583d4300-c51f-11eb-8ecf-6aa36e8aa000.png 是这样的结果吗?情感根据观点很容易得到

但是你这个效果和我想要的还不一样, 我想的是精细化aspects-sentiment-opinion配对输出

一一对应的三元组是吧,也可以的 [image]https://user-images.githubusercontent.com/36957508/120740764-6cd10980-c526-11eb-9195-e6dbf292aa45.png

嗯,很棒, 用哪个模型做的?有参考project或者资料吗

没有,生产用的,不开源

― You are receiving this because you authored the thread. Reply to this email directly, view it on GitHubhttps://github.com/yangheng95/pyabsa/issues/27#issuecomment-854340297, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWNK3CZSWHMI5ZYVHXLTRBFVXANCNFSM46AW7SCQ.

yangheng95 commented 3 years ago

调试发现大的问题出在all_tokens,也就是分词没有分出来,见下图:

screenshot_20210604091849419

已经根据你给的代码修复了,谢谢贡献代码

LangDaoAI commented 3 years ago

不客气不客气

Get Outlook for Androidhttps://aka.ms/AAb9ysg


From: YangHeng @.> Sent: Friday, June 4, 2021 12:46:29 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27)

调试发现大的问题出在all_tokens,也就是分词没有分出来,见下图:

[screenshot_20210604091849419]https://user-images.githubusercontent.com/83859417/120731663-a69a1400-c516-11eb-970e-372905602d71.png

已经根据你给的代码修复了,谢谢贡献代码

― You are receiving this because you authored the thread. Reply to this email directly, view it on GitHubhttps://github.com/yangheng95/pyabsa/issues/27#issuecomment-854354702, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWPOWSKTV7742RI4DF3TRBLCLANCNFSM46AW7SCQ.

LangDaoAI commented 3 years ago

下一步考虑:观点抽取如何加入模型中、模型做改动、数据标注如何考虑观点的抽取。

yangheng95 commented 3 years ago

本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下,

image

有空格和没有空格都是一样的。

Sentence with predicted labels: 尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O) {'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'} Sentence with predicted labels: 照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O) {'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'} Sentence with predicted labels: 关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O) {'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O) {'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'} {'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'}

这是综合4个中文数据集训练的模型的结果

LangDaoAI commented 3 years ago

本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下, image 有空格和没有空格都是一样的。

Sentence with predicted labels: 尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O) {'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'} Sentence with predicted labels: 照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O) {'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'} Sentence with predicted labels: 关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O) {'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O) {'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'} {'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'}

这是综合4个中文数据集训练的模型的结果

颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。

yangheng95 commented 3 years ago

本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下, image 有空格和没有空格都是一样的。

Sentence with predicted labels: 尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O) {'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'} Sentence with predicted labels: 照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O) {'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'} Sentence with predicted labels: 关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O) {'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O) {'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'} {'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'} 这是综合4个中文数据集训练的模型的结果

颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。

主要原因是将4个中文数据集合并了,数据量增多,代码已经更新,正在上传模型

LangDaoAI commented 3 years ago

合并的意思是把四个分散的数据集全部放到一个里面,只是单纯追加吗,可否详细说一下,谢谢

Get Outlook for Androidhttps://aka.ms/AAb9ysg


From: YangHeng @.> Sent: Friday, June 4, 2021 6:38:12 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27)

本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下, [image]https://user-images.githubusercontent.com/83859417/120736527-fbda2380-c51e-11eb-94b0-c30ecea42979.png 有空格和没有空格都是一样的。

Sentence with predicted labels: 尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O) {'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'} Sentence with predicted labels: 照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O) {'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'} Sentence with predicted labels: 关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O) {'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O) {'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'} {'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'} 这是综合4个中文数据集训练的模型的结果

颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。

主要原因是将4个中文数据集合并了,数据量增多,代码已经更新,正在上传模型

― You are receiving this because you authored the thread. Reply to this email directly, view it on GitHubhttps://github.com/yangheng95/pyabsa/issues/27#issuecomment-854606848, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWNZFDTWARXWMBAVCNTTRCUJJANCNFSM46AW7SCQ.

yangheng95 commented 3 years ago

合并的意思是把四个分散的数据集全部放到一个里面,只是单纯追加吗,可否详细说一下,谢谢 Get Outlook for Androidhttps://aka.ms/AAb9ysg ____ From: YangHeng @.> Sent: Friday, June 4, 2021 6:38:12 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27) 本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下, [image]https://user-images.githubusercontent.com/83859417/120736527-fbda2380-c51e-11eb-94b0-c30ecea42979.png 有空格和没有空格都是一样的。 Sentence with predicted labels: 尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O) {'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'} Sentence with predicted labels: 照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O) {'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'} Sentence with predicted labels: 关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O) {'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O) {'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'} {'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'} 这是综合4个中文数据集训练的模型的结果 颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。 主要原因是将4个中文数据集合并了,数据量增多,代码已经更新,正在上传模型 ― You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWNZFDTWARXWMBAVCNTTRCUJJANCNFSM46AW7SCQ.

就是合并所有的中文训练集和测试集作为一整个训练集和测试集,现在可以从google drive下载中文模型,读取模型之后会打印训练时的参数,其中的datasets_files就是采用的数据集

LangDaoAI commented 3 years ago

好的感谢!

Get Outlook for Androidhttps://aka.ms/AAb9ysg


From: YangHeng @.> Sent: Friday, June 4, 2021 7:17:27 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27)

合并的意思是把四个分散的数据集全部放到一个里面,只是单纯追加吗,可否详细说一下,谢谢 Get Outlook for Androidhttps://aka.ms/AAb9ysg … ____ From: YangHeng @.> Sent: Friday, June 4, 2021 6:38:12 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27https://github.com/yangheng95/pyabsa/issues/27) 本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下, [image]https://user-images.githubusercontent.com/83859417/120736527-fbda2380-c51e-11eb-94b0-c30ecea42979.png 有空格和没有空格都是一样的。 Sentence with predicted labels: 尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O) {'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'} Sentence with predicted labels: 照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O) {'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'} Sentence with predicted labels: 关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O) {'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O) {'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'} {'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'} 这是综合4个中文数据集训练的模型的结果 颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。 主要原因是将4个中文数据集合并了,数据量增多,代码已经更新,正在上传模型 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)https://github.com/yangheng95/pyabsa/issues/27#issuecomment-854606848>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWNZFDTWARXWMBAVCNTTRCUJJANCNFSM46AW7SCQ.

就是合并所有的中文训练集和测试集作为一整个训练集和测试集,现在可以从google drive下载中文模型,读取模型之后会打印训练时的参数,其中的datasets_files就是采用的数据集

― You are receiving this because you authored the thread. Reply to this email directly, view it on GitHubhttps://github.com/yangheng95/pyabsa/issues/27#issuecomment-854627966, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWPQDEJONX3FEGBOKIDTRCY4PANCNFSM46AW7SCQ.

LangDaoAI commented 3 years ago

12号后我再用新的模型验证一下,这几天出差,另外观点抽出可能模型架构要改动的,有空还请看一下,或者说当前模型架构是否支持这样的观点抽出?

Get Outlook for Androidhttps://aka.ms/AAb9ysg


From: Tang Yong @.> Sent: Friday, June 4, 2021 7:18:13 PM To: yangheng95/pyabsa @.>; yangheng95/pyabsa @.> Cc: Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27)

好的感谢!

Get Outlook for Androidhttps://aka.ms/AAb9ysg


From: YangHeng @.> Sent: Friday, June 4, 2021 7:17:27 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27)

合并的意思是把四个分散的数据集全部放到一个里面,只是单纯追加吗,可否详细说一下,谢谢 Get Outlook for Androidhttps://aka.ms/AAb9ysg … ____ From: YangHeng @.> Sent: Friday, June 4, 2021 6:38:12 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27https://github.com/yangheng95/pyabsa/issues/27) 本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下, [image]https://user-images.githubusercontent.com/83859417/120736527-fbda2380-c51e-11eb-94b0-c30ecea42979.png 有空格和没有空格都是一样的。 Sentence with predicted labels: 尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O) {'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'} Sentence with predicted labels: 照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O) {'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'} Sentence with predicted labels: 关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O) {'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O) {'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'} {'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'} 这是综合4个中文数据集训练的模型的结果 颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。 主要原因是将4个中文数据集合并了,数据量增多,代码已经更新,正在上传模型 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)https://github.com/yangheng95/pyabsa/issues/27#issuecomment-854606848>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWNZFDTWARXWMBAVCNTTRCUJJANCNFSM46AW7SCQ.

就是合并所有的中文训练集和测试集作为一整个训练集和测试集,现在可以从google drive下载中文模型,读取模型之后会打印训练时的参数,其中的datasets_files就是采用的数据集

― You are receiving this because you authored the thread. Reply to this email directly, view it on GitHubhttps://github.com/yangheng95/pyabsa/issues/27#issuecomment-854627966, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWPQDEJONX3FEGBOKIDTRCY4PANCNFSM46AW7SCQ.

yangheng95 commented 3 years ago

12号后我再用新的模型验证一下,这几天出差,另外观点抽出可能模型架构要改动的,有空还请看一下,或者说当前模型架构是否支持这样的观点抽出? Get Outlook for Androidhttps://aka.ms/AAb9ysg ____ From: Tang Yong @.> Sent: Friday, June 4, 2021 7:18:13 PM To: yangheng95/pyabsa @.>; yangheng95/pyabsa @.> Cc: Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27) 好的感谢! Get Outlook for Androidhttps://aka.ms/AAb9ysg ____ From: YangHeng @.> Sent: Friday, June 4, 2021 7:17:27 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27) 合并的意思是把四个分散的数据集全部放到一个里面,只是单纯追加吗,可否详细说一下,谢谢 Get Outlook for Androidhttps://aka.ms/AAb9ysg … ____ From: YangHeng @.> Sent: Friday, June 4, 2021 6:38:12 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27>) 本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下, [image]https://user-images.githubusercontent.com/83859417/120736527-fbda2380-c51e-11eb-94b0-c30ecea42979.png 有空格和没有空格都是一样的。 Sentence with predicted labels: 尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O) {'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'} Sentence with predicted labels: 照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O) {'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'} Sentence with predicted labels: 关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O) {'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O) {'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'} {'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'} 这是综合4个中文数据集训练的模型的结果 颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。 主要原因是将4个中文数据集合并了,数据量增多,代码已经更新,正在上传模型 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)<#27 (comment)>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWNZFDTWARXWMBAVCNTTRCUJJANCNFSM46AW7SCQ. 就是合并所有的中文训练集和测试集作为一整个训练集和测试集,现在可以从google drive下载中文模型,读取模型之后会打印训练时的参数,其中的datasets_files就是采用的数据集 ― You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWPQDEJONX3FEGBOKIDTRCY4PANCNFSM46AW7SCQ.

改模型倒不是最大的问题, 问题是没有标注好opinion的数据集

LangDaoAI commented 3 years ago

数据我来提供,加入观点后标记规则是否要做修改

Get Outlook for Androidhttps://aka.ms/AAb9ysg


From: YangHeng @.> Sent: Sunday, June 6, 2021 2:59:11 PM To: yangheng95/PyABSA @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/PyABSA] 多观点的抽出是否支持? (#27)

12号后我再用新的模型验证一下,这几天出差,另外观点抽出可能模型架构要改动的,有空还请看一下,或者说当前模型架构是否支持这样的观点抽出? Get Outlook for Androidhttps://aka.ms/AAb9ysg … ____ From: Tang Yong @.> Sent: Friday, June 4, 2021 7:18:13 PM To: yangheng95/pyabsa @.>; yangheng95/pyabsa @.> Cc: Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27https://github.com/yangheng95/PyABSA/issues/27) 好的感谢! Get Outlook for Androidhttps://aka.ms/AAb9ysg ____ From: YangHeng @.> Sent: Friday, June 4, 2021 7:17:27 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27https://github.com/yangheng95/PyABSA/issues/27) 合并的意思是把四个分散的数据集全部放到一个里面,只是单纯追加吗,可否详细说一下,谢谢 Get Outlook for Androidhttps://aka.ms/AAb9ysg … ____ From: YangHeng @.> Sent: Friday, June 4, 2021 6:38:12 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27https://github.com/yangheng95/PyABSA/issues/27<#27https://github.com/yangheng95/PyABSA/issues/27>) 本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下, [image]https://user-images.githubusercontent.com/83859417/120736527-fbda2380-c51e-11eb-94b0-c30ecea42979.png 有空格和没有空格都是一样的。 Sentence with predicted labels: 尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O) {'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'} Sentence with predicted labels: 照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O) {'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'} Sentence with predicted labels: 关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O) {'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O) {'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'} {'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'} 这是综合4个中文数据集训练的模型的结果 颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。 主要原因是将4个中文数据集合并了,数据量增多,代码已经更新,正在上传模型 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27https://github.com/yangheng95/PyABSA/issues/27 (comment)<#27 (comment)https://github.com/yangheng95/PyABSA/issues/27#issuecomment-854606848>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWNZFDTWARXWMBAVCNTTRCUJJANCNFSM46AW7SCQ. 就是合并所有的中文训练集和测试集作为一整个训练集和测试集,现在可以从google drive下载中文模型,读取模型之后会打印训练时的参数,其中的datasets_files就是采用的数据集 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)https://github.com/yangheng95/PyABSA/issues/27#issuecomment-854627966>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWPQDEJONX3FEGBOKIDTRCY4PANCNFSM46AW7SCQ.

改模型倒不是最大的问题, 问题是没有标注好opinion的数据集

― You are receiving this because you authored the thread. Reply to this email directly, view it on GitHubhttps://github.com/yangheng95/PyABSA/issues/27#issuecomment-855350091, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWMACZNRK5NF6JXYGXDTRMMD7ANCNFSM46AW7SCQ.