Open kennishida17 opened 1 year ago
https://paperswithcode.com/paper/aspect-based-sentiment-analysis-using-bert
Emanuel H. Silva/Institute of Mathematics and Computer Sciences, University of Sao Paulo, Brazil
2021
Sentiment analysis(意見分析)はNLPの一分野であり、テキストをネガティブ、ニュートラル、ポジティブといったカテゴリに分類するもの。ユーザがどのようにある製品、ブランド、アイデア、トピックについて感じたり考えたりすることは、企業や研究にとって貴重な情報源。
難しいのが一つの文に複数のAspectが含まれてることがある。
ABSA(Aspect-Based Sentiment Analysis)では、BERT(Bidirectional Encoder Representations from Transformers)を利用して、感情分析を行なっている。BERTはテキストの文脈を左右の両方から考慮して処理するTransformerに基づいた双方向のエンコーダ表現を探索することで、より意味的なテキスト表現を生成する。最近の研究では、ABSAのほとんどが、異なるBERT Fine-tuning戦略を探索している。
2020年に紹介されたBERTベースの言語モデルトレーニングのための新しいアーキテクチャ「Decoding-enhanced BERT with Disentangled Attention(DeBERTa)」を用いて、文書中んお単語の位置に基づく意味的な表現と、構文的な表現を分離して学習することで、意味分析におけるアスぺクトとセンチメントの相互依存性を自然に取り組むことができる。Disentangled representation learning(DRL) は、各ニューロンが他のニューロンと独立した完全な機能を学習でき、現実世界のオブジェクトを説明する因子で表現される。DRLはコンピュータビジョン分野で広く使われており、テキストデータに関しては、あまり開拓されていない。
Semevalベンチマークデータセット(Pontiki et al.、2014)を使用 このタスクには、laptopとrestaurantのレビューの2つのデータセットがある。 データセットには、ユーザがアスペクトとそれらの品質に基づいて、laptopまたはrestaurantの体験を評価する5,936サンプルと3つの感情(positive,negative,neutrul)が含まれている。
実験はトレーニングデータ80%、検証には20%を使用
-https://webbigdata.jp/post-3328/
リンク
https://paperswithcode.com/paper/aspect-based-sentiment-analysis-using-bert
著者/所属機関
Emanuel H. Silva/Institute of Mathematics and Computer Sciences, University of Sao Paulo, Brazil
投稿年
2021
概要:
【研究背景】
Sentiment analysis(意見分析)はNLPの一分野であり、テキストをネガティブ、ニュートラル、ポジティブといったカテゴリに分類するもの。ユーザがどのようにある製品、ブランド、アイデア、トピックについて感じたり考えたりすることは、企業や研究にとって貴重な情報源。
難しいのが一つの文に複数のAspectが含まれてることがある。
ABSA(Aspect-Based Sentiment Analysis)では、BERT(Bidirectional Encoder Representations from Transformers)を利用して、感情分析を行なっている。BERTはテキストの文脈を左右の両方から考慮して処理するTransformerに基づいた双方向のエンコーダ表現を探索することで、より意味的なテキスト表現を生成する。最近の研究では、ABSAのほとんどが、異なるBERT Fine-tuning戦略を探索している。
【提案手法】
2020年に紹介されたBERTベースの言語モデルトレーニングのための新しいアーキテクチャ「Decoding-enhanced BERT with Disentangled Attention(DeBERTa)」を用いて、文書中んお単語の位置に基づく意味的な表現と、構文的な表現を分離して学習することで、意味分析におけるアスぺクトとセンチメントの相互依存性を自然に取り組むことができる。Disentangled representation learning(DRL) は、各ニューロンが他のニューロンと独立した完全な機能を学習でき、現実世界のオブジェクトを説明する因子で表現される。DRLはコンピュータビジョン分野で広く使われており、テキストデータに関しては、あまり開拓されていない。
【用語メモ】
実験
データセット
Semevalベンチマークデータセット(Pontiki et al.、2014)を使用 このタスクには、laptopとrestaurantのレビューの2つのデータセットがある。 データセットには、ユーザがアスペクトとそれらの品質に基づいて、laptopまたはrestaurantの体験を評価する5,936サンプルと3つの感情(positive,negative,neutrul)が含まれている。
実験はトレーニングデータ80%、検証には20%を使用
感想
参考
-https://webbigdata.jp/post-3328/