Open osuossu8 opened 4 years ago
senti bert のアーキテクチャ
モジュール i : BERT エンコーダ (バックボーン)
モジュール i i : Attention 機構に基づく意味合成モジュール
モジュール i i i : フレーズレベルのセンチメント予測器
loss 関数はクロスエントロピー関数
課題 "Frenetic but not really funny. "
先行研究
提案手法
フレーズ単位でのセンチメントラベルの教師データを得るのは高価なので、あるタスクから学習した構成的センチメントセマンティクスが他のタスクに移行できるかどうかをさらに調査
関連研究
センチメント分析のセンチメント分類器の構築
事前学習済み言語モデル
構成的意味論
Attention to tokens
Attention to Children
実験
SSTデータセット上でSentiBERTを評価 (有効性と移植性)
SST-phraseは、2値構成要素ツリー上の全フレーズのセンチメントを予測する5クラス分類タスク
マスキング機構は
下流タスクの finetune は
文レベルのセンチメントと感情分類タスクでは、[CLS] トークンを対象とするのではなく、ツリーのルートを正しくラベル付けすることが目的であることに注意
論文リンク
https://arxiv.org/abs/2005.04114
公開日(yyyy/mm/dd)
2020/05/08
概要
構成的なセンチメントセマンティクスを効果的に捕捉するBERTの変種である SentiBERT を提案
文脈化された表現と二値構成要素の構文解析木を組み合わせて、意味的な構成を捉える
フレーズレベルのセンチメント分類において競争力のある性能を達成していることを実証
SST上のフレーズレベルのアノテーションから学習した文意構成が、他の文意分析タスクや感情分類タスクなどの関連タスクにも適用可能であることを示した
ベースラインアプローチよりも否定と対比関係の捕捉に優れている
有効性と移植性
公式実装
(20200523 時点では not available ...) https://github.com/WadeYin9712/SentiBERT