Closed smiyawaki0820 closed 4 years ago
@inproceedings{sasano-kurohashi-2011-discriminative, author = {Sasano, Ryohei and Kurohashi, Sadao}, title = {A Discriminative Approach to {J}apanese Zero Anaphora Resolution with Large-scale Lexicalized Case Frames}, booktitle = {Proceedings of 5th International Joint Conference on Natural Language Processing}, year = {2011}, url = {https://www.aclweb.org/anthology/I11-1085}, pages = {758--766}, }
構文的選好 (syntactic)
語彙的選好 (semantic)
[Sasano and Kurohashi, 2006]
大規模格フレームに基づくゼロ照応解析を対数線形モデルを使ってモデル化
A Fully-Lexicalized Probabilistic Model for Ja ZAR Sasano and Kurohashi, 2006 (ACL)
[問題点]
Ferrandez and Peral, 2000 (ACL)
Zhao.19
Kong.9
CL:32 子供(0.974),幼児(0.738),...
候補ごとの確率的評価方法を除き,Sasano らと同様の手順で行う.
例:息子は悪戯が好きで私も(φni)手を焼いている.
「焼く」に対して格フレームを選択
dep である「私・手」を評価スコアを元に格フレームと対応づける(足切りも行う)
dep 以外の項から,未選択の二格に対して対応づけを行う
対応付けにおける確率的評価が最も高い 5番 を PAS として出力する
(既存)
(提案)
入力文 t, 対象述語 p が与えられたときの,格フレーム cf ,格フレームと談話要素の対応付け a の条件付き確率を求める
以下の対数線形モデルで表現する
F(素性関数で構成されるベクトル),Λ(素性関数に関する重み),C(p,t)(p の格フレーム cf'と,cf' と談話要素との対応関係 a' を返す)
重み Λ の線形層にかけられた,encoder F から出力されるベクトル F(•) に対して,
全ての取りうる cf, a に対して softmax 的なことを考える.
セット数 N の (a, p, t) からなるインスタンス
事後確率を最大とするような格フレーム cf とパラメータ Λ の組み合わせを求める
CF(各インスタンスの取りうる格フレームの組み合わせ)
softmax 関数
汎化用例 PMI = {意味クラス, カテゴリ, 固有表現} PMI
以下 PMI : 先行詞がどれくらい対象格スロットに対応づけられやすいかどうかを表す(大規模格フレームより計算)→ Sasano らが考慮できなかった互いに重なりを持つ素性
dep と格スロットとの対応の確からしさを,構文・格解析の統合的モデル(河原 and 黒橋, 2007)に基づき,述語一つに対して計算する
格の対応関係生成確率:
(第一項)(格フレームから計算)
(第二項)表層格生成確率(PAS が付与されたコーパスから計算)
用例 PMI
ある格スロットにどのくらい先行詞が入りやすいか
対象の格スロットと先行詞候補の PMI
log{ P(子供| cf: 焼く(2), 二格) / P(子供) }
意味クラス PMI
対象格フレームの意味クラスと,先行詞候補の意味クラスとの PMI
log{ P(CL-32| cf: 焼く(2), 二格) / P(CL-32) }
カテゴリ PMI
対象格スロットのカテゴリ情報と,先行詞候補のカテゴリ情報との PMI(先行詞候補にカテゴリが付与されている場合)
log{ P(CT-人| cf: 焼く(2), 二格) / P(CT-人) }
固有表現 PMI
対象格スロットの NEと,先行詞候補のNE との PMI(先行詞候補が NE である場合)
log{ P(NE-人| cf: 焼く(2), 二格) / P(NE-人) }
対象格の埋まりやすさ
格フレームのそれぞれの格の埋まりやすさは,その格が明示されていない場合に,zero なのか,単にその格が考慮されていないかの手がかりとなる
焼く | 省略格 | 用例(頻度) | 埋まりやすさ | したがって |
---|---|---|---|---|
焼く(1) | ニ | おやつ: 35, - | 埋まりにくい | 単に考慮されてない |
焼く(3) | ニ | CD: 3106. - | 埋まりやすい | zero として省略されている |
対象格が zero として先行詞と対応づけられた場合
対象格が zero として先行詞と対応づけられなかった場合
先行詞の出現格と位置に関する素性
85 (64+21) 次元の二値ベクトル(対応すれば 1)
先行詞の顕現性に関する素性
談話要素の顕現性は照応関係を解く上で有力な手がかりとなる(Lappin and Leass, 1994 ; Mitkov et al., 2002)
以下のルールで顕現性を近似計算(1 以上であれば 1 とする二値)
対象の格が対応付けられたかどうか
実験
素性の ablation
各素性に対して学習された重み
1. どんなもの?
(タスク) 述語項構造解析
(手法)
モデルの提案というよりは,素性を増やした
2. 先行研究と比べてどこがすごい?
先行研究:Sasano and Kurohashi, 2006
語彙的選好(格フレーム)を用いた ZAR の確率モデル
(識別モデルに基づく対応付けの評価)
提案手法
(識別モデルに基づく対応付けの評価)
3. 技術や手法のキモはどこ?
4. どうやって有効だと検証した?
5. 議論はある?
6. 次に読むべき論文は?