cl-tohoku / showcase_miyawaki

0 stars 1 forks source link

A Discriminative Approach to Japanese Zero Anaphora Resolution with Large-scale Lexicalized Case Frames #4

Closed smiyawaki0820 closed 4 years ago

smiyawaki0820 commented 4 years ago

1. どんなもの?

(タスク) 述語項構造解析

(手法)

モデルの提案というよりは,素性を増やした

2. 先行研究と比べてどこがすごい?

先行研究:Sasano and Kurohashi, 2006

語彙的選好(格フレーム)を用いた ZAR の確率モデル

  1. 対象述語の格フレームを一つ選択
  2. dep 関係にある談話要素を格フレームのスロットと対応づける
  3. 対応しない格と,dep 関係にない談話要素との対応付けを ZAR として候補を生成

(識別モデルに基づく対応付けの評価)

提案手法

(識別モデルに基づく対応付けの評価)

重み Λ の線形層にかけられた,encoder F から出力されるベクトル F(•) に対して,
全ての取りうる cf, a に対して softmax 的なことを考える.

3. 技術や手法のキモはどこ?

4. どうやって有効だと検証した?

5. 議論はある?

6. 次に読むべき論文は?

smiyawaki0820 commented 4 years ago

paper

abstract

bib

@inproceedings{sasano-kurohashi-2011-discriminative, author = {Sasano, Ryohei and Kurohashi, Sadao}, title = {A Discriminative Approach to {J}apanese Zero Anaphora Resolution with Large-scale Lexicalized Case Frames}, booktitle = {Proceedings of 5th International Joint Conference on Natural Language Processing}, year = {2011}, url = {https://www.aclweb.org/anthology/I11-1085}, pages = {758--766}, }

smiyawaki0820 commented 4 years ago

Introduction

構文的選好 (syntactic)

語彙的選好 (semantic)

[Sasano and Kurohashi, 2006]

In This Paper

大規模格フレームに基づくゼロ照応解析を対数線形モデルを使ってモデル化

smiyawaki0820 commented 4 years ago

ベースライン

A Fully-Lexicalized Probabilistic Model for Ja ZAR Sasano and Kurohashi, 2006 (ACL)

[問題点]

smiyawaki0820 commented 4 years ago

Related Work

格フレーム構築

Seki et al., 2002 (COLING)

Kawahara and Kurohashi, 2004

Iida et al., 2007

Taira et al., 2008 (EMNLP)

Imamura et al., 2009 (ACL)

吉川 et al., 2010 (NLP)

Ferrandez and Peral, 2000 (ACL)

Zhao.19

Kong.9

smiyawaki0820 commented 4 years ago

大規模格フレームと用例の汎化

格フレームの用例汎化

smiyawaki0820 commented 4 years ago

識別モデルに基づく ZAR

提案モデル概要

候補ごとの確率的評価方法を除き,Sasano らと同様の手順で行う.

  1. 形態素解析,NER,構文解析
  2. 共参照解析による,テキスト中に出現した談話要素の認識
  3. 入力一文ごと,文末述語から順に,格フレームと談話要素の対応づけ候補を生成(対応づけは PAS 全体で評価する)
    • 対象述語の格フレームを一つ選択
    • dep 関係にある談話要素を,格フレームのスロットと対応づける
    • これら対応づけ候補に対し,対応づけられなかった格と,dep 関係にない談話要素と対応づけを行うことで,ZAR を考慮した対応づけ候補を生成

例:息子は悪戯が好きで私も(φni)手を焼いている.

識別モデルに基づく対応づけの評価

(既存)

(提案)

重み Λ の線形層にかけられた,encoder F から出力されるベクトル F(•) に対して,
全ての取りうる cf, a に対して softmax 的なことを考える.

パラメータ推定

スクリーンショット 2020-02-01 15 16 20
smiyawaki0820 commented 4 years ago

softmax 関数

スクリーンショット 2020-02-01 14 56 17
smiyawaki0820 commented 4 years ago

使用する素性

語彙的選好性を反映する素性

汎化用例 PMI = {意味クラス, カテゴリ, 固有表現} PMI

以下 PMI : 先行詞がどれくらい対象格スロットに対応づけられやすいかどうかを表す(大規模格フレームより計算)→ Sasano らが考慮できなかった互いに重なりを持つ素性

dep と格スロットとの対応の確からしさを,構文・格解析の統合的モデル(河原 and 黒橋, 2007)に基づき,述語一つに対して計算する

スクリーンショット 2020-02-01 15 28 35

格の対応関係生成確率:

スクリーンショット 2020-02-01 15 36 29 スクリーンショット 2020-02-01 15 40 07
焼く 省略格 用例(頻度) 埋まりやすさ したがって
焼く(1) おやつ: 35, - 埋まりにくい 単に考慮されてない
焼く(3) CD: 3106. - 埋まりやすい zero として省略されている

対象格が zero として先行詞と対応づけられた場合

対象格が zero として先行詞と対応づけられなかった場合

smiyawaki0820 commented 4 years ago

使用する素性

構文的・談話的選好性を反映する素性(二値表現)

以下のルールで顕現性を近似計算(1 以上であれば 1 とする二値)

他?

対象の格が対応付けられたかどうか

smiyawaki0820 commented 4 years ago

実験

実験

結果

スクリーンショット 2020-02-01 16 43 15

素性の ablation

スクリーンショット 2020-02-01 16 45 11

各素性に対して学習された重み

スクリーンショット 2020-02-01 16 49 15