himkt / survey

3 stars 0 forks source link

[Reading] Neural Cross-Lingual Named Entity Recognition with Minimal Resources #31

Open himkt opened 4 years ago

himkt commented 4 years ago

Neural Cross-Lingual Named Entity Recognition with Minimal Resources

altescy commented 4 years ago

一言でいうと

単語埋め込みのアライメントを利用したzero-shot cross-lingual NERモデルの提案

概要

cross-lingual NERでは,単語翻訳を行い文字レベルの情報を利用することで効率的に学習することができる(らしい). 辞書を用いた単語単位の翻訳には大規模な辞書情報を必要とするが,単語埋め込みを利用する教師なし・弱教師有りの翻訳を用いることでパラレルコーパスの少ない言語においても単語翻訳を実現できる. 単語埋め込み→アライメント→単語翻訳→ソースのコーパスでモデルを学習→zero-shot

貢献

手法

self-attentive_Bi-LSTM-CRF

以下の手順で学習:

  1. 単一言語コーパスで単語埋め込みを学習
  2. 教師有り・辞書を使った弱教師有り学習でソース・ターゲットの単語アライメント
  3. 埋め込みの最近傍に基づくソース→ターゲットの単語翻訳
  4. 翻訳した単語と埋め込みで上のモデルを学習

結果

Screenshot from 2019-09-15 15-41-10

コメント