Open himkt opened 4 years ago
中国語で単語分割タスクからNERへの敵対的転移学習の手法を提案し,SOTAを達成した.
中国語のNERデータセットは小規模なものしかない(Weibo NER: 1.3k, Sighan2006 NER: 45k). 一方で単語分割のデータセットは比較的多く存在する(MSR: 87k). 単語の分割とNEの境界は共通している場合が多いため,タスク同士で情報を共有してNERの学習を効率的に行う. タスク間で情報を共有する一方で,各タスクに特有な特徴を捉えるための配慮もしている.
Adversarial Transfer Learning for Chinese Named Entity Recognition with Self-Attention Mechanism