An Empirical Study of Contextual Data Augmentation for Japanese Zero Anaphora Resolution

https://twitter.com/icoxfog417/status/1324877958692052994

省略された主語/目的語を特定するゼロ照応解析の精度を言語モデルによるData Augmentationで向上させた研究。通常tokenを入れ替えデータ量を増やすが、適切な代替tokenを発見するための言語モデル推論が重い+適切な保障がないことから、単純に[MASK]する＋入れ替える品詞を限定し速度と精度を維持 November 7, 2020

https://twitter.com/Pxx_rai/status/1324363742440611841

#coling2020 に論文が採択されました．
日本語では，正しい文法で書かれた文章（新聞など）であっても，主語や目的語が頻繁に省略されます．この論文では，省略の自動解析（ゼロ照応解析）における性能を向上させるため，言語モデルを使った既存のデータ拡張方法に改良を加えました． https://t.co/9ZlmM3AaZn pic.twitter.com/PMhPGbMgzg
— Ryuto Konno (@Pxx_rai) November 5, 2020

https://twitter.com/arxiv_cscl/status/1324179855102169088

An Empirical Study of Contextual Data Augmentation for Japanese Zero Anaphora Resolution https://arxiv.org/abs/2011.00948
— arXiv CS-CL (@arxiv_cscl) November 5, 2020

![image](https://user-images.githubusercontent.com/1615546/98459087-8bfaf900-21da-11eb-8cb5-f489665ea0f8.png)

morioka / reading

An Empirical Study of Contextual Data Augmentation for Japanese Zero Anaphora Resolution #26