Open morioka opened 3 years ago
https://twitter.com/icoxfog417/status/1324877958692052994
省略された主語/目的語を特定するゼロ照応解析の精度を言語モデルによるData Augmentationで向上させた研究。通常tokenを入れ替えデータ量を増やすが、適切な代替tokenを発見するための言語モデル推論が重い+適切な保障がないことから、単純に[MASK]する+入れ替える品詞を限定し速度と精度を維持 November 7, 2020
#coling2020 に論文が採択されました.日本語では,正しい文法で書かれた文章(新聞など)であっても,主語や目的語が頻繁に省略されます.この論文では,省略の自動解析(ゼロ照応解析)における性能を向上させるため,言語モデルを使った既存のデータ拡張方法に改良を加えました. https://t.co/9ZlmM3AaZn pic.twitter.com/PMhPGbMgzg— Ryuto Konno (@Pxx_rai) November 5, 2020
#coling2020 に論文が採択されました.日本語では,正しい文法で書かれた文章(新聞など)であっても,主語や目的語が頻繁に省略されます.この論文では,省略の自動解析(ゼロ照応解析)における性能を向上させるため,言語モデルを使った既存のデータ拡張方法に改良を加えました. https://t.co/9ZlmM3AaZn pic.twitter.com/PMhPGbMgzg
An Empirical Study of Contextual Data Augmentation for Japanese Zero Anaphora Resolution https://arxiv.org/abs/2011.00948— arXiv CS-CL (@arxiv_cscl) November 5, 2020
An Empirical Study of Contextual Data Augmentation for Japanese Zero Anaphora Resolution https://arxiv.org/abs/2011.00948
https://twitter.com/icoxfog417/status/1324877958692052994
https://twitter.com/Pxx_rai/status/1324363742440611841 https://twitter.com/arxiv_cscl/status/1324179855102169088 ![image](https://user-images.githubusercontent.com/1615546/98459087-8bfaf900-21da-11eb-8cb5-f489665ea0f8.png)