Open ymym3412 opened 5 years ago
Platforms for Non-Speakers Annotating Names in Any Language Ying Lin,1 Cash Costello,2 Boliang Zhang,1 Di Lu,1 Heng Ji,1 James Mayfield,2 Paul McNamee
英語の話者向けの他言語のアノテーションツール
英語話者向けに特化させた他言語アノテーションツール
言語資源の乏しい言語のアノテーションはコストがかかる。 そこでromanizationを通して、各言語のデータをラテン語に変換、そこから英語に変換することで英語で資源の乏しい言語のアノテーションを行うツールを作成した。
言語資源の乏しい言語に対してツールを使用して教師データを作成し、タスクの精度を計測した
日本語のローマ字表記のようなものが他言語にもあるとは知らなかった
Out-of-the-box Universal Romanization Tool uroman Ulf Hermjakob, Jonathan May, Kevin Knight
「Out-of-the-box Universal Romanization Tool uroman」の解説
0. 論文
Platforms for Non-Speakers Annotating Names in Any Language Ying Lin,1 Cash Costello,2 Boliang Zhang,1 Di Lu,1 Heng Ji,1 James Mayfield,2 Paul McNamee
1. どんなもの?
英語の話者向けの他言語のアノテーションツール
2. 先行研究と比べてどこがすごい?
英語話者向けに特化させた他言語アノテーションツール
3. 技術や手法のキモはどこ?
言語資源の乏しい言語のアノテーションはコストがかかる。 そこでromanizationを通して、各言語のデータをラテン語に変換、そこから英語に変換することで英語で資源の乏しい言語のアノテーションを行うツールを作成した。
4. どうやって有効だと検証した?
言語資源の乏しい言語に対してツールを使用して教師データを作成し、タスクの精度を計測した
5. 議論はある?
日本語のローマ字表記のようなものが他言語にもあるとは知らなかった
6. 次に読むべき論文は?
Out-of-the-box Universal Romanization Tool uroman Ulf Hermjakob, Jonathan May, Kevin Knight