ftnext / MLPaperSummary

論文のサマリーをIssueに蓄積(arXivTimesリスペクト)
0 stars 0 forks source link

[2010.12309] A Survey on Recent Approaches for Natural Language Processing in Low-Resource Scenarios #1

Open ftnext opened 3 years ago

ftnext commented 3 years ago

https://arxiv.org/abs/2010.12309

piqcyさんのツイートで興味を持った https://twitter.com/icoxfog417/status/1380796854783250437?s=20

時間を決めて気になるところを読んだ(なのでまとめには偏りがある)

まとめ

Low-ResourceなシナリオにおけるNLPのアプローチのサーベイ論文。

NLPにおけるlow resourceとは話者がmillionオーダーの言語らしい(ref: Figure 1。英語は1000million=1billion)

サーベイは Table 1 にまとまっている。

興味深いのは

このあたりの事例を個別に見ていきたい

Distant supervision

外部のデータを使ってラベルを追加する

自動アノテーションの例

Learning from Noisy Labels

Distant supervisionで追加されたラベルは誤りを含むのがモチベーションになっている