Open ss1357 opened 5 years ago
機械翻訳のencoder-decoderモデルはend2endによってソースとターゲットの言語知識を学習している. この機械翻訳の精度を上げるために言語の構造をマルチタスクラーニングで学習しつつ,翻訳するようなモデルを提案する. そのモデルを用いて,マルチタスクラーニングの学習スケジュールを工夫することによって,大きなコーパスでも,小さなコーパスでもBLEUを上げることに成功した. マルチタスク学習のスケジューリングが精度に影響を及ぼすことを示した.
Eliyahu Kiperwasser Miguel Ballesteros(IBM Research)
TACL2018 https://arxiv.org/pdf/1804.08915.pdf
1.通常のエンコーダと以下のようなデコーダで構成したseq2seqを構築.参考にしているのはAmmar et al. (2016)で,特別なタスク埋め込みベクトルをターゲットに付与することによって,複数のタスクを同時に学習する. 2.入力は文だが,出力が自然な文ではないPOStaggingやUnlabeled Dependency Parsing,Predicting Dependency Relations-Labeled De- pendency Parsingの出力が文になるように定義し直す.だいたい,ラベルの系列を出力文とみなしていく.例は以下.
POSとParsingのデータは共通で,大きめの翻訳コーパスと小さめの翻訳コーパスで実験している
小さめだとすごくよく効く
スケジューラのパラメータチューニングも行なっている
マルチタスク学習のスケジューリングが精度に影響を及ぼすことがわかったので,今回提案したスケジューラ以外にもより多くのスケジューラを考えていきたい.
概要
機械翻訳のencoder-decoderモデルはend2endによってソースとターゲットの言語知識を学習している. この機械翻訳の精度を上げるために言語の構造をマルチタスクラーニングで学習しつつ,翻訳するようなモデルを提案する. そのモデルを用いて,マルチタスクラーニングの学習スケジュールを工夫することによって,大きなコーパスでも,小さなコーパスでもBLEUを上げることに成功した. マルチタスク学習のスケジューリングが精度に影響を及ぼすことを示した.
著者
Eliyahu Kiperwasser Miguel Ballesteros(IBM Research)
リンク
TACL2018 https://arxiv.org/pdf/1804.08915.pdf
手法
1.通常のエンコーダと以下のようなデコーダで構成したseq2seqを構築.参考にしているのはAmmar et al. (2016)で,特別なタスク埋め込みベクトルをターゲットに付与することによって,複数のタスクを同時に学習する. 2.入力は文だが,出力が自然な文ではないPOStaggingやUnlabeled Dependency Parsing,Predicting Dependency Relations-Labeled De- pendency Parsingの出力が文になるように定義し直す.だいたい,ラベルの系列を出力文とみなしていく.例は以下.
実験
POSとParsingのデータは共通で,大きめの翻訳コーパスと小さめの翻訳コーパスで実験している
小さめだとすごくよく効く
スケジューラのパラメータチューニングも行なっている
Future work
マルチタスク学習のスケジューリングが精度に影響を及ぼすことがわかったので,今回提案したスケジューラ以外にもより多くのスケジューラを考えていきたい.