LearningWord Meta-Embeddings by Autoencoding

一言で言うと

手法やコーパスの違う事前学習した単語分散表現を組み合わせることでいい分散表現を生成

論文リンク

http://aclweb.org/anthology/C18-1140

著者/所属機関

Cong Bao and Danushka Bollegala Department of Computer Science University of Liverpool

投稿日付(yyyy/MM/dd)

2018/

概要

単語分散表現はword2vec等の手法によって大規模コーパスから事前学習される。手法、コーパスによって分散表現に含まれる情報が異なるので、それらの情報を共有する分散表現(meta-embedding)を作りたい meta-embeddingを作ることで既存の分散表現より性能向上オートエンコーダーを利用することで既存のmeta-embeddingより性能向上