DaikiTanak / MLPapers

0 stars 0 forks source link

EFFICIENT VECTOR REPRESENTATION FOR DOCUMENTS THROUGH CORRUPTION #9

Open DaikiTanak opened 4 years ago

DaikiTanak commented 4 years ago

Doc2VecC

publication

ICLR 2017

link

https://openreview.net/pdf?id=B1Igu2ogg

problem

unsupervised document embedding

method

スクリーンショット 2020-06-15 15 07 46

Paragraph vectorでは文書IDから文書埋め込みをlookup-tableによって作成していたが、Doc2VecCでは文書の中からランダムに単語をサンプリングし、それらの単語埋め込み平均をglobal contextとして扱う。

experiment

down stream taskにおいてParagraph vectorや重み付きw2vよりも高精度を達成した。