kacky24 / papers

my publications and short summaries of papers I have read
3 stars 1 forks source link

Named Entity Recognition With Parallel Recurrent Neural Networks #45

Open kacky24 opened 5 years ago

kacky24 commented 5 years ago

short summary

NERにおいて、1つの大きなLSTMを使うのではなく、複数のLSTMを使って、各出力をconcatし、fc層、softmaxに通すことで予測を行うモデルの提案。パラメータ数を削減しつつ、SOTAレベルの精度。

工夫として、各LSTMの以下の図のWcが、

2019-01-20 21 11 39

互いに直行するように制約をかけることで各LSTMが多様な出力をするようにしている。

2019-01-20 21 12 51

のだが、vecあたりの操作がよくわからない。 (LSTMのパラメータWcをベクトル化しているという理解であっているならどういう操作しているのか)

author

Andrej Zukov-Gregori ˇ cˇ ‡ , Yoram Bachrach† , and Sam Coope DigitalGenius, 1 Canada Square, London E14 5AB ‡Department of Computer Science, Royal Holloway, University of London, Egham TW20 0EX andrej.zukovgregoric.2010@live.rhul.ac.uk yorambac@gmail.com sam@digitalgenius.com

URL

http://aclweb.org/anthology/P18-2012

year

ACL2018(short)