magicpieh28 / Paper-Summary

1 stars 0 forks source link

How Transferable are Neural Networks in NLP Applications?(2016) #26

Open magicpieh28 opened 5 years ago

magicpieh28 commented 5 years ago

about this paper

Author: Lili Mou, Zhao Meng, Rui Yan, Ge Li, Yan Xu, Lu Zhang, Zhi Jin Link: https://www.aclweb.org/anthology/D16-1046

experiments

transfer methods

results

즉, INIT에서 특히 IMDB -> MR과 같은 감정 분류 태스크에서는 엠베딩과 은닉층 두 개가 중요한 역할을 했다. MULT에서 엠베딩은 전이가능성을 관측할 수 있는 파라메터일 뿐이다. 또한 정보를 전이하는 최적의 타이밍은 S를 꽤 적은 epoch일 때였다. 다시 말해, 정확도(accuracy)의 증가 속도가 더뎌질 때 전이하는 것이 가장 좋았다. 학습률에 관해서는 0.3과 같이 학습률이 큰 경우 정확도는 급격하게 좋아졌고 꽤 빠른 epoch에서 정점을 찍었다. 특히 INIT에서 커다란 학습률은 전이된 지식을 손상시키지 않았지만 훈련 절차를 급발진 시켰다. INIT+MULT는 딱히 더 좋아지거나 하는 일은 없었다.

code

https://sites.google.com/site/transfernlp/