upura / papers

What I read
24 stars 2 forks source link

Identifying Semantically Duplicate Questions Using Data Science Approach: A Quora Case Study #147

Open upura opened 4 years ago

upura commented 4 years ago

どんなもの?

Quoraを題材とした意味的に重複する質問の特定。tf-idfによるベクトル化では、xgboostで論文中の最高性能を出している。deep learningベースと比べてもそこそこ良い性能。

https://arxiv.org/abs/2004.11694