Open oratosa opened 4 years ago
論文タイトル Document Retrieval Model Through Semantic Linking (WSDM'17)
著者(所属) Faezeh Ensan, Ebrahim Bagheri.
論文PDF/ランディングページへのリンク https://dl.acm.org/doi/pdf/10.1145/3018661.3018692
論文まとめ(落合フォーマット準拠)
どんなもの(どんな問題を解きたい)? Document retrievalに関する研究で,ドキュメントとクエリの意味的な関連性の導出手法を提案している.
先行研究と比べてどこがすごい? ドキュメントが与えられた時のクエリの発生確率をbag-of-wordsモデルで考える研究に対して,entity-linkingを通じて得られるコンセプトの関係性でドキュメントとクエリの関係性を検討していることが新しい.
技術や手法のキモはどこ? コアとなるアイデアは,ドキュメントのコンセプトとそれらコンセプト間の関係性を与えられた条件として,クエリ内に観察されるコンセプトの条件付き発生確率を見つけること,である.ここで,コンセプトはEntity linkingを通じて得るものとする. CRF(Conditional Random Fields)のようなモデル(ノードがコンセプト,エッジが関係性)で,コンセプト間の依存関係を考える. この手法により算出されるScoreは他のScoreに内挿することで,精度の向上に寄与する(したがって,実験でもベースライン手法に提案手法を内挿した結果を比較評価している)
どうやって有効だと検証した? データセット:Robust04, FACCI-09, ClueWeb09-B, ClueWeb12-B クエリ:各データセットのトピックのTitle Field 評価指標:Mean Average Precision,Precision@20,nDCG@20 ベースライン:Sequential Dependence Model(SDM),Relevance Model(RM3),Entity Query Feature Query Expansion(EQFE) 結果:MAPでSDM+SELM(提案手法)がSDM単体より,+9.2%の精度向上を主張しているが,MAP自体の値は0.2615->0.2858の変化で,実用上,効果があるといえるのかよくわからない.
議論はある? クエリ意図の分析によって提案手法の精度向上,など
次に読むべき論文は? ベースライン(SDM,EQFE)はどの論文でも出てくる印象.
Fielded Sequential Dependence Model for Ad-Hoc Entity Retrieval in the Web of Data, Nikita Zhiltsov, Alexander Kotov, Fedor Nikolaev., SIGIR '15.
Entity query feature expansion using knowledge base links. Jeffrey Stephen Dalton, Laura Dietz, James Allan., SIGIR '14.
論文タイトル Document Retrieval Model Through Semantic Linking (WSDM'17)
著者(所属) Faezeh Ensan, Ebrahim Bagheri.
論文PDF/ランディングページへのリンク https://dl.acm.org/doi/pdf/10.1145/3018661.3018692
論文まとめ(落合フォーマット準拠)
どんなもの(どんな問題を解きたい)? Document retrievalに関する研究で,ドキュメントとクエリの意味的な関連性の導出手法を提案している.
先行研究と比べてどこがすごい? ドキュメントが与えられた時のクエリの発生確率をbag-of-wordsモデルで考える研究に対して,entity-linkingを通じて得られるコンセプトの関係性でドキュメントとクエリの関係性を検討していることが新しい.
技術や手法のキモはどこ? コアとなるアイデアは,ドキュメントのコンセプトとそれらコンセプト間の関係性を与えられた条件として,クエリ内に観察されるコンセプトの条件付き発生確率を見つけること,である.ここで,コンセプトはEntity linkingを通じて得るものとする. CRF(Conditional Random Fields)のようなモデル(ノードがコンセプト,エッジが関係性)で,コンセプト間の依存関係を考える. この手法により算出されるScoreは他のScoreに内挿することで,精度の向上に寄与する(したがって,実験でもベースライン手法に提案手法を内挿した結果を比較評価している)
どうやって有効だと検証した? データセット:Robust04, FACCI-09, ClueWeb09-B, ClueWeb12-B クエリ:各データセットのトピックのTitle Field 評価指標:Mean Average Precision,Precision@20,nDCG@20 ベースライン:Sequential Dependence Model(SDM),Relevance Model(RM3),Entity Query Feature Query Expansion(EQFE) 結果:MAPでSDM+SELM(提案手法)がSDM単体より,+9.2%の精度向上を主張しているが,MAP自体の値は0.2615->0.2858の変化で,実用上,効果があるといえるのかよくわからない.
議論はある? クエリ意図の分析によって提案手法の精度向上,など
次に読むべき論文は? ベースライン(SDM,EQFE)はどの論文でも出てくる印象.
Fielded Sequential Dependence Model for Ad-Hoc Entity Retrieval in the Web of Data, Nikita Zhiltsov, Alexander Kotov, Fedor Nikolaev., SIGIR '15.
Entity query feature expansion using knowledge base links. Jeffrey Stephen Dalton, Laura Dietz, James Allan., SIGIR '14.