Open oratosa opened 4 years ago
論文タイトル T2KG: An End-to-End System for creating Knowledge Graph from Unstructured Text(AAAI’17)
著者(所属) Kertkeidkachorn, Natthawut, and Ryutaro Ichise
論文PDF/ランディングページへのリンク https://aaai.org/ocs/index.php/WS/AAAIW17/paper/view/15129/14743
論文まとめ(落合フォーマット準拠)
どんなもの(どんな問題を解きたい)? テキストデータ からの情報抽出から知識グラフの構築までを一貫したい
先行研究と比べてどこがすごい? 抽出された述語を,既存のKGの述語にマッピングするというモジュールを含めたフレームワークであること
技術や手法のキモはどこ? ルールベースの述語マッピングに加えて,ベクトル表現した述語の類似度によるマッピングの手法を加えていること.これによって,Open-domainからの知識のスパースな性質に対応した
どうやって有効だと検証した?
述語マッピングの評価:DBpediaの述語にマッピングされた300個の抽出されたトリプルを正解データとして,ルールベースの述語マッピングと提案手法の述語マッピングの精度をPrecision, Recall, F1スコアで評価し,Recall,F1スコアで優れていることを確認した
知識グラフ構築の評価:100個の文から手作業でトリプルを抽出し,DBpediaとマッピングしたものを正解データとし,ルールベースの述語マッピングのみのシステムと提案手法の精度をPrecision, Recall, F1スコアで評価.全ての指標においてベースラインを上回った(が,2pt~4ptほどで,50%程度の精度)
議論はある? エラー(正解データとは異なるトリプル)の原因を調べると,原因の35%がtriple抽出に関するものだった. 特に複雑な文で抽出精度が低い
次に読むべき論文は? Exner, Peter, and Pierre Nugues. "Entity Extraction: From Unstructured Text to DBpedia RDF triples." WoLE@ ISWC. 2012.
論文タイトル T2KG: An End-to-End System for creating Knowledge Graph from Unstructured Text(AAAI’17)
著者(所属) Kertkeidkachorn, Natthawut, and Ryutaro Ichise
論文PDF/ランディングページへのリンク https://aaai.org/ocs/index.php/WS/AAAIW17/paper/view/15129/14743
論文まとめ(落合フォーマット準拠)
どんなもの(どんな問題を解きたい)? テキストデータ からの情報抽出から知識グラフの構築までを一貫したい
先行研究と比べてどこがすごい? 抽出された述語を,既存のKGの述語にマッピングするというモジュールを含めたフレームワークであること
技術や手法のキモはどこ? ルールベースの述語マッピングに加えて,ベクトル表現した述語の類似度によるマッピングの手法を加えていること.これによって,Open-domainからの知識のスパースな性質に対応した
どうやって有効だと検証した?
述語マッピングの評価:DBpediaの述語にマッピングされた300個の抽出されたトリプルを正解データとして,ルールベースの述語マッピングと提案手法の述語マッピングの精度をPrecision, Recall, F1スコアで評価し,Recall,F1スコアで優れていることを確認した
知識グラフ構築の評価:100個の文から手作業でトリプルを抽出し,DBpediaとマッピングしたものを正解データとし,ルールベースの述語マッピングのみのシステムと提案手法の精度をPrecision, Recall, F1スコアで評価.全ての指標においてベースラインを上回った(が,2pt~4ptほどで,50%程度の精度)
議論はある? エラー(正解データとは異なるトリプル)の原因を調べると,原因の35%がtriple抽出に関するものだった. 特に複雑な文で抽出精度が低い
次に読むべき論文は? Exner, Peter, and Pierre Nugues. "Entity Extraction: From Unstructured Text to DBpedia RDF triples." WoLE@ ISWC. 2012.