BrambleXu / knowledge-graph-learning

A curated list of awesome knowledge graph tutorials, projects and communities.
MIT License
736 stars 120 forks source link

NLP-2008-Web上の資源から構築した複数の固有表現辞書を用いた日本語固有表現認識 #271

Open BrambleXu opened 4 years ago

BrambleXu commented 4 years ago

Summary:

从Wiki那里构建词典,然后和用CRF的模型进行比较。通过使用词典,精度向上了。

Resource:

Paper information:

Notes:

Wikipediaから獲得した知識とWeb文書における名詞と動詞の係り受け関係をクラスタリングした結果による知識を使って固有表現認識をしている論文。Wikipediaの辞書を使うと、F1で0.5くらい上がる。クラスタリングで作成した辞書を使うと、0.8くらい上がる。

クラス数3000くらい。手法的にはWikipediaの一文目からその上位語を抽出して使っている。複数マッチした場合、最左最長一致を用いている。分類器にはCRFを使用。Wikipediaの辞書は50万弱。カバレッジ的には50%くらい。

Model Graph:

Result:

Thoughts:

Next Reading: