Open BrambleXu opened 4 years ago
Summary:
从Wiki那里构建词典,然后和用CRF的模型进行比较。通过使用词典,精度向上了。
Resource:
Paper information:
Notes:
Wikipediaから獲得した知識とWeb文書における名詞と動詞の係り受け関係をクラスタリングした結果による知識を使って固有表現認識をしている論文。Wikipediaの辞書を使うと、F1で0.5くらい上がる。クラスタリングで作成した辞書を使うと、0.8くらい上がる。
クラス数3000くらい。手法的にはWikipediaの一文目からその上位語を抽出して使っている。複数マッチした場合、最左最長一致を用いている。分類器にはCRFを使用。Wikipediaの辞書は50万弱。カバレッジ的には50%くらい。
Model Graph:
Result::
Thoughts:
Next Reading:
Summary:
从Wiki那里构建词典,然后和用CRF的模型进行比较。通过使用词典,精度向上了。
Resource:
Paper information:
Notes:
Wikipediaから獲得した知識とWeb文書における名詞と動詞の係り受け関係をクラスタリングした結果による知識を使って固有表現認識をしている論文。Wikipediaの辞書を使うと、F1で0.5くらい上がる。クラスタリングで作成した辞書を使うと、0.8くらい上がる。
クラス数3000くらい。手法的にはWikipediaの一文目からその上位語を抽出して使っている。複数マッチした場合、最左最長一致を用いている。分類器にはCRFを使用。Wikipediaの辞書は50万弱。カバレッジ的には50%くらい。
Model Graph:
Result::
Thoughts:
Next Reading: