Open AkihikoWatanabe opened 6 years ago
PageRankベースの手法で、キーワード抽出/文書要約 を行う手法。 キーワード抽出/文書要約 を行う際には、ノードをそれぞれ 単語/文 で表現する。 ノードで表現されている 単語/文 のsimilarityを測り、ノード間のedgeの重みとすることでAffinity Graphを構築。 あとは構築したAffinity Graphに対してPageRankを適用して、ノードの重要度を求める。 ノードの重要度に従いGreedyに 単語/文 を抽出すれば、キーワード抽出/文書要約 を行うことができる。
単一文書要約のベースラインとして使える。
gensimに実装がある。 個人的にも実装している:https://github.com/AkihikoWatanabe/textrank
https://web.eecs.umich.edu/~mihalcea/papers/mihalcea.emnlp04.pdf