tm4roon / survey

Survey on machine learning.
14 stars 1 forks source link

Automatic Assessment of Absolute Sentence Complexity #45

Open tm4roon opened 5 years ago

tm4roon commented 5 years ago

Automatic Assessment of Absolute Sentence Complexity

文の難易度推定を行うためのデータセット(文難易度:5段階評価)と、教師なしの難易度推定器を構築した。教師なしの難易度推定器では、(unigram, bigram, trigram)が出現する(各レベルのおける相対度数, 最も高い難易度, 最も低い難易度)の組み合わせにおいて、以下の8種類の特徴量を利用。また、文長も特徴量として加え、合計で73種類の特徴量を用いて、Random Forestにより難易度の推定を行う。結果として、教師ありの難易度推定手法を上回る結果を達成。また、人手評価と相関のある57種類のみで、73種類使用した場合と同等程度の性能を達成できることを示した。

* PCL: Phrase Complexity Level

文献情報