Open shin-kanouchi opened 5 years ago
ユーザの質問文を形態素解析器で分かち書きした単語及び単語分散表現を用い,SVM で判定を行うことで応答可能性を判定する機能を提案し,判定精度を検証した.
Sudachi の分割モード B/C を利用した場合に適合率が高いが,これは単語の分割単位が長いために,特徴的な単語が抽出できたためであると考えられる.単語分散表現を利用した場合に再現率が高いが,これは単語分散表現により,同義語などの言い換え表現が評価対象となっているためであると考えられる.
評価実験には,年末調整についての想定質問と応答文のセット 90 件,評価用のユーザの質問文 51 件,ユーザの質問文に対する検索結果として得られた想定質問が適切であるか否かについて,ユーザの質問文が想定質問と合致しているか否かで判断し,応答可否 (1:可,0:否) を付与したものを実験データ (表 1) とする.
論文リンク
http://www.anlp.jp/proceedings/annual_meeting/2018/pdf_dir/A4-3.pdf
著者
○谷岡広樹 (徳島大), 中谷良平, 与儀涼子, 内田佳孝 (ワークス)