shin-kanouchi / japanese-dialog-paper

日本語の対話関連論文読破のためのリポジトリ
1 stars 0 forks source link

[NLP2018]行政FAQページからの対話フローチャート自動生成とそれに基づく対話ボットの構築 #116

Open shin-kanouchi opened 5 years ago

shin-kanouchi commented 5 years ago

論文リンク

http://www.anlp.jp/proceedings/annual_meeting/2018/pdf_dir/D5-4.pdf

著者

○坂田亘 (京大), 柴田知秀, 黒橋禎夫 (京大/CREST)

shin-kanouchi commented 5 years ago

概要

本研究ではその端緒として、行政サービスに関する 問合せに自動的に応答する対話ボットの構築に取り組 んだ。 本研究では行政サイトのテキスト情報、主に FAQ ページを解析することで対話フローチャートを生成 し、それに基づき数往復の対話を行うシステムを構築 する。対話フローチャートは自動生成後、確認・手動 修正ができるため、自治体職員が確認を行うことで責 任をもったサービスとすることができ、不適切な対話 が行われることを防ぐこともできる。川崎市の FAQ をもとにプロトタイプシステムを構築して予備実験を 行い、最大の問題であるユーザ質問と FAQ のズレを 解消するための知識獲得等を行う。

image

システムはざっくり、以下の3つの機能を持つ

発話が来た時の対応

対話システムがユーザーからのクエリを受け付けた とき、そのクエリ文が Factoid 型対話応答、雑談応答 に登録されているクエリであればそれぞれのモジュー ルに従って対話を行う。登録されていないときは、対 話フローチャートを用いた対話応答を行う。 初期状態でユーザーからクエリを受け付けたとき、 システムは全ツリーの根ノードのマッチング文から最 も類似度の高いツリーを見つけ、その根ノードをシス テムの状態として持つ。このとき、システムは根ノー ドの対話出力文を発話する。ただし、同程度類似度の 高いツリーが複数あったときは、それらをユーザーに 提示し、「次のどちらの事でしょうか」というように 選択するように促す。

image

同義語の取得(「パスポートの取り方」↔「旅券の取り方」)

ユーザーの質問意図の推測(運動不足だ -> プールに行きたい)

  1. 行政サイトの各 FAQ ページと関連度の高い Yahoo!知恵袋の質問群を取得
  2. 取得した文書から抽象表現を抽出
    • 抽象表現を見つけるために、各種のモダリティ情報を利用
      • 「教えて下さい」など質問文に定型な表現 を含む節は重要度が低いため除く
      • モダリティ解析の結果、疑問となった節は具 体度が高いと考えられるために除く
      • 上記の条件を満たした上で、モダリティ解析 の結果「意志」である文節または「ために」 が後に続く文節を含む節を抽象表現候補とする

image

(15分)