shin-kanouchi / japanese-dialog-paper

日本語の対話関連論文読破のためのリポジトリ
1 stars 0 forks source link

[NLP2011]WWWテキストのみを用いたオープンドメイン質問応答用音声認識言語モデル #271

Open shin-kanouchi opened 5 years ago

shin-kanouchi commented 5 years ago

論文リンク

http://www.anlp.jp/proceedings/annual_meeting/2011/pdf_dir/D1-2.pdf

著者

○Varga, Istvan, 大竹清敬, 鳥澤健太郎, De Saeger, Stijn, 松田繁樹, 林輝昭 (NICT)

shin-kanouchi commented 5 years ago

概要

本論文では、オープンドメインな音声質問応答システ ムで用いる音声認識言語モデルを WWW テキストのみ から作成する方法を提案する。ヒューリスティックスに よる文選択や、WWW 上の情報を元に自動生成した質 問文やフレーズ等を加える事を試みた。 本研究の目的は、いつでも、どこでも有用な情報に容 易にアクセスする手段を構築することである。

KNP1 で解析したWWW6億ページのTsubakiコー パス [5] を利用して WWW テキストから言語モデルを 作成する。さらに、クエリーを認識しやすくするために 文選択を行って言語モデルを作成する。また、KNP の 解析結果からパターンと呼ばれるデータを抽出し、パ ターンデータから、直接的にクエリーを自動生成し、言 語モデルを構築するための資源として利用する。

(9min)