Open shin-kanouchi opened 5 years ago
本論文では、オープンドメインな音声質問応答システ ムで用いる音声認識言語モデルを WWW テキストのみ から作成する方法を提案する。ヒューリスティックスに よる文選択や、WWW 上の情報を元に自動生成した質 問文やフレーズ等を加える事を試みた。 本研究の目的は、いつでも、どこでも有用な情報に容 易にアクセスする手段を構築することである。
KNP1 で解析したWWW6億ページのTsubakiコー パス [5] を利用して WWW テキストから言語モデルを 作成する。さらに、クエリーを認識しやすくするために 文選択を行って言語モデルを作成する。また、KNP の 解析結果からパターンと呼ばれるデータを抽出し、パ ターンデータから、直接的にクエリーを自動生成し、言 語モデルを構築するための資源として利用する。
(9min)
論文リンク
http://www.anlp.jp/proceedings/annual_meeting/2011/pdf_dir/D1-2.pdf
著者
○Varga, Istvan, 大竹清敬, 鳥澤健太郎, De Saeger, Stijn, 松田繁樹, 林輝昭 (NICT)