re-born / say_queristory

0 stars 1 forks source link

英語の時は Alex あたりのネイティブに喋らせる #1

Closed daicche closed 9 years ago

daicche commented 9 years ago

日本語と英語が混じってる時はどうしよう〜

rooa commented 9 years ago

ありそうなのはこんなものかな?


1: スペース区切りでEN/JA切り替わってる場合

ex. ios アプリ

2: 一単語にEN/JA両方入ってる場合

ex iosアプリ 開発

rooa commented 9 years ago

mecabで日本語クエリまで切られちゃうか

daicche commented 9 years ago

ruby だと 正規表現の \w で英数字、 \W で 英数字以外(日本語とか)がマッチするみたい

rooa commented 9 years ago

まじか、

mecabで 'iosアプリ 開発' → ['ios', 'アプリ','開発']みたいにした後正規表現で判定して、マッチしない隣接項はconcatするとできるかな、メンド。

daicche commented 9 years ago

正規表現で単語ごと(スペース区切りと日本語英語区切り)に配列にぶっ込んで 1単語ずつ喋らせると実装は楽だと思うけど、 sayコマンド何回も使うとインターバルが長くなるかも

rooa commented 9 years ago

だめだ、アプリと開発を分けられん。

そうだね

daicche commented 9 years ago

iOSアプリ みたいな英語と日本語がくっついてるクエリって 分けた方がいい場合とそうじゃない場合の両方ある気がする

rooa commented 9 years ago

アイオーエス アプリ じゃなくて アイオーエスアプリ と読むべき、的な場合分け?

daicche commented 9 years ago

うん、iOSアプリ とか id取得 みたいなのは喋らせてみたけど分けない方がよさそう

rooa commented 9 years ago

それはさすがにコンピュータ判別は無理そう

daicche commented 9 years ago

分けた方が良い(英語と日本語がくっついてて英語はネイティブ英語な発音の方がいい)場合ってあんまり無いような気もする。 あるとすれば levenberg-marquardt法 とか damerau-levenshtein距離 とか…?

rooa commented 9 years ago

必要だとは言ったけど、そんなネイティブの発音必要ないかな。ツイート見れば垂れ流しを注意深く聴いてクエリ判断する必要ないし。

daicche commented 9 years ago

全部英語だった場合にだけ ネイティブ勢に喋らせる?