Closed daicche closed 9 years ago
ありそうなのはこんなものかな?
ex. ios アプリ
delimiter=' '
で区切った後,それぞれを[a-zA-Z0-9]とかで判別
true
→ Alexfalse
→ Otoyaex iosアプリ 開発
mecabで日本語クエリまで切られちゃうか
ruby だと 正規表現の \w
で英数字、 \W
で 英数字以外(日本語とか)がマッチするみたい
まじか、
mecabで 'iosアプリ 開発' → ['ios', 'アプリ','開発']
みたいにした後正規表現で判定して、マッチしない隣接項はconcatするとできるかな、メンド。
正規表現で単語ごと(スペース区切りと日本語英語区切り)に配列にぶっ込んで 1単語ずつ喋らせると実装は楽だと思うけど、 sayコマンド何回も使うとインターバルが長くなるかも
だめだ、アプリと開発を分けられん。
そうだね
iOSアプリ
みたいな英語と日本語がくっついてるクエリって
分けた方がいい場合とそうじゃない場合の両方ある気がする
アイオーエス アプリ
じゃなくて アイオーエスアプリ
と読むべき、的な場合分け?
うん、iOSアプリ
とか id取得
みたいなのは喋らせてみたけど分けない方がよさそう
それはさすがにコンピュータ判別は無理そう
分けた方が良い(英語と日本語がくっついてて英語はネイティブ英語な発音の方がいい)場合ってあんまり無いような気もする。
あるとすれば levenberg-marquardt法
とか damerau-levenshtein距離
とか…?
必要だとは言ったけど、そんなネイティブの発音必要ないかな。ツイート見れば垂れ流しを注意深く聴いてクエリ判断する必要ないし。
全部英語だった場合にだけ ネイティブ勢に喋らせる?
日本語と英語が混じってる時はどうしよう〜