Santhu / mozc

Automatically exported from code.google.com/p/mozc
0 stars 0 forks source link

お願い: 短い文字数でのサジェストの挙動 #123

Closed GoogleCodeExporter closed 9 years ago

GoogleCodeExporter commented 9 years ago
短い文字数を打った時点で極端に頻度の低そうな単語を
サジェストすることがあって、不自然に感じます。

例:
「ぼくは」で「朴柱」「朴一」をサジェスト。
入力者としては「僕は」をイメージしています。

「わたしは」で「渡し始める」をサジェスト。
「私は」をイメージするのが一般的だと思います。

他に、
「これも」で「これ妄想」
「これに」で「これニュース」
「あれも」で「アレモン」
「どれに」で「ドレニゾン」
「それが」で「逸れがち」

入力者が打ちそうな単語をサジェストするのが本来であっ��
�、
上記のサジェストはまあ打たないと思います。

面白単語をサジェストするのも時には楽しいですが、
打ち始めて3文字で空気を読まない単語ばかり出してくるよ�
��では
苦笑いです。

短い文字数の時は、デフォルトでは
高頻度の名詞を中心にサジェストするほうが良いかもしれ��
�せん。

Mozc-1.3.975.102
シークレットモード有効

Original issue reported on code.google.com by heathros...@gmail.com on 8 Feb 2012 at 2:44

GoogleCodeExporter commented 9 years ago
細かい話ですが、
> 「これに」で「これニュース」
ローマ字入力だと
「これに」は「koreni」、
「これにゅーす」は「korenyu-su」
と打つことが多いと思います。

「koren*i*」で「koren*y*u」を意図することはまずありません。
もちろん「korenixyu」と続ける可能性もなくはありませんが��
�

未入力文字の1文字目が /ゃ/ゅ/ょ/ で、
ローマ字入力モードの場合は、
サジェストの順位を下げてもいいかもしれません。

Original comment by heathros...@gmail.com on 9 Feb 2012 at 5:35

GoogleCodeExporter commented 9 years ago
https://groups.google.com/a/googleproductforums.com/forum/#!searchin/ime-ja/%E3%
82%B5%E3%82%B8%E3%82%A7%E3%82%B9%E3%83%88$20%E5%B7%A5%E8%97%A4/ime-ja/vxawZ5TJwv
I/23xbmsTm2rkJ

のスレッドをご参照ください。デスクトップ版のサジェス��
�は投機的な振る舞いするように設計されています。(具体的
には削減タイプ数の期待値順)
また、リアルタイム変換を有効にしている場合(デフォルト�
��作)は、件のサジェストはどれも2位以降に表示されるため�
��害はないと考えます。
さらに、入力履歴からのサジェストを有効にしていれば(デ�
��ォルト動作)、件のサジェストは履歴に上書きされていき��
�す。

投機的な振る舞いではなく、頻度順にしたい場合は、下記��
� mixed_conversion = true に設定してリビルドしてみてください。
http://code.google.com/p/mozc/source/browse/trunk/src/prediction/dictionary_pred
ictor.cc#143

Original comment by t...@google.com on 13 Feb 2012 at 4:31