tadd / braille-ja

日本語と点字を扱う変換器です
GNU General Public License v3.0
7 stars 4 forks source link

Use tataki #3

Closed hogelog closed 10 years ago

hogelog commented 11 years ago

漢字→かな変換ライブラリtatakiというものを作ってみたので、使ってみました。

tadd commented 10 years ago

@hogelog さん、コメント遅くなりましてごめんなさい :cry: PRいただけてほんとに嬉しかったです!

ですが残念なことに、Rejectせざるを得ないかなと思っています。点字の表記規則として、助詞の「は」や「へ」は、「わ」と「え」に読み替えた後に点字にしなければならないのです。視覚障害者の方が、耳から入る音を基準に文字を認識している故のルールのようです。 https://ja.wikipedia.org/wiki/%E7%82%B9%E5%AD%97#.E5.AE.9F.E9.9A.9B.E3.81.AE.E7.99.BA.E9.9F.B3.E3.81.A8.E7.82.B9.E5.AD.97.E8.A1.A8.E8.A8.98

これを踏まえると、読み仮名変換だけでは点字への翻訳ができず、「形態素解析をして助詞を見つけ出す」という作業が必要になると思います。この過程で、解析するエンジン側が読み仮名も持っているはずと思ってよさそうです。(少なくとも自分の知る限り、MeCabはそうなっているようでした)

ただその実現方法(主にHerokuの無料枠で実現するソフトウェアの構成法)がよく分かっていないので、自分の調べた限りを、また別のissueとして切ってみようと思っています。そちらでまた何かアドバイスをいただければうれしいです。

hogelog commented 10 years ago

なるほどそんなルールが。真面目に形態素解析しなきゃいけないなあ。