limura / NovelSpeaker

text speech app for text novel site.
https://limura.github.io/NovelSpeaker/
MIT License
27 stars 5 forks source link

「一生懸命(けんめい)」みたいなのを「けんめい」と読むのはおかしい #108

Open limura opened 5 years ago

limura commented 5 years ago

現状は

() の前が漢字かつ、() の中がカタカナまたは平仮名 という正規表現 ([\\p{Han}]{1,10})[《((]([\\p{Hiragana}\\p{Katakana}]{1,10})[》))]

で取り出しているだけなのでそれはまぁそうなりますよねという感じなのだけれど、 ChaSen だか MeCab だかで使う ipadic には 見出し語 から 読み への変換テーブルがあるはず?なので それを使って表題のような奴については回避可能ではあるという事に気づきはした。 やるべきかどうかはよくわからん。ただ、直感としては例外処理ぽいのでやりたくない感じ。