Closed k-tahiro closed 2 years ago
https://github.com/azu/kuromojin/blob/374bba24329507caa16c2e5b1cdc9e69c1062a76/src/kuromojin.ts#L75-L99
kuromojinの getTokenizer
の方にもLRUキャッシュが効くように変更しちゃうのはどうですかね?
getTokenizer
でキャッシュ入れてないのはあんまり一貫性がない気がするので、入れてしまうのが楽なのかなーと思って。
kuromoji.jsのTokenizerではなくて、kuromojinのTokenizerクラスを作って返す感じですかね。 kuromojinのgetTokenizerがどういった使われ方を想定しているのかを詳しく知っているわけではないですが、良いんじゃないかなと思います。
kuromoji.jsのTokenizerではなくて、kuromojinのTokenizerクラスを作って返す感じですかね。
はい。
https://github.com/azu/kuromojin/blob/374bba24329507caa16c2e5b1cdc9e69c1062a76/src/kuromojin.ts#L9-L12 型的には2つのメソッド持つラッパーになってるので、ラッパー的なオブジェクトを返すとかで良いのかなーと思いました。
別途Issueを作りました https://github.com/azu/kuromojin/issues/13
これ自体は問題ないため、マージしてしまいます。
ルール間で形態素解析結果を使いまわせるように
tokenize
を使用するPRです。