VOICEVOX / voicevox_core

無料で使える中品質なテキスト読み上げソフトウェア、VOICEVOXのコア
https://voicevox.hiroshiba.jp/
MIT License
864 stars 117 forks source link

open_jtalkの辞書ファイルが別リポジトリ管理のものに依存している #238

Open qwerty2501 opened 2 years ago

qwerty2501 commented 2 years ago

内容

現状 テスト用にダウンロードしているopen_jtalkの辞書ファイルが別リポジトリで管理されているもの であり、これはあまり良くない状態であると思います。 これについてvoicevox側でリソースを管理する体制にするか、voicevox_coreのリポジトリで辞書ファイルを管理するようにしたほうがよさそうです。しかし辞書ファイルのサイズがgitから警告される程度には大きいのでリポジトリでそのまま管理するのはちょっと考えたほうが良いと思います。 大きいと言ってもLFSを利用するかというと微妙なラインですが

対応

https://jaist.dl.sourceforge.net/project/open-jtalk/Dictionary/open_jtalk_dic-1.11/open_jtalk_dic_utf_8-1.11.tar.gz にダウンロードリンクを差し替える

Pros

辞書ファイルの依存関係を解決できる

Cons

リソースする管理する手間が増える、またはリポジトリで管理するファイルのサイズが増える

Hiroshiba commented 2 years ago

issue作成ありがとうございます!

たしかに別リポジトリに依存しているのは健全な状態ではなさそうです。 LFSにするとお金がかかるので避けたいです。やるならファイルとしてcommitか、元と同じようにreleasesを作って管理が良さそうという所感です。

qwerty2501 commented 2 years ago

fileとしてcommitだと元と同じようにreleasesにするよりもコード書き直す量がちょっと多そうなので、voicevox/open_jtalkあたりのreleasesに辞書ファイル上げたほうが良さそうです

qwerty2501 commented 2 years ago

いやhihoさんの手間が増えることを考えるとfileとしてcommitのほうが良いかも

y-chan commented 2 years ago

他所に依存しているという点で不健全であることに変わりはないのですが、OpenJTalk公式からのダウンロードに切り替えるという手もあるかも...? https://sourceforge.net/projects/open-jtalk/

私たちはOpenJTalkを改変して使ってはいますが、OpenJTalk自体は私たちのプロジェクトではないので、辞書をVOICEVOX側で持つというのはそれはそれで違和感を覚えるような気がする...?:thinking:

qwerty2501 commented 2 years ago

公式だと常に有効な直リンクがなさそうなのでちょっときびしいのでは

y-chan commented 2 years ago

sourceforgeからwgetを用いてダウンロードする方法で直リンクが得られないか調べてみたら、普通に得ることができました。 こちらからダウンロードできるみたいです。 https://jaist.dl.sourceforge.net/project/open-jtalk/Dictionary/open_jtalk_dic-1.11/open_jtalk_dic_utf_8-1.11.tar.gz

スクリーンショット 2022-08-15 3 15 07

公式なら依存してもいいかっていうと微妙なところではありますが、一つの手段としてはアリかなと思います。

qwerty2501 commented 2 years ago

なるほどありですね

Hiroshiba commented 2 years ago

公式の方からダウンロードする方式にしますか…!

qwerty2501 commented 2 years ago

これリンク変えるだけで良さそうなので初心者向けタスクですね