VOICEVOX / voicevox_core

無料で使える中品質なテキスト読み上げソフトウェア、VOICEVOXのコア
https://voicevox.hiroshiba.jp/
MIT License
844 stars 114 forks source link

.binファイルのソースについて #726

Closed neoedmund closed 7 months ago

neoedmund commented 7 months ago

質問の内容

voice-coremodelVVM 型式 配布した voicevox-linux-cpu-0.14.11 などに model は .bin 型式 .binの処理に関するソースが見付からない。

と、質問は .binに関する処理のソースは何処ですか? formatは何ですか?

VOICEVOXのバージョン

0.14.11

OSの種類/ディストリ/バージョン

Hiroshiba commented 7 months ago

質問が少し不鮮明で、意図がわかりません!英語でもOKなので、より詳細を書いてください。 あなたが何をしたいかも書いてください。より良い答えを提供できます。

sevenc-nanashi commented 7 months ago

As I felt you're not Japanese speaker, so I'm writing this in English: bin file is a proprietary thing, you can't/shouldn't try to read. See https://github.com/VOICEVOX/voicevox/blob/main/docs/全体構成.md for more details (it's not translated though)

Also there's repository for voicevox core, https://github.com/voicevox/voicevox_core .

neoedmund commented 7 months ago

bin file is a proprietary thing, you can't/shouldn't try to read.

あなたが何をしたいかも書いてください。

voice-coreをAMD GPUに対応にカスタマイズしたい時の疑問。

.binの処理について、一部Open Sourceではない物が含まれていると理解してよろしいでしょうか?

Hiroshiba commented 7 months ago

CORE用のリポジトリにissueを移動しました。

voice-coreをAMD GPUに対応にカスタマイズしたい時の疑問。

なるほどです!こちらが参考になるかもしれません。 https://github.com/VOICEVOX/voicevox_core/issues/617

.binの処理について、一部Open Sourceではない物が含まれていると理解してよろしいでしょうか?

はい。キャラクターや声はOSSではありません。 https://github.com/VOICEVOX/voicevox/blob/766131d13085f8e8f7f1a5ff62e86a1178a2711a/docs/%E5%85%A8%E4%BD%93%E6%A7%8B%E6%88%90.md

onnxモデルはサンプルがここにあります。もしAMD GPUでこのモデルが動くととても嬉しいです! https://github.com/VOICEVOX/voicevox_core/tree/main/model

neoedmund commented 7 months ago

「キャラクター声はOSSにできない」が自由ですが、できない理由に違和感が感じされた。 後、「OSS版VOICEVOXは直接「キャラクター」データー利用出来ない、修正したVOICEVOXいわゆる製品版VOICEVOXが「キャラクター」データーが利用出来る」でしょうか.

せっかく説明したが、 https://github.com/VOICEVOX/voicevox/blob/main/docs/res/%E5%85%A8%E4%BD%93%E6%A7%8B%E6%88%90_OSS%E7%89%88%E3%81%A8%E8%A3%BD%E5%93%81%E7%89%88%E3%81%AE%E9%81%95%E3%81%84.svg 製品版VOICEVOX の図の意味が間違ている、図の中に、"OSS版VOICEVOX" の定義はOSSに言えないでは?

qryxip commented 7 months ago

Perhaps you're right. Both voicevox and voicevox_engine is dual-licensed, the first license is LGPL-3.0, and the second one is "all rights reserved. contact me if you want to fork". To my understanding, the second "licensed" is used for "製品版VOICEVOX", therefore from a licensing perspective "OSS版VOICEVOX" may not be a part of "製品版VOICEVOX".

Moreover, voicevox_core embedded in "製品版VOICEVOX" is currently totally proprietary. voicevox_core under MIT cannot read .bin models. Even you add ROCm support to voicevox_core, you cannot test it with proprietary .bin models.

However, after resolving following issue/PR, I believe you can use voicevox_core under MIT License for "製品版VOICEVOX" and it's .bin models. Do you read and write Rust code? If so, your contribution is welcome.

FYI, you can build "OSS版VOICEVOX" that consists of following software now, though it's not a part of "製品版VOICEVOX":

neoedmund commented 7 months ago

onnxruntimeにfeedするデーターは生onnxだろう、そこでonnxを取り出すのは手間かかるだけ。 proprietaryにする発想は、「使いたいなら、VOICEVOXでして、他のForkでは止めろう」は本音だろうか。 分らなくでもない、何かOSS面はすっきりしない感じ。

neoedmund commented 7 months ago

Off Topic,どうでもいい話何ですが、僕はRustのfanではないだ. Rustはメモリ安全性にこたわるんだが、ここは取柄はないだろうか。

Hiroshiba commented 7 months ago

We do not distribute as raw ONNX files for various reasons. However, you are free to use the proprietary parts in other open-source software! The VOICEVOX voice cannot be distributed as OSS, but the code to use that voice can be made open source, as we have done.

私たちはあなたのコントリビュートを歓迎します! もしValkanで動くととても素敵ですね…!