VOICEVOX / voicevox_core

無料で使える中品質なテキスト読み上げソフトウェア、VOICEVOXのコア
https://voicevox.hiroshiba.jp/
MIT License
844 stars 114 forks source link

[project-s] ハミング機能・歌機能向けのモデル・API(compatible_engineのみ)を追加 #724

Closed y-chan closed 7 months ago

y-chan commented 7 months ago

内容

題の通りです。 テストは一旦無視しています。 また、ダミーモデルも既存のものを適当に刺しているため、動きません。

関連 Issue

その他

各ネーミングは適当なので、後で書き換えたほうがいいかもしれない...?

Hiroshiba commented 7 months ago

あ、ちなみにgenerate APIのテストが落ちてるのはcargo xtask generate-c-headerでヘッダー更新すれば解決すると思います!

y-chan commented 7 months ago

source filter decode -> sf_decode sing style model -> sing teacher model source filter model -> sf_decode_model

上記のように変更しました! また、レビューいただいた点を反映しました! generate APIのテストが落ちているのはよくわかりませんでした... 手元では動いたけど、GitHub Actions上だとダメそうな感じで...

shpinx-autoapiパッケージのバージョンを上げればいい...? https://stackoverflow.com/questions/77257145/sphinx-autoapi-error-module-object-has-no-attribute-doc-with-various-sphi

qryxip commented 7 months ago

generate API

v0.15ではSphinxはv6に上げることで解決してました。(https://github.com/VOICEVOX/voicevox_core/pull/626) 0.14だともうgenerate API documentsだけ :x: のまま通してしまうか、起動しないようにするというのもありかと思います。

qryxip commented 7 months ago

0.15の方で質問なのですが、"sing teacher"と"sf decode"が別VVMに入ることってありそうですか? もしそうであるなら、パブリックAPIの形をちょっと考えなおす必要がありそうです(歌声を触りたい人がどれだけいるかはわかりませんが)。

Hiroshiba commented 7 months ago

たしかに、0.15(ハミング)で更新されるのはcompatible engineの部分だけで、ドキュメントに現れるAPIは1個も変わらないですね! なのでgenerate API documentは切ってしまっても確かに問題なさそう。 けどまあ後で元に戻さないといけないですし、サクッとできるなら #626 をcherry-pickするのもありかも。 どっちでも良さそう!

Hiroshiba commented 7 months ago

0.15の方で質問なのですが、"sing teacher"と"sf decode"が別VVMに入ることってありそうですか? もしそうであるなら、パブリックAPIの形をちょっと考えなおす必要がありそうです

ある想定です! 歌い方生成対応キャラ(sing teacher)はなかなか増えないけど、ハミング対応キャラ(sf decode)は増えていくので。

あ、あとモデルの種類が変わるとStyleIdも必ず変えるようにする予定・・・・・だったのですが、今思うとsing teacher modelsf_decode_modelは同じStyleIdにしたくなりそうですね・・・・・・・。 (トークとハミングはStyleIdを変える、というところまでは考えてました。)

VVMでの制約について考えていなかったのですが、1つのVVM内では1つのInferenceDomainしか持てない、みたいな制約は設けられる・・・かも・・・?

歌声を触りたい人がどれだけいるかはわかりませんが

僕も需要は分かりませんが、自分が知る範囲では歌が生成できる動的ライブラリを見たことがないです。 それが無料で、有名なキャラクターもいて、マルチOS対応なものがリリースできれば、まあ結構楽しいことになるんじゃないかな~~~~と期待してます。