tegnike / aituber-kit

AITuber Kit
MIT License
143 stars 24 forks source link

ローカルのTTS APIエンドポイントを追加し #64

Closed yelban closed 3 weeks ago

yelban commented 3 weeks ago

ローカルのTTS APIエンドポイントを追加し、GSVIを含むがこれに限定されないさまざまなローカル音声推論APIサービスが利用可能になり、感情タグに対応した感情音声を生成できるようにしました。

SCR-20240612-jiaf

ローカルのTTS APIエンドポイントはすべて使用できるはずです。音声感情推論に対応したTTSエンドポイントであれば、キャラクターの会話時の感情タグを利用して感情のこもった音声を生成することができます。

SCR-20240612-kifa

tegnike commented 3 weeks ago

@yelban

ちなみに、GSVI 以外のTTSサービスは試されていますか?
私あまりTTSサービスに明るくなく、参考に教えていただきたいなと。

もし、GSVI に最適化されているならどこかに "GSVI" という文言を入れたほうが良いかも、と思いました。

yelban commented 3 weeks ago

GSVIの文字を含めるのは良いアイデアですね。実際にChatTTSをテストする予定もあります。両者のパラメータは完全には一致しませんが、感情パラメータはChatTTSには無効です。現在のところ、GSVI-TTSのような名前に変更するのは確かに良さそうです。必要であれば、別のPRを提出しましょうか?

tegnike commented 3 weeks ago

そうですね、まだTTSサービスの数が少ないですし、いったん今回はGSVI専用にしてChatTTSは別にしたほうが良いかもしれません。お願いできますか?

yelban commented 3 weeks ago

光栄です。すでにGSVI TTSに変更し、PR #67 として再提出しました。

tegnike commented 3 weeks ago

ありがとうございます!ではこちらはクローズしてしまいますね