usagi / virtual-avatar-connect

配信支援アプリ Virtual Avatar Connect; VAC AI疑似人格共演者、VRM制御、音声認識、画像認識、字幕、翻訳、読み上げ、Twitchチャットなどなど
MIT License
5 stars 1 forks source link

CoeiroInk Processor に複数の他の Processor から channel_to すると音声出力が混ざる場合があります #8

Closed usagi closed 9 months ago

usagi commented 9 months ago

再現手順

  1. 《OpenAI-Chat》の channel_to を 《CoeiroInk》 の channel_from で受け取り split_regex_pattern で句読点などで分割合成される設定をします。
  2. 《OCR》 の channel_to を 《CoeiroInk》の channel_from で受け取 split_regex_pattern で句読点などで分割合成される設定をします。
  3. (1)の音声合成が動作するタイミングにあわせて(2)の出力を被せるように出力します。

期待した挙動

先に着信したコンテント全体の音声が再生されてから、次に着信したコンテント全体の音声が再生されます。

実際の挙動

split_regex_pattern で分割された単位でほぼ交互に2つのコンテントの一部分が再生されます。

VAC version

0.0.0-alpha.0

conf.toml

[[processors]]
channel_from = "ai-synth"
feature = "coeiroink"
api_url = "http://localhost:50032/v1/synthesis"
split_regex_pattern = "[、。!?]"
speaker_uuid = "c97966b1-d80c-04f5-aba5-d30a92843b59"
style_id = 4
speed_scale = 1.15
volume_scale = 1.0
pitch_scale = 0.15
intonation_scale = 0.65
pre_phoneme_length = 0.05
post_phoneme_length = 0.65
output_sampling_rate = 48000