Closed dyxang closed 1 year ago
我看到文本转语音可以分段,但是我使用超过一千字的SSML二十分钟没生成出来。 日志:
[2023-02-22 20:46:05.179] [info] 创建webscoket连接... [2023-02-22 20:46:06.327] [info] 第1次上报... [2023-02-22 20:46:06.328] [info] 第2次上报... [2023-02-22 20:46:06.328] [info] 第3次上报...
控制台:
SSML文本
<speak xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="http://www.w3.org/2001/mstts" xmlns:emo="http://www.w3.org/2009/10/emotionml" version="1.0" xml:lang="en-US"> <voice name="zh-CN-XiaoxiaoNeural"> <mstts:express-as > <prosody duration="3800ms">当我们谈到英语,我们常常想到 它是一种语言</prosody> <prosody duration="4340ms">但是那些遍布世界各国不同的方言呢</prosody> [此处省略60行] <prosody duration="4910ms">但这仍然改变不了一个令人不可思议的事实,那就是全世界近30亿人</prosody> <prosody duration="2560ms">尽管他们中的一些人听不懂彼此所说的语言</prosody> <prosody duration="6380ms">但他们却说着历经6000年历史淬炼的相同的词汇</prosody> </mstts:express-as> </voice> </speak>
SSML标签的内容无法分段,所以是有字数限制的。。
我看到文本转语音可以分段,但是我使用超过一千字的SSML二十分钟没生成出来。 日志:
控制台:
SSML文本