ming024 / FastSpeech2

An implementation of Microsoft's "FastSpeech 2: Fast and High-Quality End-to-End Text to Speech"
MIT License
1.69k stars 515 forks source link

求救!!在VarianceAdaptor中 进行pith_embeding的时候显示编码器输出张量x和音素嵌入张量形状不同无法相加 #216

Closed aaqq112 closed 8 months ago

aaqq112 commented 8 months ago

image image 我是一个深度学习小白 请问各位 这两个张量的各个维度代表什么为什么会出现大小不一致的现象呢 求救!!各位大佬