Open XuWink opened 7 months ago
作者您好!看了您的论文和代码,我学习到了很多。在看代码时,我对这部分有点疑惑。x: [B, C, T, Q],B,C分别代表batchsize和通道,T,Q分别代表什么?是语音的时域和频域吗?
frame数目和频率数目
作者您好!看了您的论文和代码,我学习到了很多。在看代码时,我对这部分有点疑惑。x: [B, C, T, Q],B,C分别代表batchsize和通道,T,Q分别代表什么?是语音的时域和频域吗?