Open huihui1114 opened 3 weeks ago
问题:我在使用您开源的代码和预训练模型进行推理的时候,我把输入模型的帧数设置为8,16,32,64,128等,发现模型在帧数小于64时效果会有影响,按照帧长512,帧移256,采样率16K,时延达到了64*256/16ms=1024ms,延迟太大了。 原因:我去查找了代码发现模型中有批量归一化模块nn.BatchNorm2d导致每帧信号收到上下帧之间的影响。 疑问:请问您如何解决这个问题,会有哪些影响?
问题:我在使用您开源的代码和预训练模型进行推理的时候,我把输入模型的帧数设置为8,16,32,64,128等,发现模型在帧数小于64时效果会有影响,按照帧长512,帧移256,采样率16K,时延达到了64*256/16ms=1024ms,延迟太大了。 原因:我去查找了代码发现模型中有批量归一化模块nn.BatchNorm2d导致每帧信号收到上下帧之间的影响。 疑问:请问您如何解决这个问题,会有哪些影响?