wenet-e2e / wespeaker

Research and Production Oriented Speaker Verification, Recognition and Diarization Toolkit
Apache License 2.0
707 stars 116 forks source link

自监督训练速度过慢 #200

Closed speechless-z closed 11 months ago

speechless-z commented 1 year ago

用dino是不是会比非自监督训练慢很多呢?我用了一张A100训练voxceleb和cnceleb的混合数据集,基本上2个多小时一个epoch,我有点不明白是本身就这么慢还是我的训练产生了问题?

speechless-z commented 1 year ago

我的参数是80g显存占用76g,但是gpu占用率是会,一会儿0%一会儿100%,我还有什么改进方案吗,感觉调节这些参数改进也不大 dataloader_args: batch_size: 524 num_workers: 18 pin_memory: True prefetch_factor: 20 drop_last: True

wntg commented 1 year ago

调小窗口

speechless-z commented 1 year ago

非常感谢,但是您说的是提帧的窗口吗?我有点没明白

Hunterhuan commented 1 year ago

@speechless-z

DINO对同一段话需要提取多个长短片段,并优化多个片段之间的距离,所以整个训练过程确实有些慢。

对于GPU利用率低的问题,你可以看一下瓶颈是在读数据,还是在CPU提fbank的过程。