yuangan / EAT_code

Official code for ICCV 2023 paper: "Efficient Emotional Adaptation for Audio-Driven Talking-Head Generation".
Other
269 stars 30 forks source link

关于voxs_images和voxs_wavs #14

Closed Tpcsy closed 9 months ago

Tpcsy commented 9 months ago

作者您好,您的项目非常棒,我很感兴趣,但是为在进行A2KP Training时遇到了一些问题,当我执行python pretrain_a2kp.py --config config/pretrain_a2kp_s1.yaml --device_ids 0,1,2,3 --checkpoint ./ckpt/pretrain_new_274.pth.tar时,终端循环输出如下: /Vox2-mp4/dev//voxs_images/id00062_osRcP9DYjAQ_00416 59878 /Vox2-mp4/dev//voxs_wavs/id00062_osRcP9DYjAQ_00416.wav /Vox2-mp4/dev//voxs_images/id00776_f4QpbV2nV14_00184 3282 /Vox2-mp4/dev//voxs_wavs/id00776_f4QpbV2nV14_00184.wav /Vox2-mp4/dev//voxs_images/id00287_DJpelTdmYdk_00039 83446 /Vox2-mp4/dev//voxs_wavs/id00287_DJpelTdmYdk_00039.wav 我判断是没有找到voxs_images和voxs_wavs文件夹,我下载了vox数据集,里面没有voxs_images和voxs_wavs,请问是否是需要对vox数据集进行预处理,我没有找到数据集的预处理代码。谢谢!

yuangan commented 9 months ago

感谢关注,voxceleb是需要预处理的,你可以参考这里进行对视频数据进行预处理。需要注意的是,训练集不需要这一行后面针对demo的处理。得到voxs_images之后,你还需要利用extract_bbox提取人脸的boundingbox。有其他关于训练的问题可以随时提issue。

Tpcsy commented 9 months ago

自动回复:您好,邮件已收到