MRzzm / DINet

The source code of "DINet: deformation inpainting network for realistic face visually dubbing on high resolution video."
963 stars 171 forks source link

关于visual quality的计算方式 #110

Open aidenyzhang opened 4 months ago

aidenyzhang commented 4 months ago

在计算SSIM,PSNR,LPIPS的时候,需要输入两张图。 想请教下参考图是如何选取的?

给定一段视频A,如果用另一段音频来生成视频B,那么A和B的嘴形不一致,直接算好像不合适。 如果用A的音频来生成视频C,参考图就带有口型信息了,似乎也不太合适。

thd-ux commented 2 months ago

想问问你最后PSNR和SSIM算出来大概多少,我算出来都30往上,跟作者的结果差很多 @aidenyzhang

aidenyzhang commented 1 month ago

PSNR 34左右,ssim大约0.94