fudan-generative-vision / hallo

Hallo: Hierarchical Audio-Driven Visual Synthesis for Portrait Image Animation
https://fudan-generative-vision.github.io/hallo/
MIT License
9.49k stars 1.3k forks source link

mask 类别问题 #191

Open DBDXSS opened 2 months ago

DBDXSS commented 2 months ago

这是一篇很棒的工作,感谢您的开源!

在阅读代码的时候注意到,使用的mask是full_mask、face_mask和lip_mask,数据处理后的结果也能看到三个mask, 但是似乎与论文中Figure 3描述的lip、exp和pose不一样,并且直接观察输出的话,可以看到mask的区域也不同。