mask 类别问题 - Githubissues

fudan-generative-vision / hallo

Hallo: Hierarchical Audio-Driven Visual Synthesis for Portrait Image Animation

MIT License

9.49k stars 1.3k forks source link

Open DBDXSS opened 2 months ago

DBDXSS commented 2 months ago

这是一篇很棒的工作，感谢您的开源！

在阅读代码的时候注意到，使用的mask是full_mask、face_mask和lip_mask，数据处理后的结果也能看到三个mask，但是似乎与论文中Figure 3描述的lip、exp和pose不一样，并且直接观察输出的话，可以看到mask的区域也不同。