kleinlee / MiniMates

The fastest digital human algorithm, now on your desktop.
312 stars 28 forks source link

MiniMates

MiniMates 是一款轻量级的图片数字人驱动算法,比liveportrait、EchoMimic、MuseTalk等算法快10-100倍,支持语音驱动和表情驱动两种模式,并嵌入普通电脑实时运行,让用户能够定制自己的ai伙伴。

🔥 更新日志

https://github.com/user-attachments/assets/d42b7893-34f1-422e-9027-b69110b97efa

旋转驱动-0

https://github.com/user-attachments/assets/787837b9-1c18-4303-82fa-a4c23cbd0e63

旋转驱动-0

https://github.com/user-attachments/assets/1a18e531-69c8-4b64-88a9-2b13bfb1c6fc

面部重演+语音驱动

https://github.com/user-attachments/assets/3bde6132-e541-4f4f-85b7-0a22bd2d97d1

亮点

To Do List

百度网盘 https://pan.baidu.com/s/18stswLIZ0zyCcVWF7kTV7g?pwd=zosn (提取码:zosn)

创建环境

conda create -n MiniMates python=3.12
conda activate MiniMates
pip install torch --index-url https://download.pytorch.org/whl/cu124
pip install -r requirements.txt

人像抠图(可选)

python interface/matting.py <img_path> <output_path>
# eg: python interface/matting.py assets/01.jpg assets/01_rgba.png

output_path是你要保存的RGBA图片的位置。 例如: python interface/matting.py assets/01.jpg assets/01_rgba.png

用摄像头快速尝试

python interface/interface_face.py <img_path>
# eg: python interface/interface_face_rotation.py assets/01_rgba.png

等待几秒钟让相机启动,你可以观测到图片的人物跟随你的头部来运动。

注意img_path必须是包含RGBA四通道的图片。

目前的表情驱动还不完善,所以谨慎使用,可能会获得不稳定但有趣的结果。使用的blendshape模版在checkpoint/bs_dict.pkl文件中,欢迎提出修改意见。

用一个人物的视频当做表情模版

python interface/generate_move_template.py  <video_path> <template_path>
# eg: python interface/generate_move_template.py assets/driving.mp4 assets/driving.template

video_path是你找的模版视频,template_path则是要生成的模版文件位置。

让图片人物按照语音文件和表情模版来生成视频

python interface/interface_audio.py  <img_path> <wav_path> <output_path> <template_path>
# eg: python interface/interface_audio.py  assets/01_rgba.png assets/audio.wav assets/output.mp4 assets/driving.template

template_path是可选项,若template_path不存在,那么人物就会在头部静止状态下说话。

算法介绍

MiniMates 采用 coarse-to-fine 的 wrap network 架构,取代传统的 dense motion 方法,以实现在 CPU 上的性能提升。 此外,我们还使用 显式的 UV map 技术来提高人像的精度。 40ae6207dd3cbee4c0df7e6474fe1c5

速度

以下是 MiniMates 数字人算法在不同设备和推理框架下的fps表现(纯粹推理耗时):

设备 推理框架 fps
Intel i5 12600k ncnn-cpu 11
AMD Ryzen7 7735H ncnn-cpu 10
RTX4050 laptop ncnn-vulkan 119
mac m1 ncnn-cpu 36
RTX3080 ncnn-vulkan 100
Intel graphics 770 ncnn-vulkan 18
mac m1 ncnn-vulkan 66
RTX3080 pytorch-gpu 374

致谢

我们感谢以下开源项目的支持:

License

MiniMates 数字人算法遵循 MIT 协议。


联系

进入QQ群聊,分享看法和最新咨询。 加我好友,请备注“进群”,拉你进去微信交流群。
QQ群聊 微信交流群