GeneFace: Generalized and High-Fidelity 3D Talking Face Synthesis; ICLR 2023; Official code
4090显卡,Ubuntu22.04,pythorch2.0 操作全纪录

感谢作者提供这么优秀的方案。 我有一个4090的机器,cuda版本是12.0。在安装过程执行到步骤: bash docs/prepare_env/install_ext.sh时,因为cuda版本问题,无法继续进行。

      The detected CUDA version (12.0) mismatches the version that was used to compile
      PyTorch (11.3). Please make sure to use the same CUDA versions.

cuda11.3 对 4090 支持不好,这个需要如何处理?

【2023-05-04更新】 本issue将记录深度使用过程中遇到的一些问题和解决方案,再次感谢 @yerfor 同学,期待新版本的发布。

正在测试,cuda版本换成 11.8 了,pytorch2.0目前支持的最高版本。pytorch3d 也支持cuda 11.8。我先试试看,如果没问题,可以提供 docs/prepare_env/geneface_rtx4090.yaml

4090卡,安装 cuda 11.8,按照pytorch的官方教程,使用 conda 安装 pythorch2.0,已经成功了。

目前在走下面这个步骤,速度比较慢,4090的显存不到6G,要运行30分钟,不知道是否正常,export VIDEO_ID=May

CUDA_VISIBLE_DEVICES=0 bash data_gen/nerf/ $VIDEO_ID



Traceback (most recent call last):
  File "/home/ubuntu/code/GeneFace/data_util/deepspeech_features/", line 129, in <module>
  File "/home/ubuntu/code/GeneFace/data_util/deepspeech_features/", line 103, in main
    deepspeech_pb_path = get_deepspeech_model_file()
  File "/home/ubuntu/code/GeneFace/data_util/deepspeech_features/", line 54, in get_deepspeech_model_file
    with zipfile.ZipFile(zip_file_path) as zf:
  File "/home/ubuntu/miniconda3/envs/geneface/lib/python3.9/", line 1266, in __init__
  File "/home/ubuntu/miniconda3/envs/geneface/lib/python3.9/", line 1333, in _RealGetContents
    raise BadZipFile("File is not a zip file")
zipfile.BadZipFile: File is not a zip file
[INFO] ===== extracted deepspeech =====
[INFO] ===== extracted all audio labels =====
最终报错了,看起来还是 deepspeech没有下载好。

loading deepspeech ...
Traceback (most recent call last):
  File "/home/ubuntu/code/GeneFace/data_gen/nerf/", line 277, in <module>
  File "/home/ubuntu/code/GeneFace/data_gen/nerf/", line 267, in parse
    ret = load_processed_data(processed_dir)
  File "/home/ubuntu/code/GeneFace/data_gen/nerf/", line 86, in load_processed_data
    deepspeech_features = np.load(deepspeech_npy_name)
  File "/home/ubuntu/miniconda3/envs/geneface/lib/python3.9/site-packages/numpy/lib/", line 390, in load
    fid = stack.enter_context(open(os_fspath(file), "rb"))
FileNotFoundError: [Errno 2] No such file or directory: 'data/processed/videos/May/aud_deepspeech.npy'
conda 环境:

看日志,deepspeech-0_1_0-b90017e8.pb.zip是下载好了的,但是只有===== extract deepspeech =====,没有出现 ===== extracted deepspeech =====

[INFO] ===== extracted esperanto =====

[INFO] ===== extract deepspeech =====
61.68it/s]Downloading /home/ubuntu/.tensorflow/models/ from
100%|| 6073/6073 [01:30<00:00, 67.11it/s] 【下载成功,但是没有出现 ===== extracted deepspeech =====】

[INFO] ===== extracted face landmarks =====
[INFO] ===== perform face tracking =====
[INFO] ===== extract semantics from data/processed/videos/May/ori_imgs to data/processed/videos/May/parsing =====
重新执行一次 CUDA_VISIBLE_DEVICES=0 bash data_gen/nerf/ $VIDEO_ID ,这次成功了,🍻。

用May跑了 zozo 的 DEMO案例,视频生成了,但是没有声音,这个是预期的效果吗? @yerfor

【误会,vscode 远程调试时,音频没让输出,输出的视频,是有声音的】

ModuleNotFoundError: No module named 'utils.commons'

试过在项目根目录下,运行export PYTHONPATH=.,不起效果。最后是加了两个__init__.py文件解决的,git 截图如下:


接下来,目标是训练一个自己的视频,深度使用下 😄。过程中遇到的问题,都会记录到这个issue中,楼主先别关issue~

感谢作者提供这么优秀的方案。 我有一个4090的机器,cuda版本是12.0。在安装过程执行到步骤: bash docs/prepare_env/install_ext.sh时,因为cuda版本问题,无法继续进行。

      The detected CUDA version (12.0) mismatches the version that was used to compile
      PyTorch (11.3). Please make sure to use the same CUDA versions.

cuda11.3 对 4090 支持不好,这个需要如何处理?

【2023-05-04更新】 本issue将记录深度使用过程中遇到的一些问题和解决方案,再次感谢 @yerfor 同学,期待新版本的发布。

  • [x] 安装环境
  • [x] 运行 DEMO
  • [ ] 制作个人 512*512 视频
  • [ ] 熟悉训练流程
  • [ ] 真实训练流程
  • [ ] 验证模型效果
  • [ ] 下一步优化点

hi,如果4090的CUDA版本无法改变 (大家共用的服务器,没有root),安装不同的cudatoolkit之后仍然会有这个问题。有什么好的方法吗?

@Awj2021 主要问题是将cuda版本,pythoch版本,pythorch3d对应起来,不一定非要用哪个版本的。但是,目前pythorch官方编译好的只到11.8,然后 pythorch3d也一样的。所以只要不高于11.8版本,理论上都是可以的。

也可以使用 docker:

也可以使用 docker: not found.......

走作者的demo到最后一步了“bash scripts/”, 然后报错:

Traceback (most recent call last):
  File "/home/lcs/OpenDCO/GeneFace/modules/radnerfs/encoders/gridencoder/", line 10, in <module>
    import _gridencoder as _backend
ImportError: /home/lcs/anaconda3/envs/geneface/lib/python3.9/site-packages/ undefined symbol: _ZNK3c1010TensorImpl18compute_contiguousEv
File "/home/lcs/OpenDCO/GeneFace/modules/radnerfs/encoders/", line 29, in get_encoder
    from modules.radnerfs.encoders.gridencoder import GridEncoder
  File "/home/lcs/OpenDCO/GeneFace/modules/radnerfs/encoders/gridencoder/", line 1, in <module>
    from .grid import GridEncoder
  File "/home/lcs/OpenDCO/GeneFace/modules/radnerfs/encoders/gridencoder/", line 12, in <module>
    from .backend import _backend
  File "/home/lcs/OpenDCO/GeneFace/modules/radnerfs/encoders/gridencoder/", line 32, in <module>
    _backend = load(name='_grid_encoder',
  File "/home/lcs/anaconda3/envs/geneface/lib/python3.9/site-packages/torch/utils/", line 1284, in load
    return _jit_compile(
  File "/home/lcs/anaconda3/envs/geneface/lib/python3.9/site-packages/torch/utils/", line 1535, in _jit_compile
    return _import_module_from_library(name, build_directory, is_python_module)
  File "/home/lcs/anaconda3/envs/geneface/lib/python3.9/site-packages/torch/utils/", line 1929, in _import_module_from_library
    module = importlib.util.module_from_spec(spec)
ImportError: /home/lcs/.cache/torch_extensions/py39_cu118/_grid_encoder/ cannot open shared object file: No such file or directory


