RuntimeError: The expanded size of the tensor (50) must match the existing size (55) at non-singleton dimension 0. Target sizes: [50, 44]. Tensor sizes: [55, 44]

yerfor / GeneFace

GeneFace: Generalized and High-Fidelity 3D Talking Face Synthesis; ICLR 2023; Official code

MIT License

2.44k stars 290 forks source link

RuntimeError: The expanded size of the tensor (50) must match the existing size (55) at non-singleton dimension 0. Target sizes: [50, 44]. Tensor sizes: [55, 44] #228

Closed tito-dt closed 5 months ago

tito-dt commented 8 months ago

首先感谢作者的项目分享，然后我在尝试提取另外的特定人物特征的时候，即执行 python data_util/process.py --video_id=video_1_4 --task=2 时，报如下错误，已经在本项目中尝试找过类似问题，但没有找到，而且在尝试提取示例May.mp4的特征时，是没有问题的。请问该如何解决？环境： python 3.9.16 cuda 11.7

Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained. Traceback (most recent call last): File "/home/GeneFace/data_util/extract_esperanto.py", line 424, in asr.run() File "/home/GeneFace/data_util/extract_esperanto.py", line 364, in run self.run_step() File "/home/GeneFace/data_util/extract_esperanto.py", line 222, in run_step self.feat_queue[start:end] = feats RuntimeError: The expanded size of the tensor (50) must match the existing size (55) at non-singleton dimension 0. Target sizes: [50, 44]. Tensor sizes: [55, 44]

lokvke commented 7 months ago

解决了吗，遇到相同问题了 RuntimeError: The expanded size of the tensor (50) must match the existing size (51) at non-singleton dimension 0. Target sizes: [50, 44]. Tensor sizes: [51, 44]

jackyin68 commented 7 months ago

only supports 512x512 and 25 fps videos

aurelianocyp commented 3 months ago

我的视频就是512*512和25fps的，但依旧出了这个问题，后来尝试了许多方法后觉得是视频的原音频有问题，于是在视频剪辑软件中将视频减掉了一小点，导出再进行处理，就成功了

tito-dt commented 3 months ago

我的视频就是512*512和25fps的，但依旧出了这个问题，后来尝试了许多方法后觉得是视频的原音频有问题，于是在视频剪辑软件中将视频减掉了一小点，导出再进行处理，就成功了

方便分享下具体的操作方法吗？减掉一小点是指长度剪短么？

aurelianocyp commented 3 months ago

我的视频就是512*512和25fps的，但依旧出了这个问题，后来尝试了许多方法后觉得是视频的原音频有问题，于是在视频剪辑软件中将视频减掉了一小点，导出再进行处理，就成功了

方便分享下具体的操作方法吗？减掉一小点是指长度剪短么？

是的，就是随便找个视频剪辑软件，将视频拖到时间轴上，然后减掉个一秒或者零点几秒或者一秒多都行，然后导出，处理导出的视频就不会报这个错了。我使用的是万兴喵影软件。

tito-dt commented 3 months ago

我的视频就是512*512和25fps的，但依旧出了这个问题，后来尝试了许多方法后觉得是视频的原音频有问题，于是在视频剪辑软件中将视频减掉了一小点，导出再进行处理，就成功了

方便分享下具体的操作方法吗？减掉一小点是指长度剪短么？

是的，就是随便找个视频剪辑软件，将视频拖到时间轴上，然后减掉个一秒或者零点几秒或者一秒多都行，然后导出，处理导出的视频就不会报这个错了。我使用的是万兴喵影软件。

请问下，视频总长度是多少秒的？

aurelianocyp commented 3 months ago

我的视频就是512*512和25fps的，但依旧出了这个问题，后来尝试了许多方法后觉得是视频的原音频有问题，于是在视频剪辑软件中将视频减掉了一小点，导出再进行处理，就成功了

方便分享下具体的操作方法吗？减掉一小点是指长度剪短么？

是的，就是随便找个视频剪辑软件，将视频拖到时间轴上，然后减掉个一秒或者零点几秒或者一秒多都行，然后导出，处理导出的视频就不会报这个错了。我使用的是万兴喵影软件。

请问下，视频总长度是多少秒的？

我本来是4：00，然后报错，说是Tensor sizes: [53, 44]，剪成3：59了，就成了。之前没尝试过剪，只尝试过导出的时候更改各种参数，包括采样率之类的，试了十多个视频发现没用。剪了一下就有用了。

tito-dt commented 3 months ago

我的视频就是512*512和25fps的，但依旧出了这个问题，后来尝试了许多方法后觉得是视频的原音频有问题，于是在视频剪辑软件中将视频减掉了一小点，导出再进行处理，就成功了

方便分享下具体的操作方法吗？减掉一小点是指长度剪短么？

是的，就是随便找个视频剪辑软件，将视频拖到时间轴上，然后减掉个一秒或者零点几秒或者一秒多都行，然后导出，处理导出的视频就不会报这个错了。我使用的是万兴喵影软件。

请问下，视频总长度是多少秒的？

我本来是4：00，然后报错，说是Tensor sizes: [53, 44]，剪成3：59了，就成了。之前没尝试过剪，只尝试过导出的时候更改各种参数，包括采样率之类的，试了十多个视频发现没用。剪了一下就有用了。

好的，感谢

zxs-learn commented 3 months ago

extract_esperanto

我的视频就是512*512和25fps的，但依旧出了这个问题，后来尝试了许多方法后觉得是视频的原音频有问题，于是在视频剪辑软件中将视频减掉了一小点，导出再进行处理，就成功了

方便分享下具体的操作方法吗？减掉一小点是指长度剪短么？

是的，就是随便找个视频剪辑软件，将视频拖到时间轴上，然后减掉个一秒或者零点几秒或者一秒多都行，然后导出，处理导出的视频就不会报这个错了。我使用的是万兴喵影软件。

我直接改成 self.feat_queue[start:end] = feats[:50] 了，不知道对效果有没有影响。