anliyuan / Ultralight-Digital-Human

一个超轻量级、可以在移动端实时运行的数字人模型
712 stars 116 forks source link

提取音频特征时出现ValueError: Input signal length=2 is too small to resample from 44100->16000 #44

Open yx-180-mutouren opened 4 hours ago

yx-180-mutouren commented 4 hours ago

提取音频特征时出现ValueError: Input signal length=2 is too small to resample from 44100->16000为啥我用别的音频会报错,这个只能是原视频的语音吗?

yx-180-mutouren commented 4 hours ago

错误如下: ![Uploading 企业微信截图_17304516622025.png…]()

yx-180-mutouren commented 4 hours ago

不对,放错代码了,错误是这个: 企业微信截图_17304516622025

FXmonkey commented 4 hours ago

ffmpeg -i audio.wav -ar 16000 -b:a 256k -ac 1 output.wav 将音频转为 16000hz、256k比特率、单声道后再提取 hubert 特征试一下

yx-180-mutouren commented 1 hour ago

ffmpeg -i audio.wav -ar 16000 -b:a 256k -ac 1 output.wav 将音频转为 16000hz、256k比特率、单声道后再提取 hubert 特征试一下

OK,试了写可以提取了,但是就是最后生成口型都对不上,还很抖动