AlexandaJerry / whisper-vits-japanese

Vits Japanese with Whisper as data processor (you can train your VITS even you only have audios)
MIT License
160 stars 28 forks source link

运行auto.py时候,没有任何报错,但是什么文本和音频都没有提取 #2

Open lunar333 opened 1 year ago

lunar333 commented 1 year ago

image image

lunar333 commented 1 year ago

前面whisper已经运行了,音频和识别文本都在

AlexandaJerry commented 1 year ago

您好,auto.py调用 /content/whisper-vits-japanese/util/merge_transcripts_and_files.py,该文件的第22行df_files = df_files[df_files['duration']<10.00]对切片音频的总时长上限做了限制,即超过10秒的文件会被跳过筛选(为了防止单条音频长度过长)。如果您的音频文件在经过auto.py的切片后仍然较长,可以把10改成25

AlexandaJerry commented 1 year ago

你这个连音频文件都没有切出来,需要回到srt_files查看是否生成csv文件,以及每个csv文件里是否有对应的时间戳起点和终点,如果在本地运行的话,记得检查ffmpeg和pydub能正常运行