Closed Hecate2 closed 1 year ago
感谢反馈,类似你这样的bug最近收到了特别多,但是很抱歉我其实并不清楚原因。 请问可以分享一下你的zip文件吗?我会尝试在我这边复现,如果能够找到原因的话会通知你
非常感谢。我也想办法搞个大猛显卡Linux机debug一下 上传到github好困难。完整数据集可访问 https://github.com/Hecate2/sukasuka-vocal-dataset-builder/releases/tag/0.0.anime
刚刚测试了你的数据,初步鉴定为数据集过大的时候,由于不明原因,并没有生成custom_character_anno.txt这个文件,目前正在尝试修复,修复完成后会在这里通知你,感谢你的反馈!
该问题现已修复,具体原因是:根据音频的不同,whisper有时候会抽风生成超长的标注,导致cleaner报错buffer overflow。现在加了一个过滤条件把长度长于100个字符的标注忽略掉,经测试已经没有问题了。
月莫拜大佬!
The end of output from STEP 3:
The output of STEP 4: