modelscope / FunClip

Open-source, accurate and easy-to-use video speech recognition & clipping tool, LLM based AI clipping intergrated.
MIT License
3.37k stars 360 forks source link

LLM根据时间戳剪辑,取值问题 #75

Closed littlerookie closed 3 months ago

littlerookie commented 3 months ago
523635adab5992bb734ddafae1c2dda

LLM剪辑模式下,解析时间戳,然后转成毫秒;是不是少了*16;根据文本或者说话人切分的,都是有*16的

90f8fbe8f8dbb863fa774d9a82910c8
R1ckShi commented 3 months ago

convert_time_to_millis函数把LLM返回的"小时:分钟:秒,毫秒“格式的时间转成了毫秒

littlerookie commented 3 months ago

只做了毫秒转换,视频切分没有问题,音频切分的时候是有问题的;视频切分在有时间戳时,会做*16处理, image

而音频切分没有做处理

image