作者大大 - Githubissues

OpenGVLab / InternVideo

[ECCV2024] Video Foundation Models & Data for Multimodal Understanding

Apache License 2.0

1.44k stars 88 forks source link

Open xiyangyang99 opened 1 week ago

xiyangyang99 commented 1 week ago

作者大大，你们测试过和cogVLM-video2在视频理解任务上的对比吗？

leexinhao commented 1 week ago

看了一下在MVBench上是比我们弱一些的，另外我们月底左右会放出更强一版的sota模型，欢迎后续关注

xiyangyang99 commented 1 week ago

看了一下在MVBench上是比我们弱一些的，另外我们月底左右会放出更强一版的sota模型，欢迎后续关注

希望作者大大可以把多模态的时间敏感度考虑到后面的版本中去。强时序性的视频理解任务。