OpenGVLab / InternVideo

[ECCV2024] Video Foundation Models & Data for Multimodal Understanding
Apache License 2.0
1.44k stars 88 forks source link

作者大大 #211

Open xiyangyang99 opened 1 week ago

xiyangyang99 commented 1 week ago

作者大大,你们测试过和cogVLM-video2在视频理解任务上的对比吗?

leexinhao commented 1 week ago

看了一下在MVBench上是比我们弱一些的,另外我们月底左右会放出更强一版的sota模型,欢迎后续关注

xiyangyang99 commented 1 week ago

看了一下在MVBench上是比我们弱一些的,另外我们月底左右会放出更强一版的sota模型,欢迎后续关注

希望作者大大可以把多模态的时间敏感度考虑到后面的版本中去。强时序性的视频理解任务。