daooshee / HD-VG-130M

The HD-VG-130M Dataset
106 stars 2 forks source link

有关CLIP划分的问题 #4

Open HuihuiChyan opened 5 months ago

HuihuiChyan commented 5 months ago

作者您好,感谢您出色的工作。我注意到在数据中,一个clip被切分成了多个scene_cut,每个scene_cut对应一条caption。请问对于一个clip的caption,是把多个scene_cut的caption拼接在一起吗?另外,数据集的130M指的是clip的数量,还是scene_cut的数量呢?

daooshee commented 5 months ago

你好!感谢你关注我们的工作 我们在论文中说的 video clip 指的是 scene_cut,130M 是 scene_cut 的数量