whwu95 / Cap4Video

【CVPR'2023 Highlight & TPAMI】Cap4Video: What Can Auxiliary Captions Do for Text-Video Retrieval?
https://arxiv.org/abs/2301.00184
MIT License
225 stars 16 forks source link

some questions #24

Closed shams2023 closed 8 months ago

shams2023 commented 8 months ago

image 这里面的C指的是这个视频生成的辅助字幕的数量吗? 我看最后做消融实验的时候说最好的结果是1个辅助字幕就会得到很好的结果 所以这个C该如何理解

whwu95 commented 8 months ago

C是caption的数量,“我看最后做消融实验的时候说最好的结果是1个辅助字幕就会得到很好的结果”这里可能有误会哈,这里是指caption用于与video构建额外正样本对时(即caption三个功能中的input阶段),只用1个就行。