Closed shams2023 closed 8 months ago
这里面的C指的是这个视频生成的辅助字幕的数量吗? 我看最后做消融实验的时候说最好的结果是1个辅助字幕就会得到很好的结果 所以这个C该如何理解
C是caption的数量,“我看最后做消融实验的时候说最好的结果是1个辅助字幕就会得到很好的结果”这里可能有误会哈,这里是指caption用于与video构建额外正样本对时(即caption三个功能中的input阶段),只用1个就行。
这里面的C指的是这个视频生成的辅助字幕的数量吗? 我看最后做消融实验的时候说最好的结果是1个辅助字幕就会得到很好的结果 所以这个C该如何理解