Closed MindsetFather closed 3 years ago
是不是一个片段,每一帧做crop之后得到例如A1-A10,B1-B10,C1-C10,D1-D10这样的被crop的新的帧,之后A1B1C1D1组成一个片段,送入I3D。
是不是一个片段,每一帧做crop之后得到例如A1-A10,B1-B10,C1-C10,D1-D10这样的被crop的新的帧,之后A1B1C1D1组成一个片段,送入I3D。
你好 是的 您的理解是对的 A1 B1 C1 D1 都会保持相同的crop区域(例如crop左下角) 这样做十次 每 16 帧 (1个片段) 就会生成10个片段 对应10次相应的crop 最终一个video 有T个片段 就会出现 T 10 2048
多谢
您好,很有益的工作。 我发现您视频中对一个视频的特征维度是TX2048,但是Onedrive中的维度是TX10X2048 通过阅读其他的issues,解释是一段视频分为T个片段,每个帧都要经过10-crop,每个crop的图片提取出2048维度的特征,不知道我这样理解对不对 如果对的话,有一个小问题尚未明白,分为T个片段,每个片段含有n个帧(举例n=16),这16个帧通过10-crop会产生160个图片,每个图片都提取2048维度的特征,所以最后一个视频对应的是不是应该为TX160X2048,与TX10X2048相矛盾。请问提取特征是不是还有一些细节我没有注意到。 谢谢