Open Zhoumoz opened 5 months ago
作者你好,RegoinCLIP如何获取encode_image中的的[B,N_patch,768]的结果,其中B为batch_size,N_patch为划分的patch数,谢谢🙏
同问~如何获得中间层的特征
文章中计算text到image的attention map能提供一下嘛~please
作者你好,RegoinCLIP如何获取encode_image中的的[B,N_patch,768]的结果,其中B为batch_size,N_patch为划分的patch数,谢谢🙏