Open sy00n opened 7 months ago
궁금한 점 1: text prompt 설계할 때 channel 방향 concat에 대한 ablation이 있는가? 본문에는 일단 없음.
궁금한 점 2: 그래서 왜 v-v attention이 잘 되는지에 대한 해석, v-v attention 구체적으로 어떻게 적용하는건지 수식이 한줄도 없음 -> 이건 revision 내용으로 확인 가능.
궁금한 점 3: 이 논문에서 v-v attention을 제안한 게 아닌데 reference가 없어도 되는건가...?
Abstract
Introduction
Method
Object-Agnostic Text Prompt Design
Global context optimization
Refinement of textual space
Refinement of the local visual space
Training and Inference
Experiments
Datasets and Evaluation Metrics
Main Results
object-agnostic vs object-aware prompt learning
Ablation
Conclusion