sy00n / DL_paper_review

issues에 논문 요약
0 stars 0 forks source link

[41] CLIP Surgery for Better Explainability with Enhancement in Open-Vocabulary Tasks #46

Open sy00n opened 7 months ago

sy00n commented 7 months ago
image

1. CLIP Architecture Surgery to Correct

Opposite Visualization

image image

Dual path 설계

2. CLIP Feature Surgery to Mitigate Noisy Activations

그럼 왜 이러 노이지 맵이 생긴것일까?

  1. false prediction : 모델이 잘못 예측했을 때 false region에 집중하는 경우
  2. Related context : redundant features in CLIP. CLIP은 특정 클래스에 대해 몇 개의 피쳐만 활성화되고 나머지 피쳐들은 non-activated 되기 때문에 이런 non-activated features들이 redundant되어 feature space상에 상당한 영향을 미치게 됨.
    • 이 redundant feature들을 제거했을 때 성능이 상당히 개선됨.

CLIP Feature Surgery (noisy activation 문제를 어떻게 해결할 것인가)