Open long8v opened 3 weeks ago
paper, code
CLIP은 틀린 단어(keyboard)에 대해 negative 점수를 주지 못한다.
keyboard
게임이론의 shapley 기반이라고 하넹
occulsion based랑 비슷한데 각 토큰이 아니라 토큰 조합까지 subset으로 만들어서 occulde 하는 방식. 너무 조합이 많으니까 subsampling해서 사용
cheferCAM은 negative 못본다!
paper, code
TL;DR
Details
motivation
CLIP은 틀린 단어(
keyboard
)에 대해 negative 점수를 주지 못한다.SHAP
게임이론의 shapley 기반이라고 하넹
occulsion based랑 비슷한데 각 토큰이 아니라 토큰 조합까지 subset으로 만들어서 occulde 하는 방식. 너무 조합이 많으니까 subsampling해서 사용
why not attention based?
cheferCAM은 negative 못본다!