uhhyunjoo / paper-notes

이슈로 가볍게 남깁니다.
0 stars 0 forks source link

[arXiv 2021] Cross Modal Retrieval with Querybank Normalisation #11

Open uhhyunjoo opened 2 years ago

uhhyunjoo commented 2 years ago
link
paper Cross Modal Retrieval with Querybank Normalisation
code papers with code
etc official web site
uhhyunjoo commented 2 years ago

Abstract

uhhyunjoo commented 2 years ago

Introduction

Cross Modal Retrieval

Two challenges

contributions

  1. Retrieval 할 때 cross modal embeddigns 에서의 hubness 가 a significant concern 이라는 것을 보임
  2. QB-Norm 제안 : fine-tuing 없이, model 의 retrieval performance gain 을 이끄는 a simple non-parametric 프레임워크
  3. 현재의 query 이외의 test queries 에 no access 해도 Querybank Normalisation 이 효과적임
  4. Dynamic Inverted Softamx 제안 : a novel normalisatoin method for QB-Norm, 이전 연구들 보다 more robust
  5. QB-Norm is highly effective across a broad range of tasks, models, and benchmarks.
uhhyunjoo commented 2 years ago

Task Definition

uhhyunjoo commented 2 years ago

Motivation

uhhyunjoo commented 2 years ago

Querybank Normalisation

2. Similarity normalisation

image

image

image

Design choices

  1. Globally-Corrected (GC) retrieval

    • bilingual translation 과 zero-shot learning 에 대한 tasks 를 위해 소개된 접근 방식
    • querybank construction 에 적용될 수 있다. : test queries 의 full set 인 Q 로 부터, querybank 를 constructing 함으로써!
    • bilingual translation task 에서, authors 는 m_q 로부터의 additional randomly samples collection of instances 를 가져와서, 그들의 querybank 를 supplement 한다. 이를 통해 performance 를 향상시킨다.
    • [latex] q[/latex] 와 gallery vector [latex]g_j[/latex] 의 normalised similarity 는, [latex] n_q(j) = -(Rank(s_q(j), p_j) - s_q(j)) \in R [/latex] 이다. 이때, Rank = R x R^N -> {0, ... , N} 는, second argument 의 array of elements 를 고려해서 first argument 의 rank 를 return 한다.
  2. Cross-Domain Similarity Local Sacaling (CSLS) image

  3. Inverted Softmax (IS) image

  4. Dynamic Inverted Softmax (DIS)

    • 실험을 통해서, (sec. 4 에 설명될 예정), 본 연구진은 중요한 "practical issue" 를 발견했다.
    • 만약 querybank 가 gallery 를 포함하고 있는 space 를 충분히 cover 하지 못한다면, performance 가 degraded 될 것이다.
    • 따라서, unnormalised similarities 의 performance 보다 더 낮아질 것이다!
    • 이 issue 를 해결하기 위해서, querybank probe matrix 에 추가로, a gallery activation set 를 precompute 했다.
    • [latex] A = {j : i \in \overset{k}{argmax_l} s(b_i, g_l) , i \in {1, ... , N}} [/latex]
    • [latex] \overset{k}{argmax_l} f(l) [/latex] : k-max select operator 인데, f(l) 을 최대화하는 l 에 대한 k values 를 return 한다. (k는 hyperparameter 이고, l 은 gallery indices 이다)
    • 직관적으로, 이 집합 A 는 querybank probe 가, potential hubs 라고 인식한 gallery vecotors 의 indices 를 포함하고 있다.
    • 즉, A 에 속하는 nearest neighbour retrievals 에 inverted softmax 를 activating 하는, Dynamic inverted Softmax image

image

image

uhhyunjoo commented 2 years ago

Experiments

uhhyunjoo commented 2 years ago

Datasets