Closed subinium closed 3 years ago
Figure 2만 보면 방법론 끝.
data augmentation은 3가지 사용함
negative sample을 따로 만들지 않고, batch size N를 키워서 2(N-1) 샘플을 negative로 사용
유사도는 코사인유사도로 계산, loss는 NT-Xent loss 사용 (InfoNCE랑 폼 자체는 유사)
batch size를 256~8192개까지 다양하게 실험
Global Batch Normalization 사용
나머지 부분은 다 위에서 사용한 테크닉이 성능에 좋았다는 것을 이야기하는 내용 (S.O.T.A 라구욧!!)