Open long8v opened 1 year ago
paper, blog
text pair가 있을 경우 그것도 같이 해서 학습한게 Text Paired. Absolute SOTA는 supervised training 한 거
emergent는 직접적으로 text-audio set을 안썼다는 뜻
옛날 word embedding 스럽게 연산 가능 ㅋㅋ
OD도 되네..
당연히.. image encoder 키우니 잘됐다
paper, blog
TL;DR
Details
text pair가 있을 경우 그것도 같이 해서 학습한게 Text Paired. Absolute SOTA는 supervised training 한 거
emergent는 직접적으로 text-audio set을 안썼다는 뜻
옛날 word embedding 스럽게 연산 가능 ㅋㅋ
OD도 되네..
당연히.. image encoder 키우니 잘됐다