Closed hjsg1010 closed 2 years ago
안녕하세요, paper 잘 읽었습니다. 궁금한게 있어서 issue에 글 남깁니다.
shared encoder로 부터 두개의 query가 나와 각각 instance decoder와 interaction decoder로 들어간다고 나오는데 하나의 input (CNN feature + positional encoding) 으로부터 어떻게 2개의 output (instance query, interaction query)가 나오는지 궁금합니다.
다시한번 훌륭한 연구 결과물 공유해주셔서 감사드립니다.
안녕하세요, paper 잘 읽었습니다. 궁금한게 있어서 issue에 글 남깁니다.
shared encoder로 부터 두개의 query가 나와 각각 instance decoder와 interaction decoder로 들어간다고 나오는데 하나의 input (CNN feature + positional encoding) 으로부터 어떻게 2개의 output (instance query, interaction query)가 나오는지 궁금합니다.
다시한번 훌륭한 연구 결과물 공유해주셔서 감사드립니다.