ConvNeXt V2는 Masked Autoencoder(MAE)같은 Self-Supervised Learning 사용하는데요. 사전 학습된 가중치를 재활용 품목 분류에 Transfer Learning을 활용하면 좋을 것 같다는 생각이 들었습니다. 왜냐하면 ConvNeXt V2는 GRN(Global Response Normalization) 레이어를 사용하여 채널 간 특징을 경쟁적으로 학습하기 때문에 저번에 작은 object를 detect할 수 없는 문제가 있었는데, 재활용 품목 간의 미세한 차이를 인식해서 bbox 좌표와 카테고리를 정확하게 예측할 수 있지 않을까요?
Background
Todo
See also
ConvNeXt V2