boost-devs / peer-session

🚀 부스트캠프 AI Tech 1기 U-Stage 4조 피어 세션 자료/질문 모음 (archived)
8 stars 2 forks source link

[DAY 34] Instance/Panoptic segmentation and landmark localization & Conditional Generative Model #100

Closed bsm8734 closed 3 years ago

bsm8734 commented 3 years ago

오늘 배운 것


질문

image

Semantic head는 deformable convolution으로 구성되어 있으며 feature pyramid networks (FPN)으로부터 얻어낸 multi-scale의 정보를 이용합니다. Instance head는 Mask R-CNN의 구조를 따르며 mask segmentation, bounding box 그리고 클래스 정보를 출력합니다. 그리고 가장 중요한 panoptic head는 최종 panoptic segmentation을 예측하는 역할을 합니다. 앞선 두 개의 heads의 logits에 extra unknown class에 해당하는 새로운 채널을 추가합니다. 이렇게 함으로써, semantic과 instance segmentation 사이에 발생하는 충돌(conflicts)을 해결할 수 있습니다.

Additionally, the authors also construct logits for an ‘unknown’ class in order to avoid making wrong predictions. The rationale behind this is that for any pixel if the maximum of logit for a ‘thing’ class from the semantic head is larger than the maximum of the logit from the instance head (max(X thing)- max(X stuff) in the below image), then it is highly likely that we are missing some instances. Therefore, those pixels must be labeled as unknown.


과제에 대한 이야기