boostcampaitech6 / level2-objectdetection-cv-12

level2-objectdetection-cv-12 created by GitHub Classroom
0 stars 3 forks source link

[Discussion] Data Cleaning이 학습에 영향이 크게 미칠까?? #22

Open Revabo opened 9 months ago

Revabo commented 9 months ago

📌 Description

모델 실험을 하기 전에 Data Cleaning이 효과적인가에 대해서 확인이 필요할 것 같아요. 또, Data Cleaning을 하려면 데이터를 직접 눈으로 보고 어떤 부분이 학습에 문제가 될 것인가를 확인해봐야하는데 각자 데이터를 확인할 때 어떤 프로그램을 쓰는지 공유하는 것도 좋을 것 같아요. 제가 사용하고 있는 프로그램은 labelImg를 사용하고 있습니다.

✅ CheckList

📁 Reference

📎 ETC

Revabo commented 9 months ago

제가 발견한 문제점은 일반쓰레기봉투를 비닐봉투로 분류하는 경우가 꽤 많은 것 같아요 image

faye-1221 commented 9 months ago

제가 발견한 문제점은 일반쓰레기봉투를 비닐봉투로 분류하는 경우가 꽤 많은 것 같아요 image

image 일반 쓰레기 봉투는 따지고보면 general trash이지만 plastic bag으로 치는 것 같네요... 혹시 일반 쓰레기봉투가 general trash로 되어있는 이미지 보신분 있으시면 공유 부탁드리겠습니다.

faye-1221 commented 9 months ago

image

image image

Dong-Uri commented 9 months ago

이런 두 class에 대한 이슈들은 confusion matrix로 확실히 확인되면 더 좋을 것 같아요!

faye-1221 commented 9 months ago

mmdetection2에서 confusion matrix를 사용하고 싶으시면 mmdetection/tools/test.py를 통해서 확인하려는 .pth를 .pkl로 바꾸고 mmdetection/tools/analysis_tools/confusion_matrix.py를 실행시켜주시면 됩니다.

실행할 때 명령어들은 아래의 사이트를 참고하시면 됩니다. https://mmdetection.readthedocs.io/en/v2.21.0/useful_tools.html (버전 에러가 많이 떠서 추천하지는 않습니다.)

+) mmdetection3의 경우는 확인해보고 커맨드 남기겠습니다 mmdetection3도 mmdetection2랑 같이 사용하면 됩니다. 버전 문제로 인한 에러는 안떠서 괜찮을 것 같아요. 다만 config.py에 test set을 정의할 때 valid set으로 사용해주세요.