boostcampaitech4lv23cv3 / final-project-level3-cv-17

final-project-level2-cv-17 created by GitHub Classroom
2 stars 0 forks source link

AI hub 이미지 데이터 수량 파악에 관한 이슈 #3

Closed JKbin closed 1 year ago

JKbin commented 1 year ago

고가사다리소방차 : 3239 구급차 : 5722 소방차 : 5833 total : 14794 (위 수량은 AI hub 데이터 분포 통계 수치를 보고 작성했습니다.)

(장원님의 서버에서 가져 온 데이터 수량입니다.)

  1. Training - 원천데이터

    • M12_고가사다리소방차 : 2591
    • M14_구급차 : 4577
    • M32_소방차 : 4666 Training - 라벨링데이터
    • M12_고가사다리소방차 : 2591
    • M14_구급차 : 4577
    • M32_소방차 : 4666 total : 11834
  2. Validation - 원천데이터

    • M12_고가사다리소방차 : 324
    • M14_구급차 : 572
    • M32_소방차 : 583 Validation - 라벨링데이터
    • M12_고가사다리소방차 : 324
    • M14_구급차 : 572
    • M32_소방차 : 583 total : 1479

고가사다리소방차 : 2591 + 324 = 2915 구급차 : 4577 + 572 = 5149 소방차 : 4666 + 583 = 5249 total = 2915 + 5149 + 5249 = 13313

결론적으로 AI hub 데이터 분포에 있는 수량과 안 맞네요. 누락된 것 같은데 아직은 크게 신경 쓸 부분이 아닌 것 같은데 이러한 점을 발견해서 공유드립니다!

p.s. github issue도 잘 사용하면 좋을 것 같아서 이 건에 대해서는 이슈로 남겨봅니다. 사용 여부 어떻게 생각하시는지 의견 부탁드릴게요!

nanpuhaha commented 1 year ago

이슈를 아주 적절하게 잘 사용하셨네요! 앞으로 이슈도 잘 활용해봅시다.

데이터 수량이 안 맞는 것은 확인해봐야겠네요.

sjleo1 commented 1 year ago

누락된 이미지가 전체 이미지의 대략 10%네요? 아마 test dataset이 아닌가 싶습니다!

Image