본 과정은 NAVER Connect 재단 주관으로 인공지능과 딥러닝 Production의 End-to-End를 명확히 학습하고 실무에서 구현할 수 있도록 훈련하는 약 5개월간의 교육과정입니다. 전체 과정은 이론과정(U-stage, 5주)와 실무기반 프로젝트(P-stage, 15주)로 구성되어 있으며, 이 곳에는 그 중 첫 번째 대회인 Image Classification
과제에 대한 Level1 - 08조 의 문제해결방법을 기록합니다.
”색칠을 하다 보면 그림이 완성되어 있을 거예요”
김지수 | 김혜수 | 배지연 | 이승현 | 임문경 | 진명훈 |
---|---|---|---|---|---|
Github | Github | Github | Github | Github | Github |
김지수
Modeling • Feature Engineering • Age-specific model • EfficientNet Master • Out of fold
김혜수
Dataset curation • Construct Pipeline • Mental Care • Data license verification
배지연
Dataset generation • Dataset curation • Mask synthesis • Hyperparameter tuning
이승현
Team Management • Dataset preprocessing • Modeling • Make task-specific loss
임문경
EDA, Modeling • Visualizing • Search augmentation technique • MLops
진명훈
Modeling • Active Learning • Mentoring • Huggingface pipeline • Handling imbalance problem
마스크 착용여부
, 성별
, 나이
를 추측하여 18개의 class
로 분류함
→ 주요 논점을 해결하는 방법론을 제시하고 실험결과를 공유하며 토론을 반복했습니다
More Detail : https://github.com/jinmang2/boostcamp_ai_tech_2/blob/main/assets/ppt/palettai.pdf
Method | F-score |
---|---|
Synthetic Dataset + EfficientLite0 | 69.0 |
Synthetic Dataset + non-prtrained BEIT | 76.9 |
Synthetic Dataset + EfficientNet + Age-speicific | 76.9 |
Synthetic Dataset + NFNet (Pseudo Labeling + Weighted Sampling) | 78.5 |
Stacking BEIT + NFNet | 77.1 |
External dataset을 이용하기 위해서는 kaggle 의 https://www.kaggle.com/tapakah68/medical-masks-p4 에서 추가적으로 다운로드 받으셔야 합니다.
.
├──input/data/train
├──input/data/eval
├──input/data/images(external kaggle data)
├──image-classification-level1-08
│ ├── configs
│ ├── solution
│ ├── cnn_engine
│ ├── hugging
│ ├── jisoo
│ ├── hugging
│ └── moon
soloution
안에는 각각 train • test • inference가 가능한 라이브러리가 들어있습니다
사용자는 전체 코드를 내려받은 후, 옵션을 지정하여 개별 라이브러리의 모델을 활용할 수 있습니다
각 라이브러리의 구성요소는 ./solution/__main__.py
에서 확인할 수 있습니다
git clone https://github.com/boostcampaitech2/image-classification-level1-08.git
$python __main__.py -m {module} -s {script} -c {config}