boostcampaitech4lv23cv1 / level2_dataannotation_cv-level2-cv-01

Data Annotation Competition - 부스트캠프 AI Tech 4기
1 stars 2 forks source link

EXP: Training with Synthetic data for fine-tuning #19

Open KidsareBornStars opened 1 year ago

KidsareBornStars commented 1 year ago

Description

KidsareBornStars commented 1 year ago

중간 상황

image

train lossa가 굉장히 잘 수렴하는 추세로 보여 synthetic data에 대해 학습은 잘 하는 것으로 보인다. 그러나,

image

target dataset(test dataset)과 유사하다고 판단되는 upstage data에 대한 valid는 epoch이 늘어나도 수렴하지 않는 모습.

따라서 실험을 끊고, 두 가지의 실험을 진행해보기로 하였다.

  1. 현재까지 실험한 것을 finetuning하는 형식으로 icdar19 데이터셋으로 train하여 upstage dataset을 valid

    • sweep 의 결과로 보았을 때 lr 2e-4 / batch 28 / optimizer adam 으로 하였을때 결과가 좋은 것으로 판단. 이에 finetuning하는 것이기에 lr 1e-4 / batch 32 / optimizer adam으로 실험 진행(먼저 시작, 현재 진행 중)
  2. ICDAR 17 / ICDAR 19를 다 함께 train했던 model에 Synthetic Dataset으로 finetuning 하여 Upstage dataset을 valid(1번 이후에 바로 실험)

KidsareBornStars commented 1 year ago
quasar529 commented 1 year ago

template에 맞게 수정했어욥

KidsareBornStars commented 1 year ago

망한거

  1. ICDAR 17 / ICDAR 19를 다 함께 train했던 model에 Synthetic Dataset으로 finetuning 하여 Upstage dataset을 valid(1번 이후에 바로 실험) -> 이건 망해버림

남은 시간 해야할 것

  1. synth + (17korean+upstage) finetuning
  2. (synth + icdar19) + (17korean+upstage) finetuning
  3. pretrained + synth + (17korean+upstage) finetuning → (pretrained+synth가 너무 구려서 나중으로 미룸)

1번부터 진행중 (trainbatch 16 / validbatch 32 / lr 1e-4 / max epoch 20)

KidsareBornStars commented 1 year ago

남은 시간 해야할 것의 1번

image

남은 시간 해야할 것의 2번

(synth + icdar19) + (17korean+upstage) finetuning 진행중

결과 image

KidsareBornStars commented 1 year ago
image

보라색이 1번, 하늘색이 2번인데 loss가 더 낮아질 수 있지 않을까 해서 2번에서 30epochs 정도 더 continue 실험 진행(settings 유지)

원래보다 성능이 안나와서 중단!