boostcampaitech2 / mrc-level2-nlp-06

KLUE-MRC - Machine Reading Comprehension
6 stars 2 forks source link

baseline 코드 따라잡기2: 학습 돌릴 때 에폭을 건너 뛰는 에러. #12

Closed BaekTree closed 2 years ago

BaekTree commented 2 years ago

원인: last checkpoint를 불러와서 거기에서 부터 시작 함.

해결책

  1. train_result = trainer.train(resume_from_checkpoint=checkpoint)을 train_result = trainer.train()으로 수정.(임시)
  2. 리팩토링. config 달아서 resum = True 등의 옵션을 넣으면 좋을 것 같아요. 나중에 실험하다가 끊겼을 때 끊긴 지점부터 바로 실행할 수 있도록