Korea-Health-Datathon / KHD2020

24 stars 8 forks source link

nsml run 문의 #103

Open HyunLee103 opened 4 years ago

HyunLee103 commented 4 years ago

image 위와 같은 에러가 세션 run할 때 반복적으로 발생합니다

실행 커맨드는 nsml run -e main_pytorch.py -d 2020KHD_PNS -a "model_name UNet" 입니다.

찾아보니 nsml 내부 캐시 메모리 관련 문제인듯 한데 확인 부탁드립니다.

gibiee commented 4 years ago

54 에서 동일한 답변드렸습니다.

저 같은 경우는 특정 변수에 값을 너무 많이 집어넣어 메모리 초과 시에 위와 비슷한 133 killed 에러가 뜨면서 종료되었습니다.

혹시 메모리를 과하게 차지하는 변수가 있는지 살펴보시면 될 것 같습니다.