Korea-Health-Datathon / KHD2020

24 stars 8 forks source link

nsml run 관련 문제 #54

Open HyunLee103 opened 4 years ago

HyunLee103 commented 4 years ago

NSML에서 run을 하면 image

이렇게 에러가 뜨면서 종료됩니다. 문제가 무엇인가요?

wnsdud81684 commented 4 years ago

nsml에서는 실행하실때 nsml run -e main_pytorch.py -d dataset_name 으로 실행해주셔야 합니다.

감사합니다.

HyunLee103 commented 4 years ago

그렇게 실행했는데 저런 에러가 나옵니다ㅠㅠ

계속해서 정확한 커멘드로 실행하는데 위와같은 에러와 함께 세션 생성과 할당은 되는데 실행이 안됩니다.

확인 부탁드립니다. @wnsdud81684

gibiee commented 4 years ago

저 같은 경우는 특정 변수에 값을 너무 많이 집어넣어 메모리 초과 시에 위와 비슷한 133 killed 에러가 뜨면서 종료되었습니다.

혹시 메모리를 과하게 차지하는 변수가 있는지 살펴보시면 될 것 같습니다.

HyunLee103 commented 4 years ago

@gibiee 배치 사이즈 같은 인풋 데이터 크기를 줄여보면 될까요??

gibiee commented 4 years ago

@HyunLee103 죄송하지만 정확한 원인을 제가 알 수는 없네요. 이것저것 시도해보시는 수밖에 없습니다.

HyunLee103 commented 3 years ago

@gibiee 덕분에 해결했습니다 감사합니다:)