ai-starthon / AI_Starthon2019

60 stars 44 forks source link

docker daemon timeout 발생 #195

Open singetta opened 5 years ago

singetta commented 5 years ago

Informations

CLI

WEB

What is your NSML login ID? singetta

What is name of session in problem? (bug message or screenshot) NSML Log start!Error: Docker daemon timeout! -> 학습 중 shm 부족으로 에러표시 뜨면서 학습 중단. 하지만 docker 내에서는 학습으로 표시되고 있습니다. -> nsml rm -f 명령어를 써도 지워지지 않습니다. Warning: Removing team_23/12_idet_food/237 is failed Error: Session error: 'Failed to delete session [team_23/12_idet_food/237]' time="2019/07/29 18:39:34.011" level=fatal msg="Internal server error" -> team_23/12_idet_food/237 세션 삭제 요청 드립니다.

Steps to reproduce the problem

What is the expected behavior?

Suggested solutions

bluebrush commented 5 years ago

@singetta 님, 불편을 드려서 대단히 죄송합니다. 인프라 문제로(하드웨어,gpu error)로 호스트 머신에 문제로 확인되었습니다. 세센 시작 시간 감안하여 credit 계산후 충전하도록 하겠습니다. (+150credit)