Closed sejeong98105 closed 7 months ago
현재 학습 중단 UI가 만들어져 있지 않은데, 해당 기능은 추가 예정입니다.
현재 상태에서 학습을 중단하시려면, TANGO
폴더에서
docker-compose down
를 커맨드 창에 입력하셔서 컨테이너를 내리면 프로세스도 내릴 수 있습니다.
현재 프로세스가 running
중이라고 되어 있는데 nvidia-smi
명령어를 통해 실제로 프로세스가 살아있는지 확인이 필요할 것 같습니다.
nvidia-smi
명령어를 통해 프로세스가 죽은 것은 확인했는데 원인을 잘 모르겠습니다.
현재 추측하기로는, BMS에서 자동 설정한 batch size
에 비해 실제 데이터 갯수가 적은 상황 때문에 발생한 에러로 보입니다.
혹시 가능하다면 GPU 1장만 사용해서 테스트를 부탁드립니다.
아래와 같이 docker-compose.yml
파일의 100번째 라인과 198번째 라인의 NVIDIA_VISIBLE_DEVICES
를 0
으로 변경 후 docker-compose up -d
하시면 됩니다.
NVIDIA_VISIBLE_DEVICES=0
AutoNN 서비스를 실행했을 경우 API 상태 체크만 계속 반복되고 AutoNN 서비스가 종료되지 않습니다.
아래는 AutoNN 실행 시 발생하는 로그입니다.