Naver-AI-Hackathon / AI-Vision

67 stars 34 forks source link

load가 run 할때는 되는데 제출할때는 안됩니다. #258

Open heasungkim opened 5 years ago

heasungkim commented 5 years ago

안녕하세요. 저희는 tensorflow용 bind_model을 사용하고 있습니다. 그 중 load함수는 #245 에서 제안해주셨던 작년 tensorflow용 bind_model의 load함수를 그대로 사용하고 있습니다. 그런데 문제점 2가지가 있어서 질문드립니다.

문제점 1 ) bind_model 안에 정의해놓은 load함수가 nsml run을 할 시엔 model이 제대로 load되고, nsml submit -t snu_CherryPickers/ir_ph2/211 0를 하면 Error: Error occurred while loading model라는 에러가 발생합니다. 그 원인을 파악할 수 없는데 어떠한 이유인지 알 수 있을까요?

문제점 2) 또한 위의 load함수로 테스트 제출을 하면 세션이 생성되었다가 10초후에 사라지는 현상이 발생합니다. 세션번호는 214번 215번입니다. 어떠한 이유인지 알 수 있을까요?

nsml-admin commented 5 years ago

안녕하세요.

if __name__ == '__main__':
    main()

다음과 같이 main() 함수를 따로 정의해서 발생한 문제인데요,

  1. main() 함수를 없애고 if __name__ == '__main__': 안에 로직을 다시 작성하는방법
  2. if args.pause:
    nsml.paused(scope=locals())

    위와같이 scope에 locals()변수를 전달할때

    
    if __name__ == '__main__':
    main(local=locals())

... def main(local): if args.pause: nsml.paused(scope=local)


로 변경해주시면 됩니다. 
감사합니다.