Question
Training 단계에서 model을 bind_model을 이용해 바인딩하고, nsml.load를 통해 다른 세션에 있는 pretrained된 weight를 불러오는 것은 알겠습니다.
그런데 submit시에는 weight가 제대로 안불러지는 것같아서 bind_model(model)함수의 infer(raw_data, **kwargs) 함수에 대해 궁금한 점이 있는데요.
일단 submit시에는 pause 모드로 들어가는 것 같고 거기서 모델을 로드해서 bind_model의 infer를 통해 제출한 정답을 내서 채점을 하게 되는 것 같아보이는데, submit시 어디에서 제가 제출하고자 하는 모델의 weight를 불러와서 model에 로드를 하는건지 모르겠습니다. infer를 보면 bind_model에서 받은 모델을 가져다가 그대로 쓰는 것 같아보이는데, pause시에 baseline코드를 보면
task = HateSpeech() model = BaseLine(256, 3, 0.2, task.max_vocab_indexes['syllable_contents'], 384) model.to("cuda") bind_model(model) nsml.paused(scope=locals())
모델 바인딩만 하고 어디서 weight을 로드하는 건지 모르겠습니다. 아무래도 training시의 weight와 submit시 weight가 다른 것 같아서 여쭤봅니다. (baseline코드는 잘 작동합니다. 제가 바꾼 코드에서 training시와 submit 시 양상이 너무 다른 것 같아서 여쭤봅니다)
Informations
CLI
WEB
What is your login ID?
Question Training 단계에서 model을 bind_model을 이용해 바인딩하고, nsml.load를 통해 다른 세션에 있는 pretrained된 weight를 불러오는 것은 알겠습니다.
그런데 submit시에는 weight가 제대로 안불러지는 것같아서 bind_model(model)함수의 infer(raw_data, **kwargs) 함수에 대해 궁금한 점이 있는데요.
일단 submit시에는 pause 모드로 들어가는 것 같고 거기서 모델을 로드해서 bind_model의 infer를 통해 제출한 정답을 내서 채점을 하게 되는 것 같아보이는데, submit시 어디에서 제가 제출하고자 하는 모델의 weight를 불러와서 model에 로드를 하는건지 모르겠습니다. infer를 보면 bind_model에서 받은 모델을 가져다가 그대로 쓰는 것 같아보이는데, pause시에 baseline코드를 보면
task = HateSpeech() model = BaseLine(256, 3, 0.2, task.max_vocab_indexes['syllable_contents'], 384) model.to("cuda") bind_model(model) nsml.paused(scope=locals())
모델 바인딩만 하고 어디서 weight을 로드하는 건지 모르겠습니다. 아무래도 training시의 weight와 submit시 weight가 다른 것 같아서 여쭤봅니다. (baseline코드는 잘 작동합니다. 제가 바꾼 코드에서 training시와 submit 시 양상이 너무 다른 것 같아서 여쭤봅니다)