ML-TANGO / TANGO

public repo for TANGO (Target Aware No-code neural network Generation and Operation framework)
Other
68 stars 20 forks source link

Host 기기에서 모델을 학습시킬 Resource가 충분한지 확인하는 과정 #69

Closed iksooman closed 11 months ago

iksooman commented 1 year ago

Host 기기에서 모델을 학습시킬 Resource가 충분한지 확인하는 과정을 추가하려고 합니다. 이 과정은 TANGO의 전체 과정 중 가장 첫번째로 사용되는 모듈인 BMS에 할당하려고 합니다. 이와 관련된 기능은 현재 AutoNN에서 담당하고 있습니다. AutoNN에서 Host 기기에 모델을 직접 업로드한 후 Dummy 데이터 사이즈를 늘려가며 Batch Size를 정하고 있습니다. 하지만 현재 방식은 Batch Size가 1조차 올라가지 못하는 상황은 고려하지 않고 있습니다. 이러한 상황은 BMS에서 미리 체크되면 좋을 것 같습니다.

BMS에서 이것을 체크하려면 AutoNN이 가지고 있는 모델 라이브러리를 모두 BMS로 가지고 와야하는데 이것은 비효율적으로 보입니다. BMS와 AutoNN간에 통신 과정을 추가하면 쉽게 해결할 수 있을 것 같습니다. Project Manager와 AutoNN 간의 통신에 사용하는 start API에 옵션 하나만 추가하여 BMS와 AutoNN간 통신 정보로 사용하면 원하는 기능 구현이 가능할 것으로 보입니다.

iksooman commented 11 months ago

BMS에서 확인하는 방식으로 결정되었습니다. AutoNN의 모델 라이브러리를 BMS로 가지고와서 BMS에서 체크합니다.