Open kh3654po opened 1 year ago
각 장비의 하드웨어 성능이 달라 모델의 추론 성능 및 로드 할 수 있는 모델 또한 다르다. xavier, tx2, nano 장비에서의 각 모델에 대한 최대 처리량 및 각 장비가 로드 할 수 있는 모델들을 파악한 후 이에 맞는 스케줄러를 설계하여 총 처리시간을 개선한다.
현재 각 장비에서 처리가능한 요청량을 파악했고 총 처리시간대비 각 장비의 idle time을 알 수 있습니다. 매초 각 장비가 처리한 요청들과 그 요청들을 처리하는데 소요된 시간을 알 수 있습니다.
앞으로 해야할 것
기존 라운드로빈 스케줄러와 장비의 성능을 고려한 스케줄러의 차이를 측정
응 석현아 잘 정리했다. 구체적인 action item 들을 내일 금요일 오전에 같이 이야기해보자.
각 장비의 하드웨어 성능이 달라 모델의 추론 성능 및 로드 할 수 있는 모델 또한 다르다. xavier, tx2, nano 장비에서의 각 모델에 대한 최대 처리량 및 각 장비가 로드 할 수 있는 모델들을 파악한 후 이에 맞는 스케줄러를 설계하여 총 처리시간을 개선한다.
현재 각 장비에서 처리가능한 요청량을 파악했고 총 처리시간대비 각 장비의 idle time을 알 수 있습니다. 매초 각 장비가 처리한 요청들과 그 요청들을 처리하는데 소요된 시간을 알 수 있습니다.
앞으로 해야할 것
기존 라운드로빈 스케줄러와 장비의 성능을 고려한 스케줄러의 차이를 측정