ddps-lab / tfserving-inference

0 stars 2 forks source link

모델별 각 장비의 처리할 수 있는 추론요청량 측정 #37

Open kh3654po opened 1 year ago

kh3654po commented 1 year ago

모델마다 자원사용량이 다른데 장비별로 처리할 수 있는 처리량에 제한이 있다. 각 장비가 모델별로 어느정도의 요청을 처리할 수 있는지 측정해야 한다.

kh3654po commented 1 year ago
kh3654po commented 1 year ago

현재는 간단하게 각 장비별로 어떤 모델을 최대로 얼마나 처리 가능한지 측정을 해보았습니다. 초당 50개(총 500개) 이상의 요청에 대해서는 아직 진행하지 않았는데 이 이상도 측정해 볼까요? 앞으로는 요청을 보내는 시간을 늘려서도 실험을 진행하겠습니다. 예를들어 tx2가 yolo v5를 10초동안 최대 30개정도 처리를 하는데 20초동안 60개를 처리할 수 있는지도 확인해보겠습니다. 그리고 최대 요청개수를 처리할 때 걸리는 시간도 기록하겠습니다.

kmu-leeky commented 1 year ago

오케이. 석현아 잘했다. 오늘 스크럼 미팅 마치고 다음 단계 실험 내용을 같이 논의해보자.