ddps-lab / edge-inference

Evaluation of inference model performance on edge devices
Apache License 2.0
2 stars 3 forks source link

Nano 장비에서 BERT 추론 시 에러 #9

Closed unhochoi closed 2 years ago

unhochoi commented 2 years ago
unhochoi commented 2 years ago
kmu-leeky commented 2 years ago

아마도 나노와 tx1 의 메모리 크기가 비슷할것 같은데, 비슷한 이유로 실패할 수 있을듯 하네. 이건 배치 사이즈 상관없이 무조건 에러가 발생하는 거지?

unhochoi commented 2 years ago

네, Nano 에선 배치 추론 전 모델 로드 단계에서 에러가 발생하고 있습니다.

jungae-park commented 2 years ago

에러를 보니 324 MB로 GPU에 메모리가 할당된 것 같은데, 사이즈를 늘려서 할당해보는 것도 확인이 필요해보입니다. 제 실험 같은 경우에 사이즈를 늘려서 실험을 했을 때 가능한 시나리오도 있었습니다.

unhochoi commented 2 years ago

현재 2GB 까지 할당해보았으나, 정상적으로 동작하지 않고 있습니다. 좀 더 파악해보겠습니다.