ddps-lab / edge-inference

Evaluation of inference model performance on edge devices
Apache License 2.0
2 stars 3 forks source link

NLP 모델 TensorRT 양자화 코드 작성 및 TFLite와 성능 비교 #44

Closed unhochoi closed 1 year ago

unhochoi commented 2 years ago
unhochoi commented 2 years ago
kmu-leeky commented 2 years ago

운호야 그러면 코랩을 사용하지 않고 엣지 환경에서는 nlp 모델도 잘 convert 된다는 이야기지?

unhochoi commented 2 years ago

현재 RNN 모델 변환만 완료했으며, 모든 NLP 모델에 대해선 추가적인 확인이 필요합니다.

kmu-leeky commented 2 years ago

오케이. 다행이다. 추가적으로 호가인을 해보자. cnn 모델도 함게 해보자.

unhochoi commented 2 years ago
kmu-leeky commented 2 years ago

쉽지가 않구나. 그렇다해도 우선 성능 파악에 필요한 정보일수 있으니 시간을 내서 해결을 해보자.

unhochoi commented 2 years ago

넵, 알겠습니다.