Open Codekang opened 2 years ago
大神,请教一下,你是否有尝试过实现movenet模型的量化,比如在hub上提供的tensorflowjs 模型是半精度的即float16的,你这边是否有再进一步量化成uint8精度的?若有,请问是怎么操作的?效果如何?
半精度应该不会掉点,这个当时没有尝试,后面其它项目做了。uint8尝试过Post-Training Quantization,文章提到了,掉点严重,因为本身就是小网络,而且任务比较敏感。使用Quantization Aware Training来进行量化应该会好一些,官方的tflite应该也是这样,只是当时PyTorch貌似不支持QAT,也就没有做了。
大神,请教一下,你是否有尝试过实现movenet模型的量化,比如在hub上提供的tensorflowjs 模型是半精度的即float16的,你这边是否有再进一步量化成uint8精度的?若有,请问是怎么操作的?效果如何?