Open NLPvv opened 5 months ago
RTF Comparison:
exp | RTF (FP32) | RTF (ORT C++ FP32) | RTF (ORT C++ INT8) |
---|---|---|---|
atten-ori | 0.078 | 0.049 | 0.043 |
atten-new | 0.062 | 0.033 | 0.019 |
see above.
需要把 squeezeformer 引入后的实验结果,报告一下
MultiHeadedSelfAttentionModule 修改需要更多的说明,
RTF Comparison: exp RTF (FP32) RTF (ORT C++ FP32) RTF (ORT C++ INT8) atten-ori 0.078 0.049 0.043 atten-new 0.062 0.033 0.019 这张表,需要贴到readme.md,并补充实验条件。否则不知道,什么条件下的实验。
squeezeformer
: squeezeformer implementation, please refer paper