Closed piaohe20221128 closed 1 year ago
在代码中看到对于LSTM用的是传统的量化方法,即用的float的GEMM计算的,请问有没有用int8 GEMM计算的方案呢?非常感谢!!!
Currently LSTM models are not supported. For Transformer models, we use cuBLASLt for int8 GEMM.
thank you
在代码中看到对于LSTM用的是传统的量化方法,即用的float的GEMM计算的,请问有没有用int8 GEMM计算的方案呢?非常感谢!!!