Cambricon / mlu-ops

Efficient operation implementation based on the Cambricon Machine Learning Unit (MLU) .
MIT License
103 stars 102 forks source link

active算子与非active算子的使用差别及选择 #1020

Closed Terrencezwy closed 3 months ago

Terrencezwy commented 5 months ago

如指数或平方根运算,在bang接口中存在bang_active_pow2()及bang_pow2(),sqrt同理,这种情况下应如何选择,内部实现上是否有精度或性能的区别?

duzekunKTH commented 5 months ago

相关一手信息可以翻阅在线文档 Cambricon BANG C Developer Guide ,在在线文档中可以搜索相关算子名。 __bang_pow2() 是指数计算运算。 __bang_active_pow2() 的算子行为是通过查表完成指数运算。该算子的输入有较大的限制:只能传整数,且限制大小范围。