InfiniTensor / InfiniGen

Apache License 2.0
1 stars 1 forks source link

Add binary #42

Closed Chamberlain0w0 closed 11 months ago

Chamberlain0w0 commented 11 months ago

添加了双目算子,具体包括:DIV, EQ, GE, GT, LE, LT, NE, AND, OR, XOR。

可能存在的问题:

  1. CUDA上对于某些运算符,每个element做完运算以后存在一个隐式类型转换到float(可能会损失精度?)
  2. DivBang目前是以倒数+乘法得到,需要额外为倒数操作的输出开辟一块片上内存再free掉,这块逻辑请各位帮忙检查一下。