InfiniTensor / InfiniGen

Apache License 2.0
1 stars 1 forks source link

add function wrapper #23

Closed Chamberlain0w0 closed 1 year ago

Chamberlain0w0 commented 1 year ago

具体修改有:

  1. 修改了Task的genCode函数,使其生成device端的kernel的代码;
  2. 添加了若干Task成员变量,如加了static的count用于命名,以及记录整个task操作数的字符串用于生成代码;
  3. 修改了Graph的genCode函数,使其额外生成包裹调用kernel语句的函数代码;
  4. 修改了各种genCode的函数的参数,有的添加了PlatformType,有的添加了indentation,用于拼字符串。
Chamberlain0w0 commented 1 year ago

现在输出长这样,最后那层host端的包装不太确定要不要。

  1. CUDA:

    image
  2. BANG:

    image