issues
search
InfiniTensor
/
InfiniGen
Apache License 2.0
1
stars
1
forks
source link
add function wrapper
#23
Closed
Chamberlain0w0
closed
1 year ago
Chamberlain0w0
commented
1 year ago
具体修改有:
修改了Task的genCode函数,使其生成device端的kernel的代码;
添加了若干Task成员变量,如加了static的count用于命名,以及记录整个task操作数的字符串用于生成代码;
修改了Graph的genCode函数,使其额外生成包裹调用kernel语句的函数代码;
修改了各种genCode的函数的参数,有的添加了PlatformType,有的添加了indentation,用于拼字符串。
Chamberlain0w0
commented
1 year ago
现在输出长这样,最后那层host端的包装不太确定要不要。
CUDA:
BANG:
具体修改有: