Open linkk08 opened 5 months ago
任务目标: 新增decoder_attention_fuse_pass; 需求场景: decoder模型性能优化; 功能描述: 新增 decoder attention 融合的pir pass, 该pass将q k v 的计算融合成一个大算子运算(不带mask)
No response
您好,感谢您的pr,CI通过后联系相关同学帮忙review下
需求描述 Feature Description
任务目标: 新增decoder_attention_fuse_pass;
需求场景: decoder模型性能优化;
功能描述: 新增 decoder attention 融合的pir pass, 该pass将q k v 的计算融合成一个大算子运算(不带mask)
替代实现 Alternatives
No response