Open lk137095576 opened 2 weeks ago
1
No response
这里这里会判断mask,这个东西为什么会影响不能走scaled_dot_production_score?我看pytorch的api,没有这个限制啊? 这个会会节省大量显存,很有必要使用
System Info / 系統信息
1
Who can help? / 谁可以帮助到您?
No response
Information / 问题信息
Reproduction / 复现过程
Expected behavior / 期待表现
1