Open CloverZhou opened 8 months ago
最好把 pip -r reques.txt,把几个重要的库和环境按照官方文档的要求,对齐。
这个错误RuntimeError: CUDA error: device-side assert triggered
通常表示在GPU上运行的CUDA代码中发生了某种断言错误。这种错误可能由于各种原因,例如索引超出数组范围,数据类型不匹配等。
错误消息中提到的CUDA_LAUNCH_BLOCKING=1
和TORCH_USE_CUDA_DSA
是两个调试选项。让我们详细解释一下:
CUDA_LAUNCH_BLOCKING=1
,CUDA操作将变为同步,即函数调用将等待操作完成才返回。这有助于准确地确定导致错误的代码位置,因为错误将在触发它的函数调用处立即报告,而不是在稍后的某个时间点。为了解决这个问题,你可以尝试以下步骤:
CUDA_LAUNCH_BLOCKING=1
。这将使CUDA操作变为同步,并帮助你更准确地定位错误。在Linux或MacOS上,你可以在终端中使用以下命令设置环境变量:
export CUDA_LAUNCH_BLOCKING=1
在Windows上,你可以在命令提示符中使用以下命令:
set CUDA_LAUNCH_BLOCKING=1
然后运行你的代码。
TORCH_USE_CUDA_DSA
选项(如果你从源代码编译PyTorch)。这将允许你在设备端代码中放置断言,并提供更多关于错误的详细信息。但是,请注意,这可能需要一些额外的努力来设置和编译PyTorch。RuntimeError: CUDA error: device-side assert triggered
Compile with TORCH_USE_CUDA_DSA
to enable device-side assertions.
RuntimeError: CUDA error: device-side assert triggered Compile with
TORCH_USE_CUDA_DSA
to enable device-side assertions.
你好有解决这个问题吗,我也遇到了。
RuntimeError: CUDA error: device-side assert triggered Compile with
TORCH_USE_CUDA_DSA
to enable device-side assertions.
请问你解决了吗,我也遇到这个问题了
请问以下情况怎么处理,麻烦大佬看一下: RuntimeError: CUDA error: device-side assert triggered CUDA kernel errors might be asynchronously reported at some other API call, so the stacktrace below might be incorrect. For debugging consider passing CUDA_LAUNCH_BLOCKING=1. Compile with
TORCH_USE_CUDA_DSA
to enable device-side assertions.
遇到同样的问题,有解决吗?
请问以下情况怎么处理,麻烦大佬看一下: RuntimeError: CUDA error: device-side assert triggered CUDA kernel errors might be asynchronously reported at some other API call, so the stacktrace below might be incorrect. For debugging consider passing CUDA_LAUNCH_BLOCKING=1. Compile with
TORCH_USE_CUDA_DSA
to enable device-side assertions.