198808xc / Pangu-Weather

An official implementation of Pangu-Weather
1.1k stars 202 forks source link

您好,请问一下跑这个需要多少显存的显卡 #12

Open Skyfall-PD opened 1 year ago

Skyfall-PD commented 1 year ago

我使用3050ti和3060ti运行范例数据都会报错,如下::AllocateRawInternal Failed to allocate memory for requested buffer of size 1234206720。两张卡显存一个是4g,一个是8g。

Skyfall-PD commented 1 year ago

或者能不能将1440*720的数据范围改小一点呢,他是不是无法识别其中的区域了

timqin123 commented 1 year ago

我是用云端跑的,建议试试colab或者aws。映像里大概是16gb

tfonda commented 1 year ago

P5000 16GB显存同样会报错

youngforblbl commented 1 year ago

实测3090可以跑,可能是cuda不对?

tfonda commented 1 year ago

实测3090可以跑,可能是cuda不对?

请问您的cuda版本和设置是怎样的?

youngforblbl commented 1 year ago

实测3090可以跑,可能是cuda不对?

请问您的cuda版本和设置是怎样的?

cuda 版本为11.6 ,cudnn 版本为 8.2.4(Linux系统) 或者 8.5.0.96 (Windows系统)

tfonda commented 1 year ago

实测3090可以跑,可能是cuda不对?

请问您的cuda版本和设置是怎样的?

cuda 版本为11.6 ,cudnn 版本为 8.2.4(Linux系统) 或者 8.5.0.96 (Windows系统)

一样的版本,您的显卡显存多大,我的跑起来之后16GB显存直接满了,然后就提示这个错误: onnxruntime.capi.onnxruntime_pybind11_state.RuntimeException: [ONNXRuntimeError] : 6 : RUNTIME_EXCEPTION : Non-zero status code returned while running Concat node. Name:'/b1/Concat_5' Status Message: D:\a_work\1\s\onnxruntime\core\framework\bfc_arena.cc:368 onnxruntime::BFCArena::AllocateRawInternal Failed to allocate memory for requested buffer of size 400343040

tfonda commented 1 year ago

实测3090可以跑,可能是cuda不对?

请问您的cuda版本和设置是怎样的?

cuda 版本为11.6 ,cudnn 版本为 8.2.4(Linux系统) 或者 8.5.0.96 (Windows系统)

一样的版本,您的显卡显存多大,我的跑起来之后16GB显存直接满了,然后就提示这个错误: onnxruntime.capi.onnxruntime_pybind11_state.RuntimeException: [ONNXRuntimeError] : 6 : RUNTIME_EXCEPTION : Non-zero status code returned while running Concat node. Name:'/b1/Concat_5' Status Message: D:\a_work\1\s\onnxruntime\core\framework\bfc_arena.cc:368 onnxruntime::BFCArena::AllocateRawInternal Failed to allocate memory for requested buffer of size 400343040

onnx版本是1.12,onnxruntime-gpu版本是1.14

TianboJi commented 1 year ago

实测3090可以跑,可能是cuda不对?

请问您的cuda版本和设置是怎样的?

cuda 版本为11.6 ,cudnn 版本为 8.2.4(Linux系统) 或者 8.5.0.96 (Windows系统)

你好,我cuda是用conda安装的11.6,但是安装cudnn的时候总是会把cuda降级为11.4,请问您是怎么解决的?我现在运行总是提示“Failed to create CUDAExecutionProvider”

liwenyu0625 commented 1 year ago

或者能不能将1440*720的数据范围改小一点呢,他是不是无法识别其中的区域了

咱们这个可以只算1部分区域吗,或者调整一下参数让它减小内存的消耗

luobu-code commented 1 year ago

我1060跑通了不知道是真是假。。

198808xc commented 1 year ago

按理说1060(6GB显存)是跑不通的,会不会是CPU在工作?结果正确吗?跑一次需要多久(如果除去载入时间接近1分钟,那就可能是CPU在运行)?

luobu-code commented 1 year ago

确实一直在占用cpu,我的i5-8300h将近用时6分钟,但我运行的是inference_gpu.py,它是不有当gpu显存不满足就用cpu?

PeterHavwood commented 10 months ago

请问有解决吗?在CPU上跑通了,但是在GPU(两块2080ti)上一直提示内存不够。不知道能否调整内存占用?