nihui / realcugan-ncnn-vulkan

real-cugan converter ncnn version, runs fast on intel / amd / nvidia / apple-silicon GPU with vulkan
MIT License
771 stars 46 forks source link

tilesize=400的意义是什么? #48

Closed yuxiao-ash closed 1 year ago

yuxiao-ash commented 1 year ago

想请教下以tilesize=400进行分块处理的意义是什么?不了解这个模型,请问下这样分块处理是由于realcugan模型的要求,还是出于ncnn推理超分模型时的性能考虑?

nihui commented 1 year ago

分块能减少显存占用

yuxiao-ash commented 1 year ago

分块能减少显存占用

感谢~ 也就是说如果使用的模型更小,或者使用的GPU有更大的显存时,不使用tile理论上会更优一点是吗?

nihui commented 1 year ago

分块能减少显存占用

感谢~ 也就是说如果使用的模型更小,或者使用的GPU有更大的显存时,不使用tile理论上会更优一点是吗?

能减少多个tile同步的操作,效率更高些