Artiprocher / FastSDXL

An efficient implementation of Stable-Diffusion-XL
Apache License 2.0
45 stars 2 forks source link

linux上测试没有加速,反而更慢 #3

Open ziyaxuanyi opened 11 months ago

ziyaxuanyi commented 11 months ago

是否有在linux上测试过了,我在linux上测试,显卡为3090,使用fastsdxl里的launch_without_olss.py测试运行:

相同的默认参数情况下:

使用重构的unet:平均耗时约为 2.88 it/s

注释掉代码中以下三行替换重构unet的代码,使用原版的unet block_unet = BlockUNet().half().to("cuda") block_unet.from_diffusers(state_dict=pipe.unet.state_dict()) pipe.unet = block_unet 平均耗时约为 3.02 it/s

原版的unet速度反而更快 ps:diffusion库(版本相同)似乎在windows和linux上有所差异 windows上迭代输出单位是 s/it , 而linux上则是 it/s

Hzj199 commented 11 months ago

我测试也是更慢,ubuntu18, RTX4090