showlab / Show-o

Repository for Show-o, One Single Transformer to Unify Multimodal Understanding and Generation.
https://arxiv.org/abs/2408.12528
Apache License 2.0
806 stars 36 forks source link

图像生成推理问题 #25

Open william-ljz opened 1 week ago

william-ljz commented 1 week ago

感谢你们的好工作。我有点关于图像生成的疑问,一张图像对应于256token,论文说的只需要8 step就能生成图像,请问是怎么做的呀

Sierkinhane commented 1 week ago

你好,感谢关注。具体实现可以参考models/modeling_showo.py中的t2i_generate()函数,过几天我们会添加实现细节到arixv中,同时你也可以参考maskgit文章中的实现,我们follow了他们的做法。

BTW, welcome to star our project :)