[GPT beats diffusion🔥] [scaling laws in visual generation📈] Official impl. of "Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction". An *ultra-simple, user-friendly yet state-of-the-art* codebase for autoregressive image generation!
请问作者,如果使用1) multi scale VQVAE(VQGAN) 但是采用VQGAN(taming transfomer)的transformer(clip?), 或者是使用2) VQVAE(VQGAN) 但是gpt-like transformer, 这两种方式下的指标和原始VQGAN相比怎么样呢?
感觉2)有点难做实验,但还是想问问作者有没有做过这样的实验,感谢~~