Alpha-VLLM / Lumina-T2X

Lumina-T2X is a unified framework for Text to Any Modality Generation
MIT License
2.04k stars 86 forks source link

demo显示色块、网格比较明显 #37

Open leonardodora opened 4 months ago

leonardodora commented 4 months ago

image

请问是网络结构的问题吗,还是训练时间太短呢

gaopengpjlab commented 4 months ago

因为中文prompts,训练集合从来没有见过,属于OOD prompts。

leonardodora commented 4 months ago

因为中文prompts,训练集合从来没有见过,属于OOD prompts。

image 英文prompt也有呢,如上。刚刚做了实验,step=10太少了,step设置为50会明显减少

gaopengpjlab commented 4 months ago

step太少也是artifacts出现的原因。我们看看是否有办法解决。

JincanDeng commented 4 months ago

@gaopengpjlab 之前基于 EDM 的训练 unet 模型的时候,也遇到了类似的 artifacts 的问题。不知道有没有什么共性的问题。 get