出图效果不够惊艳

Alpha-VLLM / Lumina-T2X

Lumina-T2X is a unified framework for Text to Any Modality Generation

MIT License

1.84k stars 76 forks source link

Open liangwq opened 1 month ago

liangwq commented 1 month ago

为什么你们模型出图效果不够惊艳呢甚至不如pixart-sigma效果是因为模型训练数据量不够吗还是你们模型对prompt做了你们自己指令规范

liangwq commented 1 month ago

5b的理解力比2b好，但是感觉还是不太行，不够出片具备一些zhong wen中文能力，但是很明显中文比英文差很多 z这个模型是只经过了一阶段pretrain吗，没有用高质量图做sft对齐吗

gaopengpjlab commented 1 month ago

谢谢你的建议。未来我们会扩大数据集，增加算力，提升模型的出图效果。现在模型由于数据和算力的缺乏，还没有完全收敛。

liangwq commented 1 month ago

谢谢你的建议。未来我们会扩大数据集，增加算力，提升模型的出图效果。现在模型由于数据和算力的缺乏，还没有完全收敛。

你们有找到卡了吗，如果需要我们可以私聊