Alpha-VLLM / Lumina-T2X

Lumina-T2X is a unified framework for Text to Any Modality Generation
MIT License
1.84k stars 76 forks source link

出图效果不够惊艳 #18

Open liangwq opened 1 month ago

liangwq commented 1 month ago

为什么你们模型出图效果不够惊艳呢 甚至不如pixart-sigma效果 是因为模型训练数据量不够吗 还是你们模型对prompt做了你们自己指令规范

liangwq commented 1 month ago
image image

5b的理解力比2b好,但是感觉还是不太行,不够出片 具备一些zhong wen中文能力,但是很明显中文比英文差很多 z这个模型是只经过了一阶段pretrain吗,没有用高质量图做sft对齐吗

gaopengpjlab commented 1 month ago

谢谢你的建议。未来我们会扩大数据集,增加算力,提升模型的出图效果。现在模型由于数据和算力的缺乏,还没有完全收敛。

liangwq commented 1 month ago

谢谢你的建议。未来我们会扩大数据集,增加算力,提升模型的出图效果。现在模型由于数据和算力的缺乏,还没有完全收敛。

你们有找到卡了吗,如果需要我们可以私聊