Closed HZWHH closed 1 week ago
请问这个方法能用到多模态大模型(MLLM)吗?
应该是可以的,alpha-DPO 可以看成DPO的一种变种,只要在DPO4MLLM场景中,将其损失函数更换为 alpha-DPO 即可
好的,谢谢
请问这个方法能用到多模态大模型(MLLM)吗?