Closed Stubborn-one closed 3 months ago
https://github.com/RLHF-V/RLHF-V/commit/7bea6198432e431f13cec5b03cb8ecf0f653d302 是因为数据集不一样了? 原文是1.4k的后来是5k+
你好,感谢关注!
我们发现 1.1 的权重能够更稳定训练从而适合更广泛的训练环境,所以在 readme 中进行了更新。参数的选择可以根据训练使用的数据和训练情况(比如训练是否稳定)进行调整。
https://github.com/RLHF-V/RLHF-V/commit/7bea6198432e431f13cec5b03cb8ecf0f653d302 是因为数据集不一样了? 原文是1.4k的后来是5k+