Closed cdm114514 closed 1 month ago
actor在做inference的时候不是可以直接返回logits吗,为什么experience maker里面还重算了一次
to ensure accuracy. the accuracy of VLLM is different from HF
Thanks!
actor在做inference的时候不是可以直接返回logits吗,为什么experience maker里面还重算了一次