Open peterpan23 opened 1 week ago
如题,项目中用的教师模型只有1.8b,那教师模型可以用商用的大参数量(几B甚至几十B)的闭源模型吗?
对模型参数量没有限制。但是需要模型能够对输入的句子输出相应的loss
如题,项目中用的教师模型只有1.8b,那教师模型可以用商用的大参数量(几B甚至几十B)的闭源模型吗?