Closed Franklin-L closed 6 months ago
前辈您好,我是小白接触chatglm3,最近在想办法评估微调后的chatglm3的性能,现在是了解到对于通用的评估有BLEU 和 ROUGE 分数,请问前辈做过这个方面的吗
用cEval, MMLU
嗷嗷好的谢谢大佬,那针对微调后的呢,如果想自己个性化定制一个方法应该怎么下手呢
微调后评估。
前辈您好,我是小白接触chatglm3,最近在想办法评估微调后的chatglm3的性能,现在是了解到对于通用的评估有BLEU 和 ROUGE 分数,请问前辈做过这个方面的吗