Open prefect12 opened 2 weeks ago
也没错,这是个原始尺寸236B的混合模型,放这里是只算了其推理时使用21B的激活参数,但也超过200亿了
哈哈哈,10B内最强,20B内也是最强