Open nuoma opened 1 year ago
您好,关于预训练阶段语料不知道以下几点是否有特殊的考量?
请问法律增量预训练阶段的语料大约是多少B的量级?全都是法律的吗,没有和通用的做混合?以及同属于法律数据,不同数据来源的比例?
您好,关于预训练阶段语料不知道以下几点是否有特殊的考量?
请问法律增量预训练阶段的语料大约是多少B的量级?全都是法律的吗,没有和通用的做混合?以及同属于法律数据,不同数据来源的比例?