Closed lonngxiang closed 3 years ago
1.预训练的语料就是句子列表,具体构造方式根据自己的语料来修改preprocess.py 中的 generator_corp方法即可。 2.暂时是只做了roberta的方式。 3.更灵活的方式可以参考classification_tnews_pretrain_before_finetuning.py
1.预训练的语料就是句子列表,具体构造方式根据自己的语料来修改preprocess.py 中的 generator_corp方法即可。 2.暂时是只做了roberta的方式。 3.更灵活的方式可以参考classification_tnews_pretrain_before_finetuning.py