Some weights of the model checkpoint at /home/sjh/project/NER/Bert-BiLSTM-CRF/model/ were not used when initializing BertModel: ['cls.seq_relationship.weight', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias', 'cls.seq_relationship.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.predictions.bias']
- This IS expected if you are initializing BertModel from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertModel from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
博主您好,我尝试复现了您的程序,目前有一些疑问,希望您能够帮助解答:
首先是关于预训练模型的选择,我在您提供的百度网盘中下载了bert-base-chinese文件夹内的模型文件并进行使用,发现无论是在训练还是在预测时,都会提示如下内容:
我不清楚这是否是正常的现象,因为确实在提示过后,程序也能够正常运行。
其次是在训练的过程中,每一轮epoch的训练时间会逐渐递增,例如第一轮只需要20分钟,第五轮就增加到了30分钟,第十轮就要40分钟时间,我不确定是否是因为存在内存泄漏的原因,还是和每一轮都重新生成一个模型文件这行指令有关,不知道博主是否有遇到过,并拥有解决方案。
最后,我也关注到了博主的另一个与CLUENER2020有关的项目,十分感兴趣,如果可以的话希望能够和博主取得联系并进行交流,我的邮箱为jianhangshang@126.com,博主方便的话可以将联系方式发至我的邮箱,谢谢!