taishan1994 / pytorch_bert_entity_linking

基于bert的中文实体链接
28 stars 7 forks source link

作者你好,关于训练数据的来源 #2

Closed St-fcq closed 2 years ago

St-fcq commented 2 years ago

你好! 有幸看到基于bert的实体链接代码,关于代码中训练集采用,train.pkl文件为啥不用train.json文件,还有这个.pkl文件是如何来的,里面的数据格式不是很懂,麻烦解答一下,谢谢

taishan1994 commented 2 years ago

你好! 有幸看到基于bert的实体链接代码,关于代码中训练集采用,train.pkl文件为啥不用train.json文件,还有这个.pkl文件是如何来的,里面的数据格式不是很懂,麻烦解答一下,谢谢

在el_preprocess.py里面,实际上是根据tran.json处理后得到的,为了避免每次训练时都要再处理一遍,就先生成结果并保存。