lxy444 / bertcner

Chinese clinical named entity recognition using pre-trained BERT model
121 stars 21 forks source link

请问用于预训练的数据只有CCKS的电子病历数据,还是有加入额外的医疗or电子病历数据? #9

Open fenglsh3 opened 3 years ago

fenglsh3 commented 3 years ago

如题。btw,请问有项目相关的论文or教程可以参考吗?

lxy444 commented 3 years ago

如题。btw,请问有项目相关的论文or教程可以参考吗?

预训练的数据还包括了爬虫获取的数据。 论文的话可以看一下参考文献列表里的经典论文。

fenglsh3 commented 3 years ago

如题。btw,请问有项目相关的论文or教程可以参考吗?

预训练的数据还包括了爬虫获取的数据。 论文的话可以看一下参考文献列表里的经典论文。

非常感谢解答!!!

fenglsh3 commented 3 years ago

如题。btw,请问有项目相关的论文or教程可以参考吗?

预训练的数据还包括了爬虫获取的数据。 论文的话可以看一下参考文献列表里的经典论文。

请问方便提供放入预训练的词向量数据吗?

lxy444 commented 3 years ago

如题。btw,请问有项目相关的论文or教程可以参考吗?

预训练的数据还包括了爬虫获取的数据。 论文的话可以看一下参考文献列表里的经典论文。

请问方便提供放入预训练的词向量数据吗?

你是说爬虫获取的语料吗,这个比较杂乱,小文件也比较多,所以没上传,不过公开了代码,在crawl_data 这个文件夹里。

fenglsh3 commented 3 years ago

如题。btw,请问有项目相关的论文or教程可以参考吗?

预训练的数据还包括了爬虫获取的数据。 论文的话可以看一下参考文献列表里的经典论文。

请问方便提供放入预训练的词向量数据吗?

你是说爬虫获取的语料吗,这个比较杂乱,小文件也比较多,所以没上传,不过公开了代码,在crawl_data 这个文件夹里。

好滴!!谢谢啦!

weinixuehao commented 3 years ago

ccks 2018的数据集现在下不了了吗