hiyoung123 / SoftMaskedBert

Soft-Masked Bert 复现论文:https://arxiv.org/pdf/2005.07421.pdf
255 stars 47 forks source link

统一回复 #11

Open hiyoung123 opened 4 years ago

hiyoung123 commented 4 years ago

各位抱歉,当时只是照着论文写出代码跑通了而已. 由于工作比较忙,没有时间搞这个code, 还有很多bug. 在这里给大家推荐一个网站,大多数数据集都可以在这里下载 https://www.cluebenchmarks.com/dataSet_search.html

论文中的数据集,作者自己也爬取了100w的新闻标题,数据量不是一个级别的. 有兴趣可以自己写爬虫爬取,数据处理的脚本,本仓库也有.

在此感谢大家关注,多谢!

huitang commented 4 years ago

你好 请问random_text origin_text 和label 分别是什么。 多谢了