Closed bidoudhd closed 2 years ago
在进行填空时,需要通过<span>
来设置需要预测的位置。
Input: 近日,北京智源人工智能研究院和清华大学____以中文为核心的大规模预训练语言模型 “____”,参数规模达 26 亿,预训练中文数据规模 100 GB。
Output: 近日,北京智源人工智能研究院和清华大学共同发布以中文为核心的大规模预训练语言模型 “中文语库”,参数规模达 26 亿,预训练中文数据规模 100 GB。
在T5预训练任务,会将15%的token给mask掉,所以在最终使用的时候,合理的设置span会有更好的效果。
请问对于span的选择有什么要求吗?如果
Input: 近日,北京智源人工智能研究院和清华大学研究团队____以中文为核心的大规模预训练语言模型CPM-LM,参数规模达 26 亿,预训练中文数据规模 100 GB。
则报错
Unexpected model output: 26239
这个错误的原因是什么?
这个应该是因为span数量有点少所以模型不能很好的去做填空任务,一般随便再加两个就好了。
将输入改成 input_text = "近日,北京智源人工智能研究院和清华大学研究团队发布了以中文为核心的大规模预训练语言模型 CPM-LM,参数规模达 26 亿,预训练中文数据规模 100 GB。" 会报错 "Unexpected model output: 26239" 请问fill_blank输入的文本有什么要求?或者对要填空的词有什么要求? 用的是 cpm2 = bminf.models.CPM2()
用pip 安装的,bminf-1.0.0