Open cjt222 opened 3 years ago
请问下,使用中文语料训练语言模型,得到的指标是 epoch 15 iter 28000: eval loss = 2.5787, ccr = 0.7434, cwr = 0.0914, ted = 0.0000, ned = 0.0000, ted/w = 0.0000,但是推理时却效果不佳,这个可能是什么原因?
input: 我是申华人民共和国公民 output:['这校中请人民共和谐公司的的']
我也遇到这种汉字出现重复比如你的结果里面的(的的),不知道为啥
论文中abinet的语言模型的cwr可以到41%我看到训练集是mj+st的词库,测试集是随机抽取的20000词,然后60%是replace错误,20%增删错误,测试集这部分具体是什么样?能不能放出来,我按照论文复现了这部分数据集,但是只能到37.07%
请问下,使用中文语料训练语言模型,得到的指标是 epoch 15 iter 28000: eval loss = 2.5787, ccr = 0.7434, cwr = 0.0914, ted = 0.0000, ned = 0.0000, ted/w = 0.0000,但是推理时却效果不佳,这个可能是什么原因?
input: 我是申华人民共和国公民 output:['这校中请人民共和谐公司的的']
你好,想请教下你是如何生成语言的语料库呢?
你好,想请教下你是如何生成语言的语料库呢?
你好,想请教下你是如何生成语言的语料库呢?
你好,想请教下你是如何生成语言的语料库呢?
你好,想请教下你是如何生成语言的语料库呢?
同问
请问下,使用中文语料训练语言模型,得到的指标是 epoch 15 iter 28000: eval loss = 2.5787, ccr = 0.7434, cwr = 0.0914, ted = 0.0000, ned = 0.0000, ted/w = 0.0000,但是推理时却效果不佳,这个可能是什么原因?
input: 我是申华人民共和国公民 output:['这校中请人民共和谐公司的的']