Open ann22 opened 4 years ago
您好,bert-distil-chinese模型的json文件里 有一个参数是"hidden_size": 768,运行程序时总是提示这个参数不能赋值,是什么原因呢?呀?
我也遇到了同样的问题
我用的是transformer 2.10,给出我的参考解决方案:
因为distilBertConfig类里用了@property来修饰hidden_size,所以就不能直接对hidden_size赋值
@property def hidden_size(self): return self.dim
可见hidden-size已经用dim的参数来代替了,且config.json里已经设了dim的参数,因此需要删除hidden_size参数。
除此外num_attention_heads(n_heads)和num_hidden_layers(n_layers)会遇到同样的问题,同解决方案。
@ann22 下载地址:https://huggingface.co/adamlin/bert-distil-chinese ,但是我试了一些,没有跑成功 @zhaogaofeng611 大佬你用的transformers 对应版本是2.5.1 的吗