Open li-aolong opened 4 years ago
在
soft_masked_bert.py
中的41行,传入attention_mask
参数的应该是extended_attention_mask
,而不是encoder_extended_attention_mask
,但是extended_attention_mask
值,在36行被输出为_
。另外,很奇怪为什么要把原本封装好的函数拆开零散放到
_init_inputs()
中,内部基本没变还减少了一些东西,感觉没有必要而且降低代码的可阅读性。
拆开是因为需要softmask embedding这个操作吧, 至于参数extended_attention_mask的传递。。。没搞懂作者为什么传encoder_extended_attention_mask。。。
在
soft_masked_bert.py
中的41行,传入attention_mask
参数的应该是extended_attention_mask
,而不是encoder_extended_attention_mask
,但是extended_attention_mask
值,在36行被输出为_
。另外,很奇怪为什么要把原本封装好的函数拆开零散放到
_init_inputs()
中,内部基本没变还减少了一些东西,感觉没有必要而且降低代码的可阅读性。