xhw205 / GPLinker_torch

CMeIE/CBLUE/CHIP/实体关系抽取/SPO抽取
207 stars 14 forks source link

似乎有个BUG,训练过程loss出现负值,但是保存的模型仍然有效 #3

Closed xhw205 closed 2 years ago

xhw205 commented 2 years ago

有知道原因的朋友欢迎讨论

xhw205 commented 2 years ago

https://github.com/bojone/bert4keras/issues/436

Chtholly1 commented 2 years ago

确实是的,我也没搞太明白,不过还是复现的很赞了,感谢作者!

touchwolf commented 2 years ago

bojone/bert4keras#436

仔细调试了一下,苏神在截断的时候采用的值是1e-7,而楼主复现的代码里截断值是1e-10,会不会是这个原因?