Open erichuazhou opened 1 year ago
1、在sequence_tagger_model.py的simple_forward_distillation_loss()的实现中,在 2185 行:
该条件永远为False,请问下该条件下的代码是测试代码吗?还是为了解决 句子长度为1 时的特殊情况?
2、在复现Linear-Chain CRF⇒Linear-ChainCRF的任务过程中,配置均为默认配置。发现simple_forward_distillation_loss()的实现中,exact_loss的值的数量级永远大约是target_loss值的 **T***T 倍。而这两者应该是同一个数量级才有意义。是否在代码实现中有些bug? 谢谢。
@wangxinyu0922 @yanzhh @JZXXX
1、在sequence_tagger_model.py的simple_forward_distillation_loss()的实现中,在 2185 行:
该条件永远为False,请问下该条件下的代码是测试代码吗?还是为了解决 句子长度为1 时的特殊情况?
2、在复现Linear-Chain CRF⇒Linear-ChainCRF的任务过程中,配置均为默认配置。发现simple_forward_distillation_loss()的实现中,exact_loss的值的数量级永远大约是target_loss值的 **T***T 倍。而这两者应该是同一个数量级才有意义。是否在代码实现中有些bug? 谢谢。
@wangxinyu0922 @yanzhh @JZXXX