Closed zhangyifei1 closed 2 years ago
大佬,你写的静态图和动态图模型我都在使用,但是在训练的时候有个疑问。相同的数据、字典、标准化值,在训练的时候收敛的速度很不一样,请问下这是什么原因。 图一是静态图下2个epoch的loss以及test cer。 图二是动态图下20个epoch的loss以及test cer。
模型结构不是完全对齐的,这个项目下的准确率更好些。
大佬,你写的静态图和动态图模型我都在使用,但是在训练的时候有个疑问。相同的数据、字典、标准化值,在训练的时候收敛的速度很不一样,请问下这是什么原因。 图一是静态图下2个epoch的loss以及test cer。 图二是动态图下20个epoch的loss以及test cer。