stanleylsx / text_classifier_tf2

Tensorflow2.3的文本分类项目,支持各种分类模型,支持相关tricks。
174 stars 42 forks source link

这两个参数是什么意思? #18

Closed zhanghaoxuan1999 closed 2 years ago

zhanghaoxuan1999 commented 2 years ago

attention_size patient 您好,我在其他的项目论文中没有看到这两个参数的信息,想知道这两个参数是什么意思,以及它们的大小会产生什么影响? 在用bert等预训练模型中需要用这两个参数吗?

stanleylsx commented 2 years ago

attention_size patient 您好,我在其他的项目论文中没有看到这两个参数的信息,想知道这两个参数是什么意思,以及它们的大小会产生什么影响? 在用bert等预训练模型中需要用这两个参数吗?

attention_size是TextRNN里面的注意力矩阵的大小,不适用它的时候不用管; patient是early_stop的参数,当patient次模型不会有进步时候自动停止训练。