Closed liuwj2000 closed 1 month ago
请问超参数里面的这个d_ff是什么啊
d_ff来自于dimension_feedforward,是指transformer中的feedforward中间层的维度,这里是也是一个维度变换的中间维度,从d_model变换到d_ff
请问超参数里面的这个d_ff是什么啊