Open LittleMisss opened 4 years ago
我想请问一下,attention部分的代码中,outputs = outputs / (keys.get_shape().as_list()[-1] ** 0.5)这步操作是做什么用的呀?
我想请问一下,attention部分的代码中,outputs = outputs / (keys.get_shape().as_list()[-1] ** 0.5)这步操作是做什么用的呀?