Closed rick-mondy closed 5 years ago
您好,您的代码给了我很大帮助,关于transformer我想请教一下,一个[batch_size, seq_len, embed_size]的tensor经过transformer的encoder后还是[batch_size, seq_len, embed_size],然后可以在第二个维度上累加为[batch_size, embed_size],进行分类任务吗?
您好,您的代码给了我很大帮助,关于transformer我想请教一下,一个[batch_size, seq_len, embed_size]的tensor经过transformer的encoder后还是[batch_size, seq_len, embed_size],然后可以在第二个维度上累加为[batch_size, embed_size],进行分类任务吗?