Open BrambleXu opened 5 years ago
一句话总结:
也是针对NMT任务的, 关于analysis of multi-head attention 的部分,the average of attention weights over all heads at a given position。 #235 引用了
资源:
论文信息:
笔记:
模型图:
结果:
接下来要看的论文:
一句话总结:
也是针对NMT任务的, 关于analysis of multi-head attention 的部分,the average of attention weights over all heads at a given position。 #235 引用了
资源:
论文信息:
笔记:
模型图:
结果:
接下来要看的论文: