Implementar "Masked Multi-Head Attention" con PyTorch (.py)

somosnlp / the-annotated-transformer

Traducción al español del notebook "The Annotated Transformer" de Harvard NLP donde se explica e implementa el paper "Attention Is All You Need".

5 stars 3 forks source link

Open mariagrandury opened 3 years ago

mariagrandury commented 3 years ago