Open evansfk opened 4 years ago
Πρώτα κάνετε merge τις κατευθύνσεις μεταξύ τους και μετά να κάνετε attention. Συνοπτικά, αν N o αριθμός των timesteps και h το hidden size:
Μπορείτε να δοκιμάσετε και την εναλλακτική που προτείνετε για να συγκρίνετε, αλλά εμείς ζητάμε αυτό που περιέγραψα.
Στο αμφίδρομο LSTM με attention έχουμε 2 attention layers (ένα ανά κατεύθυνση)?