Επανέρχομαι σχετικά με την άσκηση 2.2, γιατί, αν και έχω μία εκτίμηση, κάνοντας κάποιες παραδοχές, την εκφώνηση στην ολότητά της συνεχίζω να μην μπορώ να την καταλάβω. Σχετικά με κάθε ερώτημα:
Πώς γίνεται να μην συμμετέχει η $f$ στην τελική έκφραση για την παράγωγο, αν, από ότι καταλαβαίνω, η συνάρτηση σφάλματος είναι $L_t = L(o_t, (πραγματική ~ τιμή)_t)$ και $o_t = f(V h_t)$? Μάλιστα, θα έλεγα ότι πρέπει να συμμετέχει η παράγωγος της $f$.
Για παρόμοιους λόγους, δεν βλέπω πώς γίνεται να μην χρησιμοποιήσω το $V$.
Να σημειώσω εδώ ότι έχω υποθέσει πως η συνάρτηση σφάλματος συγκρίνει $o_t$ και πραγματική τιμή, υποθέτοντας ότι η $o_t$ είναι η τελική έξοδος του δικτύου μας, αν και αυτός ο συμβολισμός δεν είναι ο ίδιος με αυτόν που βλέπω στο βιβλίο του Goodfellow εδώ, σελ 374 πχ. Οπότε μήπως εδώ κάτι δεν έχω καταλάβει σωστά;
Καλησπέρα.
Επανέρχομαι σχετικά με την άσκηση 2.2, γιατί, αν και έχω μία εκτίμηση, κάνοντας κάποιες παραδοχές, την εκφώνηση στην ολότητά της συνεχίζω να μην μπορώ να την καταλάβω. Σχετικά με κάθε ερώτημα:
Να σημειώσω εδώ ότι έχω υποθέσει πως η συνάρτηση σφάλματος συγκρίνει $o_t$ και πραγματική τιμή, υποθέτοντας ότι η $o_t$ είναι η τελική έξοδος του δικτύου μας, αν και αυτός ο συμβολισμός δεν είναι ο ίδιος με αυτόν που βλέπω στο βιβλίο του Goodfellow εδώ, σελ 374 πχ. Οπότε μήπως εδώ κάτι δεν έχω καταλάβει σωστά;