slp-ntua / patrec-labs

Helper scripts for Pattern Recognition NTUA Course
10 stars 20 forks source link

Lab 3 - Απορία για overfit_batch #175

Closed NickSpanos55 closed 1 year ago

NickSpanos55 commented 1 year ago

Καλησπέρα σας. Προσπαθούμε να υλοποιήσουμε την μέθοδο του overfit_batch, παρ'ολ'αυτά, το μοντέλο LSTM δεν κάνει overfit ακόμα και για 1 batch. Θα έπρεπε να βλέπουμε 100% accuracy στα training δεδομένα και ,γενικότερα, πρέπει να βλέπουμε τέτοια χαμηλά scores?(τύπου 15%) Σας ευχαριστούμε πολύ.

NickSpanos55 commented 1 year ago

Το πρόβλημα με το overfit λύθηκε. Αλλά έχουμε ακόμα απορία για τα scores. Σας ευχαριστούμε.

pxaris commented 1 year ago

Καλησπέρα, ναι το απλό LSTM πιθανότατα κινείται σ' αυτά τα επίπεδα. Δοκιμάστε να αναπτύξετε Bidirectional-LSTM, να αυξήσετε τα LSTM layers (πχ σε 2 ή 3) και να βάλετε dropout (πχ 0.2).