slp-ntua / patrec-labs

Helper scripts for Pattern Recognition NTUA Course
10 stars 20 forks source link

2o Lab - Βήματα 9-12 - Χαμηλό Accuracy GMM-HMM #169

Closed NikolaosSintoris closed 1 year ago

NikolaosSintoris commented 1 year ago

Καλησπέρα σας.

Αντιμετωπίζουμε ένα πρόβλημα στα βήματα 9 εως 12 για το 2ο lab το οποίο από ότι είδαμε είχε προκύψει ξανά σε προηγούμενες χρονιές.

Πιο συγκεκριμένα, παίρνουμε πολύ χαμηλό accuracy (max 40%) στο validation dataset από τις προβλέψεις των 10 GMM-HMM που έχουμε εκπαιδεύσει.

Αναλυτικά έχουμε κάνει τα ακόλουθα:

Επίσης δοκιμάσαμε και τις εκδόσεις πακέτων που προτείνατε στο αντίστοιχο πρόβλημα #44

Σημείωση: Όλα έχουν μετατραπεί σε float64. Επίσης η διαδικασία έχει πραγματοποιηθεί και με MultivariateGaussianDistribution.from_samples(X).

Ευχαριστούμε εκ των προτέρων.

ibatsis commented 1 year ago

Καλησπέρα.

Τί σημαίνει " X είναι τα stacked στοιχεία της λίστας του κάθε ψηφίου"; Ποιά είναι η διαφορά του X απο το data;

grilio commented 1 year ago

Υπάρχει κάποια απάντηση σε αυτό; Γιατί αρκετοί έχουμε αυτό το πρόβλημα

georgepar commented 1 year ago

Αναλυτικά έχουμε κάνει τα ακόλουθα

Η διαδικασία που περιγράφετε φαίνεται σωστή. Έχετε πειραματιστεί με διαφορετικές παραμέτρους (πχ αριθμό gaussian, iterations, καταστάσεων?). Επίσης είναι σίγουρα left to right το HMM που φτιάχνετε?

Μπορείτε επίσης να ελέγξετε και τα παρακάτω: https://github.com/slp-ntua/patrec-labs/issues/166#issuecomment-1336136392

Τέλος, μπορείτε να συμπεριλάβετε και τα deltas/deltas^2 features και να ελέγξετε αν το normalization είναι σωστό

Τί σημαίνει " X είναι τα stacked στοιχεία της λίστας του κάθε ψηφίου"; Ποιά είναι η διαφορά του X απο το data;

Tα δεδομένα θα είναι σε μορφή λίστας από numpy arrays (sequence_length, num_features)