2o Lab - Βήματα 9-12 - Χαμηλό Accuracy GMM-HMM

NikolaosSintoris commented 1 year ago

Καλησπέρα σας.

Αντιμετωπίζουμε ένα πρόβλημα στα βήματα 9 εως 12 για το 2ο lab το οποίο από ότι είδαμε είχε προκύψει ξανά σε προηγούμενες χρονιές.

Πιο συγκεκριμένα, παίρνουμε πολύ χαμηλό accuracy (max 40%) στο validation dataset από τις προβλέψεις των 10 GMM-HMM που έχουμε εκπαιδεύσει.

Αναλυτικά έχουμε κάνει τα ακόλουθα:

Διαβάζουμε τα δεδομένα του recordings μέσω των συναρτήσεων του βοηθητικού υλικού.
Κατασκευάζουμε μία λίστα για κάθε ψηφίο η οποία περιέχει όλα τα recordings του ψηφίου αυτού, υπό μορφή πινάκων με διάσταση (*, n_mfcc) όπου διαλέξαμε n_mfcc=13.
Για κάθε ψηφίο εκπαιδεύουμε ένα μοντέλο GMM-HMM όπου για την παραγωγή των GMMs χρησιμοποιήσαμε την συνάρτηση GeneralMixtureModel.from_samples(MultivariateGaussianDistribution, num_mixtures, X) όπου X είναι τα stacked στοιχεία της λίστας του κάθε ψηφίου.

Επίσης δοκιμάσαμε και τις εκδόσεις πακέτων που προτείνατε στο αντίστοιχο πρόβλημα #44

Σημείωση: Όλα έχουν μετατραπεί σε float64. Επίσης η διαδικασία έχει πραγματοποιηθεί και με MultivariateGaussianDistribution.from_samples(X).

Ευχαριστούμε εκ των προτέρων.

ibatsis commented 1 year ago

Καλησπέρα.

Τί σημαίνει " X είναι τα stacked στοιχεία της λίστας του κάθε ψηφίου"; Ποιά είναι η διαφορά του X απο το data;

grilio commented 1 year ago

Υπάρχει κάποια απάντηση σε αυτό; Γιατί αρκετοί έχουμε αυτό το πρόβλημα

georgepar commented 1 year ago

Αναλυτικά έχουμε κάνει τα ακόλουθα

Η διαδικασία που περιγράφετε φαίνεται σωστή. Έχετε πειραματιστεί με διαφορετικές παραμέτρους (πχ αριθμό gaussian, iterations, καταστάσεων?). Επίσης είναι σίγουρα left to right το HMM που φτιάχνετε?

Μπορείτε επίσης να ελέγξετε και τα παρακάτω: https://github.com/slp-ntua/patrec-labs/issues/166#issuecomment-1336136392

Τέλος, μπορείτε να συμπεριλάβετε και τα deltas/deltas^2 features και να ελέγξετε αν το normalization είναι σωστό

Τί σημαίνει " X είναι τα stacked στοιχεία της λίστας του κάθε ψηφίου"; Ποιά είναι η διαφορά του X απο το data;

Tα δεδομένα θα είναι σε μορφή λίστας από numpy arrays (sequence_length, num_features)

slp-ntua / patrec-labs

2o Lab - Βήματα 9-12 - Χαμηλό Accuracy GMM-HMM #169