Open iliaspap opened 4 years ago
Και μια ακόμη συμπλήρωση στο παραπάνω post: με ποια συνάρτηση φτιάχνουμε το διάγραμμα με τις κουκκίδες;
Καλημέρα,
Μέσω της PCA, βρίσκετε έναν γραμμικό μετασχηματισμό V, ωστε να πάρετε τα δεδομένα Y = XV για τα οποία ισχύει ότι οι στήλες του Y περιγράφουν τη διακύμανση (η διασπορά) των αρχικών δεδομένων με φθίνουσα σειρά προς τα δεξιά, ευθυγραμμίζοντας πρακτικά τους άξονες με την κατανομή των δεδομένων (η διακύμανση των δεδομένων δεν είναι παρά το άθροισμα των ανά στήλη/χαρακτηριστικό διακυμάνσεων). Η συνολική διακύμανση ισούται με sum(σκ^2)/r = sum(λκ) οπου r ο βαθμός του αρχικού σου πίνακα, και η διακύμανση που εξηγεί η κάθε συνιστώσα yk ισούται με τη σειρά της με τη διασπορά της συνιστώσας (και ισχύει οτι σk^2/sum(σk^2) = var(yk)/sum(var(yk)).
Το 2D plot θα γίνει μέσω της συνάρτησης scatter() της matplotlib, η οποία δέχεται ως ορίσματα τις x και y συντεταγμένες των σημείων που θα πλοτάρεις, ως vectors.
Καλη συνέχεια, Χρήστος
Καλημέρα, ευχαριστώ για την απάντηση. Με μπερδεύει λίγο το λk^2. Μήπως εννοείτε σk^2, όπου σk οι ιδιόμορφες τιμές; Ευχαριστώ.
Ναι ναι σωστά, εννοούσα τα διαγώνια στοιχεία του Σ (τα οποία και ισούνται με τις ιδιοτιμές του Σ). Will edit the above post accordingly.
Χρήστος
Καλησπέρα. Είναι δυνατόν να μου θυμίσετε τι ακριβώς είναι η "η διακύμανση των αρχικών δεδομένων" και τι αναπαριστά η συνιστώσα yk που την "εξηγεί"; Η συνολική διακύμανση είναι το άθροισμα των λk; Ευχαριστώ πολύ.