ntua-cvsp-lab / DSP_LabSupport

Here the students of the 2019-2020 DSP course can submit questions regarding the course to the teaching assistants.
7 stars 3 forks source link

[Lab 2] 3.2 #88

Open iliaspap opened 4 years ago

iliaspap commented 4 years ago

Καλησπέρα. Είναι δυνατόν να μου θυμίσετε τι ακριβώς είναι η "η διακύμανση των αρχικών δεδομένων" και τι αναπαριστά η συνιστώσα yk που την "εξηγεί"; Η συνολική διακύμανση είναι το άθροισμα των λk; Ευχαριστώ πολύ.

iliaspap commented 4 years ago

Και μια ακόμη συμπλήρωση στο παραπάνω post: με ποια συνάρτηση φτιάχνουμε το διάγραμμα με τις κουκκίδες;

cgaroufis commented 4 years ago

Καλημέρα,

Μέσω της PCA, βρίσκετε έναν γραμμικό μετασχηματισμό V, ωστε να πάρετε τα δεδομένα Y = XV για τα οποία ισχύει ότι οι στήλες του Y περιγράφουν τη διακύμανση (η διασπορά) των αρχικών δεδομένων με φθίνουσα σειρά προς τα δεξιά, ευθυγραμμίζοντας πρακτικά τους άξονες με την κατανομή των δεδομένων (η διακύμανση των δεδομένων δεν είναι παρά το άθροισμα των ανά στήλη/χαρακτηριστικό διακυμάνσεων). Η συνολική διακύμανση ισούται με sum(σκ^2)/r = sum(λκ) οπου r ο βαθμός του αρχικού σου πίνακα, και η διακύμανση που εξηγεί η κάθε συνιστώσα yk ισούται με τη σειρά της με τη διασπορά της συνιστώσας (και ισχύει οτι σk^2/sum(σk^2) = var(yk)/sum(var(yk)).

Το 2D plot θα γίνει μέσω της συνάρτησης scatter() της matplotlib, η οποία δέχεται ως ορίσματα τις x και y συντεταγμένες των σημείων που θα πλοτάρεις, ως vectors.

Καλη συνέχεια, Χρήστος

iliaspap commented 4 years ago

Καλημέρα, ευχαριστώ για την απάντηση. Με μπερδεύει λίγο το λk^2. Μήπως εννοείτε σk^2, όπου σk οι ιδιόμορφες τιμές; Ευχαριστώ.

cgaroufis commented 4 years ago

Ναι ναι σωστά, εννοούσα τα διαγώνια στοιχεία του Σ (τα οποία και ισούνται με τις ιδιοτιμές του Σ). Will edit the above post accordingly.

Χρήστος