Open IdoRafael opened 6 years ago
אם הדאטה לא מתפלג נורמלית אתה יכול להפעיל log ואז אולי זה יעזור ואז תוכל לבצע את מבחן Z.
יש ב-skleran שיטות להבין אם כלל הרשומה היא outlier אבל הייתי נזהר קצת מזה כי לפעמים זה לא מתפקד טוב אם הדאטה מלוכלך מדי.
החלטה מה לעשות עם outlier: להפטר מרשומה, או להפוך ערך outlier ל-null (ואח"כ לטפל בו ב-imputation).
אלגוריתמים לדוגמא:
*plot_lof: זה אלגוריתם יותר טוב מ-eliptic envelop: http://scikit-learn.org/stable/auto_examples/neighbors/plot_lof.html
Manually test features for illogical entries (like negative salary, etc).
אם הדאטה לא מתפלג נורמלית אתה יכול להפעיל log ואז אולי זה יעזור ואז תוכל לבצע את מבחן Z.
יש ב-skleran שיטות להבין אם כלל הרשומה היא outlier אבל הייתי נזהר קצת מזה כי לפעמים זה לא מתפקד טוב אם הדאטה מלוכלך מדי.
החלטה מה לעשות עם outlier: להפטר מרשומה, או להפוך ערך outlier ל-null (ואח"כ לטפל בו ב-imputation).
אלגוריתמים לדוגמא:
*plot_lof: זה אלגוריתם יותר טוב מ-eliptic envelop: http://scikit-learn.org/stable/auto_examples/neighbors/plot_lof.html