AlenaMochalina / Credit-card-attrition-analysis-in-Python

0 stars 2 forks source link

Data Preprocessing #3 #3 #6

Open AlenaMochalina opened 2 months ago

AlenaMochalina commented 2 months ago

Missing values: Identify missing values using isnull() and decide how to handle them (imputation, removal, etc.).

Data formatting: Ensure that all columns have the correct data types (e.g., converting strings to dates or categorical variables).

Duplicate removal: Use drop_duplicates() to ensure there are no duplicate records in the data.

Normalization and scaling: If using models sensitive to value scaling (e.g., K-Means), consider scaling the data using StandardScaler or MinMaxScaler from the sklearn library.

AlenaMochalina commented 2 months ago

Příprava dat pro modelování je klíčovým krokem v procesu strojového učení. Před samotným modelováním je nutné provést několik kroků, jako je prozkoumání dat, čištění, úprava proměnných a rozdělení dat na trénovací a testovací sady.

1.) pro klasifikaci odstraním 3 fearatury: 'CLIENTNUM', 'Naive_Bayes_Classifier_Attrition_Flag_Card_Category_Contacts_WalkIn_Delta_2', 'Naive_Bayes_Classifier_Attrition_Flag_Card_Category_Contacts_WalkIn_Delta_1',

2.) pro shlukování odstraním navíc i cílovou proměnnou Attrition_Flag, protože pro shlukování není potřebná.