[ ] Definir 4 conjuntos de variables : 1) Todas las variables , 2) Todas las variables con menos de 5% y probar con 10% de nulls, 3)Variables elegidas "Segun la literatura", 4)Usar las 5 variables mas importantes
[x] RandomGridSearch() para elegir los hiperparams
[x] Exportar grilla, instancias del modelo y metricas EN CADA ITERACION DE LA GRILLA!
[x] Modelos:
[x] Regresion lineal Todo multple → No robusta
[x] Lasso (Regresion penalizada por cantidad variables)
[x] Elasticnet
[x] Regresion Trees
[x] Random Forest
[x] Bagging
[x] XGBoost
[x] LigthGBM
[x] Red neuronal → No robusta
[x] KNN pa mostrar que da pesimo → No robusta
[x] XGBoost Quantile
[x] Lasso Quantile Regression
CREAR FUNCIONES POR EJEMPLO:
def modelo_lasso(df, vars, params):
# Corre el lasso, no elige hyperparametros. SIrve para entrenar un modelo solo.
metrics = calcula_metricas(df[y], model)
# Guardar params y metrics
return model, metrics
def correr_lasso(df, vars):
grilla = ...
model = modelo_lasso(df, vars, params=grilla):
return metrics, model
Metrics son las métricas que vamos a usar (MSE) y model es el modelo entrenado para poder reutilizarlo.
CREAR FUNCIONES POR EJEMPLO:
Metrics son las métricas que vamos a usar (MSE) y model es el modelo entrenado para poder reutilizarlo.