ergostats / curso_python_poli_dec

En este repositorio se va a preparar el material del curso de python para la Asociacion de estudiantes del DEC en el contexto del programa Nido del Buho

GNU General Public License v3.0

0 stars 0 forks source link

Notas para las clases 9 #19

Open ergostats opened 9 months ago

ergostats commented 9 months ago

Este es la estructura que debemos cumplir:

[x] Cambiar categorías de referencia con get_dummies. Función para hacer esto automaticamente
```
import pandas as pd
```

Asumiendo que 'df' es tu DataFrame y 'tipo_piso' es tu columna de tipo de piso

dummies = pd.get_dummies(df['tipo_piso'], prefix='piso')

Eliminar la columna correspondiente a la categoría de referencia

Asumiendo que 'piso_4' es la categoría de referencia

dummies = dummies.drop('piso_4', axis=1)

Unir las columnas dummy al DataFrame original

df = pd.concat([df, dummies], axis=1)

Eliminar la columna original 'tipo_piso'

df = df.drop('tipo_piso', axis=1)


- [x] Como interpretar un modelo con dummies grandes
- [ ] Cross validation :
```python

# Sin la seed se vuelve una resample cada vez

X_train, X_test, y_train, y_test = train_test_split(x.values.reshape(-1, 1), y.values, test_size=0.2, random_state=42)

Las idea sería explicar como cambia el beta con las samples.

Alex

[ ] Con las dummies ya tenemos introducción a modelos de regresión multiple
[ ] Aplicar esta regression multiple