IIC2433 / Syllabus-2020-2

20 stars 6 forks source link

Hardcodeo lml #61

Closed inveterate-cladocerus closed 3 years ago

inveterate-cladocerus commented 3 years ago

Hola, vengo a hacer una pregunta vergonzosa y polémica, ¿se pueden hardcodear los nombres de las columnas? No me juzguen uwu.

Hernan4444 commented 3 years ago

Hola,

No se puede hardcodear. A lo más podrías hacer que el fito el __init__ reciba un parámetros de "columnas a ocupar" o "columnas a ignorar" donde le dices que columnas del Dataframe puede usar o ignorar y en caso de ser None, usa todas. De este modo, si queremos usar otro dataset, solo tenemos que cambiar ese parámetro. De este modo árbol mantiene su capacidad de ser genérico y poder aplicarlo a cualquier dataset.

Saludos :v:

sricke commented 3 years ago

Hola!

Complementando lo que djo Hernán, la idea es que tu algoritmo reciba las columnas a ocupar ya que existen algunas columnas como Name que en este caso no aportan nada a este algoritmo. Pero, no puede recibir las columnas categóricas y numéricas como parámetros distintos, la idea es que tu función detecte cuales columnas son categóricas o numéricas, logrando así que el algoritmo sea lo más genérico posible

Saludos!

sebacarrasco commented 3 years ago

Hola y los valores de la columna a predecir? ("successful" y "failed"))?

Hernan4444 commented 3 years ago

Hola, tampoco se puede hardcodear eso. En el código base (y enunciado) se especifica que el método train recibe X, Y, es decir ya está separado la parte de datos para entrenar y la columna a predecir. El árbol debe ser capaz de detectar cuales valores son los posibles de dicha columna.

Saludos :v: