Closed inveterate-cladocerus closed 3 years ago
Hola,
No se puede hardcodear. A lo más podrías hacer que el fit
o el __init__
reciba un parámetros de "columnas a ocupar" o "columnas a ignorar" donde le dices que columnas del Dataframe puede usar o ignorar y en caso de ser None, usa todas. De este modo, si queremos usar otro dataset, solo tenemos que cambiar ese parámetro. De este modo árbol mantiene su capacidad de ser genérico y poder aplicarlo a cualquier dataset.
Saludos :v:
Hola!
Complementando lo que djo Hernán, la idea es que tu algoritmo reciba las columnas a ocupar ya que existen algunas columnas como Name que en este caso no aportan nada a este algoritmo. Pero, no puede recibir las columnas categóricas y numéricas como parámetros distintos, la idea es que tu función detecte cuales columnas son categóricas o numéricas, logrando así que el algoritmo sea lo más genérico posible
Saludos!
Hola y los valores de la columna a predecir? ("successful" y "failed"))?
Hola, tampoco se puede hardcodear eso. En el código base (y enunciado) se especifica que el método train
recibe X, Y, es decir ya está separado la parte de datos para entrenar y la columna a predecir. El árbol debe ser capaz de detectar cuales valores son los posibles de dicha columna.
Saludos :v:
Hola, vengo a hacer una pregunta vergonzosa y polémica, ¿se pueden hardcodear los nombres de las columnas? No me juzguen uwu.