IIC2433-2017-2 / T02

Repositorio para realizar consultas sobre la tarea 1
1 stars 0 forks source link

Reglas de decisión #15

Open Hernan4444 opened 6 years ago

Hernan4444 commented 6 years ago

Hola, La pregunta puede ser media tonta 🙏, pero para confirmar, cuando solicitan la regla de decision del corte, se refieren a la forma de medir la calidad cuando se crean los nodos (Entropia o gini) o es otra cosa.

Saludos Gracias de antemano!

bcsaldias commented 6 years ago

Hola!

No hay preguntas tontas :). Y voy a citar una frase que escuché el otro día "Do not apology, you are learning".

Correcto, esa es la regla de decisión, además de cuántas filas debe haber mínimo para realizar el corte.

Saludos!

El 14 de octubre de 2017, 22:46, Hernan Valdiviesonotifications@github.com escribió:

Hola, La pregunta puede ser media tonta 🙏, pero para confirmar, cuando solicitan la regla de decision del corte, se refieren a la forma de medir la calidad cuando se crean los nodos (Entropia o gini) o es otra cosa.

Saludos Gracias de antemano!

— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub https://github.com/IIC2433-2017-2/T02/issues/15, or mute the thread https://github.com/notifications/unsubscribe-auth/AKHLfvJvf0lw3KmMOQ6n52xhicmfLzfDks5ssWP8gaJpZM4P5mGW .

Hernan4444 commented 6 years ago

Muchas gracias!! c: ¿Esto implica que los input serían 4?

  1. Numero de arboles del forest.
  2. Usar gini o entropia para los cortes.
  3. Numeros de filas para los cortes.
  4. Números de features para cada arbol del forest al hacer random features

Está bien eso? (Que en enunciado solo se indicaban 3 y eso podría generar alguna duda a otros compañeros 😅)

Además, es posible agregar más input como la profundidad máxima de los árboles? o es recomendable no jugar con esa variable por ahora?

Saludos!!

bcsaldias commented 6 years ago

Si, puedes agregar más inputs.

En el control del entrenamiento tiene que ir por definición el treshold o número de filas. Así que aunque no está explícito como input hay que considerarlo. Como bien te diste cuenta.

Saludos!!

El 14 oct. 2017 23:12, "Hernan Valdivieso" notifications@github.com escribió:

Muchas gracias!! c: ¿Esto implica que los input serían 4?

  1. Numero de arboles del forest.
  2. Usar gini o entropia para los cortes.
  3. Numeros de filas para los cortes.
  4. Números de features para cada arbol del forest al hacer random features

Está bien eso? (Que en enunciado solo se indicaban 3 y eso podría generar alguna duda a otros compañeros 😅)

Además, es posible agregar más input como la profundidad máxima de los árboles? o es recomendable no jugar con esa variable por ahora?

Saludos!!

— You are receiving this because you commented. Reply to this email directly, view it on GitHub https://github.com/IIC2433-2017-2/T02/issues/15#issuecomment-336680905, or mute the thread https://github.com/notifications/unsubscribe-auth/AKHLfrlNof4J2QEi5gaafCb-Eg-K98Hqks5ssWntgaJpZM4P5mGW .

vaopaso commented 6 years ago

No entiendo algo. Si uno hace bagging, entonces la idea es que cada árbol se entrene con un subset del set total de training, pero este subset es realmente un subconjunto de qué? Es un subconjunto del número de samples (manteniendo todas las features)? o es un subconjunto del número de features (manteniendo todas las samples)?

Saludos!