IIC2433-2017-2 / T03

1 stars 0 forks source link

Valores iniciales #2

Open Hernan4444 opened 7 years ago

Hernan4444 commented 7 years ago

Hola,

Estoy trabajando en la tarea y tengo el problema que actualmente estoy seleccionando los centros de las gaussianas de forma random entre los datos que tengo y a veces pasa que 2 valores son parte de la misma gaussiana, lo cual hace que dos gaussianas estén con el mismo grupo de datos y otra se expanda para solapar los 2 cluster de puntos.

En base al problema anterior, quería preguntar si era posible usar k-means para encontrar cluster y en base a eso definir los centroides iniciales de EM. ¿Es posible?

En el caso de Si, ¿uso el de sklearn o el implementado por mi?

Y si es el implementado por nosotros, ¿tiene que ser todo sin ningún for, al menos 1 para itelar las gaussiana o esa parte puede usar todos los fors que queramos?

Gracias de antemanno por la respuesta. Saludos ✌️

bcsaldias commented 7 years ago

Hola,

  1. Recomiendo toma valores aleatorios en el espacio. No asumas que un punto será centro de cluster.
  2. Si relajas lo anterior tu proceso debería adar bien. Se ajustan los PI ?
  3. Al menos debe funcionar con medias aleatorias. Puedes también trabajarlo con Kmeans antes, para esto debes usar tu implementación de la AC (sin requisitos de for - porque de alguna forma hay que hacer un map para pasar por todos los datos).

Saludos! Belén

El 11 de noviembre de 2017, 12:27, Hernan Valdivieso< notifications@github.com> escribió:

Hola,

Estoy trabajando en la tarea y tengo el problema que actualmente estoy seleccionando los centros de las gaussianas de forma random entre los datos que tengo y a veces pasa que 2 valores son parte de la misma gaussiana, lo cual hace que dos gaussianas entén con el mismo grupo de datos y otra se expanda para solapar los 2 cluster de puntos.

En base al problema anterior, quería preguntar era posible usar k-means para encontrar cluster y en base a eso definir los centroides iniciales de EM. ¿Es posible?

En el caso de Si, ¿uso el de sklearn o el implementado por mi?

Y si es el implementado por nosotros, ¿tiene que ser todo sin ningún for, al menos 1 para itelar las gaussiana o esa parte puede usar todos los fors que queramos?

Gracias de antemanno por la respuesta. Saludos ✌️

— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub https://github.com/IIC2433-2017-2/T03/issues/2, or mute the thread https://github.com/notifications/unsubscribe-auth/AKHLfoeufgjHAYzY7Vq1UH_VT8LQxUm6ks5s1bzNgaJpZM4Qahme .

bcsaldias commented 7 years ago
  1. Kmeans no soluciona el problema que anteriormente mencionaste. Solo da velocidad a la convergencia.

Saludos

El 11 nov. 2017 14:26, "Belén Carolina Saldías Fuentes" bcsaldias@uc.cl escribió:

Hola,

  1. Recomiendo toma valores aleatorios en el espacio. No asumas que un punto será centro de cluster.
  2. Si relajas lo anterior tu proceso debería adar bien. Se ajustan los PI ?
  3. Al menos debe funcionar con medias aleatorias. Puedes también trabajarlo con Kmeans antes, para esto debes usar tu implementación de la AC (sin requisitos de for - porque de alguna forma hay que hacer un map para pasar por todos los datos).

Saludos! Belén

El 11 de noviembre de 2017, 12:27, Hernan Valdivieso<notifications@ github.com> escribió:

Hola,

Estoy trabajando en la tarea y tengo el problema que actualmente estoy seleccionando los centros de las gaussianas de forma random entre los datos que tengo y a veces pasa que 2 valores son parte de la misma gaussiana, lo cual hace que dos gaussianas entén con el mismo grupo de datos y otra se expanda para solapar los 2 cluster de puntos.

En base al problema anterior, quería preguntar era posible usar k-means para encontrar cluster y en base a eso definir los centroides iniciales de EM. ¿Es posible?

En el caso de Si, ¿uso el de sklearn o el implementado por mi?

Y si es el implementado por nosotros, ¿tiene que ser todo sin ningún for, al menos 1 para itelar las gaussiana o esa parte puede usar todos los fors que queramos?

Gracias de antemanno por la respuesta. Saludos ✌️

— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub https://github.com/IIC2433-2017-2/T03/issues/2, or mute the thread https://github.com/notifications/unsubscribe-auth/AKHLfoeufgjHAYzY7Vq1UH_VT8LQxUm6ks5s1bzNgaJpZM4Qahme .

Hernan4444 commented 7 years ago

Muchas gracias! 😄

Otra duda, en el enunciado se dice que solo se aceptan 2 for, para obtener datos aleatorios es posible realizar otro for y solo son 2 para la parte de e-step, m-step y calcular log-likelihood?? o son 2 para todo el algoritmo EMGM?

Gracias de antemano. Saludos ✌️

jfastudillo commented 7 years ago

Hernán,

Puedes realizar un for para obtener los datos iniciales de manera aleatoria si quieres. Son 2 para todo el resto del algoritmo EMGMM, lo que incluye e-step, m-step y calcular log-likelihood.

Saludos

Hernan4444 commented 7 years ago

@jfastudillo muchas gracias!! 😄