IIC2413 / Syllabus-2021-2

Contenido del curso Bases de datos del DCC PUC versión 2021-2
62 stars 44 forks source link

Inciso 2.2.1 y 2.2.2 : Diferencia entre ambos incisos #304

Open felipehen opened 2 years ago

felipehen commented 2 years ago

Hola! no me queda muy claro cual es la diferencia entre los puntos 2.2.1 y 2.2.2. Por esto queria preguntar, ¿Podrian explicar la diferencia?

ironcadiz commented 2 years ago

Puede ser que la distribución de los descriptores se comporte de manera diferente las veces que las canciones aparecieron en el ranking. Es decir, si una canción (o su album) apareció 5 veces entonces sus descriptores cuentan 5 veces para construir el histograma

felipehen commented 2 years ago

Me surgio otra duda al respecto, imaginemos una cancion X, que aparece 3 veces en el ranking, entonces: Para la 2.2.1 se ocupa 1 vez cada descriptor por cada vez que aparecio y para la 2.2.2 se ocupa 3 veces cada descriptor por cada vez que aparecio?

O

En la 2.2.1 solo se ocupa 1 vez cada cancion sin importar cuantas veces haya aparecido en el ranking? (de este ser el caso, se ocupa el descriptor medio?)

ironcadiz commented 2 years ago

En la 2.2.1 cuenta 1 vez cada canción y en la 2.2.2 cuenta n veces donde n es la cantidad de veces que estuvo en el ranking

On Wed, Nov 24, 2021, 23:20 Felipehen @.***> wrote:

Me surgio otra duda al respecto, imaginemos una cancion X, que aparece 3 veces en el ranking, entonces: Para la 2.2.1 se ocupa 1 vez cada descriptor por cada vez que aparecio y para la 2.2.1 se ocupa 3 veces cada descriptor por cada vez que aparecio?

O

En la 2.2.1 solo se ocupa 1 vez cada cancion sin importar cuantas veces haya aparecido en el ranking? (de este ser el caso, se ocupa el descriptor medio?)

— You are receiving this because you commented. Reply to this email directly, view it on GitHub https://github.com/IIC2413/Syllabus-2021-2/issues/304#issuecomment-978746761, or unsubscribe https://github.com/notifications/unsubscribe-auth/ADI2TKI7AICMXCKSG6DH62DUNWMOLANCNFSM5IXMFOYQ .

mjsifri commented 2 years ago

Hola, en esta misma parte, me di cuenta que en la tabla acoustic_features hay canciones que tienen el mismo nombre, artista y album, pero distintos descriptores y id, esto sería una incongruencia? es decir habría que eliminar estos duplicados? o habría que tomarlas como canciones distintas?

ironcadiz commented 2 years ago

Efectivamente eso es ruido en el dataset. Queda a criterio de ustedes como manejarlo, recomiendo eliminar los duplicados y quedarse con cualquiera.

spplaza commented 2 years ago

Hola, aparte de los histogramas de los descriptores , la 2.2.1 no entiendo la última parte de la pregunta donde sale ¿hay alguna tendencia en los tracks que aparecen en el ranking? en esa parte de la pregunta es la primera vez que se habla del ranking y no entiendo bien que se espera. Hasta ahora tengo los histogramas para cada descriptor de acuerto a acoustic_features, pero no lo he relacionado con el ranking porque entiendo que no es lo que se pide en la primera oración de la pregunta.

ironcadiz commented 2 years ago

Todas las canciones que estan en la tabla acoustic_features son canciones que pertencen a albumes que han estado en el ranking del billboard. La pregunta apunta a que comenten que se ve en los histogramas.

spplaza commented 2 years ago

Muchas gracias!!!