IIC2413 / Syllabus-2021-2

Contenido del curso Bases de datos del DCC PUC versión 2021-2
62 stars 44 forks source link

Inciso 2.2.2 : Manera de ponderar la aparición de canciones en el ranking #321

Open benjamincaro opened 2 years ago

benjamincaro commented 2 years ago

Hola! Escribo porque he tenido problemas para ponderar el peso de cada canción según la cantidad que su álbum aparece en el ranking. El método original con el que lo intenté fue hacer un dataframe con las columnas artist, album y cantidad de veces en el ranking, usando .itertuples() para obtener un generador. Lo mismo hice con la tabla de acoustic_features, haciendo un dataframe con artist, album y los descriptores que pedían, y también obtuve un generador a partir de eso. Mi idea era iterar a través de los álbums y después las canciones aplicando append al dataframe de acoustic_features cada vez que coincidian album y artist, con la idea de terminar con un dataframe similar al de acoustic_features pero donde cada fila estaría repetida la cantidad de veces que el álbum estuvo en el ranking. El tema es que claramente son muchas filas las que se están procesando y ya llevo 45 mins esperando un resultado, claramente no es la mejor manera de realizar lo pedido. Quería pedir hints sobre una manera más elegante de ponderar las canciones según la cantidad de veces que el álbum aparece en el ranking. Gracias!

ironcadiz commented 2 years ago

La respuesta a esto es una de los contenidos más fundametales del curso. Eso es todo el hint que te puedo dar.