PUC-RecSys-Class / RecSysPUC-2020

Material del curso de Sistemas Recomendadores IIC3633 PUC Chile
MIT License
72 stars 16 forks source link

[Paper discussions][S4] Document clustering based on non-negative matrix factorization. #19

Open pacalein opened 3 years ago

ivaniadg commented 3 years ago

Hola! :wave: Esta es sugerida o obligatoria? :eyes:

pacalein commented 3 years ago

Buena tienes razón, le cambié el título.

Jiruiz2 commented 3 years ago

Hola,

Mi consulta es específicamente que se busca hacer en el paper, ya que no entiendo muy bien los términos usados. Mi intuición me dice que buscan obtener el tipo de documento (investigación, ciencia ficción, drama, etc.) a partir del contenido de este, pero no estoy seguro.

Adjunto un extracto que puede ayudar a explicar mi duda.

In this paper, we have presented a novel document partitioning method based on the non-negative factorization of the term-document matrix of the given document corpus

Saludos.

denisparra commented 3 years ago

El próposito del paper no es exactamente recomendar, es en realidad hacer clustering. Pero la técnica que usan está muy bien explicada y les puede servir para entender cómo usar contenido (en este caso texto) y reducción de dimensionalidad del contenido para hacer recomendación.

El "partitioning" se refiere a hacer clustering del corpus de documentos, la técnica NMF permite hacer esta partición de modo más efectivo.