alaixgg / FilmCast

Desarrollar una aplicación móvil que permita a los productores conectar y comunicarse de manera eficiente con actores, utilizando un modelo que agrupe las variables cualitativas de los actores mediante clústers, con el fin de identificar y mostrar perfiles que se ajusten a los requerimientos específicos de los proyectos audiovisuales.
GNU General Public License v3.0
0 stars 0 forks source link

El modelo de clasificación debe ser no supervisado #12

Closed SpanishHans closed 2 weeks ago

SpanishHans commented 1 month ago

Contexto

Teniendo en cuenta que el dataset tiene las siguiente columnas:

Index(['Gender', 'Nationality', 'Genre Specialization', 'Education Level'], dtype='object')

Index(['Name', 'Age', 'Gender', 'Nationality', 'Years Active', 'Genre Specialization', 'Beauty', 'Skill Level', 'Education Level', 'Award Wins', 'Media Mentions', 'Social Media Followers', 'Social Media Likes', 'Network Size', 'Income'], dtype='object')

y que ninguna corresponde con la salida esperada: Nivel de recomendación

Posibles aproximaciones

  1. Nos vemos obligados a plantear un modelo de aprendizaje no supervisado que retorne por ejemplo la distancia de cada criterio al conjunto basado en criterios ingresados por usuario y luego un promedio que resulte en criterio de recomendado o no.
  2. Modelo que realice clustering desde la data dada y retorne distancia a centroide de cluster.
  3. ¿Redes neuronales?

Información

Revisen porfa los gráficos anexos para que se hagan una idea

Juan José

image image image image image image

alaixgg commented 1 month ago

Volvemos al Crustering entonces?

Lo único que veo es que el modelo tiene que estar muy bien segmentado para lograr una diferenciación clara entre un enfoque de clustering y un sistema de filtrado.

Sin embargo, ¿no sería posible considerar algunas variables como 'Beauty', 'Skill Level', 'Education Level', 'Award Wins', 'Media Mentions' y 'Social Media Followers', y asignarles algún peso en el modelo?

Estrategias de Modelado: Regresión Ponderada y Modelos de Puntuación para la Selección de Actores

Podríamos optar por un modelo de regresión ponderada o un modelo de puntuación que calcule cuán bien se adapta un actor a las necesidades del usuario según esos criterios. Utilizando variables como 'Beauty', 'Skill Level' y 'Award Wins', podríamos construir un modelo que asigne pesos a cada criterio y, a partir de eso, calcular un puntaje de adecuación para cada actor. Esto proporcionaría un enfoque más personalizado y efectivo para ayudar a los usuarios a encontrar al actor ideal.

Los pesos pueden ser definidos de manera subjetiva al principio, basados en la intuición o en la experiencia sobre la importancia relativa de cada variable. Por ejemplo:

Beauty: 0.2 Skill Level: 0.3 Award Wins: 0.2 Media Mentions: 0.1 Social Media Followers: 0.1 Social Media Likes: 0.1

Documentación

Microsoft Analysis Services: Mining Models IBM Scoring Models IBM SPSS Statistics: Regression Weight Estimation

Por cierto 🥸☝🏻

El profesor dejó un entregable donde se supone que debemos solucionar precisamente esta problemática. El entregable debe contener lo siguiente:

Cito lo que dice en Avata:

Mini investigación para la construcción del modelo

De literatura científica o académica valida (tesis de maestría o doctorado, papers científicos, artículos académicos, etc.) investigue por lo menos en 10 de ellos como han solucionado un problema similar al de ustedes con ayuda de técnicas de aprendizaje de maquina.

Tengan en cuenta los siguiente:

Revisar que tipos de algoritmos de aprendizaje de maquina (supervisado, no supervisados, clustering, etc.) utilizaron para poder brindar la solución al problema en cuestión. Sean meticulosos en los detalles. ¿Cómo implementaron dichos algoritmos debido al set de datos que utilizaron? ¿Cómo fue el proceso de entrenamiento e inferencia? Seleccionen y analicen cuatro (4) algoritmos candidatos distintos para implementarlos con sus datos según el problema que cada grupo quiere solucionar. Implementen dos (2) modelos distintos de aprendizaje de máquina para su proyecto a partir de los distintos algoritmos que analizaron y seleccionaron..

Redes Neuronales

Por otro lado, mencionas redes neuronales. Qué tienes en mente?