Closed omiras closed 1 year ago
1 - Photor.io : https://photor.io/
Descartamos ya que solo proporciona porcentajes sobre determinadas características de la imagen, identifica el producto o productos y los califica teniendo en cuenta su presencia en la imagen mediante porcentajes.
Visión Api de Google - https://cloud.google.com/vision?hl=es
Analiza e identifica objetos, lugares, personas y otros elementos presentes en una imagen y proporcionar una lista de etiquetas descriptivas.
En el siguiente link se muestra como podriamos implementar esta AI en conjunto con reconocimiento por cámara y no solo por subida de imágenes.
https://umaar.com/dev-tips/118-cloud-vision-image-detect-javascript/
Esta API opera bajo un modelo de precios basado en el consumo de recursos. Esto significa que se nos cobrará en función del número de las solicitudes realizadas y la cantidad de datos procesados.
3 - Computer Vision: https://www.microsoft.com/en-us/ai/ Descartamos por que solo existe mediante pago anual y extrae texto de las imágenes , no genera texto descriptivo referida la imagen.
4 - chatGPT : https://chat.openai.com/auth/login
Descartamos debido a que acepta imágenes pero analiza y describe sin criterio alguno.
Imagen proporcionada:
Respuesta recibida:
@NordinMM @clopezva Super buen trabajo de investigación. Mañana pueden contar las conclusiones al equipo. Quizás lo mejor sería dejar este informe tal cual y pasar a otra issue para avanzar en la práctica? Ustedes deciden mañana.
Me pregunto si la opción "4 - chatGPT" quizñas no hay que refinar la pregunta? Después de que te suelte todo ese rollo, decirle : "no, simplemente escribe el título de la imagen que acabo de subir y una descripción corta"
Sería interesante afinar ese punto, talvez funcione. Gracias por el consejo
El mar, 13 jun 2023 23:46, Oscar Miras @.***> escribió:
Me pregunto si la opción "4 - chatGPT" quizñas no hay que refinar la pregunta? Después de que te suelte todo ese rollo, decirle : "no, simplemente escribe el título de la imagen que acabo de subir"
— Reply to this email directly, view it on GitHub https://github.com/Singulars-2023-Front-End/Singluars/issues/4#issuecomment-1590065202, or unsubscribe https://github.com/notifications/unsubscribe-auth/A2HF4JGYBDMNA2DSZ4KMSGTXLDNS7ANCNFSM6AAAAAAZDIELBY . You are receiving this because you were mentioned.Message ID: @.***>
Se realizaron pruebas con ChatGPT proporcionandole un link de la imagen.
Concluimos que solo funciona si la URL contiene información sobre la imagen como por ejemplo.
Ya que nos manda lo siguiente: La imagen que mencionas muestra unos zapatos de novia de color rosa en terciopelo. Los zapatos parecen tener un estilo elegante y femenino, con un diseño de tacón alto y una apariencia sofisticada.
Pero si mandamos otra URL la cual no contiene información en su link, nos comenta que:
https://conceptodefinicion.de/wp-content/uploads/2013/08/objeto.jpg
Basándome en la nueva URL proporcionada, desafortunadamente, como modelo de lenguaje de IA, no puedo acceder directamente a la imagen ni analizarla visualmente. Mi capacidad se limita al procesamiento del lenguaje natural.
Si tienes alguna descripción o información sobre la imagen en cuestión, puedes proporcionarla, y estaré encantado de ayudarte a generar texto relevante en base a esa información.
Como podemos ver, no cumple los requisitos que necesitamos.
Ok! La dejamos cerrada por el momento, gracias por el trabajo de invesigación!
Objetivo
Metodología
Una vez encontrada la IA, probadla en un poryecto que creeis vosotros, algo simple con HTML y JavaScript. Lo más sencilla possible para probarla.
Documentad en esta misma issue vuestras conclusiones.