matcom / ia-sim-cmp-21

Repositorio para registrar los proyectos del curso
MIT License
8 stars 0 forks source link

Éngrafos #15

Open cassius66 opened 3 years ago

cassius66 commented 3 years ago

Datos del proyecto

Nombre: Éngrafos Repositorio: https://github.com/ramuff/Engrafos/ Reporte:https://github.com/ramuff/Engrafos/blob/main/Report.pdf

Breve resumen

Tenemos un modelo, que será capaz de procesar texto etiquetado, es decir, texto y subtextos de estos textos con anotaciones o etiquetas sujetas a una cierta métrica. El modelo podrá corregir la etiqueta a partir de otras entradas a este modelo.

A partir de este texto etiquetado, el modelo se encargará de asignarlo a determinados espacios que luego formarían artículos. Los objetivos de dicho modelo durante el procesamiento del texto pueden ser la clasificación de este texto; la verificación de la precisión o correctitud de estas etiquetas, o incluso la modificación de las mismas; la reorganización de texto según lo etiquetado; la agrupación de familias de texto de clasificación o tipo similares; etc; aunque pudieran agregarse otro tipo de características. El fin del modelo es servir de herramientas en la creación de wikis y documentaciones, a enriquecer libros o documentos pedagógicos y muchas otras tareas que se pudieran lograr con el kit de herramientas que tendrá el modelo.

El modelo está pensado para ser alimentado con texto generado por una comunidad, comunidad que aportará el texto con una etiqueta, cada miembro de la comunidad tiene la posibilidad de poder corregir la etiqueta que se la ha asignado a un determinado texto o incluso a una fragmento de este, a partir de estas decisiones el modelo debería ser capaz de mejorar sus resultados.

Se tendrá una simulación para llevar a cabo posibles escenarios positivos y negativos, donde por ejemplo los miembros de la comunidad aportan textos basura o valiosos, donde se establecen etiquetas correctas o erróneas, donde se administra información sesgada o solo algunos miembros de la comunidad aportan verdaderamente, etc. Esta simulación será controlada y monitoreada por un lenguaje de programación de dominio específico.

Miembros del equipo

Aprobación

Estos elementos serán chequeados por los profesores de la asignatura para aprobar el proyecto.

En caso de que algunas de las condiciones anteriores no se cumplan, en este issue les dejaremos todos los comentarios y discusiones necesarias para lograr la aprobación del proyecto.

Este issue será cerrado una vez se considere definitivamente aprobado o rechazado el proyecto, y se le pondrá la etiqueta correspondiente.

apiad commented 3 years ago

De la explicación que ponen no me queda claro el proyecto. La primera parte donde describen todo lo que sería posible hacer si tuvieran un modelo capaz de reconocer automáticamente esas etiquetas, etc., me parece por un lado demasiado ambiciosa y por otro lado fuera del dominio de las asignaturas, así que creo que eso es solamente contexto en este marco. En el párrafo final que es donde creo describen como tal de que va el proyecto, es donde no me queda claro qué es lo que van a simular. ¿Me pueden poner un ejemplo sencillo pero con textos y etiquetas concretos para ver qué es lo que se simularía y con qué propósito?

sestevez commented 3 years ago

Yo seré el tutor de este proyecto creo que todavía nos faltan coss por describir mejor en la definición

cassius66 commented 3 years ago

De la explicación que ponen no me queda claro el proyecto. La primera parte donde describen todo lo que sería posible hacer si tuvieran un modelo capaz de reconocer automáticamente esas etiquetas, etc., me parece por un lado demasiado ambiciosa y por otro lado fuera del dominio de las asignaturas, así que creo que eso es solamente contexto en este marco. En el párrafo final que es donde creo describen como tal de que va el proyecto, es donde no me queda claro qué es lo que van a simular. ¿Me pueden poner un ejemplo sencillo pero con textos y etiquetas concretos para ver qué es lo que se simularía y con qué propósito?

• El modelo planteado consistiría basicamente de lo siguiente.

Tenemos un texto, que puede o no tener tags o etiquetas. En caso de no tenerlas el modelo se encargaría de etiquetarlo él mismo, en caso de tenerlas, el modelo trataría de corregir dichas etiquetas.

Una idea adicional nuestra, era que el modelo pudiera "aprender" si sus tags fueron correctas o no, simulando una "comunidad" que reaccione a esos tags de forma positiva o negativa. Aunque no hemos concretado esta parte.

• En caso del problema de simulación, deseamos simular el comportamiento de este modelo en distintos environments o situaciones. Consideremos el ejemplo siguiente:

Tenemos un texto sin etiquetar, que se le pasa como entrada a nuestro modelo. Este procede a clasificarlo y etiquetarlo. Este texto etiquetado bien puede estar correcto y terminar ahí, pero durante el proceso de simulación es posible que se tomen esos tags y se reaccionen a alguno de ellos de forma negativa, indicando al modelo que dichas decisiones o clasificaciones son incorrectas. Este texto con tags ahora "calificados" se procesa en una segunda parte del modelo, la cual no realiza modificaciones, sino que "aprende" de las correcciones realizadas.

De esta forma si el texto se vuelve a pasar como entrada sin etiquetar, el modelo debe cometer menos errores al clasificarlo.