Chatbots-Inc / ChatbotSI-Beta

Chatbot para la concentración de sistemas inteligentes, disponible para pruebas Beta (próximamente) en actions on google.
0 stars 0 forks source link

Generar base de 215 preguntas #1

Closed rreyeso closed 6 years ago

rreyeso commented 6 years ago

Cada quien puede generar 100 y con eso empezamos.

Hoja de cálculo para agregar las preguntas. Click aquí.

rreyeso commented 6 years ago

@diegoajv, ¿puedes sugerir alguna técnica de datamining que conozcas para que esto no nos tome tanto tiempo?

dajvisha commented 6 years ago

@CR-Reyes creo que la otra sería dado un texto encontrar las entidades y las posibles intenciones que se podrían resolver con dicho extracto de texto. Eso en la situación de que lo que se quiere solucionar es encontrar una posible respuesta para una consulta que no aparece en la estructura que aloja las preguntas y respuestas. Al igual que en en el trabajo actual, tendriamos que iniciar con proceso manual.

rreyeso commented 6 years ago

Me parece que sería conveniente iniciar con una especie de glosario (entidades) de inteligencia artificial y después identificarlas como dices en un texto para saber qué tanto podemos obtener de cada una.

dajvisha commented 6 years ago

@CR-Reyes relacionado a #3 hay un concepto llamado Linked Data que consiste en generar relaciones entre datos, similar a la forma en que funciona la web. Entonces podemos generar un diccionario de entidades, como lo estas proponiendo, y utilizar un poco del concepto de "Linked Data", por ejemplo:

Entidades: [Inteligencia Artificial, etc...] Intenciones: [Concepto, Ejemplo, Explicación formal, etc...]

Texto 1: La inteligencia artificial es una rama de ....

Texto 2: Un ejemplo practico de la inteligencia artificial es ...

Para el texto 1 podremos identificar la entidad "Inteligencia Artificial" y la intención "Definición". Para el texto 2 seria "Inteligencia Artificial" como entidad y "Ejemplo" como definición. Suponiendo que estas dos intenciones tienen una coeficiente de relación de 75%. Podríamos hacer lo siguiente:

Si el usuario pregunta: ¿Qué es la inteligencia artificial? y si dicha pregunta no se encuentra en la BD de respuestas, se podría utilizar este mini algoritmo para tratar de generar una respuesta. Dicha respuesta sería la concatenación de ambos textos.

En un caso esta respuesta sería enviada a un moderador para revisar que este correcta, de ser así se agregaría a la BD.

En otras palabras, seguir un modelo de esta forma podría crear una arquitectura escalable. Volviendo al concepto de "Linked Data", podríamos fragmentar la información de la siguiente forma:

Esa es una idea mas o menos de lo que se podría lograr. Las tareas a desarrollar si irían definiendo a los alcances marcados.

Nota: Funcionaria mejor explicándolo con un diagrama.

rreyeso commented 6 years ago

Me late esa estructura @diegoajv, ya había pensado previamente en el tema del contexto. De hecho, tenía la duda de si guardarlo en la base de datos, o guardarlo a través de Dialogflow, y después recuperarlo en cada input del usuario.

La idea era comenzar con un string vacío y en cuanto se mencionara algún concepto, tomarlo como contexto y no soltarlo hasta que se mencionara otro concepto diferente.

rreyeso commented 6 years ago

Se terminaron por generar 215 preguntas 103 de ellas con respuesta. A la espera de más recursos para incrementar este número, esto posterior a un primer análisis de las preguntas que ya se tienen.