Closed jorcox closed 8 years ago
Un pequeño error al asignarte a ti a esa Issue corregido.
Se puede utilizar como primera referencia una lista de nombres geográficos como http://geonames.nga.mil/gns/html/namefiles.html (6 ó 7 millones de nombres)
Dejo el comentario de Slack con lo que comentaba sobre esto aquí.
Hay algunas cosas que no tengo claras sobre el algoritmo. Por ejemplo Shark-Search calcula la similaridad entre una query y varias cosas. En nuestro caso cuál sería la query?
[2:52] Nuestra query es global. Se me ha ocurrido que en vez de usar una query, podriamos: 1.- Analizar el texto a comparar con la query(en el algoritmo original, en esta solución no tendríamos query) para extraer lo más relevante. 2.- Con el elemento más relevante extraído determinar si es importante para nosotros. (¿Cómo?. Una base de datos de términos geográficos . :thinking_face: ) 3.- Dependiendo de el peso que tienen el el texto y del peso que tiene el elemento geográfico con el que se asemeja devolver el valor de similitud del algoritmo original.
[2:53] Esta sería nuestra función de similitud
La idea es cómo, a partir de los términos devueltos por el algoritmo que devuelve la palabra más significativa para premiar a los relacionados con el tema que estamos buscado.