jorcox / GeoCrawler

Apache License 2.0
3 stars 0 forks source link

Pensar en como relacionar la información dada por los algoritmos para premiar a términos geoposicionales. #16

Closed jorcox closed 8 years ago

jorcox commented 8 years ago

La idea es cómo, a partir de los términos devueltos por el algoritmo que devuelve la palabra más significativa para premiar a los relacionados con el tema que estamos buscado.

jorcox commented 8 years ago

Un pequeño error al asignarte a ti a esa Issue corregido.

fjlopez commented 8 years ago

Se puede utilizar como primera referencia una lista de nombres geográficos como http://geonames.nga.mil/gns/html/namefiles.html (6 ó 7 millones de nombres)

jorcox commented 8 years ago

Dejo el comentario de Slack con lo que comentaba sobre esto aquí.

jorcox commented 8 years ago

Hay algunas cosas que no tengo claras sobre el algoritmo. Por ejemplo Shark-Search calcula la similaridad entre una query y varias cosas. En nuestro caso cuál sería la query?

[2:52] Nuestra query es global. Se me ha ocurrido que en vez de usar una query, podriamos: 1.- Analizar el texto a comparar con la query(en el algoritmo original, en esta solución no tendríamos query) para extraer lo más relevante. 2.- Con el elemento más relevante extraído determinar si es importante para nosotros. (¿Cómo?. Una base de datos de términos geográficos . :thinking_face: ) 3.- Dependiendo de el peso que tienen el el texto y del peso que tiene el elemento geográfico con el que se asemeja devolver el valor de similitud del algoritmo original.

[2:53] Esta sería nuestra función de similitud