datosgobar / georef-ar-api

API del Servicio de Normalización de Datos Geográficos de Argentina.
https://apis.datos.gob.ar/georef
MIT License
153 stars 35 forks source link

Spike: establecer flexbilididad de búsquedas por texto #133

Closed federicotdn closed 5 years ago

federicotdn commented 6 years ago

La búsqueda de entidades vía texto es flexible (nombre, provincia, etc.), lo cual permite encontrar resultados incluso si no se cuenta con el texto exacto de la entidad indexada.

Para lograr esta flexibilidad, se utilizan varias herramientas de Elasticsearch: sinónimos, fuzzy search, búsqueda por prefijos y normalización de texto (lowercase, asciifolding, etc.).

Sin embargo, la flexibilidad de búsqueda puede traer problemas. Existen casos donde se traen resultados que claramente (para un usuario) no están relacionados a los términos buscados. Por ejemplo:

Investigar formas de manejar estos resultados de búsquedas poco intuitivos. Algunas ideas: