pombreda / cdpedia

Automatically exported from code.google.com/p/cdpedia
0 stars 0 forks source link

Revisar el indizado... #12

Closed GoogleCodeExporter closed 9 years ago

GoogleCodeExporter commented 9 years ago
¿se podrá hacer sobre el texto completo?

¿Usaremos PyLucene? 

Había un parche de Zuzel por ahí, pero era contra el repositorio viejo...

Original issue reported on code.google.com by facundob...@gmail.com on 3 Jan 2009 at 6:35

GoogleCodeExporter commented 9 years ago
También tener en cuenta a:

  http://whoosh.ca/
  http://nucular.sourceforge.net/

Original comment by facundob...@gmail.com on 13 Feb 2009 at 10:23

GoogleCodeExporter commented 9 years ago
Hay una implementación interesante de indices en python acá:
http://lists.canonical.org/pipermail/kragen-hacks/2006-August/000432.html

Esta bueno que los índices ocupan poco espacio: "produces indexes of around 
17-19% of
the size of the original files", y que está hecho todo 100% en python.

Está malo que para nuestro caso puede tardar en generarlo, y que no hace 
búsquedas
por partes de una palabra.

El flaco que lo hizo vive en Argentina y vino alguna vez a una reunion de PyAr.

Original comment by alecura on 8 May 2009 at 5:26

GoogleCodeExporter commented 9 years ago

Original comment by facundob...@gmail.com on 18 Jun 2009 at 1:36

GoogleCodeExporter commented 9 years ago
Guillo probó whoosh, y terminó decidiendo que (todavía) no nos sirve...

Yo mejoré la implementación del dirty hack actual, porque para el DVD ocupaba
demasiado RAM.

Ahora me voy a poner para ver "nucular", a ver qué onda...

Original comment by facundob...@gmail.com on 30 Sep 2009 at 8:29

GoogleCodeExporter commented 9 years ago
Nucular es pure python, y fácil de usar.

Pero no tiene búsquedas parciales. O sea, si yo quiero encontrar "Gato de
Schrödinger", y busco por "dinger", no encuentra nada.

Así que también lo descartamos, :(

Original comment by facundob...@gmail.com on 10 Oct 2009 at 11:51

GoogleCodeExporter commented 9 years ago
No habiendo ninguna alternativa viable, nos quedamos con lo que tenemos...

Original comment by facundob...@gmail.com on 10 Oct 2009 at 11:52