GovernIB / gdib

Gestor Documental de les Illes Balears (Arxiu CAIB)
0 stars 1 forks source link

Jobs de resellado #118

Open tgaya-dgtic opened 1 year ago

tgaya-dgtic commented 1 year ago

Una vez realizada la incidencia #114, se tienen revisar los 2 jobs (os pasé un pdf con los jobs que hay), específicamente el job de resellado de documentos (en DM), y el job de resellado de índices (en RM).

tgaya-dgtic commented 1 year ago

Aunque depende de la otra incidencia de recuperar firma, se pueden ir repasando los jobs en paralelo.

En principio los jobs a repasar son estos:

Yo lo que haría es cambiar la query de los documentos para que solamente se seleccionen 2 o 3, activar el resellado y ver qué errores o qué cambios se producen. Como mínimo se debería actualizar la fecha de modificación del resellado del documento.

CesarGarcia-inetum commented 11 months ago

He probado como comentas y es cierto que influye con el lenguaje del navegador, pero hay algo que no me cuadra, si acotas la búsqueda sólo al mes de junio de 2023, me devuelve más resultados que si busco con el año entero como has probado tú, esto con el navegador en inglés:

1 año, 62 resultados: Search for '@eni:cod_clasificacion:'S0002' and @cm:created:[2022-06-01T00:00:00 TO 2023-07-03T00:00:00]' found 62 results (search took 371ms)

Este último mes junio 2023, más de 100 resutados: Search for '@eni:cod_clasificacion:'S0002' and @cm:created:[2023-06-01T00:00:00 TO 2023-07-03T00:00:00]' found over 100 results (search took 334ms). Showing first 100 only.

Esto es un tema muy raro, ya que devuelve más resultados acotando en el tiempo el último mes, y menos resultados cogiendo todo el año.

Con el navegador en español, buscando por el año entero con el tipo de búsqueda en "lucene", en lugar de "fts-alfresco", me devuelve más resultados, 95:

La búsqueda de '@eni\:cod_clasificacion:"S0002" and @cm\:created:[2023-06-01 TO 2023-07-03]' ha encontrado 95 resultados (la búsqueda ha tardado 450ms)

He ido a la consola de administración, en el navegador de nodos y he buscado en con la misma búsqueda con el último año, navegador en español y con el tipo de búsqueda "lucene", me devuelve 759 resultados:

Todo esto no me cuadra, que, dependiendo del idioma del navegador y tipo de búsqueda, me devuelva tanta diferencia de resultados. Investigaremos más a fondo este tema, pero sigo pensando que hay un problema con el SOLR.

tgaya-dgtic commented 11 months ago

Efectivamente, se dan 3 problemas:

Search for '@eni\:cod_clasificacion:'S0002' and @cm\:created:[2022-06-01T00:00:00 TO 2023-07-03T00:00:00]' found 68 results (search took 269ms)

Search for '@eni\:cod_clasificacion:'S0002' and @cm\:created:[2022-06-01 TO 2023-07-03]' found 68 results (search took 328ms)

Search for '@eni\:cod_clasificacion:'S0002' and @cm\:created:[2023-06-01T00:00:00 TO 2023-07-03T00:00:00]' found over 100 results (search took 424ms). Showing first 100 only.

Search for '@eni\:cod_clasificacion:'S0002' and @cm\:created:[2023-06-01 TO 2023-07-03]' found over 100 results (search took 318ms). Showing first 100 only.

Search for '@eni:cod_clasificacion:'S0002' and @cm:created:[2022-06-01T00:00:00 TO 2023-07-03T00:00:00]' found 62 results (search took 349ms)

Search for '@eni:cod_clasificacion:'S0002' and @cm:created:[2022-06-01 TO 2023-07-03]' found 62 results (search took 294ms)

Search for '@eni:cod_clasificacion:'S0002' and @cm:created:[2023-06-01T00:00:00 TO 2023-07-03T00:00:00]' found over 100 results (search took 364ms). Showing first 100 only.

Search for '@eni:cod_clasificacion:'S0002' and @cm:created:[2023-06-01 TO 2023-07-03]' found over 100 results (search took 1.1s). Showing first 100 only.