dmlls / jizt-tfg

Servicio de Resumen de Textos con AI en la Nube (versión TFG).
https://dmlls.github.io/jizt-tfg-website/
GNU General Public License v3.0
13 stars 3 forks source link

[Postgres] Values larger than 1/3 of a buffer page cannot be indexed #86

Closed dmlls closed 3 years ago

dmlls commented 3 years ago

Describe el error: PostgreSQL devuelve el siguiente mensaje de error:

22/01/2021 08:21:17 PM SummaryDAOPostgresql ERROR    index row size 4592 exceeds btree version 4 maximum 2704 for index "source_content_key"
DETAIL:  Index row references tuple (0,1) in relation "source".
HINT:  Values larger than 1/3 of a buffer page cannot be indexed.
Consider a function index of an MD5 hash of the value, or use full text indexing.

El mensaje es lo suficiente descriptivo por sí mismo: el campo content de la tabla source (es decir, el texto a resumir) es demasiado largo para ser indexado. Esto ocurre porque lo hemos definido como UNIQUE.

Pasos para reproduccir: Tratar de resumir un texto muy largo.

Información adicional: Para solucionarlo, podeoms proceder de modo similar a como lo hacemos con la tabla de resúmenes; aplicado a este caso, calcular un hash SHA-2 del texto a resumir, y utilizar ese valor como PRIMARY KEY de la tabla.