Namísto dlouhotrvajícího procesu pro sklízení statistik pro dané období by se přidal endpoint, který by fungoval jako proxy nad SOLR jádrem logs.
sklízeč by dával dotazy typu: GET /api/access_logs?from=2024-05-01&to=2024-05-07 a dostával hned data ze SOLR přes proxy endoint
proxy endpoint by omezil maximální časový rozsah (den, týden, ...) jako prevenci zahlcení
zůstalo by zachované šifrování citlivých údajů, jak to dělá exportní proces teď. Tj. v konfiguraci je nastaveno, která pole se šifrují (resp. hashují)
Otázky:
skutečně je v SOLR (v jádru logs) všechno potřebné, nedoplňuje se něco z repozitáře? (možná paths, pid_paths, root_title apod.)
distribuce autentizačních klíčů: navrhuji sdílený klíč (konkrétní kramerius, sklízeč) nastavený v konfiguračním souboru. Vyhnul bych se složitosti keycloaku, na druhou stranu to vyžaduje https, aby nemohlo dojít k odposlechnutí klíče.
Namísto dlouhotrvajícího procesu pro sklízení statistik pro dané období by se přidal endpoint, který by fungoval jako proxy nad SOLR jádrem
logs
.GET /api/access_logs?from=2024-05-01&to=2024-05-07
a dostával hned data ze SOLR přes proxy endointOtázky: