ARUP-CAS / aiscr-dapro

OAI-PMH Data Provider pro AMČR
https://api.aiscr.cz/
GNU General Public License v3.0
2 stars 0 forks source link

Minimální filtrace pro všechna API #6

Closed motyc closed 5 years ago

motyc commented 5 years ago

Přemýšlel jsem nad nutnými filtracemi nad daty poskytovanými pro jakékoli API a vyšla mi tato tři nepřekročitelná kritéria, která nějak musíme zohlednit: 1) filtrace na základě procesního stavu 2) filtrace na základě přístupnosti záznamu 3) zobrazení/nezobrazení osobních údajů (částečně souvisí s oběma předchozími)

Jako "nice to have" bych přidal ještě datum archivace, případně i jiných změn stavů, ale to už pro začátek není tak podstatné.

Prosím zamyslete se, jak to řešit. Jako nouzová varianta mi přijde data filtrovat již při exportu do XML. Vznikaly by tak dílčí bloky/soubory pro jednotlivé skupiny dat, takže API by pak již jen bralo ty správné, které mají být danému uživateli při daném dotazu k dispozici.

Poptávka pro stahování dat, které se změnily po nějakém datu.

motyc commented 5 years ago

Pokud v tom nenajdete nějaký háček, vyřešil jsem celkem elegantně náš problém s filtrací podle data - stačí v rámci DT brát vždy to nejmladší datum z logu stavů.

Ve specifikaci níže jsme ponechal jen ta pole, která se mají brát v úvahu. Tam, kde je pole jen jedno, tak je to jasné. V ostatních případech se vezme vždy jen nejvyšší datum (myšleno nejmladší) a tím pádem bude datum záznamu skutečně odrážet na denní bázi záznamy, které se změnily, a to jakýmkoli způsobem. Snad taková agregace nebude problém, ale stejně bychom něco podobného museli u akcí řešit tak jako tak...

Jediný problém je s DT let, což je položka u které datum vztažitelné k evidenci chybí. Použijeme tedy prozatím datum letu.

AMCR_XML_mapping_190408_datum.zip

pbartosova commented 5 years ago

Přihlášené projekty s dočasným X- nemají žádné datum, pouze datetime_born, chceme tyto záznamy filtrovat?

motyc commented 5 years ago

Já jsem to explicitně zapomněl zmínit, ale tyto projekty bych z XML exportu úplně vyřadil, protože ještě nedošlo k jejich finálnímu schválení a jde v podstatě o interní data ARÚ.

pbartosova commented 5 years ago

Soubor nemá identifier jako ostatní objekty, které pole pro jeho identifier chcete použít?

motyc commented 5 years ago

Už se mne na to ptal pan Bárta v #97, použijte prosím filepath.