LIBCAS / DL4DH-Kramerius-plus

DL4DH Kramerius +
0 stars 1 forks source link

Spusob obohacovani obrazovych dat via OCR engine #42

Open JanMeritus opened 2 years ago

JanMeritus commented 2 years ago
zabak commented 2 years ago

PERO OCR API viz https://pero-ocr.fit.vutbr.cz/api/ - může pracovat s obrázky z Krameria, ale musejí se stáhnout (klidně přes IIIF) a uploadovat přes API na OCR server.

JanMeritus commented 2 years ago

@bodnarIQ zde je potreba popsat aktualni spusob implementace vs planovany spusob implementace

daliboris commented 2 years ago

PERO OCR API viz https://pero-ocr.fit.vutbr.cz/api/ - může pracovat s obrázky z Krameria, ale musejí se stáhnout (klidně přes IIIF) a uploadovat přes API na OCR server.

Na adrese https://pero-ocr.fit.vutbr.cz/api/ žádné REST API nevidím.

Dokumentace OpenAPI je až zde: https://app.swaggerhub.com/apis-docs/LachubCz/PERO-API/1.0.4

zabak commented 2 years ago

@daliboris je tam tlačítko Read the documentation. Tam je swagger dokumentace toho api

daliboris commented 2 years ago

Pro přístup k PERO API, je potřeba api-key. Existují dokonce dva druhy klíčů, jeden je určen pro přístup k interním funkcím.

Na základě příkladu u metody post_processing_request konstatuju, že obrázek není nutné na server nahrávat, pokud je veřejně dostupný.

{
  "engine": 1,
  "images": {
    "Magna_Carta": "https://upload.wikimedia.org/wikipedia/commons/e/ee/Magna_Carta_%28British_Library_Cotton_MS_Augustus_II.106%29.jpg",
    "United_States_Declaration_of_Independence": "https://upload.wikimedia.org/wikipedia/commons/8/8f/United_States_Declaration_of_Independence.jpg",
    "Treaty_of_Tordesillas": null
  }
}

U autorsky chráněných děl však bude potřeba obrázek nejdříve nahrát na server. Nevidím ale žádnou metodu, která by snímky umožnila ze serveru smazat.

daliboris commented 1 year ago

Je možné sloučit s #49.