HlidacStatu / OcrMinion

Client pro získávání textů z obrázkových dokumentů
MIT License
46 stars 4 forks source link

Funkčnost verze 2.0? #17

Closed pstast closed 4 years ago

pstast commented 4 years ago

Mám problém s novou verzí 2.0. Nikde mi nefunguje.

Na jednom serveru se děje toto:

2019-12-08T20:54:17.583251696Z Loaded configuration:
2019-12-08T20:54:17.583296336Z   OCRM_APIKEY=***
2019-12-08T20:54:17.583356729Z   OCRM_EMAIL=***
2019-12-08T20:54:17.583365874Z   base_address=https://ocr.hlidacstatu.cz
2019-12-08T20:54:17.583372899Z   user_agent=OcrMinion 2.0
2019-12-08T20:54:17.738715807Z info: HlidacStatu.OcrMinion.Worker[0]
2019-12-08T20:54:17.738746709Z       OCR minion initialized. Hold on to your hat...
2019-12-08T20:54:17.738752074Z info: HlidacStatu.OcrMinion.Worker[0]
2019-12-08T20:54:17.738756196Z       Starting OCR process of #1. task.
2019-12-08T20:56:02.990541286Z warn: HlidacStatu.OcrMinion.OcrFlow[0]
2019-12-08T20:56:02.990607879Z       The operation was canceled..
2019-12-08T21:01:02.994440240Z info: HlidacStatu.OcrMinion.Worker[0]
2019-12-08T21:01:02.994510215Z       Starting OCR process of #2. task.
2019-12-08T21:02:48.068808725Z warn: HlidacStatu.OcrMinion.OcrFlow[0]
2019-12-08T21:02:48.068923250Z       The operation was canceled..
2019-12-09T06:07:19.601582968Z info: HlidacStatu.OcrMinion.Worker[0]
2019-12-09T06:07:19.601727950Z       Starting OCR process of #3. task.
2019-12-09T06:09:04.682979251Z warn: HlidacStatu.OcrMinion.OcrFlow[0]
2019-12-09T06:09:04.683087108Z       The operation was canceled..
2019-12-09T06:14:04.687750530Z info: HlidacStatu.OcrMinion.Worker[0]
2019-12-09T06:14:04.687796724Z       Starting OCR process of #4. task.
2019-12-09T06:15:49.767698806Z warn: HlidacStatu.OcrMinion.OcrFlow[0]
2019-12-09T06:15:49.767751557Z       The operation was canceled..

A tak pořád dokola.

Což je hodně podivné. Něco to zpracovává, ale přitom to nic nestahuje. Nemůže to brát nějaká stará data někde z pracovního adresáře, který si to někde vytvořilo?

Úplné zrušení a nové vytvoření kontejneru na tom nic nezmění.

Na druhém serveru se pak neustále opakuje toto:

2019-12-09T11:37:36.733566189Z warn: HlidacStatu.OcrMinion.OcrFlow[0]
2019-12-09T11:37:36.733667030Z       Impossible happened - task is null..

Tato chybová hláška chce říci co?

A na třetím serveru, kde jsem ponechal starou verzi, se úlohy zpracovávají normálně.

suchoss commented 4 years ago

Ahoj, promiň za pozdnější odpověď. Myslíš, že bys to mohl spustit s parametrem -e Logging__LogLevel__Default=Debug:

docker run --name minion -d -e OCRM_APIKEY=mykey -e OCRM_EMAIL=muj@mail.cz -e Logging__LogLevel__Default=Debug hlidacstatu/ocrminion:lin-v2.0

U toho prvního to vypadá, jako chyba sítě. Ten druhý se pak chová, jako chyba serveru, kam se OCR minion připojuje (tuhle chybu ale Michal opravoval, tak se divím, že se to opět objevuje).

Díky Petr

pstast commented 4 years ago

Podrobnější info ke druhému problému. Nejprve 11 pokusů s HTTP odpovědí 420 (tj. není co dělat) a při 12. následovala chyba.

minion_1  | 2019-12-16T13:59:02.581465745Z info: HlidacStatu.OcrMinion.Worker[0]
minion_1  | 2019-12-16T13:59:02.581550404Z       Starting OCR process of #11. task.
minion_1  | 2019-12-16T13:59:02.581566886Z dbug: HlidacStatu.Service.OCRApi.RestClient[0]
minion_1  | 2019-12-16T13:59:02.581577546Z       Getting task: https://ocr.hlidacstatu.cz/gettask.ashx?apikey=xxx&server=xxx&minPriority=0&maxPriority=99&type=image
minion_1  | 2019-12-16T13:59:02.633871426Z dbug: HlidacStatu.Service.OCRApi.RestClient[0]
minion_1  | 2019-12-16T13:59:02.633946713Z       Response status code: 420
minion_1  | 2019-12-16T13:59:02.633963174Z dbug: HlidacStatu.Service.OCRApi.RestClient[0]
minion_1  | 2019-12-16T13:59:02.633972362Z       Response content: { "nextRequestInSec" : 4 }
minion_1  | 2019-12-16T13:59:02.634520969Z dbug: HlidacStatu.OcrMinion.OcrFlow[0]
minion_1  | 2019-12-16T13:59:02.634557209Z       Server does not have any content to parse at this moment. Next try in 4 seconds.
minion_1  | 2019-12-16T13:59:06.635288413Z info: HlidacStatu.OcrMinion.Worker[0]
minion_1  | 2019-12-16T13:59:06.635384423Z       Starting OCR process of #12. task.
minion_1  | 2019-12-16T13:59:06.636054909Z dbug: HlidacStatu.Service.OCRApi.RestClient[0]
minion_1  | 2019-12-16T13:59:06.636192963Z       Getting task: https://ocr.hlidacstatu.cz/gettask.ashx?apikey=xxx&server=xxx&minPriority=0&maxPriority=99&type=image
minion_1  | 2019-12-16T13:59:06.671180319Z dbug: HlidacStatu.Service.OCRApi.RestClient[0]
minion_1  | 2019-12-16T13:59:06.671243011Z       Response status code: 200
minion_1  | 2019-12-16T13:59:06.680993592Z warn: HlidacStatu.OcrMinion.OcrFlow[0]
minion_1  | 2019-12-16T13:59:06.681062672Z       Impossible happened - task is null..
suchoss commented 4 years ago

To je zvláštní - vypadá to na chybu serveru. To budu muset probrat s Michalem.

Jinak k tomu prvnímu problému - mám podezření, že tam bude chyba v síťovém spojení mezi serverem, na kterém běží OCR Minion a naším OCR serverem.

suchoss commented 4 years ago

Ještě k tomu druhému případu - i když nastane chyba serveru, tak to neovlivňuje funkčnost OCR Miniona. Chová se to poté stejně, jako kdyby nebyl task ke zpracování ve frontě. Jen to vykazuje jinou chybovou hlášku, protože to je situace, kterou bychom si měli fixnout u nás.