Closed AurelienmartW closed 2 months ago
Utilisation de l'API d'OCR plutôt que Paddle en local sur le serveur ? [EDIT] Choisi que non pour éviter sortir du réseau
Si utilisation de PaddleOCR: attention au téléchargement potentiel de modèles lors du run. Voir un fix ici https://github.com/IA-Generative/ocr/commit/132b03c60fbcbc7a2d9076fb700e2349cd8b747d
@AurelienmartW investigue pour éviter le téléchargement des modèles lors du run. Il y a 3 modèles qui interviennent pour l'OCR
Aurélien a fait quelques tests comparatifs de plusieurs versions, à priori PaddleOCR v4 est le meilleur
Evaluation en cours de la pipeline globale. On profite de l'évaluation sur le dataset de test de 500 images pour adapter les seuils d'IQA ainsi que les regles de gestion pour la detection d'arme d'alarme
Après évaluation des resultats de la pipeline de detection d'armes d'alarme on a pu adapter les regles de gestion. Certains modèles d'armes ne presentent pas le nom de la marque il faut donc enlever cette règle.
Concernant les marquages PAK certains ont un marquage PA Knall ce qui veut dire la même chose, à inclure dans les règles de détection.
Dans les 2 cas de détection, on obtient 100% de précision, ainsi lorsqu'on indique qu'une arme est bien une arme d'alarme on est sûr à 100% (scénario prudent)
Les différences sont surtout au niveau du recall (combien d'armes d'alarme sont bien detectées/ l'ensemble des armes d'alarmes)
Le recall varie selon:
Une formalisation des résultats est en cours pour présenter les statisitques globales.
Arbitrage sur la pipeline de prétraitement réalisé avec les métiers Ecrans en cours de définitions pour les cas: