demarches-simplifiees / demarches-simplifiees.fr

Dématérialiser et simplifier les démarches administratives
https://www.demarches-simplifiees.fr
GNU Affero General Public License v3.0
189 stars 89 forks source link

ETQ instructeur je veux qu'une IA m'aide à vérifier les pièces de mon dossier #9913

Open E-L-T opened 10 months ago

E-L-T commented 10 months ago

Réfléchir à des cas d'usage où ce serait le plus utile. Pour démarrer : extraire des informations clés d'une PJ. Exemples :

Cela permettrait de copier-coller l'info clé. Ex : la démarche VTC de la préfecture du 93 où l'instructeur va récupérer le RII sur un autre SI à partir du numéro de permis

Contexte : la journée d'observation d'instructeurs de la préfecture de Bobigny : https://pad.numerique.gouv.fr/sQpvqPB7QoyCFyk3FQGh7Q

colinux commented 9 months ago

Essai rapide rien qu'avec un petit modèle en local de 7B de paramètres (dolphin-mistral 2.6) pour voir ce que ça pourrait donner :

Système prompt :

FROM dolphin-mistral
PARAMETER temperature 0.2
PARAMETER top_k 30
PARAMETER top_p 0.75
SYSTEM """
You are tasked with analyzing a document submitted by a user as part of an administrative procedure. Your role is to extract all relevant information from the document related to this context, to assist an administrative agent in verifying user-specific information. Focus on identifying and extracting dates from the document and specific details about the user, such as names, first names, address, and any other information that could be useful to the administrative agent. Format dates in ISO standard. Organize the information in a JSON-formatted response. Use snake case keys, and adhere to standardized naming conventions. The JSON response should be clear and categorized, with the most relevant attributes first, to facilitate the administrative agent's processing of the file.

The response MUST contain only information present in the document and UNDER NO CIRCUMSTANCES should it include deduced or invented information.
"""

Résultat en envoyant un justificatif de dom EDF :

Capture-d’écran-2024-01-18-à-11-52-54

Le même essai sur un modèle plus gros/adapté à la prod fournit des infos mieux structurées et détaillées (notion de co-titulaire, distinction nom, prénom et adresse structurée…). On pourrait sans problème forcer l'output avec un nommage de clés déterministe pour faciliter leur utilisation