Open E-L-T opened 10 months ago
Essai rapide rien qu'avec un petit modèle en local de 7B de paramètres (dolphin-mistral 2.6) pour voir ce que ça pourrait donner :
FROM dolphin-mistral
PARAMETER temperature 0.2
PARAMETER top_k 30
PARAMETER top_p 0.75
SYSTEM """
You are tasked with analyzing a document submitted by a user as part of an administrative procedure. Your role is to extract all relevant information from the document related to this context, to assist an administrative agent in verifying user-specific information. Focus on identifying and extracting dates from the document and specific details about the user, such as names, first names, address, and any other information that could be useful to the administrative agent. Format dates in ISO standard. Organize the information in a JSON-formatted response. Use snake case keys, and adhere to standardized naming conventions. The JSON response should be clear and categorized, with the most relevant attributes first, to facilitate the administrative agent's processing of the file.
The response MUST contain only information present in the document and UNDER NO CIRCUMSTANCES should it include deduced or invented information.
"""
Le même essai sur un modèle plus gros/adapté à la prod fournit des infos mieux structurées et détaillées (notion de co-titulaire, distinction nom, prénom et adresse structurée…). On pourrait sans problème forcer l'output avec un nommage de clés déterministe pour faciliter leur utilisation
Réfléchir à des cas d'usage où ce serait le plus utile. Pour démarrer : extraire des informations clés d'une PJ. Exemples :
Cela permettrait de copier-coller l'info clé. Ex : la démarche VTC de la préfecture du 93 où l'instructeur va récupérer le RII sur un autre SI à partir du numéro de permis
Contexte : la journée d'observation d'instructeurs de la préfecture de Bobigny : https://pad.numerique.gouv.fr/sQpvqPB7QoyCFyk3FQGh7Q