mission-apprentissage / trajectoires-pro

MIT License
3 stars 0 forks source link

Analyse data taux de couverture AF pour exposition v2 #130

Closed benjaminbarralon closed 7 months ago

jadynekena commented 1 year ago

1. Documentation pour l'étude de couverture

https://www.notion.so/mission-apprentissage/Comment-compl-ter-les-formations-ParcourSup-et-Affelnet-avec-Inserjeunes-b262e7b20c8341809cbfac2855bb2323

2. Exhaustivité des données Affelnet reçues

Les requêtes SQL associées aux données reçues filtraient sur des taux IJ non vides => en attente de liste de formations plus exhaustive (Aurelia relancée par mail)

3. Seuils selon la voie

Après étude du fichier csv issu de l'API trajpro (données IJ), l'effectif seuil pour calculer les taux dépendent de la voie :

4. Couverture avec les données AF actuelles

Image
Seule les formations dont l'effectif est trop faible sont sans stats IJ (10% des lignes), ce qui rejoint le point 2 en attente de retour.

jadynekena commented 1 year ago

Il faut garder le seuil à 20 peu importe la voie.

En revanche, les taux sont calculables dès que l'effectif est >= 20 : cela reste à rectifier sur PS (le "ou égal").

jadynekena commented 1 year ago

J'ai une visio avec Aurélia Pery le lundi 21 novembre à 14h pour qu'on échange de vive voix sur les données AF.

jadynekena commented 1 year ago

Retours suite à la visio avec Aurelia

1. Fichiers envoyés

2. Règles pour l'historique des CFD

En attente du retour de la MOA (MC Szilas)

jadynekena commented 1 year ago

Toujours en attente des 2 fichiers qu'Aurélia doit m'envoyer avant la fin de semaine.

jadynekena commented 1 year ago

METHODE D'ETUDE DE COUVERTURE

A partir d'un triplet (Académie, UAI, MEFSTAT11 AF), on calcule:

4 règles pour calculer le MEFSTAT11 de sortie (triées par ordre de priorité)

  1. Un MEFSTAT11 AF peut être associé à plusieurs MEFSTAT11 de sortie selon les familles de métiers
  2. sinon: Un MEFSTAT11 AF dont le CFD est associé un seul MEFSTAT11 dans la BCN correspond nécessairement au même MEFSTAT11 en sortie
  3. sinon: Un MEFSTAT11 AF est associé au MEFSTAT11 de la dernière année de la formation, selon la BCN
  4. sinon: Un MEFSTAT11 AF est associé à un MEFSTAT11 de la dernière année de formation, tenant compte de l'historique du CFD

TRANSFORMATION DES DONNEES AFFELNET

A partir des 19323 triplets (Académie, UAI, MEFSTAT11 AF), dont 18137 valeurs uniques, il en découle 35675 lignes.

COUVERTURE INSERJEUNES AU NIVEAU REGIONAL

En apprentissage : 11970 / 35675 lignes = 34% ont des statistiques inserjeunes (liens d'API) En voie scolaire : 17519 / 35675 lignes = 49% ont des statistiques inserjeunes (liens d'API)

Après correspondance des CFD historiques, on obtient finalement :

En apprentissage : 15565 / 35675 lignes = 44% ont des statistiques inserjeunes (liens d'API) => +3595 lignes comparé à avant En voie scolaire : 21621 / 35675 lignes = 61% ont des statistiques inserjeunes (liens d'API) => +4102 lignes comparé à avant

jadynekena commented 1 year ago

Todo

Vérifier que les taux au niveau national sont présents au moins 1x dans une région (aucune perte de données)

jadynekena commented 1 year ago

Schéma explicatif des 4 règles pour le MEFSTAT11

Règle n°1: 1 MEFSTAT11 AF => plusieurs MEFSTAT11 sorties car famille des métiers

Image

Règle n°2: même MEFSTAT11 car 1 seul MEFSTAT11 pour le CFD

Image

Règle n°3: MEFSTAT11 de la dernière année de la formation

Image

Règle n°4: MEFSTAT11 découlé du CFD historique

Image

jadynekena commented 1 year ago

FORMATION COUVERTES AU NATIONAL MAIS MANQUANTES AU NIVEAU REGIONAL

VOIE APPRENTISSAGE

4 / 74 CFD nationaux non reconnus côté régional

VOIE SCOLAIRE

5 / 115 codes mefstat11 nationaux non reconnus côté régional

Résumé

jadynekena commented 1 year ago

image image