Open IGNF-Xavier opened 9 months ago
Proposition Smile d'ici fin 2023. Mode : on récupère des pages bien taguées au DSFR depuis DRUPAL pour les amener sur cartes.gouv
On dispose depuis cet été d'un drupal accessible pour test, qui utilise le DSFR en v1.10.2 (contre >=1.12 sur cartes.gouv.fr).
Il n'est pas (et ne sera pas) dimensionné pour un afflux important de visites, donc il ne faut pas l'interroger en direct mais bien implémenter une commande, configurée ensuite en CronJob pour récupérer régulièrement la liste des actualités, chacune des actualités ainsi que les médias associés.
Il y a 2 options pour implémenter la récupération :
DOMDocument:loadHTML
ne sais parser une page HTML qu'en HtML 4. Et comme on a besoin de manipuler la structure des pages récupérées, cette limitation va vite poser problème.Récupérer le contenu de la balise <main>
des pages semble la bonne solution, sachant qu'il faut dans le rendu final garder notre header, notre footer et un fil d'ariane simple (Accueil > Actualités > {Titre de l'article}).
Où et comment structurer les données récupérées du Drupal reste à investiguer.
Drupal est préféré à un autre CMS car il est déjà connu des équipes qui vont être amenées à l'alimenter.
Un mode d'utilisation headless est préféré pour mieux s'intégrer dans un développement qui est essentiellement hors drupal, non lié à un CMS.
Il y a 2 options concernant le déploiement de drupal :
Il semble également y avoir 2 options pour l'API à utiliser :
Seul des accès en lecture (GET) sont nécessaires.
Concernant l'intégration de l'API (peu importe laquelle des 2) dans le front on a également 2 scénarios :
Update août 2023
Le portail ENR a expérimenté sans API, en allant chercher le contenu directement sur un drupal installé avec le module DSFR. Cela permet une prévisualisation des articles rédigés. Ce drupal n'a pas besoin d'être exposé sur internet, il peut être gardé interne. Il faut développer une sorte de proxy pour que seul le site cartes.gouv puisse y accéder.