opencovid19-fr / data

Consolidation des données de sources officielles concernant l'épidémie de COVID19
MIT License
285 stars 102 forks source link

Possibilité de renseigner plusieurs sources #168

Closed jdesboeufs closed 3 years ago

jdesboeufs commented 4 years ago

Même si la règle est un fichier YAML = 1 source, dans certains cas l'information d'une même source est éclatée sur plusieurs pages.

On pourrait accepter les tableaux pour le champ source.

Cf #158

ColinMaudry commented 4 years ago

Pour le CSV

jdesboeufs commented 4 years ago

On est pas obligé de tout mettre dans les CSV non ? Dans les JSON oui.

ColinMaudry commented 4 years ago

Non effectivement, il n'y aura qu'à documenter que le CSV n'a que la source principale.

Binnette commented 4 years ago

Je propose tout simplement, la syntaxe suivante dans les yaml:

source: # ou alors 'sources:' ?
 - nom: _______________ # source 1
   url: _______________
   archive: _______________
 - nom: _______________ # source 2
   url: _______________
   archive: _______________

source: ou sources ?

Les # source 1 et # source 2 qui traînent permettent de référencer les sources:

donneesNationales:
  casConfirmes: 5000 # d'après la source 1
  deces: 10 # d'après la source 2

Qu'en pensez vous ?

jdesboeufs commented 4 years ago

Je suis OK avec ça. Je pense qu'on va juste devoir passer à sources, et prévoir de n'intégrer que la première dans le CSV, et conserver source en plus (la première aussi) à des fins de compatibilité dans le JSON.

JiPiBi commented 4 years ago

Je recopie ce que j'ai mis dans une autre issue fermée , voici les sources listées dans le CSV ['ARS Auvergne-Rhône-Alpes', 'ARS Bourgogne-Franche-Comté', 'ARS Bretagne', 'ARS Centre-Val de Loire', 'ARS Corse', 'ARS Grand Est', 'ARS Guadeloupe', 'ARS Guyane', 'ARS Hauts-de-France', 'ARS Hauts-de-France et Préfecture de l’Oise', 'ARS La Réunion', 'ARS Martinique', 'ARS Mayotte', 'ARS Normandie', 'ARS Nouvelle-Aquitaine', 'ARS Occitanie', 'ARS Pays de la Loire', "ARS Provence-Alpes-Côte d'Azur", 'ARS Île-de-France', 'Coronavirus-France-Dataset', 'DSP Polynésie française', 'Gouvernement Wallis et Futuna', 'Gouvernement de la Nouvelle-Calédonie', 'Le Petit Corse', 'Ministère des Solidarités et de la Santé', 'OpenCOVID19-fr', "Préfecture d'Ille-et-Vilaine", 'Préfecture de Bretagne', "Préfecture de l'Aisne", "Préfecture de l'Allier, ARS Auvergne-Rhône-Alpes", 'Préfecture de la Manche, ARS Normandie', 'Préfecture de la Somme', 'Préfecture du Morbihan', 'Santé publique France', 'Santé publique France Data']

et j'en profite pour répéter que quand une région a 3 sources differentes pour le meme jour , ca se complique pour le choix des valeurs

image

abdoulsn commented 4 years ago

@JiPiBi Est-ce ceci peut se régler avec la tag time (si indisponible ajouter tag time à l'heure de saisie).

abdoulsn commented 4 years ago

Mais si un fichier n'a pas été saisie hier par example ça serait compliqué.

JiPiBi commented 4 years ago

J ai simplifié mon problème en prenant le max de chaque champ pour une date et une granularite donnée parmi les valeurs disponibles quelque soit le nombre de sources.

abdoulsn commented 4 years ago

Ok, :), j'ai jamais requeter la data. On peut fermer du coup ce issue,