placeholder-asso-free-spirits / placeholder-asso-free-spirit

Documentation, wiki and community discussions
0 stars 0 forks source link

Service d'acquisition + configurations #9

Open ogdabou opened 4 years ago

ogdabou commented 4 years ago

L'acquisition de données

Description courte

Temporalité

Features / mechanics

Business Model

Some notes

Beaucoup d’entreprise font appel à des SSII ou à du développement interne pour mettre en place de l’acquisition de données.

A vérifier, il semblerait et ne serait pas étonnant que tous les chercheurs et les universitaires fassent leur acquisition à la main avec des scripts customs, qui peinent à évoluer.

Service d'acquisition de données, on fournit un accès à une base de données de manière ouverte, et accès à nos service de stream. Ainsi, un data scientist, un DE ou whatever pourrait consommer les nouvelles données qui arrivent.

Quand un client à besoin de l’historique d’une source, il s’abonne à la file dédiée. La configuration de scraping définit une heure pour être lancée en mode “historique”.

Les autres gens qui s’abonnent recevront aussi les events.

Si personne n’est abonnés, on ne scrappe pas l’historique du site.

On peut probablement imaginer un modèle où pour certaines source de données qui n'autorisent pas la copie des données (ex: certains médias web) de ne pas la garder chez nous directement. On envoie la donne quand elle arrive et le reste est a la discrétion des utilisateurs.

Modèle open source ?

Il faudrait regarder, mais il me semble avoir vu que certaines license permettent de faire payer l’utilisation / les données si le client en retire de l’argent.

ogdabou commented 4 years ago

page sur la demande de scrape de data.gouv.fr : https://doc.data.gouv.fr/moissonnage/intro/