transparencia-mg / handbook

Manual interno de operação da Diretoria de Transparência Ativa
https://transparencia-mg.github.io/handbook/
MIT License
0 stars 1 forks source link

Prepara Apresentação Grupo de Dados dia 18/08/2023 #75

Open gabrielbdornas opened 1 year ago

gabrielbdornas commented 1 year ago

@Andrelamor, passando o olho na apresentação Datapackage Manager for CKAN - DPCKAN (Fechamento Curso CKAN Escola de dados OKRBR) penso que não seria necessário modificarmos nada.

Gostaria de sua opinião sobre.

Minha idéia seria fazermos um treinamento rápido da apresentação na véspera do encontro só p se certificar que tudo está nos conformes.

Coisas que podemos acrescentar, na fala, são:

Andrelamor commented 1 year ago

perguntas orientadoras:

Andrelamor commented 1 year ago

PRÓXIMOS DESAFIOS

PRÓXIMOS DESAFIOS Ecossistema de demanda e oferta de dados incipiente em MG. Gap de conhecimento tanto de publicadores quanto de usuários - Data Literacy. Conhecimentos específicos até para as pessoas que trabalham na área. Tamanho do banco necessário para comportar bases complexas (dados geospaciais).

Andrelamor commented 1 year ago

pontos da apresentação

gabrielbdornas commented 1 year ago

demonstrar facilidade para utilização dos dados

from frictionless import Package
from requests import get

ckan_datapackage = get('http://projetockan.cge.mg.gov.br/datapackage-creator/show-datapackage-json/fd3619b2-db62-45c2-8c15-52cba375a290')
package = Package(ckan_datapackage.json())
resource = package.get_resource('crimes-violentos-2022-1')
df = resource.to_pandas()

Penso que demonstrar algo utilizando campos de data e Dinheiro (valor) seria bem interessante, pois isso, de fato, é uma dor para quem trabalha com análise de dados.

Andrelamor commented 1 year ago

demonstrar facilidade para utilização dos dados

  • Premissa: utilização de especificação frictionless:
from frictionless import Package
from requests import get

ckan_datapackage = get('http://projetockan.cge.mg.gov.br/datapackage-creator/show-datapackage-json/fd3619b2-db62-45c2-8c15-52cba375a290')
package = Package(ckan_datapackage.json())
resource = package.get_resource('crimes-violentos-2022-1')
df = resource.to_pandas()

Penso que demonstrar algo utilizando campos de data e Dinheiro (valor) seria bem interessante, pois isso, de fato, é uma dor para quem trabalha com análise de dados.

esta demonstração é útil para qualquer fórum desta temática, principalmente se comparada ao pandas sem frictionless, quando ocorrem problemas de encoding, interpretação equivocada de ponto, vírgula, etc

gabrielbdornas commented 1 year ago

Este PR é um exemplo de melhoria contínua da documentação com auxílio dos consumidores.