splor-mg / notas

Base de conhecimento
https://splor-mg.github.io/notas/main
0 stars 0 forks source link

Inferir schema de arquivo HTML usando TableResource #31

Open hslinhares opened 11 months ago

hslinhares commented 11 months ago
from frictionless.resources import TableResource

resource = TableResource('data-raw/arquivo.html', dialect='dialect.yaml')
resource.infer()
resource.schema.to_yaml('schemas/arquivo.yaml')
fjuniorr commented 11 months ago

@hslinhares se você criou isso como forma de documentar um conhecimento o melhor local é o repo https://github.com/splor-mg/notas

labanca commented 7 months ago

Foi necessário o mesmo procedimento para poder realizar o describedo arquivo programa_monitoramento.txt na criação do repositório https://github.com/splor-mg/dados-sigplan-monitoramento

Além do dialect também foi necesário utilizar o campo format para indicar que o arquivo deveria ser tratado pelo Frictionless como um csv.

from frictionless.resources import TableResource

resource = TableResource("data-raw/Programa_monitoramento.txt", dialect="dialect.yaml", format='csv')
resource.infer()
print(resource.schema.to_yaml("schemas/programa_monitoramento.yaml"))