Open ppKrauss opened 6 years ago
Revisando:
Conforme definido no escopo desta primeria fase (ver README root) publicaremos apenas:
pontos de endereçamento, designando ponto de interesse com dados de endereço postal;
linhas relativas a vias que potencialmente apoiam endereçamento ou descrevam equipamentos sociais (portanto todas as roads incluindo ferrovias porém ainda não hidrovias); e
polígonos dos municípios (menor jurisdição).
As tags serão utilizadas como filtro e classificador de grupo (juntando varias geometrias num só arquivo de GeoJSON).
O prefixo de Geohash será utilizado como classificador de grupo, e garantindo uma referência textual de proximidade entre endereços e suas roads
O prefixo de ref será utilizado como classificador de grupo nas roads estaduais e municipais.
PS: é um tanto experimental, depende estritamente do que for convencionado "inside" e "outside" do município. Convém fazer isso primeiro apenas no estado PR. Cabe também rastrear todos os trechos de mesma ref, e por fim verificar o impacto sobre endereços, pois trechos municipais são rebatizados para nomes.
A seguir a sugestão final de convenções.
Além da restrição primária do item 1 acima, as tags permitem as seguintes filtragens e agrupamentos, conforme o tipo.
Filtragem de pontos:
Filtragem de roads:
Filtragem de polygon de município: tags IBGE, boundary, etc. auditadas e em conformidade com http://datasets.ok.org.br/city-codes.
Nome de "arquivo de cache": recebe o prefixo kx_
. Qualquer que seja o tipo de arquivo, se for informação redundante ou metadados (ou seja não consiste em parte da representação stable do OSM), será considerado cache de dados. Caches típicos são aqueles que podem ser calculados por SQL a partir dos dados brutos fornecidos pelos demais arquivos.
Exemplo: data/PR/kx_sumario.csv
.
Nome de arquivo de município. Dentro do path do município, arquivo único, formato data/${uf}/${municipio}/municipio.geojson
.
Exemplo: data/PR/Curitiba/municipio.geojson
.
Nome de arquivo de pontos. Dentro do path do município, diversos arquivos na forma data/${uf}/${municipio}/pt-${prefGeohash}.csv
.
Exemplo: data/PR/Curitiba/pt-6gky.csv
.
Nome de arquivo de roads. Dentro do path do município, diversos arquivos na forma data/${uf}/${municipio}/${roadTypeLabel}-${prefGeohash}.csv
.
Exemplo: data/PR/Curitiba/highway-6gky.geojson
.
roadTypeLabel
é determinado pelas keys disjuntas highway e railway, concatenando-se à key layer quando presente. Exemplos: highway
, highway_layer
, railway
.prefGeohash
) é determinado pelo ST_PointOnSurface, que depois é aplicado a ST_Geohash, truncado nos 1 a 4 primeiros dígitos. No exemplo: 6gky
. Eventualmente agrupamentos geohash podem representar intervalos (ex. 6g9-6gx
) para balancear o tamanho dos arquivos.Nome de arquivo cache de road estadual. Dentro do path do estado (jurisdição estadual), diversos arquivos na forma data/${uf}/kx_roads/${roadTypeLabel}-${nome}.csv
.
Exemplo: data/PR/kx_roads/highway-PR-012.geojson
.
Nome de arquivo cache de road federal. Dentro do path raiz (jurisdição federal), diversos arquivos na forma data/kx_roads/${roadTypeLabel}-${nome}.csv
.
Exemplo: data/kx_roads/highway-BR-116.geojson
.
A partir dos municípios-amostra pode-se eleger os tipos de geometria que serão submetidos ao "backup stable". Critérios obtidos por análise das contagens:
wikidata
ou tagsname
etype
.de relation: multipolygon, route, ou boundary;
de way: building.
Os itens serão armazenados cada qual no seu arquivo GeoJSON, de modo que a nomenclatura das pastas e dos arquivos precisa ser controlada. Resumo:
Q
(wikidata) oup
(perma_id); ou identificador temporário, iniciado pela letra correspondente (r
,w
oun
).Contagens de elementos interiores
Seleção de geometrias "inside", inteiramente contidas dentro dos limites do município.
São Paulo,
stable.vw_sampa_test_report01
Demais cidades do conjunto-teste,
stable.vw_city_test_report01
:SQLs: