CamaraDosDeputados / dados-abertos

Repositório do serviço de Dados Abertos da Câmara. Consulte as "Issues" para atendimento a dúvidas e sugestões.
http://dadosabertos.camara.leg.br
201 stars 14 forks source link

Acessando notas fiscais das despesas #9

Open filipesaraiva opened 9 years ago

filipesaraiva commented 9 years ago

Caros, há alguma forma de pegar (ou gerar) o link para as notas fiscais das despesas? O XML das despesas não apresenta essa informação.

geraugu commented 9 years ago

http://www.camara.gov.br/cota-parlamentar/documentos/publ/[id_deputado]/[ano]/[numero_doc].pdf

http://www.camara.gov.br/cota-parlamentar/documentos/publ/3026/2015/5612959.pdf

filipesaraiva commented 9 years ago

Obrigado @geraugu. o [id_deputado] e [ano] eu já tinha sacado, mas como saber o [numero_doc]? Eu vi que no site do detalhamento das despesas, o número NF/Recibo é o campo txtNumero do XML das despesas, porém esse número é diferente do nome do arquivo PDF da nota.

filipesaraiva commented 9 years ago

Usando o link que você mandou como exemplo, o número NF/Recibo da nota é 113606. http://www.camara.gov.br/cota-parlamentar/cota-analitico?nuDeputadoId=3026&numMes=2&numAno=2015&numSubCota= porém o nome do arquivo PDF é 5612959.pdf. Queria saber se há algum mapeamento direto para o nome do PDF.

geraugu commented 9 years ago

entendi, eu pensei que era esse txtNumero.

geraugu commented 9 years ago

@filipesaraiva, se vc descobrir alguma forma de construir essa url nos avise por favor.

filipesaraiva commented 9 years ago

O Rafael conseguiu fazer no Peba, acho que usando técnicas de scraper. Vou pedir pra ele passar aqui e dizer como foi. Mas de qualquer forma é um dado que poderia estar incluso no dados-abertos 2.0.

osanyin commented 9 years ago

Opa! Pra conseguir linkar os recibos tive que fazer um scraper que coleta as informações dos deputados contidos no select dessa página: http://www.camara.gov.br/cota-parlamentar/index.jsp. Com os ID eu faço uma requisição passando pelos anos e meses até a data atual preenchendo essa URL: http://www.camara.gov.br/cota-parlamentar/documentos/publ/[id_deputado]/[ano]/[numero_doc].pdf. Em cada página retornada eu busco por todas as linhas das tabelas que possuem informações de alguma despesa, com isso pego o anchor contido na 4º coluna e o href do recibo. Sendo que já tenho as despesas de todos os desputados cadastradas em um banco de dados, identifico a despesa de cada recibo através do CNPJ, Nº do Recibo e Valor da Nota.

labhacker commented 8 years ago

Ficamos gratos pela contribuição. Temos o compromisso de fomentar o uso dos dados abertos, mas também está claro que há questões de qualidade que precisam ser abordadas.

Ontem nos reunimos com diversos setores técnicos envolvidos na disponibilização dos dados abertos e discutimos melhores maneiras de atender às tantas demandas registradas.

Podem ficar tranquilos, pois estamos avaliando o que pode ser feito em âmbito institucional. Postaremos updates à medida que fizermos progresso. :-)

Pedro Brandão Laboratório Hacker

EquipeDadosAbertosCD commented 8 years ago

Bom dia, @filipesaraiva, @geraugu e @osanyin.

Um novo campo foi acrescentado ao arquivo de cotas parlamentares: ide_documento. Agora, é possível montar a URL para as notas fiscais de despesas usando a seguinte regra:

'http://www.camara.leg.br/cota-parlamentar/documentos/publ/' + nuDeputadoId + '/' + numAno + '/' + ide_documento + '.pdf'

Vale destacar que apenas as despesas reembolsadas têm documentos anexados. Despesas como passagens aéreas, telefonia e serviço postal não têm esses anexos, pois não são pagamentos feitos contra a apresentação de um documento fiscal pelo parlamentar. Elas são pagas pela Câmara debitando as cotas parlamentares.

Por favor, verifiquem se a mudança feita atende à necessidade de vocês e se está funcionando como deveria. Ainda falta atualizar a documentação do arquivo.

Paulo Henrique Centro de Informática

geraugu commented 8 years ago

Excelente @CeninCD ! Vou testar