Pois bem, sei por uma issue já fechada que o arquivo precisa ser .docx, fiz essa adaptação manualmente, porém, tendo em vista que o site da Câmara retorna as EMCs sempre em formato .pdf e essa adaptação manual é deveras desgastante e demorada, há indicação de uma ferramenta que faça essa tarefa com um retorno minimamente bem formatado para o parser?
Outrossim, como posso saber com clareza quais são os parâmetros estritamente necessários para o comando parse? Indo além, como posso definir a melhor opção de cada parâmetro para essa EMC?
Tomando por exemplos, o parâmetro --mime-type deve receber officedocument.wordprocessingml.document, correto? Mas qual seria a melhor opção para --tipo-norma, uma vez que a Wiki indica apenas a opção 'lei'?
Olá, estou há um tempo tentando executar o comando parse em uma Emenda na Comissão, disponível em: https://www.camara.leg.br/proposicoesWeb/fichadetramitacao?idProposicao=2199624
Pois bem, sei por uma issue já fechada que o arquivo precisa ser .docx, fiz essa adaptação manualmente, porém, tendo em vista que o site da Câmara retorna as EMCs sempre em formato .pdf e essa adaptação manual é deveras desgastante e demorada, há indicação de uma ferramenta que faça essa tarefa com um retorno minimamente bem formatado para o parser?
Outrossim, como posso saber com clareza quais são os parâmetros estritamente necessários para o comando parse? Indo além, como posso definir a melhor opção de cada parâmetro para essa EMC?
Tomando por exemplos, o parâmetro --mime-type deve receber officedocument.wordprocessingml.document, correto? Mas qual seria a melhor opção para --tipo-norma, uma vez que a Wiki indica apenas a opção 'lei'?
Agradeço de prontidão pela ajuda. Cordialmente;