MPMG-DCC-UFMG / C01

Coleta de Dados Públicos
GNU General Public License v3.0
18 stars 9 forks source link

Restringir a extração de links utilizando texto, xpath ou seletor css #469

Open louisaturn opened 3 years ago

louisaturn commented 3 years ago

Comportamento Esperado

Uma opção que pode ser interessante na configuração dos coletores: restringir a busca do coletor por links no código-fonte da página, utilizando expressões regulares ou os seletores css e xpath. Essas opções estão relacionadas aos parâmetros do LinkExtractor: restrict_text, restrict_css e restrict_xpaths, de acordo com a documentação.

Comportamento Atual

Atualmente, não é possível filtrar as URLs encontradas com as ferramentas descritas acima.

Passos para reproduzir o erro

Não se aplica

Especificações da coleta

Não se aplica.

rennancl commented 2 years ago

Hey team! Please add your planning poker estimate with ZenHub @elvesrodrigues @lucasaug