Uma opção que pode ser interessante na configuração dos coletores: restringir a busca do coletor por links no código-fonte da página, utilizando expressões regulares ou os seletores css e xpath. Essas opções estão relacionadas aos parâmetros do LinkExtractor: restrict_text, restrict_css e restrict_xpaths, de acordo com a documentação.
Comportamento Atual
Atualmente, não é possível filtrar as URLs encontradas com as ferramentas descritas acima.
Comportamento Esperado
Uma opção que pode ser interessante na configuração dos coletores: restringir a busca do coletor por links no código-fonte da página, utilizando expressões regulares ou os seletores css e xpath. Essas opções estão relacionadas aos parâmetros do LinkExtractor: restrict_text, restrict_css e restrict_xpaths, de acordo com a documentação.
Comportamento Atual
Atualmente, não é possível filtrar as URLs encontradas com as ferramentas descritas acima.
Passos para reproduzir o erro
Não se aplica
Especificações da coleta
Não se aplica.