A lógica de raspagem dos dados depende de uma estrutura textual adotada pelo Paraná, o que faz com o que as chances do mesmo script funcionar para estados que não adotam padrão algum nos posts ser baixíssima.
Faz sentido e é factível consideramos abandonar o esquema de expressão regular e testar NLP? Temos volume de dados (categorizados e não categorizados) para isso?
A lógica de raspagem dos dados depende de uma estrutura textual adotada pelo Paraná, o que faz com o que as chances do mesmo script funcionar para estados que não adotam padrão algum nos posts ser baixíssima.
Faz sentido e é factível consideramos abandonar o esquema de expressão regular e testar NLP? Temos volume de dados (categorizados e não categorizados) para isso?