Morpheus-Fatec / morpheus

Repositório destinado ao projeto de API do grupo Morpheus, do terceiro semestre do curso de Tecnologia em Banco de Dados da Fatec São José dos Campos - Prof Jessen Vidal
1 stars 1 forks source link

[D] [Web Scrapping] Lógica de Coleta de Dados #40

Closed cesarpelogia closed 4 weeks ago

cesarpelogia commented 1 month ago

Descrição:

Implementar a funcionalidade que utiliza a biblioteca JSoup para realizar web scraping e extrair dados relevantes (título, conteúdo, autor, data de publicação) de páginas HTML.

Critérios de Aceitação:

Tarefas:

Configuração da Biblioteca JSoup:

Mapeamento de Tags HTML:

Extração de Dados Relevantes:

Lidar com Diferentes Formatos de Páginas HTML:

Ignorar Elementos Irrelevantes:

r1cardvs commented 1 month ago

As tags extraidas automaticamente devem armazenar todos os atributos com exceção do id.