codex-team / codex-orion

News analysis project
2 stars 0 forks source link

Создать схему парсинга статей на основе Russia Today #5

Open eliseealex opened 8 years ago

eliseealex commented 8 years ago

Сейчас у нас есть очень простой парсер Russia Today и на его примере мы можем создать каркас. Пока что, мы (@eliseealex и @n0str) решили делать парсинг в три этапа:

  1. Получение списка новостей по таймеру, вызванному из Main. И передача результата запроса следующему актору.
  2. Разбиение списка новостей на отдельные новости и передача этого списка следующему актору.
  3. Парсинг статьи в общий формат для всех издательств и передача, следующему актору для аналитики.

Предполагается, что каждый из этих акторов будет в единственном экземпляре для всех источников новостей и в каждом из них будет содержаться только логика по передаче сообщения обработчику и, может быть, вызову следующего актора.