hyper-scraper / scraper-panel

Scrapers + web app
0 stars 0 forks source link

Вытаскивание номера телефона из картинки #1

Closed estliberitas closed 11 years ago

estliberitas commented 11 years ago

Алгоритм вытаскивания номера:

  1. Код выполняемый в phantom'е вытаскивает координаты и размеры картинки с телефоном.
  2. Далее делаем page#renderBase64() - вытаскиваем область.
  3. Отправляем на сервис распознавания.
  4. Проверяем на сервисе блэклистов.
  5. Если всё ок, добавляем номер.

P.S.: в BaseScraper необходимо добавить возможность отфильтровывать данные на этапе их вытаскивания из конкретной страницы.