На данный момнт код немного запутан,так как мы используем 3 библиотеки для парсинга
Есть предложение создать более структурированную архитектуру и разбить все на классы (миксины) с наследованием
Предлогается следующая архитектура:
Есть 3 библиотеки (типы парсеров):
lxml (requests+lxml)
scrapy
selenium (уже вместо pyppeteer)
Итоговый парсер каталога это класс-наследник BaseParser
Дополнение методов происхоит через наследование миксинов
[x] Разеделение аппок на core/common - 757302e14701177bf87071ebdf0d8ae96264b5cd
На данный момнт код немного запутан,так как мы используем 3 библиотеки для парсинга Есть предложение создать более структурированную архитектуру и разбить все на классы (миксины) с наследованием
Предлогается следующая архитектура:
lxml
(requests+lxml)scrapy
selenium
(уже вместоpyppeteer
)BaseParser
BaseParser
BaseMixin
- 37a8ca1c2f2addeef0963e67200089a1a4a175f9parser/lxml
parser/selenium
parser/scrapy
TODO: Что делать с сохранением
Структура файлов
Примерная диаграмма
не обязательно соответствующая стандартам
Набросок кода (уже не совсем валиден)