open-contracting / bi.dream.gov.ua

DREAM Analytics
https://bi.dream.gov.ua
Apache License 2.0
1 stars 0 forks source link

Performance: Оптимізація завантаження #95

Closed ndrhzn closed 6 months ago

ndrhzn commented 7 months ago

Оскільки у нас наразі не дуже багато активних задач, @a-radik запропонував, аби @andrzejbeletsky попрацював над "оптимізацією завантаження і обробки даних". Мотивація для цього така, що "на початку щоб швидше видати результат і оскільки обсяг був невеликий деякі речі були зроблені нашвидкоруч і не зовсім оптимально".

Цей issue - для документації проблеми та рішення, аби ми краще розуміли і що саме було зроблено, і які lessons learned.

Потрібно описати

andrzejbeletsky commented 7 months ago

Завантаження даних з API відбувається в декілька етапів. 1) завантаження з API і збереження сирих даних у файлах. тут вже реалізовано інкрементальне завантаження і звернення до API тільки для запиту модифікованих або нових даних з попереднього запуску завантаження. 2) зібрання раніш збережених сирих даних по усій сукупності файлів. для цього етапу також потрібно зробити інкрементальне опрацювання даних у зв'язку зі збільшенням кількості файлів і каталогів. 3) завантаження моделі даних в додаток з візуалізацією. наразі проблем зі швидкістю немає. просто свіжим оком передивитися, чи є очевидні місця прискорення.