Open d-cichon opened 1 year ago
summon @michalpazur
Powinienem w końcu porządnie postawić bazkę na swoim serwerze i będę mógł puścić skrypt, może zajmę się tym po obecnym posiedzeniu Sejmu (do 30 sierpnia) 🤔
Kurde, a może zrzucimy się na serwer, dorzucimy jakiś front i crona, który co jakiś czas to zescrapuje? Wydaje mi się, że coś takiego przydałoby się wszystkim.
@d-cichon VPSa mam postawionego, kwestia tego że przy scrapowaniu leci bardzo dużo requestów (liczba głosowań
x liczba kół poselskich
), więc kiedy próbowałem zescrapować całą poprzednią kadencję to cały czas leciały timeouty. Postaram się jednak niedługo dodać wsparcie dla wielu kadencji, zescrapować do końca IX kadencję i zacząć scrapować X kadencję, może faktycznie nawet jakiś front dopisać.
@michalpazur A może byłbyś w stanie podzielić się skryptem scrapera?
Cały kod scrapera głosowań jest dostępny w main.py 🤪
Cały kod scrapera głosowań jest dostępny w main.py 🤪
Aaa ok myślałem, że to nie jest ostatnia wersja. Dodali teraz captche z sugestią aby skorzystać z api.sejm.gov.pl Trzeba spróbować ;)
No nie wierzę, w końcu normalne REST API. Teraz sprawa stała się znacznie łatwiejsza 😋
Nawet chyba jet dostępny pakiet w pythonie do obsługi: https://pypi.org/project/sejmapi/
Jest jakaś szansa na powrót do projektu i zaktualizowanie go o najnowsze dane? Mógłbym jakoś przy tym pomóc?