slovensko-digital / uvobot

8 stars 7 forks source link

RF-394 Fix uvobot #27

Closed celuchmarek closed 1 year ago

celuchmarek commented 1 year ago

@jsuchal musel som vyrobiť clock, takže som vyrobil rails projekt s clockom. Aj tak chceme neskôr použiť datahub, takže tu už máme ActiveRecord a podobne.

Zdockerizoval som to a nasadil na clustri.

Samotný fix sťahovania bol zložitejší než sa najprv zdalo. Zmenili stránku tak, že sa načítava dynamicky. Teda bez ich cookie ti to pošle html s dynamickým obsahom, po ktorého vykonaní dostaneš ich cookie. Následne s tou cookie ti už ten istý request vráti reálny obsah. V praxi to znamená, že som musel z HTTParty switchnúť na Selenium s Chromom, aby browser vykonával JS, ak treba.

A tiež sa trošku zmenila štruktúra v tej tabuľke - parsovanie ID, zadávateľ, subjekt.