@jsuchal musel som vyrobiť clock, takže som vyrobil rails projekt s clockom. Aj tak chceme neskôr použiť datahub, takže tu už máme ActiveRecord a podobne.
Zdockerizoval som to a nasadil na clustri.
Samotný fix sťahovania bol zložitejší než sa najprv zdalo. Zmenili stránku tak, že sa načítava dynamicky. Teda bez ich cookie ti to pošle html s dynamickým obsahom, po ktorého vykonaní dostaneš ich cookie. Následne s tou cookie ti už ten istý request vráti reálny obsah. V praxi to znamená, že som musel z HTTParty switchnúť na Selenium s Chromom, aby browser vykonával JS, ak treba.
A tiež sa trošku zmenila štruktúra v tej tabuľke - parsovanie ID, zadávateľ, subjekt.
@jsuchal musel som vyrobiť clock, takže som vyrobil rails projekt s clockom. Aj tak chceme neskôr použiť datahub, takže tu už máme ActiveRecord a podobne.
Zdockerizoval som to a nasadil na clustri.
Samotný fix sťahovania bol zložitejší než sa najprv zdalo. Zmenili stránku tak, že sa načítava dynamicky. Teda bez ich cookie ti to pošle html s dynamickým obsahom, po ktorého vykonaní dostaneš ich cookie. Následne s tou cookie ti už ten istý request vráti reálny obsah. V praxi to znamená, že som musel z HTTParty switchnúť na Selenium s Chromom, aby browser vykonával JS, ak treba.
A tiež sa trošku zmenila štruktúra v tej tabuľke - parsovanie ID, zadávateľ, subjekt.