slovensko-digital / ekosystem

Verejný issue tracker
https://ekosystem.slovensko.digital
31 stars 0 forks source link

Data z EU vestnika #16

Open jsuchal opened 7 years ago

jsuchal commented 7 years ago

Niektore obstarka su rychlejsie v EU vestniku ako v tom nasom. Je to zaujimavy zdroj http://ted.europa.eu/TED/main/HomePage.do

Maju aj pristup k strukturovanym datam? Najdete niekto?

rsmeral commented 7 years ago

Zda sa ze ano, v TED-XML, cez FTP, zabalene v jednom tar.gz kazdy den: ftp://ted.europa.eu/daily-packages/2016/11/

rsmeral commented 7 years ago

User/pass: guest/guest Tu je k tomu info: https://data.europa.eu/euodp/en/data/dataset/ted-1

rsmeral commented 7 years ago

Wow, maju ten TED-XML format aj masivne zdokumentovany, tlieskam: ftp://ted.europa.eu/Resources/TED-XML_general_description_v2%200_20160219.pdf

jsuchal commented 7 years ago

@rsmeral fajne. Trufas si aj na scraper a tlacit to k nam do ekosystemu?

peterkohaut commented 7 years ago

len pre informaciu, tieto data su tam rychlejsie len preto, lebo oficialne sa musia zverejnit skor v eu (posielaju sa hned po odoslani oznamienia) ako na uvo portali - zobrazuju sa najblizsi den (pracovny) po odoslani oznamenia.

rsmeral commented 7 years ago

@jsuchal Neviem zatial co vsetko zahrna "tlacit do ekosystemu", ale rad by som skusil. Z rychleho pohladu - ekosystem.slovensko.digital ma teda centralnu relacnu databazu so schemou spolocnou pre vsetky datasety? Ma teda zmysel scrapovat TED ked uz scrapujeme (?) UVO?

jsuchal commented 7 years ago

Je to schéma per zdroj. Ted je EU vestnik kde je toho viac.

On Wed, 16 Nov 2016, 00:55 Ron Šmeral, notifications@github.com wrote:

@jsuchal https://github.com/jsuchal Neviem zatial co vsetko zahrna "tlacit do ekosystemu", ale rad by som skusil. Z rychleho pohladu - ekosystem.slovensko.digital ma teda centralnu relacnu databazu so schemou spolocnou pre vsetky datasety? Ma teda zmysel scrapovat TED ked uz scrapujeme (?) UVO?

— You are receiving this because you were mentioned.

Reply to this email directly, view it on GitHub https://github.com/slovensko-digital/ekosystem/issues/16#issuecomment-260809225, or mute the thread https://github.com/notifications/unsubscribe-auth/AABm5rNnlmfa397IVif61vDJzECa3ms0ks5q-kZegaJpZM4Ky69X .

jindrichmynarz commented 6 years ago

Data z Tenders Electronic Daily extrahuje do jednoduchého CSV OpenTED. V OpenData.cz jsme na tom taky před lety dělali. Nověji se těmto datům věnuje projekt Digiwhist a dává je na Opentender.eu pomocí https://github.com/digiwhist/backend. Není tedy třeba vlastní zpracování. Stačí data převzít nebo rozchodit už připravené extraktční skripty.

jsuchal commented 6 years ago

@jindrichmynarz diky!