robonomist / robonomistClient

https://robonomist.github.io/robonomistClient/
1 stars 0 forks source link

dl_filter käyttö? #4

Closed jhuovari closed 2 years ago

jhuovari commented 2 years ago

Miten data-function dl_filter:ä voi käyttää? Yritän hakea 12 kk euriboria ECB:ltä. En oikein keksi miten sieltä saa järjellisen määrän data tai dataa ylipäätään. @itkonen

itkonen commented 2 years ago

Lisäsin dokumentaatiota dl_filterin käytöstä tänne: https://robonomist.github.io/robonomistClient/reference/data.html

Tässä on pari vaihtoehtoa, joilla euriborit voi hakea:

data( "ecb/FM", dl_filter = list(freq = "M", provider_fmid = "EURIBOR1YD") ) data("ecb/FM", dlfilter = "M.U2.EUR.RT.MM.EURIBOR1YD.HSTA")

Valitettavasti EKP:n rajapinta on poikkeuksellisen hankala ja hidas. Osin hitaus liitty olemassa oleviin parsereihin, mutta suunnitelmissa on koodata omat data-hakujen nopeuttamiseksi.

jhuovari commented 2 years ago

Kiitos. Tuo EKP:n tietokanta on kyllä hankala ja sieltä oikean tiedon löytäminen kiven takana.

jhuovari commented 2 years ago

Mitenkäs vastaava toimii Tullille?

itkonen commented 2 years ago

Tässä on yksi esimerkki datahausta:

 data("tulli/uljas_cpa2008",
      dl_filter = list("Tavaraluokitus CPA2008_2" = "*A-X",
                       "Aika" = c("201505", "201506"),
                       "Maa" = "=ALL",
                       "Suunta" = "=FIRST 1",
                       "Indikaattorit" = "=FIRST 1"))

Toistaiseksi käyttöä vaikeuttaa se, että API:sta haettavien rivien määrä on rajallinen. Tähän on suunnitelmissa koodata haunpalastelija, jottei käyttäjän tarvitsisi tästä murehtia.

jhuovari commented 2 years ago

Kiitos.

Tullin tiedoista voisi olla kätevää valmiit yksinkertaisemmat taulut keskeisistä tiedoista. Näin ekonomistille siellä on vähän liikaa dataa.

itkonen commented 2 years ago

Totta! Voin tehdä valmiita tidy-taulukkoja, jos lähetät listan tiedoista, joita tarvitsette. Vissiin perus vienti- ja tuontiaggregaatit, mutta olisiko muita?

itkonen commented 2 years ago

Uusimmassa data serverissä on nyt Tulli-datoille haunpalastelija, joten nyt käyttäjän ei tarvitse välittää API:n rajoitteista.

Uutena ominaisuutena filteristä voi jättää vapaasti dimensioita määrittämättä, jolloin haetaan kaikki datat. Ääriesimerkkinä voi kokeilla argumettia dl_filter=list(NULL), jolloin funktio palauttaa koko kuution ensisijaisilla luokitteluilla. Useimmissa tapauksissa koko kuution lataus saattaa kestää tuskallisen kauan.

Lisäksi kokosin valmiiksi joitain rajatumpia näkymiä tänne: data("tidy/tulli")

jhuovari commented 2 years ago

Luulen, että noi tidy-datat riittää meillä lähes aina. Kiitos.