DagHjermann / icpw-R

ICP waters analyses, R code
0 stars 0 forks source link

Videre vei #2

Open DagHjermann opened 3 years ago

DagHjermann commented 3 years ago

TBD

GJORT / DELVIS:

kariaust commented 2 years ago

For 2000-2016. Sjekk først hvor mange flere sites som blir med sammenlignet med 1992-2016 (og hvor mange flere land). Hvis det er lite forskjell, er det ikke noe mer å mase med

DagHjermann commented 2 years ago

For 2000-2016. Sjekk først hvor mange flere sites som blir med sammenlignet med 1992-2016 (og hvor mange flere land). Hvis det er lite forskjell, er det ikke noe mer å mase med

Sjekk script 901 for dette.

DagHjermann commented 2 years ago

Punkter fra møte m. Kari, Øystein, Dick 27.01.2022

1) R2 / forklart andel devians for alle analyser

kariaust commented 2 years ago

Generelt: Lag nye koder for nye kjøringer (når det gjøres endringer i variabler, ikke nødvendig når det bare tas med nye outputs, endringer i figurer etc), så de gamle resultatene beholdes (for sammenligning) Kommentarer til punktene over: 1) Ja, kunne si noe om % forklaring. Men holder å gjøre det for nye kjøringer og 160 2) Ja - kjør 162 på nytt under nytt navn (164!). Ta bort log-transformasjon for alle variabler. Og ta bort altitude i alle kjøringer. Strengt tatt hadde det holdt med ab, c og d, men vi har litt tekst som forklarer hvorfor vi valgte sånn og ikke sånn, og for å være sikker på at den fortsatt er gyldig, må vi nesten kjøre a og b på nytt også. Si fra hvis det tar mye tid, da får det vurderes annerledes. Og fortsatt fint å kjøre de to variantene 1 og 2 (men igjen, si fra hvis det tar mye arbeidstid) 3) Trengs bare for det vi bruker, er nevnt spesifikt under andre punkter der det er nødvendig 4) Jepp. For alle nye og alle 160 - hvis det er enkelt 5) Ikke foreløpig 6) Ja. Den kan vi kalle 165. Ser at TON ikke deler seg i to klare kategorier. Er over halvparten som ikke har signifikant trend og ellers flere positive enn negative. Så kan ikke slå sammen no trend med en av de andre, som for nitrat. Så tror vi må kjøre den kontinuerlig, med Sen slope som responsvariabel. Selv om det blir inkonsistent mot 160. Forklaringsvariabler: Bruk alltid catchment_area, TON,slope_pre, slope_tmp, slope_dep_vs_time, TOTN_dep, latitude, longitude, tmp, land cover (merk at altitude er tatt ut). I tillegg en variant med TOC, en med TOC+slope_toc_vs_time og en uten begge. Her også bra å kjøre variantene 1 og 2 7) Jepp, lurt. Du ser hva jeg (foreløpig) har funnet å endre på i figurer her: K:\Prosjekter\langtransporterte forurensninger\O-23300 - ICP-WATERS - HWI\Faglige rapporter\2020 report\Report\Spørsmål og ønsker til Dag.docx. I rapporten ser du også hvilke figurer vi forløpig har valgt ut 8) Kanskje la dette ligge? Gjelder alle slags random forest-figurer. Bedre å ta det til slutt hvis tid. Eller tenker du det er kjappere å fikse nå. I tilfelle kan vi snakkes 9) Ja, fint å kjøre 160d1 separat per kontinent. Det kan kanskje bli 160e1 og 160 f1 10) Når du uansett kjører ting på nytt, kunne jeg ha et ønske for excel-filene som spyttes ut. Lar det seg enkelt gjøre at de får med seg alle forklaringsvariablene (i hvert fall site-info+klima+dep), uavhengig av om de er brukt eller ikke? Og at de har med både total forest og de to underkategoriene? Nå driver jeg og legger det til i R for de filene jeg bruker, men det er litt masete. Du trenger ikke kjøre 160 på nytt for dette, men for de andre? Hvis det er fort gjort, da

kariaust commented 2 years ago

Og forresten 11) For 162ab1 (som nå blir 164ab1): Ønsker meg blågrønt plot med slope_dep_vs_time y-akse og TOTN_dep x-akse ✔

kariaust commented 2 years ago
  1. Gå gjennom metodekapittelet for statistiske analyser. Når analysene er ferdige
  2. Da har jeg tenkt litt til, så dette punktet er nå inne på lista, ikke bare "kanskje":
    • Analysere TOC/TON med Sen slope som respons (kontinuerlig): Dette blir konseptuelt lik som 165 (samme type analyse, samme datasett), men med TOC/TON i stedet for TON som respons. Og variantene blir som for 165, men med TOC+TON, slope_toc_vs_time+slope_ton_vs_time osv. Den kan vel hete 167 ✔
    • Analysere NO3 med Sen slope som respons (kontinuerlig): Analyseoppsett som 165, men med datasettet for 160. Varianter som for 160 a-d, men ta ut altitude i a og c. Ser ut som du allerede er i gang med dette og har kalt den 166
    • altitude tatt ut, kjørt på nytt
    • Ta med TOC-trend som forklaringsvariabel i kopi av følgende analyser (her kan det komme fler)
    • ny variant av 160d1 -> 160d3 ✔ KAU: OK. Føltes først litt ulogisk å kalle det 3, men vi kan gjøre det sånn
    • ny variant av 164ab1 + 164c1 - utført, kalt 164ab1x + 164c1x ✔KAU: Fint. Men - obs. TOC-trend er i et annet datasett (samme som 165) enn median-datasettene som brukes her. Hvis det blir stress, kan du la det ligge så lenge
    • ny variant av 166d1 - kalt 166d1x ✔ - obs: her brukte jeg samme datasett som det de andre dataene er hentet fra (til forskjell fra 164ab1x + 164c1x)
kariaust commented 2 years ago

Har gått gjennom. Her har mye gått etter planen, men fant selvfølgelig noen ting:

Forøvrig: For å være helt sikker, kunne du sjekke at disse to delene av filen K:\Prosjekter\langtransporterte forurensninger\O-23300 - ICP-WATERS - HWI\Faglige rapporter\2020 report\Report\Oversikt datagrunnlag N-trend-rapport 2021.docx er riktige:

DagHjermann commented 2 years ago

Skal få gjort dette i løpet av dagen. Beklager såpass mange feil, jeg har mista oversikten (i den grad jeg noengang har hatt det!).