ZilavecM14 / APPR-2015-16

Repozitorij z gradivi za predmet Analiza podatkov s programom R v študijskem letu 2015/16
MIT License
0 stars 0 forks source link

CSV #2

Open ZilavecM14 opened 8 years ago

ZilavecM14 commented 8 years ago

Mi lahko prosim pogledate v projekt, v čem je problem da mi ne uvozi csv-ja? LP

jaanos commented 8 years ago

Na koncu prirediš funkcijo uvozi.stipendije v spremenljivko stipendije - če hočeš klicati funckijo, dodaj še (). V funkciji je sicer uporabljeno napačno kodiranje znakov - namesto "UTF-8" uporabi "Windows-1250". Namesto read.table raje uporabi read.csv2.

Sicer pa izgleda, da je s samo datoteko CSV nekaj narobe - najbrž si jo odprla v Excelu in potem shranila. Zato svetujem, da jo še enkrat pobereš iz Statističnega urada, a je pri tem ne odpiraš v Excelu oziorma kakem drugem programu, pač pa jo neposredno shraniš v mapo podatki/. Če moraš karkoli urediti v datoteki, to stori v RStudiu (pred urejanjem v meniju File izberi Reopen with Encoding... ter tam izberi Windows-1250, da se bodo šumniki pravilno prikazali in shranili).

Mimogrede, pri uvozu iz HTML v prazne vrstice pišeš nize "NaN", zaradi česar dobivaš opozorila. Namesto tega raje te vrstice pobriši - pa tudi prvo in zadnjo, saj tam nimaš podatkov:

tabela <- tabela[-c(1,2,12,22,32,42),]

Da se znebiš še preostalega opozorila, bo potrebno pobrisati še znak -, ki predstavlja manjkajočo vrednost.

ZilavecM14 commented 8 years ago

Še vedno mi ne dela. Lahko prosim popravite. LP

jaanos commented 8 years ago

Trenutno imaš pri uvozu datoteke stipendije.csv parameter row.names = 0, ki pa ne bo deloval, saj se stolpci štejejo od 1 naprej. Ker nimaš nobenega stolpca, ki bi lahko služil za imena vrstic, ta parameter odstrani; dodaj pa na.strings = "-", da bo minuse pretvorilo v NA.

Ker datoteka stipendije.csv nima glave, bo treba tudi za to poskrbeti. Da bo uvoz pravilen, dodaj še parameter header = FALSE, imena stolpcev pa podaj z vektorjem pri parametru col.names. Druga možnost bi bila, da bi glavo ročno dodala v datoteko CSV.