klarasirca / APPR-2020-21

Vzorčni repozitorij za projekt pri predmetu Analiza podatkov s programom R v študijskem letu 2020/21
MIT License
0 stars 1 forks source link

Par vprašanj v zvezi z uvozom tabelic #1

Closed klarasirca closed 3 years ago

klarasirca commented 3 years ago

Medtem, ko sem uvažala tabele, sem naletela na nekaj težav (datoteka uvoz)

  1. Pri tabelah 3. in 4., kjer opazujem starostne skupine ljudi, ki se priseljujejo in odseljujejo, so starostne skupine tip "character". To mi je seveda jasno, saj so vse zapisane v obliki 20-25 ter 65+. Vendar pa me zanima, ali je to sploh v redu ter če ni, kako naj to spremenim, da bo tip numeric ter da bodo starostne skupine še vedno razvidne.
  2. Pri tabeli 7. sem naletela na težavo, da je Hrvaška zapisana na dva načina: "...Hrvaška" ter kot "Hrvaška". To pa zato, ker so pod spremenljivko Hrvaška zapisani podatki, ko Hrvaška še ni bila v EU, pod spremenljivko ...Hrvaška pa po letu 2013, ko je Hrvaška postala del EU. Sedaj bi to želela urediti, in za leta do 2013 izbrisati eno spremenljivko, po letu 2013 pa drugo, vendar ne vem kako naj se tega lotim. Prosila bi za pomoč.
klarasirca commented 3 years ago

V bistvu sem za 2. vprašanje sicer nekako ugotovila, kaj narediti, a verjetno obstaja lepši način za reševanje tega problema: tabela7$Drzava[tabela7$Drzava == "... Hrvaška"] <- "Hrvaškaa" novo <- tabela7 %>% filter(Drzava!="Hrvaška", Leto > 2013) novo2 <- tabela7 %>% filter(Drzava!="Hrvaškaa",Leto<=2013) tabela7zares <- bind_rows(novo,novo2) tabela7zares$Drzava[tabela7zares$Drzava == "Hrvaškaa"] <- "Hrvaška"

timotejvesel commented 3 years ago
  1. To je vredu. Ne more biti tipa numeric.
  2. Ko uvažaš datoteko, mora biti skip=3, da preskoči še vrstico z imeni stolpcev. Potem pa lahko narediš tako:
    tabela7 <- tabela7[!(tabela7$Drzava=="Hrvaška" & tabela7$Leto>2013), ]
    tabela7 <- tabela7[!(tabela7$Drzava=="... Hrvaška" & tabela7$Leto<=2013), ]
    tabela7$Drzava <- gsub("... Hrvaška", "Hrvaška", tabela7$Drzava)

    V stolpcu Stevilo je ponekod namesto številke z. Nevem kaj je namen tega. Če je to enako kot ..., torej bi moralo biti NA, dodaj to pri uvozu datoteke.

Poleg tega v datoteki README.md v vrsticah 5 in 6 jaanos zamenjaj s klarasirca, da bom projekt deloval tudi v binderju.