Open sidatal1 opened 3 years ago
Poročilo deluje, tako da bom dodal povezavo do projekta na repozitorij za zagovore. Če se še nisi, se lahko z @alenFMF domeniš za termin zagovora. Če boš do takrat še kaj spreminjala, mi javi, da posodobim povezavo.
Imam še nekaj pripomb:
Pri grafu povprečne stopnje brezposelnosti glede na izobrazbo po regijah bi bilo dobro stopnje izobrazbe urediti - glede na to, da hkrati tudi preimenuješ, lahko oba koraka opraviš s pretvorbo v urejen faktor, npr.
facet_grid(~factor(Izobrazba, levels=c("OS", "Nizja poklicna", "Srednja,splosna", "Vss"),
labels=c("OŠ", "Nižja poklicna", "Srednja, splošna", "VSŠ"), ordered=TRUE))
Napoved stopnje brezposelnosti za Turčijo je zelo zavajajoča. Najprej, v surovih podatkih imaš za vsako leto stopnje glede na spol in izobrazbo - ker velikosti posameznih populacij niso enake, bo enostavno povprečenje izkrivilo rezultate (če bi poznala velikosti populacij, potem bi lahko naredila ustrezno uteženo povprečje). Pazi tudi, da podatkov ne zaokrožuješ, dokler z njimi še kaj računaš. Za modeliranje potem uporabiš metodo loess
, ki pa morda ni najboljša za napovedovanje, saj na njeno obnašanje izven območja podatkov močno vpliva dogajanje na robu območja (tako kljub temu, da so tvoji podatki več ali manj konstantni, model kaže na občuten padec v prihodnosti). Nazadnje pazi, da pri risanju grafa uporabiš originalne podatke in ne napovedi - te lahko dorišeš npr. kot točke druge barve.
Svetoval bi torej, da se omejiš na eno samo kategorijo, ali pa uporabiš kakšne sumarne podatke, če jih imaš. Nekaj takega bi šlo:
podatki <- uvoz_1 %>%
filter(Drzava == "Turkey", Spol == "Males",
Izobrazba == "Less than primary, primary and lower secondary education (levels 0-2)")
model <- lm(data=podatki, Vrednost ~ Leto) # tukaj se uporabi linearen model - seveda lahko uporabiš tudi kaj drugega
leto <- data.frame(Leto=2020:2030)
napoved <- mutate(leto, Vrednost=predict(model, leto))
graf_napoved <- podatki %>%
ggplot(aes(x=Leto, y=Vrednost)) +
geom_smooth(method="lm", fullrange=TRUE, color="red", formula=y ~ x) +
geom_point(size=1, color="blue") +
geom_point(data=napoved, color="green") +
scale_x_continuous('Leto', breaks=seq(2008, 2030, 3)) +
ylab("Stopnja brezposelnosti")
Da se bo pred aplikacijo Shiny pokazal naslov, postavi še presledek za #
.
Najlepša hvala. Sem popravila potrebno. Lahko preverite in posodobite.
Bom posodobil povezavo. Naj pa opomnim, da na grafu še vedno prikazuješ samo napovedane podatke (tj., ne vidi se, na podlagi katerih podatkov so bili napovedani).
Sem še to popravila. Hvala.
V redu, posodobljeno.
Mislim, da sem zaključila projektno nalogo. Prosila bi vas za pregled in, ali moram še kaj spremeniti/dodati.