sungon-k-big / it

0 stars 0 forks source link

20171221-R #13

Open sungon-k opened 6 years ago

sungon-k commented 6 years ago

20171221-data-r마무리.txt

종교유무와 결혼관계에 대한 파생변수를 활용해

서 이혼율에 관한 데이터를 추출해보겠습니다. 사용변수:group_marriage,religion,pct 생성데이터프레임:divorce 사용함수:filter,select 필터조건:group_marriage=="divorce"

어제 작업하여 생성한

종교유무와결혼관계(religion_marriage)에 대하여

파생변수인 group_marriage에서 이혼에 관한 데이

터를 필터링을 하고 종교와 비율(pct)를 선택출력

을 하여, divorce데이터프레임에 저장을 하는 코

드를 작성합니다.

작성코드입니다.

divorce<-religion_marriage %>% filter

(group_marriage=="divorce") %>% select

(religion,pct)

religion pct

1 no 8.3 2 yes 7.2 #그래프작성 사용함수:ggplot,geom_col() data:divorce x:religion y:pct >ggplot(data=divorce,aes (x=religion,y=pct))+geom_col() #연령대와종교유무에 대한 이혼율 분석 사용함수:filter,is.na,group_by,summarise,mutat e,sum,round(대상,소수점1자리),n 사용데이터:group_marriage,ageg,welfare 생성데이터프레임:ageg_marriage #welfare데이터프레임에 있는 group_marriage에서 결측치를 제외시키고 필터링한다. 그리고 ageg,group_marriage를 그룹핑하고,n을 활용해서 summarise요약보고데이터를 만든다. 만들어진 보 고데이터에 mutate함수를 활용해서 n에 대한 sum 함수를 계산하고, tot_group에 저장한다. 그리고 빈도n을 tot_group을 나누어주고 100을 곱해준다. 그것에 소수점1자리를 반올림하고 pct에 저장한다 . tot_group,pct 두개의 변수를 ageg_marriage생 성데이터프레임에 결합시킨다. #그룹핑함수결과에 n을 더하고, mutate함수결과인 tot_group,pct를 추가하는 코드형태가 됩니다. >ageg_marriage<-welfare %>% filter(!is.na (group_marriage)) %>% group_by (ageg,group_marriage) %>% summarise(n=n()) %>% mutate(tot_group=sum(n)) %>% mutate(pct=round (n/tot_group*100,1)) ageg group_marriage n tot_group pct 1 middle divorce 399 4599 8.7 2 middle marriage 4200 4599 91.3 3 old divorce 311 4511 6.9 4 old marriage 4200 4511 93.1 5 young divorce 2 33 6.1 6 young marriage 31 33 93.9 #청년데이터는 제외, 이혼추출 사용함수:filter,select 사용데이터:ageg_marriage,ageg,group_marriage,p ct 생성데이터프레임:ageg_divorce 주의점:young의 데이터를 제외시켜라. ageg_marriage를 활용해서 ageg가 young인 데이터 를 제외하고, group_marriage가 divorce인 데이터 만 모아줍니다.(filter) 그안에서 ageg,pct데이터 를 선택해주세요(select).그것을 ageg_divorce에 저장하면 됩니다 >ageg_divorce<-ageg_marriage %>% filter(ageg != "young" & group_marriage =="divorce") %>% select(ageg,pct) #그래프생성 함수:ggplot,geom_col()/data:ageg_divorce/ x:ageg/y:pct 제시된 정보를 활용해서 그래프를 생성합니다. >ggplot(data=ageg_divorce,aes (x=ageg,y=pct))+geom_col() #종교유무에대한 이혼율차이가 연령대별로 차이가 있을지 데이터분석을 하는 코드를 작성합니다. 사용함수:filter,is.na,group_by,summarise,n,mut ate,sum,round(인수,1자릿수) 데이터:welfare,group_marriage,ageg,religion 생성데이터:n,tot_group,pct,ageg_religion_marri age 최종저장데이터:ageg_religion_marriage welfare데이터에서 group_marriage의 결측치를 제 거필터링합니다.(ageg에는 young도 없어야 합니다 .) ageg,religion,group_marriage를 그룹핑합니다 .각그룹의 빈도수를n함수로 계산하고 n에 저장하 여 요약보고서를 만듭니다. 빈도수n을 sum하여 tot_group에 저장하고, 빈도수n을 tot_group로 나 누고 100을 곱하여,소수점1자리반올림을 한후에 pct에 저장을 합니다. tot_group,pct를 mutate함 수로 데이터프레임에 추가시킨후 ageg_religion_marriage데이터에 저장시킵니다. = [20171221-data-r마무리.txt](https://github.com/sungon-k-big/it/files/1578017/20171221-data-r.txt)