Kimuksung / bigdata

0 stars 0 forks source link

추론 통계2 #21

Open Kimuksung opened 4 years ago

Kimuksung commented 4 years ago

앞에 있는 내용을 잘못 이해한것도 있고 부족한 것도 있어 다시.

value = independent / dependent distribution discrete distribution = independent한 value가 descret(명목/서열) 하다 1) binomial distribution 이항 분포 반복된 실험에서 1,0 두가지 형태로만 나오면서 n이 계속 증가한다면, 정규 분포에 가까워진다. 2) Hypergeometric distribution N개중 K개를 뽑으려고 할 때 한정된 모집단에서 얼마나 뽑을 수 있는가 3) 포아송 일정 시간/공간 내에서 발생하는 사건 nomalize distribution = continous(등간/비율)한 value값에서 자주 나타내는 형태 평균값이 있으며 좌우 대칭

하나의 변수에서 table = discrete / continous 카이제곱 = discrete 요인 분석 = continous 신뢰도 분석 = continous

비교하고 싶은 경우 discrete value => 빈도수 비율을 통해 나타낸다. binom.test (one sample proportion test) continous value => 평균을 통해 나타내며 , 정규 분포를 따르는지 여부에 따라 t.test / wilcox

2개의 변수 data1 과 data2 가 discrete하며 dependent inpendent 여부를 따져야 한다.

dependent value = discrete + inpendent value = discrete 교차표 = Crosstable함수를 이용하여 table값을 비교하여 나타내준다. chisquare

dependent value = discrete + inpendent value = continous independent value가 continous하기 때문에 평균을 통하여 구한다. var.test를 통하여 정규 분포를 확인하고 맞다면 data 갯수에 따라 t-test 와 wilcox로 나뉜다.

dependent value = continous + inpendent value = continous prop test -> 검정 통계량

dependent value = discrete + inpendent value = discrete decision tree + logisitic