value = independent / dependent
distribution
discrete distribution = independent한 value가 descret(명목/서열) 하다
1) binomial distribution 이항 분포
반복된 실험에서 1,0 두가지 형태로만 나오면서 n이 계속 증가한다면, 정규 분포에 가까워진다.
2) Hypergeometric distribution
N개중 K개를 뽑으려고 할 때 한정된 모집단에서 얼마나 뽑을 수 있는가
3) 포아송
일정 시간/공간 내에서 발생하는 사건
nomalize distribution = continous(등간/비율)한 value값에서 자주 나타내는 형태
평균값이 있으며 좌우 대칭
하나의 변수에서
table = discrete / continous
카이제곱 = discrete
요인 분석 = continous
신뢰도 분석 = continous
비교하고 싶은 경우
discrete value => 빈도수 비율을 통해 나타낸다.
binom.test (one sample proportion test)
continous value => 평균을 통해 나타내며 , 정규 분포를 따르는지 여부에 따라
t.test / wilcox
2개의 변수
data1 과 data2 가 discrete하며 dependent inpendent 여부를 따져야 한다.
dependent value = discrete + inpendent value = discrete
교차표 = Crosstable함수를 이용하여 table값을 비교하여 나타내준다.
chisquare
dependent value = discrete + inpendent value = continous
independent value가 continous하기 때문에 평균을 통하여 구한다.
var.test를 통하여 정규 분포를 확인하고 맞다면 data 갯수에 따라 t-test 와 wilcox로 나뉜다.
dependent value = continous + inpendent value = continous
prop test -> 검정 통계량
dependent value = discrete + inpendent value = discrete
decision tree + logisitic
앞에 있는 내용을 잘못 이해한것도 있고 부족한 것도 있어 다시.
비교하고 싶은 경우 discrete value => 빈도수 비율을 통해 나타낸다. binom.test (one sample proportion test) continous value => 평균을 통해 나타내며 , 정규 분포를 따르는지 여부에 따라 t.test / wilcox
dependent value = discrete + inpendent value = discrete 교차표 = Crosstable함수를 이용하여 table값을 비교하여 나타내준다. chisquare
dependent value = discrete + inpendent value = continous independent value가 continous하기 때문에 평균을 통하여 구한다. var.test를 통하여 정규 분포를 확인하고 맞다면 data 갯수에 따라 t-test 와 wilcox로 나뉜다.
dependent value = continous + inpendent value = continous prop test -> 검정 통계량
dependent value = discrete + inpendent value = discrete decision tree + logisitic