서로 간 겹치는 컬럼 수: 4개의 데이터셋에서 서로간 겹치는 컬럼수, 16999
mda_mvac: 81.98% from 20737 Gene Symbols
mda_ddmvac: 81.7% from 20808 Gene Symbols
meta_datasets: 36.94% from 46023 Gene Symbols
amc: 69.49% from 24463 Gene Symbols
스케일링된 4가지 데이터셋 간 pairwise check에서 서로간 충분히 분포가 유사하다고 판단되는 컬럼만 남김
: T-test for means of two independent samples 기반 p_value 1% 이상일 경우 데이터 분포 동일의 귀무가설을 기각하지 못함에 근거함