Open lIms0 opened 1 year ago
: 입력 데이터(x)와 타겟값(y)을 알고 있는 데이터를 학습하여 이들의 관계를 모델링하는 학습 방법
: 종속변수 Y가 이산형 변수(discrete variable)인 경우
: 종속변수 Y가 연속형 변수(continuous variable)인 경우
: 타겟값(Y)이 없는 입력 데이터(X)만을 학습하는 방법, 입력 데이터에 내재되어 있는 특성을 찾아내는 용도
군집화(Clustering): 유사한 포인트들끼리 그룹을 만드는 방법
잠재 변수 모델(Latent Variable Model): 표현된 데이터 속에 내재되어 있는 요인을 찾는 것
밀도 추정(Density Estimation): 관측된 데이터를 이용하여 데이터 생성에 대한 확률 밀도 함수를 추정
이상치 탐지(Novelty(or Anomaly) Detection): 다른 포인트들과 비교하여 많이 벗어나 있는 포인트를 찾아내기
인공신경망 기반 비지도 학습
: 다른 변수에 영향을 받지 않음
: 독립 변수의 변화에 따라 어떻게 변하는지 알고 싶어하는 변수
독립 변수: 원인 종속 변수: 그에 따른 결과 독립 변수와 종속 변수 모두 연속형 자료(예: 몸무게, 키, 성정 등)와 범주형 자료(지역, 성별, 학력 등) 모두 가능. 보통 독립 변수가 연속형 자료라면 공변량(Covariance)라 부르고, 범주형 자료라면 요인(Factor)라고 부름.
: 두 확률 변수의 사전 확률과 사후 확률 사이의 관계를 나타내는 정리
: 이산 확률 변수 X의 분포를 나타내는 함수로 함수 값이 곧 확률이다.
위 코드에서 'dice_values' 변수에는 주사위의 값 범위인 1부터 6까지의 값이 들어 있음. 'pmf' 변수는 주사위의 각 값에 대한 확률을 나타냄. 여기서 주사위가 공평한 경우로 각 값에 대해 동일한 1/6을 할당하였음. 'for' 루프를 사용하여 주사위의 값과 해당 값에 대한 확률을 출력함.
: 연속 확률 변수 X의 분포를 나타내는 함수로 함수의 넓이가 확률이다.
'x' 변수에는 연속 확률 변수의 값 범위가 들어 있음. 'mu'는 정규 분포의 평균이고, 'sigma'는 표준 편차임. 'pdf' 변수에는 정규 분포의 확률 밀도 함수를 계한아여 저장 그 후, 'plt.plot()' 함수를 사용하여 'x'와 'pdf'를 그래프로 표현
: 해당 선형 변환에 의해 방향만 변경되고 크기는 변하지 않는 벡터
0719 세미나 피드백