lIms0 / _

0 stars 0 forks source link

4, 5, 6 피드백 #2

Open lIms0 opened 1 year ago

lIms0 commented 1 year ago

0719 세미나 피드백

lIms0 commented 1 year ago

지도 학습

: 입력 데이터(x)와 타겟값(y)을 알고 있는 데이터를 학습하여 이들의 관계를 모델링하는 학습 방법

분류

: 종속변수 Y가 이산형 변수(discrete variable)인 경우

회귀

: 종속변수 Y가 연속형 변수(continuous variable)인 경우

비지도 학습

: 타겟값(Y)이 없는 입력 데이터(X)만을 학습하는 방법, 입력 데이터에 내재되어 있는 특성을 찾아내는 용도

비지도 학습의 종류

  1. 군집화(Clustering): 유사한 포인트들끼리 그룹을 만드는 방법 image

  2. 잠재 변수 모델(Latent Variable Model): 표현된 데이터 속에 내재되어 있는 요인을 찾는 것 image

    • 현재 데이터 속에 내재되어 있는 정보가 관측되지 않은 상태에서 z라는 내재되어 있는 변수를 찾아낸다.
    • 종류 1) 주성분 분석(Principal Component Analysis, PCA) 2) 특이값 분해(Singular Value Decomposition, SVD) 3) 비음수 행렬 분해(Nonnegative Matrix Factorization, NMF) 4) 잠재 디리슐레 할당(Latent Dirichlet Allocation, LDA)
      • ex) Topic Modeling: 문서에서 주제를 찾는 모델링
        • 주어진 문서에 존재하는 단어들의 분포를 보고 주제(latent variable)별로 분류하고, 해당 언어가 그 주제에 어느 정도 기여하고 있는지 알아낸다.
  3. 밀도 추정(Density Estimation): 관측된 데이터를 이용하여 데이터 생성에 대한 확률 밀도 함수를 추정

    • 가우시안 혼합 모델(Gaussian Mixture Model, GMM): 정규 분포 image
    • 커널 밀도 추정(Kernel Density Estimation, KDE): '커널'이라고 하는 몇 가지 분포를 이용해서 데이터를 추정 image
  4. 이상치 탐지(Novelty(or Anomaly) Detection): 다른 포인트들과 비교하여 많이 벗어나 있는 포인트를 찾아내기

    • 종류 1) Local Outlier Factor(LOF) 2) Isolation Forest 3) One-class Support Vector Machine(SVM)
    • 예) image
  5. 인공신경망 기반 비지도 학습

    • 예) Generative Adversarial Network(GAN) image
lIms0 commented 1 year ago

독립 변수

: 다른 변수에 영향을 받지 않음

종속 변수

: 독립 변수의 변화에 따라 어떻게 변하는지 알고 싶어하는 변수

독립 변수와 종속 변수는 인과 관계를 가지고 있다.

독립 변수: 원인 종속 변수: 그에 따른 결과 독립 변수와 종속 변수 모두 연속형 자료(예: 몸무게, 키, 성정 등)와 범주형 자료(지역, 성별, 학력 등) 모두 가능. 보통 독립 변수가 연속형 자료라면 공변량(Covariance)라 부르고, 범주형 자료라면 요인(Factor)라고 부름.

image

lIms0 commented 1 year ago

베이즈 정리

: 두 확률 변수의 사전 확률과 사후 확률 사이의 관계를 나타내는 정리

장점

단점

언제 사용하는가?

lIms0 commented 1 year ago

image

확률 질량 함수 Probability Mass Function

: 이산 확률 변수 X의 분포를 나타내는 함수로 함수 값이 곧 확률이다.

image 위 코드에서 'dice_values' 변수에는 주사위의 값 범위인 1부터 6까지의 값이 들어 있음. 'pmf' 변수는 주사위의 각 값에 대한 확률을 나타냄. 여기서 주사위가 공평한 경우로 각 값에 대해 동일한 1/6을 할당하였음. 'for' 루프를 사용하여 주사위의 값과 해당 값에 대한 확률을 출력함.

확률 밀도 함수 Probability Density Function

: 연속 확률 변수 X의 분포를 나타내는 함수로 함수의 넓이가 확률이다.

image 'x' 변수에는 연속 확률 변수의 값 범위가 들어 있음. 'mu'는 정규 분포의 평균이고, 'sigma'는 표준 편차임. 'pdf' 변수에는 정규 분포의 확률 밀도 함수를 계한아여 저장 그 후, 'plt.plot()' 함수를 사용하여 'x'와 'pdf'를 그래프로 표현

lIms0 commented 1 year ago

선형 방정식을 역행렬을 사용하여 해를 구하는 법

image

빅데이터, 데이터 사이언스에서 선형 대수학을 사용하는 이유

아이젠 벡터 Eigenvector

: 해당 선형 변환에 의해 방향만 변경되고 크기는 변하지 않는 벡터

image

특징

lIms0 commented 1 year ago

상관관계

인과관계

상관관계와 인과관계는 다른 개념

lIms0 commented 10 months ago

image image