Closed minji-o-j closed 3 years ago
메일 1~n
1, 2, 3 ... n
주어진 메일이 스팸인지 구별하는 것
Q. 위키피디아 백과 문서를 모두 내 컴퓨터에 다운로드하면 내 컴퓨터가 똑똑해질까?
A: X -->기계학습의 조건을 만족하지 않는다.
이유: 작업(목적, Task)이 없다. -->성능 측정 기준 X (데이터는 있지만, 목적에 맞는 특정 데이터가 없다.)
훈련 데이터에 레이블(label) 이라는 구하고자 하는 출력 값이 포함됨
분류 ex: 스팸 필터
회귀 ex: 중고차 가격 예측
훈련 데이터에 레이블이 없음
군집화clustering (예: 블로그 방문자)
시각화visualization (예: 대규모 고차원 데이터 도식화)
이상치 탐지anomaly detection (예: 부정 신용 거래 방지)
차원 축소
연관 규칙 학습association rule learning
불량 데이터
부적합한 알고리즘(5장 정규화)
데이터 세트를 두 개 또는 세 개의 그룹으로 나누어 기계학습 모델의 성능을 검증함
훈련 데이터 Training data
모델을 훈련 시킬 때(학습시) 사용
성능 측정시 절대 사용하면 안된다!!
테스트 데이터 Test data
검증 데이터 Validation data
알고리즘을 훈련시킬 때, 여러 옵션 중 검증 데이터에 대해 최상의 성능을 내는 옵션을 선택 (튜닝용)
알고리즘의 훈련 옵션: 하이퍼 파라미터Hyper parameter
validation set에서 하이퍼파라미터 조정-> 최상의 성능을 내는걸 test에서 사용
테스트 세트는 최종 단 한 번의 테스트에서만 사용
>인공지능, 기계학습, 심층학습의 관계
1. 인공지능, 기계학습, 심층학습 관계와 정의
인공지능
기계학습
심층학습
2. 간락한 역사