YourCompanySucks / coursera-machine-leaning

1 stars 2 forks source link

week #1 #1

Open joonsun-baek opened 5 years ago

joonsun-baek commented 5 years ago

ML의 목적

스크린샷 2019-05-30 오후 11 39 41
joonsun-baek commented 5 years ago
스크린샷 2019-05-30 오후 11 40 03

ml은 결국 cost function이 가장 작은 hypothesis를 찾는 일. 근데 저 cost function에서 1/2m중 왜 1/2를 하는지 이해가 안됨....

joonsun-baek commented 5 years ago

1/2의 명쾌한 해답을 찾음

스크린샷 2019-05-31 오전 12 06 30
joonsun-baek commented 5 years ago

Gradient descent algorithm의 기본개념 : 이번 강의에서는 linear regression의 cost function에 대응되는 개념만 설명한점을 기억해야 할듯

스크린샷 2019-06-01 오후 10 33 47
joonsun-baek commented 5 years ago

산술식 단순화

스크린샷 2019-06-01 오후 10 33 53

여기서 위의 1/2에 대한 설명을 예시로 들 수 있음 제곱을 그냥 미분해서 없어진거임 ㅋㅋㅋ

joonsun-baek commented 5 years ago

계속 나오는 영단어 derivative

스크린샷 2019-06-01 오후 10 36 10
phh0606c commented 5 years ago

1/2 에 대해 논의할려고 git을 들어왔는데 혼자 논의를 끝내 버리셨네요 ㅋㅋ

cartoon1110 commented 5 years ago

아 나도 아이패드 가지고싶다 키보드로 쓰려니까 아예 안써짐ㅋㅋㅋ

Cost Function

linear regression에서 선형 방정식 파라미터 2개의 값을 찾아야 하는데 이 값을 어떻게 찾을 것인가?

결국 Cost Function은 예측한 값과 실제 데이터간의 오차를 최소화하는 파라미터를 찾는 함수..인걸로! -> linear regression 에서 목적함수 = cost function

Gradient Descent

Cost Function을 찾기 위한 알고리즘.. 그러니까 모양새가

  1. Linear Regression (h(x) = theta0 + theta1 * x)
  2. theta를 찾아야해! Cost Function (J(theta0, theta1))
  3. Cost Function의 최솟값을 찾아야해! Gradient Descent (theta를 변경해가며 반복 수행)

찾기 위한 알고리즘들이 각각 이름을 지니고 있어서 겁나 헷갈린다.

joonsun-baek commented 5 years ago

@cartoon1110 쓰는게 오래걸리면 걍 노트에 써서 사진찍어서 올려버려 ㅋㅋㅋㅋ 근데 노트북 케이스 몇개 살 돈이면 아이패드 충분히 사는거 아니냐

cartoon1110 commented 3 years ago

강의 내용

머신러닝 소개

1주차 핵심

phh0606c commented 3 years ago

나는 회귀랑 분류에 대해서 연속이냐 이산이냐로는 잘 이해가 안가드라고 ㅋㅋ 뭐 말하려는지는 알겠는데, 막상 그런문제를 만났을때 이게 이산이냐 연속이냐로 회귀알고리즘을 쓰자, 분류알고리즘을쓰자 이게 안된다고 할까?

예를 들어 각종 데이터를 이용해서 "신체나이 예측하기" 모델을 만들 때 신체나이란 이산형 데이터란 생각이 들어서, 1살 2살 이런식이니 이거 외에도 사실 int는 모두 이산이기도 하고

그래서 나는 Regression = 태그 값에 "없는 예측결과"를 예측하고 싶을때, Classfication = 예측결과가 태그값 중에 무조건 "나와야할때"

로 생각했는데, 어때? 이렇게 생각하면 해결하고자하는 문제에 대해서, 이건 회귀야 ! 이건 분류야 ! 하고 확실히 결정할 수 있을까?

cartoon1110 commented 3 years ago

뭐야 이거 지금봤어요 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ

음 근데 태그 값 중에 없는 값이 나와도 Classification이라고 부를 수 있을 것 같은게,

그래서 저는 어떻게 생각했냐면 내가 구하고자 하는 y 값에 따라 두개를 분류할 수 있을 것 같다고 생각했거든요.

예시가 좀 이상한 것 같긴한데.. 제가 말하고자 하는 느낌은 아시겠죠!? ㅋㅋ 저렇게 생각하는건 어떨까요?

phh0606c commented 3 years ago

음 나는 스팸 문서만 있어서는 분류가 안될거라고 생각하는데 .. classification이 라벨링이 없는 분류를 할 수 있는지 잘 모르겄구만. @joonsun-baek 멘토님 혹시 아십니까?

그치 2번째는 나랑 같은 의견이구만 ! 올지 안올지 두가지 값을 모두 알고있고 그 값중에 고르니까 classfication 내일 비가 올 확률은 어떤 값이 나올지 모르니 regression

joonsun-baek commented 3 years ago

오 댓글달아놓은걸 지금봤고만여

둘다 말한게 모두가 정답임여 정확한 포인트는 아래처럼 생각해보는것도 좋을듯!

요것과 별개로, 스팸문서만으로 학습한 모델은 일반문서를 예측해낼수 없습니당 예측하고자 하는 label은 학습시에 모두 필요함!