codestates / ds-blog

blog sharing for data science bootcamp course
2 stars 4 forks source link

[윤현태] 몬티홀 문제에 대하여 #104

Open hyuntae-yun opened 4 years ago

hyuntae-yun commented 4 years ago

영화 21에서 보면, 수학 천재 주인공 벤에게 미키 교수가 벤에게 추가 점수를 주려고 문제를 낸다.

P-"벤에게 추가 점수를 얻을 기회를 줘보기로 하지. "게임진행자의 문제"라고 부르기로 하자." P-"게임쇼에 나왔다고 가정하고, 문 세 개가 있지." P-"문 세개 중 하나의 문에만 자동차가 있고, 나머지 두 문의 뒤에는 염소가 있지." P-"어떤 문을 열겠나?" B-"첫번 째 문을 열겠습니다." P-"그러나 게임진행자는, 문 뒤에 무엇이 있는 지를 알고 있지. 그래서 3번 문을 열었고, 거기에는 염소가 있다." P-"계속 1번 문을 열 건가? 아니면 바꿀 것인가?" B-"바꾸겠습니다."

그리고 벤은 변수가 바뀌었으니, 대답도 바뀌었다고 한다. 0-> 자동차 , x- 염소 0,x,x x,0,x x,x,0 내가 1번문을 골랐을 때, 사회자가 보여줄 수 있는 경우의 수. 0,x,염소 x,0,염소 x,염소,0 따라서 선택을 바꾸지 않고 1번문을 고집하면 슈퍼카를 받을 확률은 1/3 이 되고, 선택을 바꾸면 2/3의 확률을 얻는다.

여기서 중요한 건 '사회자의 개입'이다. 왜냐하면 사회자 역시 차가 어디있는지 모르고 그냥 고르라고 했다면, 벤과 똑같이 1/3의 확률로 골라버려서 어쩌면 자동차를 실수로 오픈해버렸을 수도 있다. 그러나 사회자는 정확하게 자동차가 어디 있는지 알고 있기 때문에, 사회자가 문을 열고, 선택 기회를 한 번더 줌으로서 확률이 변화하게 되는 것이다.

Frequentist은 여기서, 사회자의 개입에 상관 없이, 어쨌든 슈퍼카가 들어있는 문을 고를 확률은 1/3 아니냐? 라고 할 것이다. 왜냐하면 그들은 상대도수로서의 확률을 생각하기 때문이다. 아마 99,999,998개의 문을 열어준다면, Frequentist의 관점으로 보자면 50%의 확률이 맞다. 문이 두개고, 하나는 염소, 다른 하나는 자동차임이 자명하니까.

그러나 Bayesian은 다르다. 확률을 믿음의 정도로 해석하기 때문에, 그 확률은 얼마든지 상황이 변하면 변화할 수 있다. 여기서 중요한 건, 우리가 처음에 가지고 있는 확률이 얼마든지 상황에 따라 변할 수 있게 된 것이다. 그래서 저런 확률적인 해석이 가능한 것이다.

여기까지 읽어도 몬티홀 문제에 대해서 이해가 안된다면, 조금 더 숫자를 확장 시켜서 가정해 보자.

100,000,000 개의 문이 있다고 치고, 1개의 문에는 한 대의 슈퍼카 99,999,999마리의 염소가 있다. 이때, 우리가 문을 골랐다. 이때 우리가 포르쉐를 고를 확률은 1/100,000,000 이지만, 대부분은 99,999,999/100,000,000의 확률로 염소를 고를 것이다. 그러나 몬티홀 아저씨가 99,999,998개의 문을 열었고 그 모든 문이 염소라면, 열지 않은 문은 99,999,999/100,000,000 의 확률로 슈퍼카가 되는 것이다. 1/100,000,000 의 확률로 어메이징한 운을 가지고 있다면 바꾸는게 손해 겠지만, 필자는 응모 당첨같은 것과는 거리가 멀어서 1/100,000,000 확률 보다는 99,999,999/100,000,000의 확률로 다른 문을 고를 것 같다.

이제 대충 몬티홀 문제가 어떤 건지는 알 것 같다. 그럼 이제, 이걸 bayes theorem 으로 한 번 풀어보자.

Event A를 자동차가 1번 문 뒤에 있을 사건이라고 하고, Event B를 몬티 아저씨가 2번 문을 열어서 염소를 보여준 사건이라고 하자.

image

우리가 자동차를 골랐을 확률은 1/3 이 되고, 하나의 문이 열렸으니, 우리는 문 2개에 대해서 1/2의 확률로 문을 선택할 수 있다.[ Pr(B|A) ] 그리고 denominator은 조금 까다로워진다.

  1. 1번문을 선택했고, 몬티 아저씨가 2번 문에 있는 염소를 보여준다.
  2. 차가 1번문 뒤에 있다면, 몬티 아저씨는 그냥 1/2 의 확률로 아무 염소를 꺼내 보여주면 된다.
  3. 만약에 차가 2번문 뒤에 있다면, 2번에는 무조건 차가 있기 때문에 몬티 아저씨는 무조건 3번 문을 열어야한다. 그러나 2번 문을 열었기 때문에 확률은 0이 되어 버린다.
  4. 만약 차가 3번문 뒤에 있다면, 몬티 아저씨는 염소를 보여줘야 하기 때문에, 무조건 2번문 밖에 열 수 없다. 그래서 확률은 1이 된다.

그래서 결국, 처음 문에 자동차가 있을 확률이 1/3 이라고 가정 했을 때, 몬티 아저씨가 2번 문을 열어도 확률은 그대로 1/3 이 된다. 그러나, 반대로 말하면 3번 문에 자동차가 있을 확률은 1-1/3이므로 2/3이 되어버린다!

여기까지 해봤으니, 숫자를 확장시켜서 계산해봐도 되지 않을까?

문이 n개 있다고 하고, 나는 1번째 문을 선택했다. 이때 2부터 n-2개의 문이 열렸고, 현재 남은 문은 내 문과 n번째 문이라고 하자. 그러나 이건 우리가 임의로 알기 쉽게 정한 숫자이고, 실제로 내가 고르는 문은 1/n의 확률로 얻어걸린 것이고, 내 문 말고 살아남는 문도 1/n-1의 확률로 얻어걸린 거라고 볼 수 있다.

그리고 denominator은 각각의 문에 슈퍼카가 존재할 확률이다.

내가 선택한 문에 슈퍼카가 있을 때의 확률: 몬티 아저씨가 n-2개의 문을 열고 나머지 하나의 문(안에 염소가 있겠지만)을 남겨둘 확률 :1/n *1/(n-1)

2~n-1의 열린 문에 대한 확률: 문이 어짜피 모두 열렸다고 가정했으므로 슈퍼카가 있을 확률은 0이 된다. 계산을 하지 않아도 된다.

그리고 최종적으로 남는 n번째 문에 진짜로 슈퍼카가 존재할 확률: n번째 문에 슈퍼카가 존재한다면, 몬티 아저씨는 어쩔 수 없이 2~n-1번째 문을 열 수 밖에 없으므로, 확률은 1이 된다.

따라서 식은,

image

이 되고, 내가 처음 뽑았던 문이 슈퍼카일 확률은 1/n 이지만, 바꾸고 난 뒤의 문이 슈퍼카일 확률은 무려 1-1/n 이 된다.

References https://www.statisticshowto.com/probability-and-statistics/monty-hall-problem/ Agresti A. (1990) Categorical Data Analysis. John Wiley and Sons, New York. Gonick, L. (1993). The Cartoon Guide to Statistics. HarperPerennial. Kotz, S.; et al., eds. (2006), Encyclopedia of Statistical Sciences, Wiley. Wheelan, C. (2014). Naked Statistics. W. W. Norton & Company

수학적인 태클 환영합니다. 저도 해놓고 긴가민가 하네요ㅠㅠ

johnnykoo84 commented 4 years ago

설명 잘 들었습니다. 특히 문의 수를 늘린 부분 설명이 재밌네요.