Statistics 110 L2. Story Proofs, Axioms of Probability

해석을 통한 문제풀이 및 확률의 공리​

sample table

  1. 첫 번째는 상식을 잃어버리지 말아야 한다. 강의가 진행될 수록 상식에서 벗어난 직관적이지 못한 결과를 자주 얻게 된다. 따라서 상식을 잃어버리지 않도록 주의해야 한다. 따라서 과제를 수행할 때, 답안이 말이 되도록 쓰는 것 뿐만 아니라 합리적인 이유가 있어야 한다.

  1. 두 번째는 항상 답을 다시 확인해야 한다.​ 다른 방법으로 확인을 해야 한다. 이것은 특별한 경우에 대해서 다른 접근 방법을 생각해보라는거다. 많은 문제들이 한 가지 이상의 방법으로 해결 가능하다. 조언으로는 간단한 형태의 극단적인 경우를 모두 시도해보라는 것이다.

  1. 세 번째는 사물이나 사람에 대해서 라벨링(label) 을 해보라는거야. 매우 간단하지만 굉장히 유용하다. 예를 들어 하나의 사람들에 대한 집단이 있을 경우, 1, 2, …n 을 붙여보는거지. 그러면 이것들이 마치 구별가능하고 표시가 있는 것처럼 행동하는거야. 구별과 관련된 문제는 복잡해서 다음에 다시 보도록 한다.

CASE 1 (팀을 나누는 방법)

팀을 나누는 방법에 대해서 생각해보자. 10명이 있는데, 6명과 4명으로 나눈다.

  • 이렇게 하는 방법이 몇 가지가 있을까? 간단하게 10명 중 4명을 고르는 경우의 수가 되겠다.

  • 왜냐하면 4명을 팀으로 만들면, 나머지 6명은 다른 팀이 되기 때문이다.

  • 물론, 6명을 먼저 고를 수도 있다. 따라서 10C4 = 10C6 와 같아야 한다.

메모: nCk = nC_(n-k)

CASE 2 (팀을 나누는 방법)

이번에는 5명을 팀으로 해본다. 여기서도 단순히 10명 중 5명을 고르는 것으로 끝낼 수 있다. 5명을 먼저 고르면 나머지 5명은 자연스럽게 한 팀이 된다.

하지만, 나머지 5명을 먼저 골라내도 결과는 동일하지. 그런데, 1~5번을 한 팀으로 만들고 6~10번을 한 팀으로 만드는 방법은 하나만 있지. 이 두 팀을 나누어 구분하지는 않아.

그래서 10명중 5명을 고르는 경우의 수에서 2로 나누어야 하는거야. 왜냐하면 여기서는 중복으로 셌기 때문이지.​

이 부분은 놓치기 쉽지만 중요한 부분이다. 이런 문제를 조심스럽게 생각해 보아야 한다. 순서가 상관있거나 없는지에 대한 차이라고 말하기에는 설명이 부족하다. 상황을 잘 이해하고 그에 맞게 생각해야 알 수 있는 문제들이다.

확률의 단순한 정의에서는 각 결과가 동일한 확률을 가진다고 가정한다.

따라서 문제를 보고, 그 문제가 동일한 확률을 가지지 않는다면 단순한 정의는 사용할 수가 없다.

이제 샘플링 테이블로 되돌아가보자.

지난번에 2x2 테이블을 그렸다. 표는 순서가 상관있는지, 복원/비복원인지에 대한 구분으로 이루어졌고, 그 4개 중 3개 항목은 곱의 법칙으로 구해졌다.

그리고 어려운 4번째 항목이 있다.

결과는 이미 말했지만, 어떻게 나오는지를 보여주겠다.

n 개의 물체 중 k 번을 선택하는데, 이 경우는 순서는 상관없고, 복원을 적용하는 경우야.

n 개중 하나를 뽑고, 이것을 다시 되돌려 놓는다. 그리고 하나를 고르고 다시 되돌려 놓는다. 이것을 k 번 반복한다. 다른 순서로 같은 것들을 뽑더라도 이것을 하나로 간주한다.

이것을 고르는 방법이 몇 가지나 될까?

지난 시간에 $_{(n+k-1)}\mathrm{C}_k$라고 이야기 했었다.

이것을 증명하고 약간의 설명을 한다. 나머지 3개는 쉬웠지만, 이것은 약간 어렵다.

몇 가지 극단적인 경우로 시작해보자.

가장 극단적인 경우는 k = 0 이다. k = 0 라는 것은 아무것도 안한다는거지.

k = 0 일때도 맞는지 보자. 이것이 맞다고 하면 n-1 개에서 0 개를 고르는거다. n-1 에서 0 개를 선택하는 것은 한 가지 뿐이지. 1 이 된다. $0!$이 1 이 되는 것과 같은 이유야.

이번에는 덜 극단적인 경우를 보자. k = 1 이라면, n 개 중에서 1개를 고르는 경우가 되고, n 가지가 있는거지. 충분히 말이 된다.

단지 1명만 고른다면, 복원을 하거나 하지 않거나 차이가 없게 된다. 그리고 순서가 있거나 없거나 동일하지. 항상 n 이 된다.

다른 결과가 나온다면 분명 잘못된 것이다.

한 가지 더 간단한 경우를 보자. n = 2 라고 해보자.

상당히 흥미로은 경우이다.

n = 2 인 경우는 가장 간단하면서도 중요하다. 보통 연구를 할때 가장 좋은 일반적인 경우는 가장 간단하면서도 사소하지 않은 example 을 보는거야. 이 경우 n = 2 는 가장 간단하면서 특별한 경우이지. 이것들은 상당히 간단하지만, 확인해볼 필요가 있다. 틀린 결과가 나온다면 무언가 잘못 된거다.

이 예시는 가장 간단한 특별한 예시이다.

이건 k+1 에서 k개를 구하는 경우가 되지. 그리고 이건, k+1 에서 1 개를 구하는 경우와 같아.

이것은 10명중 4명을 먼저 고르고 6명을 고르거나, 10명중 6명을 먼저 고르고 4명을 고르는 경우하고 정확히 동일한거지.

메모: 위에서, $n\mathrm{C}_k = _n\mathrm{C}{(n-k)}$ 인 경우를 보았다.

이제 이것이 맞는지 보자.

여기서 n은 2이고, 우리는 k번을 선택할 수 있다.

2개의 물체를 의미하는 상자를 그려본다. 우리는 k 번 선택할 수 있는데, 여기에 체크 표시를 해보자. 간단하게 하기 위해서 점을 찍을거야.

이것을 1번이라고 하고 이것을 2번이라고 하자.

복원을 하는 경우, 선택의 횟수에는 제한이 없지. 전체 횟수가 가정했던 것과 동일하기만 하면 되지.

순서가 상관없기 때문에, 점의 순서도 상관이 없다.

하나의 상자에 점이 몇 개 있는지 알면 나머지 상자에 몇 개가 있는지 알 수 있지.

첫번째 상자의 점의 갯수는 0, 1, ,,, k 중 하나가 될거야. 왜냐하면 나는 k 점을 가지고 있기 때문이지.

그래서 k + 1 개의 경우가 있는거야.

메모: n = 2 일 경우의 공식이 맞다는 것을 2개 상자를 이용해서 설명하고 있다. 여기서 n 에 해당하는 것은 상자이고, 1과 2가 부여됐기 때문에 구분 가능한 정보이다. 반면에 점으로 표현된 k 는 순서가 상관없기 때문에 구분 불가능한 정보이다.

이제는 일반적으로 이 수식이 맞는지 살펴보자.

이 점으로 그린 그림은 이미 문제에 대한 힌트를 주고 있다.

이 강의에서 가장 중요하면서도 가장 어려운 부분은 특정한 패턴이나 구조를 찾아내고자 시도하는 습관을 들이는 것이다.

즉, 2가지 문제가 동일한 문제인지 알아내는 것이지. 다른 것처럼 보이더라도 말이야.

이번에는 n개의 구분 가능한 박스 안에 k개의 구분 불가능한 입자를 넣어보자.

이것의 답은 n+k-1 개 중 k 개를 고르는 경우의 수가 된다.

그 이유를 보자.

다이어그램을 그리고, 간단한 예시들을 시도해보자.

이제 그림을 그려서 문제를 해결해보자.

여기에는 2개의 상자만 있었기 때문에 굉장히 쉬운 경우였다. 이번에는 4개의 상자를 가지고 해본다.

첫번째 상자는 점 3개, 2번째 상자는 점이 없고, 3번째 상자는 점이 2개, 4번째 상자는 점이 1개 이다.

여기서 n 은 4가 되고, k 는 6이 되지.

sample table

sample table

비구별한다는 개념은 라벨(label)을 표시하는 것과는 대조되는 개념이다.

보통은 라벨(label)을 표시하는 것을 생각할 수 있다. 이것이 가장 일반적인 시나리오이다. 하지만, 몇 가지 물리 문제에서 label 할 수 없는 조건들이 있을 수 있다. 숫자를 세는 문제에서도 그러한 경우가 있지.

이것은 경우의 수 문제에서 중요하다.

메모: label 로 표시할 수 있는 경우와 없는 경우가, 경우의 수 문제에서 중요하다.

일반적으로 단순한 정의를 사용하는 확률 문제에서는 이것을 적용할 수가 없다.

(일반적인 확률의 단순한 정의는) 이 경우보다는 레이블을 표시할 수 있는 경우에 더 적절하기 때문이다.

이제 우리가 해야 할 것은 이것을 변환시켜야 한다. 이 그림을 변환시켜서 더 쉽게 설명을 해보겠다.

약간의 코드를 적어볼꺼야.

  1. 점을 그대로 그리고, 상자는 단순하기 분리선으로 긋도록 할꺼야. 여기서 세로로 선을 그어서 이 상자처럼 구분할거야.

  2. 2번째 상자는 비어 있기 때문에, 이렇게 2개의 세로선 사이에 아무런 점도 찍지 않지.

  3. 3번째 상자는 2개의 점이 있고, 여기에 분리선을 긋는다.

그리고 마지막 점이 있지.

매우 간단한 변환이다. 이것은 단지 같은 상황을 다른 방법으로 표현한 것뿐이다.

여기에는(변환된 그림) k 개의 점이 있고, n-1 개의 분리선이 있는거야.

sample table

\[\Large {n+k-1 \choose n-1} \Large = {n+k-1 \choose k}​\]

왜냐하면 n개의 상자가 있었기 때문에 여기에 n-1개의 분리선이 들어간다.

그리고 이것을 몇 가지로 할 수 있는지 설명해보자면, 이것들을 모두 나열하는 팩토리얼로 생각할 수 있다. 그리고 중복되는 것을 제외해야 한다.

전략적 연습문제를 보면 비슷한 문제가 있다. ‘pepper’ 라는 단어에서 글자들을 배열하는 경우의 수를 구하는 문제이다.

이건 ‘pepper’ 에 포함된 글자에 단순히 팩토리얼을 구하는 문제가 아니지.

왜냐하면 여러 개의 p 와 e 가 있기 때문이다. 따라서 중복되는 경우를 제외시켜야 한다. 이것과 동일하다.

이것을 쉽게 생각하는 방법은, 여기에 n + k -1 개의 자리가 있다고 하자.

이제 이것을 설명하기 위해 필요한 것은 점이 어디에 들어가야 하는지가 된다.

점의 위치를 선택하는거지. 그리고 나머지 위치들은 분리선의 위치가 될거야. 그래서 n+k-1 개 중에서 k를 고르는 경우의 수가 되는거지.

이렇게 적는 것 외에는 내가 쓸 수 있는 방법이 없다.

이미 적는 것으로 설명이 다 되고 있다.

n+k-1 개의 위치가 있고, 여기서 k개를 골라서 점을 집어 넣는거지.

그리고 이것을 n+k-1 개 중에서 n-1 개를 고르는 경우라고 할 수도 있다.

점의 위치를 고르면, 분리선의 위치가 결정되고 분리선의 위치를 먼저 고르면 점의 위치가 결정되는 것이지. 동일한 경우이다.</span>

따라서 여기까지가 이 결과에 대한 증명이 된다.

n 이 2인 경우로 잠깐 돌아와 보면, 2개의 동전을 뒤집는 상황을 생각해볼 수 있다.

일반적으로 4가지 경우가 있다. 앞면과 뒷면이 동일한 확률을 가지는 공정한 동전이라면 말이지.

보통은 4가지 경우가 동일한 확률로 나오게 된다.

1920년대 물리학에서 굉장한 논란이 있었다.

보스 Bose 라는 젊은 인도인 물리학자가 입자 물리학을 연구했는데, 동일한 동전에 대해서는 4가지가 아닌 3가지의 경우의 수만 존재한다고 주장했다. 그리고 모두 동일한 확률을 가진거지.

(앞, 앞), (뒤, 뒤), (앞, 뒤) 만 있다는거야. 동전이 절대 구별할 수 없는 것이라면 말이야. (앞, 뒤) 와 (뒤, 앞)을 구별할 수 없다는거지.

그는 물리학에 대한 모델을 제시했는데, 웃음거리가 됐지.

하지만, 그는 아인슈타인에게 편지를 썼고, 아인슈타인은 이 아이디어를 좋아했다.

그리고 다른 사람들을 설득했고, 물질의 새로운 상태인 보스-아인슈타인 응축을 예측했다.

그들은 이론적으로만 예측했지만, 70년 후에 이것은 실제로 관찰되었다.

이것을 통해 말하고자 하는 것은, 동전과 관련된 문제에서는 동전을 구분할 수 있다고 보는 것이 일반적이지.

따라서 이것(순서 상관없고 복원일 경우의 카운트 문제)은 물리학에서도 유용하다.

하지만, 이것에 단순한 정의를 사용하려면 굉장히 주의해야 한다.

메모: 동전의 갯수 $n = 2$, $2$번 선택 $k = 2$ 라면. $_3\mathrm{C}_2 = 3$ 이 된다.

경우의 수 문제에 대해 더 이야기해보자. 내가 이야기 증명 story proof 라고 부르는거야.

간단한 예시로 시작해본다.

내가 의미하는건, 응용이나 해석에 관한 것이야. Story proof: proof by interpretation 우리는 오늘 이것에 대해서 하나 보았는데, 10개중 4개를 선택하거나 10개중 6개를 선택하는 문제를 보았지. nCk = nC_n-k 였지. 굉장히 유용한 사실이다. 이것이 example 1 이 된다. 물론, 대수를 통해서도 쉽게 증명할 수 있다.

이 이야기라는 것은 n명 중 k명을 고르는 것을 말하는거야. 이것을 팩토리얼과 같은 공식으로 생각하는게 아니라는거지.

여기서 약간 어려운 문제를 보자.

이 식은 매우 유용한 항등식 identity 이다.

이 식 또한 대수를 이용해서 간단하게 확인해볼 수 있다.

하지만, 그 방법은 이 식을 외우거나 이해하는데 도움이 되지 않는다. 그리고 이게 왜 맞는지 전혀 이해할 수 없을 것이다.

여기서 이야기 증명을 사용해보면, n명 중에서 k명을 선택한다고 하자. 사람일 필요는 없다. 중요한 것은 일반적인 해석이어야 한다는거야.

n명 중에서 k명을 선택할 때 한명을 대표로 뽑는다고 하자. 어떤 것이 대표가 되더라도 상관 없다. 어떤 위원회의 의장이 될 수도 있고, 대표가 될 수도 있고 동아리 회장이 될 수도 있다.

이렇게 하는 방법의 가짓수를 알고 싶은거야.

여기에는 2 가지 가능한 접근 방법이 있다.

먼저 동아리에 들어갈 사람 k명을 선택하는거지. 총 n명이 있다고 할 때, 동아리에는 k명이 들어오는거야.

동아리에 들어가게 될 경우의 수는 n명 중 k명을 고르는 경우의 수가 되지.

그리고 여기 k 명 중 한 명은 반드시 동아리 대표가 되어야 한다. 따라서 곱의 법칙에 의해 k를 곱하는거지.

동아리에 들어갈 사람을 먼저 고르고 그 중 동아리 대표를 선택하는 거야.

그 결과가 이것 $k * _n\mathrm{C}_k$ 이지.

하지만, 이번에는 대표를 먼저 뽑을 수도 있지. 대표를 먼저 뽑은 후에 k-1 명의 동아리원을 더 뽑는거야. n-1 명 중에서 선택하는게 되겠지. 그리고 다시 곱의 법칙이 적용되는거야. 따라서 이 둘은 같은 것이 된다.

확실히 수학적으로 엄밀한 증명인데, 추가적으로 약간의 해석을 덧붙인 것이다.

이것은 동일한 것을 다른 방법으로 세는 것이다.

좋아, 한 가지 더 예제를 보자. 이 강의에서 유용할 만한 한 가지 예시를 더 보는거야. 이것도 유용한 항등식이다. m+n 개 중에서 k 개를 고를 때, 이것을 합의 식으로 표현하려고 한다.

합을 이용해서 이렇게 표현해보겠다. j 가 0 부터 k 일 때, m 에서 j 개를 선택하고, n 개에서 k-1 개를 선택하는거야. 이제 이것이(합으로 표현된 것이) 여기 하나의 이항계수로(좌변에 있는) 바뀌는 것을 증명할 것이다.

이것은 방데르몽드(Vandermonde) 항등식이라고 불리는데, 수학에서 유명한 항등식이 된다.

story Proof

수학의 다양한 분야에서 굉장히 많이 사용된다. 특히 확률에서 많이 사용된다.

대수를 이용해 이 식을 유도하는 것은 상당히 어렵다.

팩토리얼의 모든 항을 적어서, 하나씩 지워나가더라도 합계에 대한 문제를 해결해야 한다.

이항 정리를 이용해 시도해 볼 수도 있을거야.

다양한 방법이 있지만 모두 쉬운 방법은 아니다.

그러면 이야기를 이용해 이것을 증명해 보자.

m+n 개 중에서 k개를 고르는 것이 그리 똑똑하지 않아도 알 수 있지. m+n명 중에서 k명을 선택하는 것으로 생각할 수도 있다.

m+n명 중에서 k명을 선택하는 것으로 이야기를 풀어본다.

어떻게 이것을 여기의 합에 대한 식과 연결할 수 있을까?

그래서 2개의 그룹을 생각해보는거다. 한 그룹은 m명, 다른 그룹은 n명이 있기 때문에 m+n명이 되는거지.

여기 그룹이 있는데 m명의 사람이 있고, 여기 점을 사람을 의미하는데, 구분할 수 있기 때문에 표시가 있다고 생각해야겠지.

여기에 n명의 사람이 있는 그룹이 있다.

그래서 앞에 그룹의 사람을 1번부터 3번이라고 하고, 뒤에 있는 그룹의 사람을 4, 5, 6, 7, 8번이라고 하자.

이제 여기 2개 그룹에서 총 k명의 사람을 선택하려고 한다.

내가 선택한 사람에 동그라미를 그려볼께.

예시를 들기 위해 4명을 선택했다. 이 사람까지 5명을 선택해보자.

이렇게 선택하는 방법은 몇 가지나 될까?

분명히, 이 그룹에서 몇 명을 선택해야 할거고, 이 그룹에서도 몇 명을 선택해서 총 k명이 되도록 해야 하는거야.

그래서 여기 첫번째 그룹에서 j 명을 선택하는데, 이 그룹에서 2명을 선택했기 때문에 여기서는 j 는 2가 되지.

여기 2번째 그룹에서는 3명을 선택해야 하는거지. 총 5명을 고르는 거였으니까.

그래서 여기 2번째 그룹에서는 k-j명을 선택하는거야.

여기에 j명이 있으면 여기에는 k-j명이 있어야 하는거지.

여기서 j명과 k-j명을 선택하는 방법은 몇 가지나 될까?

이 부분 곱의 법칙에 대한 합이 되는거야.

그리고 이것들을 모두 더하는거지. 중복으로 센 것은 없고 모두 다른 경우만을 더한거야.

따라서 이것을 모두 더하면 이렇게 된다.

여기까지이고, 몇 개의 문장만으로 이것을 증명했다.

대수를 이용하는 것 보다는 훨씬 나은 방법이지.

마지막으로 확률의 단순하지 않은 정의에 대해서 보자. 나머지 강의는 모두 이것에 대한 내용이다. 이것에 대한 기본적인 개념을 알려주겠다. 이것은 확률의 일반적인 정의이다. 지금까지는 모두 동일한 확률을 가지는 것에 대해서만 이야기 했다. 이제 모두 같은 확률을 가지지 않는 상황을 보겠다. 그리고 결과의 경우의 수가 유한하지 않은 경우도 보겠다. 이것을 단순하지 않은 정의라고 부르는데… 단순하지 않은 정의에서는 먼저 확률 공간(probability space)이라는 개념을 알아야 한다.

이미 표본공간(sample space)에 대해서는 이야기 했었다.

확률공간에는 2개의 성분이 있다. 이것을 S와 P라고 부르겠다.

S와 P가 무엇이고 어떤 규칙을 따르는지 설명할거야.

S 는 우리가 이전에 사용했던 표기법이야. S는 표본공간(sample space)를 의미하는거야.

어떤 실험에서 가능한 모든 경우의 수의 집합이지.

여기서는 실험이라는 단어를 매우 넓은 의미로 해석한다.

지금까지 모든 경우의 수는 유한하다고 가정했고 동일한 확률을 가진다고 했었다.

P는 어떤 함수인데, 우리가 보통 생각하는 함수는 아니다. f(x) = x^2 과 같은 것이 아니라는거지.

여기서 P의 정의역은 S의 부분집합이 된다.

P는 함수이고, 어떤 사건(event)을 입력으로 하는 함수이지.

사건(event) 은 S의 부분집합이지. P는 어떤 사건을 입력으로 가지는데, 어떤 사건을 A라고 해볼께.

사건 A는 S의 부분집합이고 P함수의 입력이 된다. 그리고 P(A) 는 0에서 1 사이의 값이 되는거야.

$A ⊆ S, P(A) ∈ [0, 1]$

여기서 입력은 사건이 되고, 출력은 0과 1 사이의 수가 되는거지.

이제 마지막으로 설명할 것은 이것을 만족시키기 위한 정리에 대한 것이 된다.

다시 말해 P를 만족시키기 위해 어떤 성질이 필요하냐는 것인데, 0과 1사이의 숫자가 나오도록 하기 위한 것이지.

복잡한 확률을 이해하기 위해서는, 여기서 우리는 단 2가지의 정리만 있으면 된다.

첫 번째 정리는 공집합에 대한 확률은 0 이라는 거야. 그리고 전체 집합에 대한 확률은 1이 되는거지. P(0) = 0, P(S) = 1

이 2가지를 한 가지로 말할 수 있는데 이 정리를 간단하게 하고 유도해본다면, 이것을 유도할 수 있다.

밴 다이어그램이 유용한데, 모든 가능한 결과의 전체 집합을 S라고 하면, 한 가지 특정한 사건을 보는 것이지.

이 동그라미를 A 라고 해볼께. 그리고 그 안에 s0 라고 적어볼께.

우리가 실험을 하기 전의 그림에서는 이렇게 일반적인 표본공간만 존재했다.

실험을 한 후에는 결과를 관찰할 수 있는데, 그 실험의 결과를 s0 라고 가정하겠다.

실제 결과가 A의 원소가 된다면, 사건 A가 발생했다고 말할 수 있는거지.

s0 가 A 바깥쪽에 있다면 발생하지 않은 것이지.

그러면 공집합의 사건이 발생했다는 것은 무엇일까?

그건 s0 가 공집합이라는 것을 의미하는데, 공집합에는 아무것도 없는 상태이지.

따라서 이것 P(0) = 0 이라고 할 수 있는거야.

이 사건은 불가능하기 때문에 0의 확률을 가지는 것이지.

그리고 이 부분 P(S) = 1 은 S에서 무조건 발생하는 사건이야. s0 가 직사각형 바깥쪽에 존재한다면 그것은 여러분이 직사각형을 잘못 설정했다는 것을 의미한다.

이 부분은 전체 부분이 되어야 하기 때문이지.

두 번째가 가장 중요한 정리이다.

두 번째 규칙을 매우 간단하게 설명하자면 합 사건(union) 인데, 합 사건은 이미 알고 있다고 생각할께.

나는 이 합 사건을 무한대로 계산할거야.

이 합 사건의 확률은 모든 확률의 합과 같다.여기에는 중요한 조건이 하나가 있다.

예를 들어 A1, A2,,, 가 서로소(disjoint) 일때, 즉, 중복되는 것이 없을 경우에만 가능하다는거야.

이 두 가지가 확률에 대한 정리이다.

이 2개의 규칙에서 한 가지 놀라운 것을 발견했는데, 이것으로 확률에 대한 모든 정리들을 유도할 수 있다는거야.

결국 모든 것들이 이 2개의 규칙을 따른다는 것이지.