일단 우리가 베르누이 분포를 배울 때, 고려하지 않은 부분이 있다.
바로바로 베르누이 분포가 복원추출인지, 비복원추출인지에 대한 여부를 확인하지 않았다
1) 결론부터 말하자면 복원추출이면 바로 전 시행의 결과와 무관하기 때문에 독립성을 가지고 있고
이를 통해 베르누이 시행을 따른다고 할 수 있다.
2) 그러나 비복원 추출은 베르누이 시행의 독립성을 만족하지 않는다.
물론 모집단의 크기가 아주 큰 경우 독립성의 위반정도가 적어져서 베르누이 시행에 근사한다
이제 초기하 분포에 대해 알아보자
예시는 다음과 같다.
상자 안의 10개의 공이 있고
흰 공 6개 / 검은 공 4개가 있다
5개의 공을 무작위로 꺼낼 때
흰 공이 3개일 확률을 구하라.
우리는 초기하 분포를 두 가지로 나눌 수 있다
.
1) 복원추출이면 독립성을 가지므로 베르누이 시행을 따르며
X의 분포는 다음과 같은 이항분포를 따른다
$ X \sim Bin(n,\frac{m}{N}) $ 이며
즉 $ X \sim Bin(5,\frac{6}{10}) $ 이다
2) 비복원 추출의 경우 X의 분포는 더 이상 이항분포를 따르지 않는다
그러나 우리는 초기하 분포가 크기가 N인 모집단에서 표본 n개를 취하는 분포를 알아낼 것이다.
그리고 위의 확률을 다음과 같이 나타낼 수 있다.
$\frac{_{6}\mathrm{C}_{3}\times_{4}\mathrm{C}_{2} }{_{10}\mathrm{C}_{5}}$
1. 분모는 10개의 공 중 5개의 공을 무작위로 뽑는 사건
2. 6개의 공 중 3개가 흰 공 (최대 3개)
3. 4개의 공 중 검은공 2개 (최대 2개)
즉 우리가 하고 있는 이 행위가 모집단에서 표본을 뽑아내는 행위이다.
표본에서 흰 공을 뽑는 것은 성공, 검은공은 실패라고 한다면
표본 5개 중에 흰 공을 뽑은 3개는 성공
나머지 검은 공 2개를 뽑은 2개는 실패
이 때 흰 공을 뽑은 확률 변수를 X(흰 공을 뽑는 것)라고 하면
X는 초기하 확률 변수라고 한다.
흰 공을 뽑는 것이 성공이므로
초기하 확률변수, 즉 X=3이 된다
초기하분포를 정리하면 다음과 같다.
$ P(X=k) = \frac{_{m}\mathrm{C}_{k}\times_{N-m}\mathrm{C}_{n-k} }{_{N}\mathrm{C}_{n}} $
표현 방식은 다음과 같다.
$ X \sim Hypergeometric(n,N,m) $
TIP
N과 m이 n에 비해 아주 클 때 비복원 추출이라고 하여도 근사적으로 베르누이 시행을 따르게 된다.
즉 N과 m이 n에 비해 아주 클 경우에 초기하 분포는 이항분포에 근사한다!
'Statistics > 확률론' 카테고리의 다른 글
9. 이산형 확률변수(기하분포) (1) | 2023.11.24 |
---|---|
7. 이산형 확률변수(이항분포) (0) | 2023.11.23 |
6. 이산형 확률변수(베르누이 분포) (0) | 2023.11.14 |
5. 확률변수, 그리고 확률 질량 함수(PMF) (1) | 2023.11.14 |
4. 분할 -> 총 확률 -> 베이즈 정리 (0) | 2023.10.16 |