본문 바로가기

Statistics/확률론

8. 이산형 확률변수(초기하분포)

일단 우리가 베르누이 분포를 배울 때, 고려하지 않은 부분이 있다.

바로바로 베르누이 분포가 복원추출인지, 비복원추출인지에 대한 여부를 확인하지 않았다

 

1) 결론부터 말하자면 복원추출이면 바로 전 시행의 결과와 무관하기 때문에 독립성을 가지고 있고
이를 통해 베르누이 시행을 따른다고 할 수 있다.

 

 

2) 그러나 비복원 추출은 베르누이 시행의 독립성을 만족하지 않는다.
물론  모집단의 크기가 아주 큰 경우 독립성의 위반정도가 적어져서 베르누이 시행에 근사한다

 

 

 

 

 

 

이제 초기하 분포에 대해 알아보자

 

예시는 다음과 같다.

 

상자 안의 10개의 공이 있고

흰 공 6개 / 검은 공 4개가 있다

5개의 공을 무작위로 꺼낼 때 

흰 공이 3개일 확률을 구하라.

 

우리는 초기하 분포를 두 가지로 나눌 수 있다

.

1) 복원추출이면 독립성을 가지므로 베르누이 시행을 따르며

X의 분포는 다음과 같은 이항분포를 따른다

$ X \sim Bin(n,\frac{m}{N}) $ 이며
즉 $ X \sim Bin(5,\frac{6}{10}) $ 이다

 

 

 

2) 비복원 추출의 경우 X의 분포는 더 이상 이항분포를 따르지 않는다

그러나 우리는 초기하 분포가 크기가 N인 모집단에서 표본 n개를 취하는 분포를 알아낼 것이다.

그리고 위의 확률을 다음과 같이 나타낼 수 있다.

$\frac{_{6}\mathrm{C}_{3}\times_{4}\mathrm{C}_{2} }{_{10}\mathrm{C}_{5}}$

 

 

1. 분모는 10개의 공 중 5개의 공을 무작위로 뽑는 사건

2. 6개의 공 중 3개가 흰 공 (최대 3개)

3. 4개의 공 중 검은공 2개 (최대 2개)

 

즉 우리가 하고 있는 이 행위가 모집단에서 표본을 뽑아내는 행위이다.

표본에서 흰 공을 뽑는 것은 성공, 검은공은 실패라고 한다면

표본 5개 중에 흰 공을 뽑은 3개는 성공

나머지 검은 공 2개를 뽑은 2개는 실패

 

이 때 흰 공을 뽑은 확률 변수를 X(흰 공을 뽑는 것)라고 하면

X는 초기하 확률 변수라고 한다.

흰 공을 뽑는 것이 성공이므로

초기하 확률변수, 즉 X=3이 된다

 

 

 

 

 

 

 

 

 

초기하분포를 정리하면 다음과 같다.

$ P(X=k) = \frac{_{m}\mathrm{C}_{k}\times_{N-m}\mathrm{C}_{n-k} }{_{N}\mathrm{C}_{n}} $ 

 

표현 방식은 다음과 같다. 

$ X \sim Hypergeometric(n,N,m) $

 

TIP


N과 m이 n에 비해 아주 클 때 비복원 추출이라고 하여도 근사적으로 베르누이 시행을 따르게 된다.

즉 N과 m이 n에 비해 아주 클 경우에 초기하 분포는 이항분포에 근사한다!