MS Office 엑셀 2007을 이용한 기하분포(확률분포) 분석
*영*
다운로드
장바구니
소개글
MS Office 엑셀 2007을 이용한 기하분포(확률분포) 분석 자료입니다.기하분포는 성공할 확률이 p인 베르누이 시행(시행의 결과가 '성공', '실패'의 두 가지로만 나타남)을 독립적으로 복원 반복할 경우 나타나는 확률분포이며 그 정의는 다음과 같습니다.
- 성공확률이 p이고 실패확률이 1-p인 반복독립시행(복원)에서 처음으로 성공이 나타날 때까지의 시행횟수 X를 기하확률변수라 하면, 그 X의 확률분포를 기하분포라고 합니다.
- 기하분포의 표시는 GEO(p)로 합니다.
기하분포 GEO(p) 확률함수(확률질량함수)는
P(X= x) = p(1-p)^x-1 (x =0,1,2,3…….)
※ p=성공확률, x= 처음으로 성공이 나타날 때까지 시행한 횟수
입니다.
위에서 정의한 기하분포를 이해하기 위해서는 먼저 베르누이 시행을 이해할 필요가 있습니다. 베르누이 시행이란 스위스의 수학자 Jakob Bernoulli에 의해 처음으로 연구되고 체계화된 것으로 다음의 두가지 특성을 가지는 시행을 의미합니다.
가) 베르누이 시행은 한번의 시행에서 오직 성공 또는 실패의 두가지 결과만 가능합니다. 그리고 그 결과는 서로 배타적(동시에 함께 발생할 수 없음)입니다.
예) 동전던지기의 앞면과 뒷면, 특정기계의 작동여부, 주사위에서 나올 숫자가 짝수 또는 홀수, 태어날 아기의 성별, 특정 후보의 당선 또는 탈락 등
나) 베르누이 시행에서 특정값(동전 앞면, 남자아이가 태어남, 주사위에서 짝수 등 ; 확률변수 값)을 가질 확률은 시행횟수와 관계없이 항상 일정(독립성)합니다.
예) 동전던지기의 앞면이 나올 확률이 1/2라면 10번을 시행하든 1000번을시행하든 앞면이 나올 확률은 항상 1/2로 동일함
이상의 특징에서 알 수 있듯이 베르누이 시행은 특정 시행의 결과가 '성공' 또는 '실패'의 두 가지 중 하나인 실험을 뜻합니다. 다시 말해 '예' 또는 '아니오' 중 하나의 결과를 낳는 시행을 의미하며 이러한 시행을 여러 번 계속하는 것을 베르누이 과정이라고 합니다.
이제부터 기하분포에 대한 확률을 엑셀 2007을 이용하여 계산해 보고 엑셀2007의 차트기능을 이용하여 기하분포의 특징에 대하여 살펴보겠습니다.
목차
1.기하분포(geometric distribution)란?2.기하분포의 예와 확률 계산
3.기하분포의 기대값(expectation)과 분산(variance)
4.성공확률(p) 변화에 따른 기하분포 그래프 분석
5.기하분포의 무기억성
본문내용
2.기하분포의 예와 확률 계산앞에서 정의한 기하분포에 대한 실제 예를 들고 이에 따른 기하확률변수의 확률값을 엑셀 2007로 계산해보겠습니다.
주머니안에 흰공이 10개, 검은공이 5개 들어 있습니다. 검은공이 나올 때까지 복원추출로 1개씩 추출할 경우 7번째에 검은공이 나올 확률을 계산해 보겠습니다.
본 문제에서 성공확률은 5/15(1/3)이며, 검은공을 처음으로 추출할 때까지 시행한 총 횟수를 확률변수 X로 하면 확률변수 X는 전형적인 기하분포를 따릅니다. 따라서 GEO(1/3)인 기하분포에서 x= 7인 경우의 확률은
*.P(X=7) = (1/3)(2/3)^7-1 = (1/3)(2/3)^6 =64/2187= 0.029264 입니다.
위의 계산식은 직접 계산해도 되지만 엑셀에서 POWER함수 또는 NEGBINOMDIST 함수를 이용하면 편리하게 계산할 수 있습니다.
가)POWER함수이용: 아래 화면과 같이 검은공을 추출할 때까지 시행한 총 횟수가 7인 경우의 확률을 계산하기 위하여 “=(1/3)*POWER(2/3,6)” 를 B2셀에 입력하면 64/2187의 값이 구해집니다.
※(함수 POWER(number,power): number는 밑수, power는 지수임. 밑수를 거듭제곱한 결과를 반환함)
나)NEGBINOMDIST함수이용: 아래 화면과 같이 검은공을 추출할 때까지 시행한 총 횟수가 7인 경우의 확률을 계산하기 위하여 “=NEGBINOMDIST(6,1,1/3)” 를 C2셀에 입력하면 64/2187의 값이 구해집니다.
※. NEGBINOMDIST(x-1,1,p) : p=성공확률, x= 처음으로 성공이 나타날 때까지 시행한 횟수