본문내용
1. 통계학 개관
1.1. 정규분포
정규분포는 통계학에서 가장 중요한 분포 중 하나이다. 정규분포는 연속확률변수의 대표적인 분포로 가우스 분포라고도 불린다. 정규분포의 확률밀도함수는 f(x) = {1} over {sigma sqrt {2 pi }} e ^{- {(x`-` mu ) ^{2}} over {2 sigma ^{2}}}의 형태로 표현된다. 정규분포의 형태는 평균(μ)과 표준편차(σ)에 의해 결정된다. 정규확률변수는 평균 주변의 값을 많이 취하며, 평균으로부터 좌우 표준편차의 3배 이상 떨어진 값은 거의 취하지 않는다.
표준정규분포는 모든 정규분포를 비교하거나 확률값을 계산하기 편리하게 하기 위해 정규분포의 확률변수 X를 변환시켜 X ~ N(0,1)이 되도록 만든 분포이다. 표준정규분포 역시 좌우대칭 종 모양을 가지며 각 α만큼의 면적이 변환 이전과 같다. 표준정규분포의 확률밀도함수는 {1} over {sqrt {2 pi }} e ^{- {x ^{2}} over {2}}의 형태로 표현된다.
정규분포의 가법성이란 독립적인 2개 이상의 정규분포 확률변수를 더하면 그 합이 다시 정규분포를 따른다는 것이다. 구체적으로 X ~ N(μ1, σ1^2), Y ~ N(μ2, σ2^2)일 때 X+Y ~ N(μ1+μ2, σ1^2+σ2^2)이 성립한다. 또한 X-Y ~ N(μ1-μ2, σ1^2+σ2^2)도 성립한다. 이러한 정규분포의 가법성은 통계학 분석에 매우 유용하게 활용된다.
1.2. 표준정규분포
정규분포를 표준화하면 표준정규분포가 된다. 표준정규분포는 평균이 0이고 표준편차가 1인 정규분포이다. 이로 인해 모든 정규분포는 표준정규분포로 변환하여 사용하는 것이 더 편리하다. 표준정규분포의 확률밀도함수는 {1} over {sqrt {2 pi }} e ^{- {x ^{2}} over {2}}이다. 정규분포의 특성상 표준정규분포도 좌우대칭의 종 모양을 가지며, 각 알파 만큼의 면적을 가진다. 이를 통해 정규분포 간의 비교나 확률값 계산이 용이해진다. 즉, 표준정규분포는 정규분포를 다루기 위해 자주 사용되는 중요한 개념이다.
1.3. 정규분포의 가법성
정규분포는 독립적인 두 개 이상의 확률변수가 정규분포를 따를 때, 이 확률변수들의 합 역시 정규분포를 따른다는 특성이 있다. 즉, 서로 독립적인 확률변수 X와 Y가 각각 정규분포 N(μ₁,σ₁²)와 N(μ₂,σ₂²)를 따르면, X+Y는 정규분포 N(μ₁+μ₂,σ₁²+σ₂²)를 따르게 된다. 또한 X-Y 역시 정규분포 N(μ₁-μ₂,σ₁²+σ₂²)를 따른다. 이러한 정규분포의 가법성은 통계 분석에서 매우 중요한 성질로, 표본의 합과 차를 통해 모집단의 특성을 추정하는데 활용된다. 예를 들어, 두 정규모집단에서 추출한 표본분산들의 합은 자유도를 더한 카이제곱분포를 따르게 되는데, 이는 정규분포의 가법성에 기반한다. 이처럼 정규분포의 가법성은 통계 분석의 기본 원리로서, 다양한 통계적 추론을 가능하게 하는 핵심 개념이라고 할 수 있다.
2. 카이제곱분포
2.1. 카이제곱분포의 특성
카이제곱분포는 확률변수 X의 표준화를 통해 만들어진 분포로 오른쪽 꼬리를 가진 비대칭 분포이다. 카이제곱분포는 교차분석의 동일성검정, 독립성검정, 적합도검정에 사용된다. 확률변수 Z가 표준정규분포 N(0,1)을 따를 때, Z의 제곱을 K개 더하면 자유도가 K인 카이제곱분포를 따르게 된다. 이를 Z1^2 + Z2^2 + Z3^2 + ... + Zk^2 ~ chi^2(k)로 표현한다. 카이제곱분포는 자유도에 따라 모양이 결정되며, 기...