소개글
서울대학교 통계학실습을 수강할 때 제출한 보고서입니다.
유의확률(p-value)에 대한 보고서인데,
가설검정방법에 관해 설명하고 있고,
유의확률에 관하여 전반적인 설명을 하고 있습니다.
예제도 3문제 정도 포함하고 있습니다.
목차
없음
본문내용
통계학에서 다루는 중요한 문제 중의 하나는 모집단의 속성을 연구하기 위하여 표본을 추출하고, 이를 이용하여 모집단이 어떤 속성을 가지는지 추론하는 문제라고 할 수 있을 것이다. 일반적으로, 모집단의 분포의 모양이나 모수 등에 대한 가설을 세우고, 모집단에서 추출한 표본에 기초하여 가설의 채택이나 기각을 결정하는 통계적 기법을 가설검정이라 한다. 그러나 표본에 기초한 의사결정에는 언제나 오류의 가능성이 있게 된다. 따라서 통계적 가설검정에서는 이와 같은 오류의 가능성을 줄이는 방법, 다시 말하면 표본을 이용하여 모집단의 속성을 탐구하는데 있어서 오류를 최소화할 수 있는 방법을 이용하여 검정하게 되는데, 이 보고서는 이러한 검정방법 중 유의성 검정방법과 관련 있는 P-value에 관해 조사한 보고서이다.
P-value에 관한 정의를 내림에 앞서, 이에 대한 이해를 돕기 위해서는 모집단, 모수, 랜덤표본과 통계적 추론 중 추정, 가설검정, 유의수준, 제1종 오류, 제2종 오류 등에 관한 개념이해가 필수적인데, 이상에 대해 설명하면 다음과 같다.
먼저, 모집단(populations)이란, 연구자가 연구하고 싶어하는 모든 구성원을 의미하고, 모수(parameter)란 θ로 나타내며, 모집단의 특성을 나타내는 대푯값을 뜻하는데, 모평균, 모분산, 모표준편차 등을 포함한다. 랜덤표본(random sample)이란 단순랜덤비복원 추출로 뽑은 표본을 뜻하는데, 유한모집단에서 n개의 추출단위로 구성된 모든 부분집합들이 표본으로 선택될 확률이 같도록 설계된 표본추출방법을 말한다.
통계적 추론이란 표본으로부터의 정보를 이용하여 모집단에 대한 추측, 또는 결정을 하는 과정을 뜻한다. 통계적 추론에서는 확률분포를 모집단의 분포에 대한 이론적 모형으로 하고, 모집단은 모수들에 의해 특징지어지므로 통계적 추론은 모수에 관한 추론인 경우가 대부분이다. 통계적 추론은 그 목적에 따라 여러 형태로 분류될 수 있으나 이들 중 가장 기본적이며 중요한 것은 추정이다. 추정(estimation)이란, 표본자료를 이용해 모집단의 모수를 추측하고 그 오차한계를 제시하는 추리과정을 뜻하는데, 추정의 가장 대표적인 것으로는 점추정과 구간추정이 있다. 점추정(point estimation)이란 표본에서 얻어지는 정보를 이용하여 미지인 모수의 참값으로 생각되는 하나의 수 값을 일정한 방법에 따라 택하게 되는 과정이며, 구간추정(interval estimation)이란 모르는 값에 대한 추정치를 범위를 이용해 추정하는 것이다. 가설검정(hypothesis test)이란, 크기 n인 확률표본이 주어졌을 때, 확률표본의 정보를 이용하여 모수에 대한 예상, 주장, 추측 등의 옳고 그름을 판정하는 과정이다.
가설검정방법에는 크게 두 가지가 있는데, 하나는 Neyman-Pearson의 검정방법이고 나머지 하나는 통계패키지에서 널리 사용하는 방법으로 Fisher의 유의성 검정방법이 있다.
참고 자료
① 『개정판 일반통계학』, 서울대학교 자연과학대학 통계학과, 영지문화사, 2005, p2-p23 p196-p228
② 『통계학의 이해』, 송인섭, 學志社, 1992, p186-p228
• 참고 사이트 : ① 피어슨 통계 사이트 (http://www.pvalue.co.kr)