자료의 통계적 처리에 있어 정규성과 동분산성이 어긋날 때 사용할 수 있는 자료변환Data transformation
- 최초 등록일
- 2011.08.24
- 최종 저작일
- 2011.07
- 5페이지/ 한컴오피스
- 가격 2,000원
소개글
자료의 통계적 처리에 있어 정규성과 동분산성이 어긋날 때 사용할 수 있는 자료변환에 대한 자료입니다.
목차
없음
본문내용
자료의 통계적 처리에 있어서 정규성 가정이 어긋날 때 :
Data manipulation & Data Transformation.
개요
대부분의 모수적 검정Parametric test는 모분포의 정규성, 여러 모분포의 동일한 분산을 가정한다. 만약 그런 가정이 어긋날 경우에 비모수적 검정Nonparametric test를 쓸 수 있다. 하지만 비모수적 검정은 모수적 검정에 비해 1종 오류를 통제하기 어렵고, 2종 오류가 높다(검정력이 낮다)는 단점이 있다.
따라서 정규성과 동분산의 가정이 어긋나더라도 Data manipulation과 Data Transformation을 통해 정규성과 동분산 가정을 충족시킬 수 있는 경우는 모수적 검정을 사용할 수 있다.
여기서는 Data manipulation과 Data Transformation에 대해 알아본다.
Data manipulation
특이점outlier이 존재할 경우 다음의 세 가지 방법이 있다.
1. 특이점을 제외한다. 만약 자료 수집시의 실수에 의해 특이점이 생긴 경우 가능하다.
2. 윈저화Winsorization. 최대 극단값을 바로 전 극단값으로 대치한다. 보통 최소값과 최대값에 동시에 적용한다. 예) 1,3,5,7,9,10,130 3,3,5,7,9,10,10
3. 절사Trimming. 극단값을 제외한다. 윈저화와 달리 표본의 크기가 감소하여, 검정력이 낮아지는 결과를 가져온다. 예) 1,3,5,7,9,10,130 3,5,7,9,10
Data Transformation
자주 쓰이는 방법은 다음과 같다.
1. 로그Logarithmic
2. Square Root제곱근
3. Angular
4. Box-cox
5. Reciprocal역수
6. Power멱승
1. 로그Logarithmic
왼쪽으로 기운(오른쪽으로 긴 꼬리를 가진) 분포, 분산이 평균과 함께 증가하는 경우에 쓰인다.
.
.
참고 자료
없음