주성분분석(Principal Component Analysis)
- 최초 등록일
- 2009.03.18
- 최종 저작일
- 2008.11
- 5페이지/ MS 워드
- 가격 1,500원
소개글
주성분분석(Principal Component Analysis)이란?
언제 주성분 분석을 사용하는가?
주성분 구하기.
Mathmetical Formulation
예제(OR CASE STUDY)
위의 목차로 구성되어 있으며 주성분분석에 대한 전반적인 내용을 파악할 수 있다
목차
주성분분석(Principal Component Analysis)이란?
언제 주성분 분석을 사용하는가?
주성분 구하기.
Mathmetical Formulation
예제(OR CASE STUDY)
본문내용
Pca
주성분분석(Principal Component Analysis)이란?
해석하고자 하는 다차원의 데이터를 거기에 포함된 정보의 손실을 가능한 작게 해서 2 혹은 3차원의 데이터로 축약하는 수법, 주성분분석을 활용하면 관측대상이 어떠한 위치에 있는지 시각적으로 파악할 수 있다.
그렇다면 언제 주성분 분석을 사용하는가?
1. 데이터 스크린
데이터가 수집되면 열 변량인 경우에는 줄기, 잎 그림 상자.수염 그림 등을 그려 데이터의 분포 형태나 이상치 존재여부를 파악한다. 이 변량인 경우에는 산점도를 그려 두 변수간 함수 관계와 이상치 등을 판단한다. 그럼 변수가 3개 이상인 경우엔 어떻게 할 것인가? 주성분 분석은 이렇게 3개 이상의 변수를 가진 데이터를 저 차원 그래프로 나타내어 특성이나 이상치의 존재여부를 알아본다.
2. 군집
개체를 분류하는 측정 항목이 1-2개이면 평균 혹은 산점도에 의해 가능하다.
역시 이 역시 3개 이상의 다변량 데이터 개체를 산점도만 으로는 어려움이 있으므로 주성분에 의해 개체를 분류하거나 군집 분석 결과에 대한 해석으로 주성분 분석을 사용한다.
3. 판별분석
판별식을 이용하여 개체를 분류하는 분석을 판별분석이라고 한다. 판별분석의 경우 분산-공분산 행렬의 역행렬을 구해야 하는데 측정 변수가 너무 많으면 계산이 오래 걸린다. 이러한 경우 주성분 분석 방법에 의해 변수의 수를 줄여 만든 새로운 변수(주성분)에 의해 판별 분석을 하게 된다.
4. 회귀분석
다중 회귀분석에서 설명 변수간의 상관관계가 높으면 다중공선성 추정 회귀계수의 분산이 커지므로 최소 자승 추정치를 믿을 수 없게 된다. 이러한 경우에 주성분 변수를 설명 변수로 이용하여 회귀분석을 하기도 한다.
참고 자료
없음