Multiple Discriminant Analysis
- 최초 등록일
- 2015.11.26
- 최종 저작일
- 2015.10
- 18페이지/ MS 워드
- 가격 1,000원
목차
없음
본문내용
판별분석은 조사자가 기존의 자료를 이용하여 집단을 분류할 경우에 유용한 분석기법이다. Metric 독립변수들을 이용하여 nonmetric or nominal(명목척도로 측정된 categorical) 종속변수를 분류하는 방법이다.
판별분석은 분류되어 있는 집단간의 차이를 의미있게 설명해줄 수 있는 독립변수들을 찾아내고 이들의 linear combination으로 다음과 같은 판별식을 만들어 내어 이 식에 분류하고자 하는 각 대상들의 특성을 대입하여 각 대상들이 속하는 집단을 찾아내려는 것이 목적이다.
여러 개의 의미있는 변수들을 동시에 고려하여 집단간의 차이를 나타내주는 장점을 가지므로 보다 의미있는 결과를 나타낸다.
판별분석에서의 기본 가설은 두개의 집단 또는 그 이상의 집단의 평균이 같다.
• 기본가정 1) 각 집단이 다변량 정규분포(multivariate normality)를 이루어야 함 2) 그룹별 분포 및 공분산구조가 동일해야함(box’s M)=분산이 균일하지 않으면 비교하기 어렵기 때문 3) (classification function)
<중 략>
• assessing classification accuracy
앞에서 선정된 독립변수 3개가 약 68%의 분산을 설명한다는 것과, 전반적인 model fit을 보았고, 여기서는 판별함수의 정확성을 측정하기 위해, cutting score를 계산하고, holding-out sample을 분석하고, 예측 정확도를 계산해야 한다.
(1) Cutting score의 계산: 모집단을 합리적으로 반영하기 위해 into-sample의 집단에 대한 사전확률로 최적 cutting score를 계산한다. 이는 함수의 집단중심점을 그룹의 observation수로 weight시켜주면 된다.
따라서, Zcs = (22*(1.085)) + (38*(-1.874)) / 60 = -.789
(2) 위에서 계산한 cutting score로 observation을 분류한다. cutting score와 판별점수를 비교하면 된다. spss에서 알아서 다 예측소속집단, 판별점수, 집단소속 확률을 보여준다.
참고 자료
없음