• LF몰 이벤트
  • 파일시티 이벤트
  • 서울좀비 이벤트
  • 탑툰 이벤트
  • 닥터피엘 이벤트
  • 아이템베이 이벤트
  • 아이템매니아 이벤트

다변량분석 ('20-01) 출석수업대체과제물

보노코리아
개인인증판매자스토어
최초 등록일
2020.07.12
최종 저작일
2020.07
15페이지/워드파일 MS 워드
가격 4,500원 할인쿠폰받기
다운로드
장바구니

목차

1. 자유도가 5인 t- 분포를 따르는 난수 100개를 만들어 분석하고자 한다.
1.1. 난수를 생성하라
1.2. 히스토그램을 그리고 설명하라
1.3. 상자그림을 그리고 설명하라
1.4. 줄기-잎 그림을 그리고 설명하라

2. USairpollution 자료를 이용하여 그래프를 그리고자 한다.
2.1. 산점도행렬, 별그림, 얼굴그림을 그리고 해석하라
2.2. (temp, wind)의 bivariate boxplot을 그리고 해석하라
2.3. (manu, popul)의 산점도에 SO2의 정보를 나타내는 bubble plot을 그리고 해석하라.

3. 다음은 R을 이용하여 “ade4” 패키지에 있는 ‘deug“ 자료를 이용하여 주성분분석을 실행해 보라.자료에 대한 설명은 http://cran.r-project.org/web/packages/ade4/ade4.pdf를 참고하라. 자료를불러오는 방법은 아래와 같다.
3.1. 9개 변수들을 기술통계량으로 요약하라.
3.2. 9개 변수들 사이의 상관계수행렬을 구하라.
3.3. 고유근을 구하고 그 고유근이 확보하는 정보의 양 및 누적정보량을 구하라.
3.4. 1보다 큰 고유근의 수와 그 고유근들이 확보하는 누적정보의 양을 구하라.
3.5. Scree plot을 그리고 해석하라.
3.6. 위의 결과를 이용하여 주성분을 구하라.
3.7. biplot을 그려보고 주성분의 특징을 정해 보라

4. 다음은 1973년 미국 각 주의 강력범죄 자료이다. 변수 Murder, Assault, Rape는 인구 100,000명당 사고건수이고, UrbanPop는 도시인구 비율이다. 이 자료를 이용하여 주성분분석을 실행하고 해석하라

5. 다음의 자료는 300명의 대학생들에게 biology(BIO), geology(GEO), chemistry(CHEM), algebra(ALG), calculus(CALC), and statistics(STAT) 6개의 과목에 대하여 선호도를 조사한 결과이다. 다음의 자료는 “http://faculty,knou.ac.kr/~sskim"에서 “favoritesubject.csv”를 다운로드 받아 사용할 수 있다. R을 이용하여 인자분석을 실행하라
5.1. 유의한 인자의 수와 그 인자들이 확보하는 정보의 양은?
5.2. 인자부하행렬을 구하고 Varimax와 Promax 방법을 이용하여 인자회전을 실시하고 결과를 비교하라
5.3. 인자들에 적절한 이름은?
5.4. 인자분석 결과를 종합적으로 정리하라

6. 다음의 자료는 미국에서 판매되고 있는 20개 맥주 브랜드에 대해서 칼로리량(CALORIES: X1), 염분량(SODIUM: X2), 알코올농도(ALCOHOL: X3), 가격(COST: X4) 등에 대하여 조사한 내용이다. 구체적 변수명과 변수의 의미는 다음과 같다. 인자분석을 실시하고 물음에 답하라.
6.1. 유의한 인자의 수와 그 인자들이 확보하는 정보의 양은?
6.2. 인자부하행렬을 구하고 인자회전을 실시하라.
6.3. 인자들에 적절한 이름은?
6.4. 인자분석 결과를 종합적으로 정리하라

본문내용

4. 다음은 1973년 미국 각 주의 강력범죄 자료이다. 변수 Murder, Assault, Rape는 인구 100,000명당 사고건수이고, UrbanPop는 도시인구 비율이다. 이 자료를 이용하여 주성분분석을 실행하고 해석하라

기초 통계량 및 상관계수 행렬은 다음과 같다. 상관계수 행렬을 통해 파악한 결과 Assault와 Murder간 상관관계가 0.8로 가장 높으며 그 다음으로 Assault와 Rape가 0.67로 높은 상관관계를 보여준다.

PCA 분석 수행 결과 약 2개의 주성분 변수까지 누적 정보량이 약 86.75%를 커버할 수 있을 것으로 보인다. 각 주성분 변수의 표준편차를 제곱하여 고유값을 확인해보면 첫번째 주성분의 고유값이 약 2.28로 유일하게 1을 넘고 있다. ‘Kaiser의 규칙’에 따라 주성분으로 고려되기 위해서는 고유값이 1이상이어야 한다고는 하나 누적정보량을 볼때 80을 넘기는게 좋다고 판단되어 두개의 주성분을 포함시킨다. loadings에서 주성분의 계수를 확인하면 다음과 같이 주성분을 표현할 수 있게 된다.

첫번째 주성분: 0.536xMurder + 0.583xAssualt + 0.278*UrbanPop + 0.543*Rape
두번째 주성분: 0.418xMurder + 0.188xAssualt - 0.873*UrbanPop - 0.167*Rape

Scree Plot을 통해서 봐도 주성분의 갯수는 기울기가 급격기 완만해지는 부분을 중심으로 2개 정도로 하는 것이 적당해 보인다. BiPlot을 통해서 주성분간의 관계를 확인할 수 있다. 가까운 거리와 방향일수록 변수들의 상관성이 높아지게 되는데 대체로 다 다른 방향과 거리를 가지고 있음을 확인할 수 있다.

참고 자료

없음
보노코리아
판매자 유형Bronze개인인증

주의사항

저작권 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

이런 노하우도 있어요!더보기

최근 본 자료더보기
탑툰 이벤트
다변량분석 ('20-01) 출석수업대체과제물
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업