(30점 만점) 한국방송통신대학교 다변량분석 출석수업대체과제
- 최초 등록일
- 2019.07.29
- 최종 저작일
- 2019.06
- 28페이지/ 한컴오피스
- 가격 7,500원
소개글
"(30점 만점) 한국방송통신대학교 다변량분석 출석수업대체과제"에 대한 내용입니다.
목차
없음
본문내용
(1) 각 변수들의 히스토그램을 그리고 설명하라.
주어진 데이터의 각 변수에 대해 작성된 히스토그램의 R Code와 출력화면은 아래와 같다. convenience의 경우 62~66 사이의 도수가 가장 높고, accuracy의 경우 65~70 사이의 도수가 가장 높다. kindness의 경우 65~70, efficiency의 경우 50~55, pleasant의 경우 60~65, automatic의 경우 60~65 사이의 도수가 각각 가장 높게 나타나고 있음을 알 수 있다.
(2) 산점도행렬 및 상관계수행렬을 구하고, 변수들의 관계를 설명하라.
산점도 행렬은 다변량 자료에서 변수들 간의 각 쌍에 대한 2차원 산점도로 구성되어 있으며 pairs() 함수를 이용한다. 1열은 은행의 이름(bankname)이기 때문에 상관분석에서 제외하였다. 상관계수(r) 값을 보면, accuracy와 kindness가 약 0.87로 가장 높게 나타나고 있으며, 뒤를 이어 kindness와 pleasant가 약 0.80, accuracy와 pleasant가 약 0.79, kindness와 efficiency가 약 0.63으로 높은 양(+)의 상관관계를 보이고 있다. 반면, convenience와 accuracy는 약 0.13, convenience와 efficiency는 약 0.18, pleasant와 automatic은 약 –0.2 정도로 낮게 나타나고 있기 때문에 상관성이 낮다고 볼 수 있다.
참고 자료
없음