방통대 [다변량분석] 2024 출석과제물 (30점 만점 인증 / 표지제외 29페이지 분량 / 코드 및 해설 포함)
- 최초 등록일
- 2024.05.14
- 최종 저작일
- 2024.04
- 30페이지/
한컴오피스
- 가격 18,000원
![할인쿠폰받기](/images/v4/document/ico_det_coupon.gif)
* 본 문서(hwp)가 작성된 한글 프로그램 버전보다 낮은 한글 프로그램에서 열람할 경우 문서가 올바르게 표시되지 않을 수 있습니다.
이 경우에는 최신패치가 되어 있는 2010 이상 버전이나 한글뷰어에서 확인해 주시기 바랍니다.
소개글
방통대 [다변량분석] 2024 출석과제물
- 30점 만점 인증
- 표지제외 29페이지 분량
- 코드 및 해설 포함
목차
1. 연습문제 1장 (p.39) 5번
1. 연습문제 2장 (p.78) 4번
본문내용
1. 연습문제 1장 (p.39) 5번
Colab에서 Salaries 데이터를 불러오기 위해 먼저 CarData 패키지를 설치한다.
(1) x축을 “yrs.since.phd“, “y축을 ”salary“로 두 변수의 산점도를 그리고 해석하시오.
1. 산점도는 차트 영역에 데이터가 분포한 형태를 바탕으로 입력변수 간의 관계를 확인할 때 사용하는 시각화이다. 데이터에 다양한 변수가 들어있고 이후 함수에서 변수 사용시 편의성을 위해 attach 함수에서 Salaries 데이터 사용을 명시한다. plot 함수에서 x축에 들어갈 입력변수 yrs.since.phd를 먼저 쓰고, y축에 들어갈 입력변수 salary를 나중에 쓴다. 셀을 실행하면 두 입력변수에 대한 산점도가 그려지며 왼쪽 하단부터 오른쪽으로 이어지는 형태가 나타난다. 즉, 박사학위 취득 이후 경력과 급여는 양의 상관관계가 있을 것으로 짐작할 수 있다.
(2) 그룹변수를 ”rank“로 구분하여 (1)번 산점도를 그리고 해석하시오.
1. plot 함수에서 x축에 들어갈 속성과 y축에 들어갈 속성을 ~ 표시를 사용하여 나타낼 수도 있다. 먼저 y축에 들어갈 속성을 쓴 후 ~ 표시 다음에 x축에 들어갈 속성을 작성한다. 속성값을 가져올 데이터 이름을 data 옵션에 작성한다. rank 라는 그룹변수를 기준으로 색상을 다르게 나타낸 산점도를 그리기 위해 컬러옵션인 col 에 rank라고 작성한다. 그 결과 산점도로부터 박사학위 취득 이후 경력과 급여의 관계는 크게 3개 그룹으로 나뉜다. 3개의 그룹에 해당하는 rank 의 값이 박사학위 취득 이후 경력이 커짐에 따라 차례대로 나타나므로 이 두 속성도 양의 상관관계가 있을 것으로 볼 수 있다.
(3) 위 (2)번 산점도에서 ”yrs.service“의 크기를 나타내는 bubble plot을 그리고 해석하시오.
참고 자료
없음