소개글
"통계패키지와 데이터시각화 중간과제물 분석"에 대한 내용입니다.
목차
1. 통계패키지 과제 분석
1.1. 과제 문제1 (SAS 이용)
1.2. 과제 문제2 (SPSS 이용)
1.3. 과제 문제3 (SPSS 이용)
1.4. 과제 문제4 (SAS 이용)
2. 데이터시각화 과제 분석
2.1. 데이터시각화 우수 사례 분석
2.2. 데이터시각화 과목 깃허브 페이지 확인
2.3. 산점도 그래프 작성 (R 이용)
2.4. 바 그래프 작성 (R 이용)
2.5. 히스토그램 작성 (R 이용)
3. 참고 문헌
본문내용
1. 통계패키지 과제 분석
1.1. 과제 문제1 (SAS 이용)
주어진 말의 수명 자료로부터 새로운 변수인 '말의 수명-22'를 생성하고 출력하는 프로그램을 작성하였다. 먼저 데이터를 입력받고 변수 'diff'를 생성하여 각 관측치에서 22를 뺀 값을 저장하였다. 그리고 이를 출력하여 말의 수명이 22년보다 얼마나 더 많거나 적은지 확인할 수 있도록 하였다. 또한 반복이 없는 이원배치법에 의한 돼지의 체중증가 자료를 읽어들여 사료와 품종에 따른 돼지의 체중증가량 데이터를 구축하였다. DO 문을 이용하여 사료와 품종의 조합을 생성하고 이에 해당하는 체중증가량 데이터를 동시에 출력하였다. 마지막으로 2개의 데이터셋을 DATASET1과 DATASET2로 각각 정의하고, COMBINED_DATA라는 새로운 데이터셋에 합쳐서 출력하였다. 이를 통해 서로 다른 파일의 데이터를 하나의 통합된 파일로 만들 수 있었다.
1.2. 과제 문제2 (SPSS 이용)
한 설문조사에 다음 6개 문항에 대하여 표본추출된 40명을 대상으로 조사한 자료과 다음과 같이 정리되어 있다.
SPSS를 이용하여 데이터를 입력하고, 변수보기에서 각 이산형 변수의 값에 대한 레이블 및 측도를 지정한다. 문제의 설문지 내용을 참고하여 값에 대한 레이블을 입력한다.
성별, 결혼상태, 직업, 학력에 대한 도수분포표를 구하고, 막대그림, 원그림을 그려본다. 분석 - 기술통계량 - 빈도분석을 클릭한 후, 좌측의 변수에서 필요한 변수들을 우측으로 이동시키고, 차트 클릭하여 막대형 차트 또는 원형 차트를 체크하고 계속 버튼을 클릭하고, 빈도표 표시를 체크한 후 확인을 클릭하면 다음의 결과가 나온다.
나이와 월수입과의 관계를 밝히기 위한 산점도를 그린다. 그래프(G)>산점도/점도표(S)에서 단순 산점도를 선택하고 정의를 클릭한다. 그림을 참고하여 Y축과 X축을 채운 후 확인을 클릭하면 산점도가 생성된다. 단, 필요하면 제목을 선택하여 제목 대화상자에서 산점도 관련 제목을 입력해 준다. 교재 p109를 참고한다.
남녀별 결혼상태에 따라 월급의 평균 및 표준편차를 구한다. 분석 - 평균 및 비율 비교 - 평균분석을 클릭한다. 독립변수로 성별을 선택하고, 다음을 클릭하여 결혼상태를 선택한 후, 종속변수로 월수입을 선택하고 확인을 클릭하면 다음의 결과를 얻는다.
남녀별로 월급 평균을 나타내는 그림을 그려 본다. 그래프 - 막대형 차트 ...
참고 자료
김성수 외 2인 공저(2018). 통계패키지. 방송통신대학교출판문화원.
박서영, 이긍희(2023), 데이터시각화, 한국방송통신대학교출판문화원.