2017학년도 2학기 과제물(온라인제출용)교과목명 : 고급R활용학 번 :성 명 :연 락 처 :_________________________________________________________________________o 과제유형 : 공통형o 과 제 명 : 교재 연습문제- 이하 과제 작성교재 연습문제 1장 ? 1번, 2번, 6번1번. 다음은 약의 투여용량과 성별, 혈압, 나이 등의 측정 데이터이다.① 텍스트파일로 만들어 R에서 읽고, 결과를 출력하시오.② 엑셀파일로 만들어 입력하고, R에서 읽으시오.③ 성별로 용량, 혈압, 나이의 평균 및 표준편차를 구하시오.④ 성별로 용량, 혈압, 나이의 히스토그램 및 상자그림을 그리고 비교하시오.2번. 다음 월수입 자료에서 각 분야별 월수입의 평균을 구하시오.1번은 79.7, 2번은 68, 3번은 109.3으로 나타납니다.6번. 다음은 13개 시중은행에 대한 편리성, 신속성, 친절, 능률, 쾌적, 자동화 등의 점수를 나타낸 자료이다. R studio를 이용하여 물음에 답하시오.① 각 변수들의 히스토그램을 그리고, 설명하시오.시중은행들이 편리성 부분과 친절 부분에서는 낮은 점수를 받은 편이고, 반대로 쾌적 분야에서는 높은 점수를 받은 것으로 나타납니다.② 산점도행렬 및 상관계수 행렬을 구하고, 변수들의 관계를 살펴보시오.친절도와 신속성, 친절도와 쾌적, 쾌적과 신속성 사이에 강한 상관관계를 보입니다.③별그림 및 얼굴그림을 그리고 설명하시오.별그림에서는 각 은행별로 점수를 볼 수 있습니다. 3번째 보람은행, 6번째 신한은행, 11번째 하나은행에서 전반적인 만족도가 높은 것을 알 수 있습니다.얼굴그림에서도 별그림과 마찬가지로 3번, 6번, 11번째 은행에서 만족도가 높은 것을 직관적으로 관찰할 수 있습니다.교재 연습문제 2장 ? 1번, 3번, 5번1번. 성공확률이 p인 기하분포의 기댓값과 분산은 (1-p)/p (1-p)/p^2이다. 1000개의 난수를 얻어 기댓값과 분산을 얻고 이론적인 값과 비교하여 보시오.p가 0.2라고 가정하면, 기댓값은 0.8/0.4=4이고, 분산은 0.8/0.04=20입니다.1000개의 난수를 얻어 시행한 결과, 기댓값은 4.005이고, 분산은 19.56으로 유사한 결과를 보여줍니다.3번. 자유도가 ν인 카이제곱분포를 따르는 확률변수 X의 기댓값과 분산을 각각 ν 및 2ν이다. 자유도가 10인 카이제곱분포로부터 500개의 난수를 생성하여 기댓값과 분산이 각각 10과 20에 근접한 값이 나오는지 살펴보시오.기댓값과 분산이 9.8과 19.2로 이론적인 값에 근접한 값이 확인됩니다.5번. (X,Y)가 이변량정규분포를 따른 확률변수라고 하자. X와 Y의 기댓값은 모두 0이고 분산은 둘 다 1이며 상관계수가 p인 경우를 생각하자. 이 경우 이변량정규분포의 난수는 다음과 같이 생성할 수 있다.1. 표본정규분포에서 x를 얻는다.2. y를 기댓값 px 분산 1-p^2인 정규분포에서 난수를 얻는다.위의 방법을 사용하여 다양한 p값에 따른 x와 y의 산점도를 그려 보시오.(bi.norml.r)교재 연습문제 3장 - 3번, 5번, 8번3번. 다음은 남녀 각 10명의 몸무게를 조사한 자료이다. 남자의 몸무게 평균이 여자보다 10이상 큰지 검정하시오. 이때 먼저 Levene검정을 하여 두 그룹의 분산이 같은지 검정하고, 그 결과에 따라 적절한 검정통계량을 사용하시오.유의확률이 0.038이므로 귀무가설을 기각할 수 있습니다. 분산이 다른 것으로 가정하고 검정합니다.