고급R활용 중간과제물
- 최초 등록일
- 2022.08.01
- 최종 저작일
- 2021.10
- 8페이지/ 어도비 PDF
- 가격 5,000원
소개글
"고급R활용 중간과제물"에 대한 내용입니다.
목차
1. 교재 1장 연습문제 1번(p.34)의 데이터를 이용하여
A. 성별로 용량, 혈압, 나이의 평균 및 표준편차를 구하시오(3점)
B. 성별로 혈압의 상자그림을 그리고 비교하시오(3점)
C. 성별로 혈압에 차이가 있는지 검정하시오(3점)
D. 혈압이 130 미만이면 "Low", 130 이상이면 "High" 값을 가지는 새로운 변수를
만드시오(3점)
2. 교재 1장 연습문제 2번(p.34)의 데이터를 이용하여 각 분야별 월수입의 평균과 표준편차를
구하시오(4점)
3. 교재 3장 연습문제 8번(p.120)의 데이터를 이용하여 일원배치 분산분석을 수행하시오(5점)
4. R에 datarium 패키지에 내장된 depression 데이터셋은 우울증 환자들의 우울점수 자료이다. 변수 t0은 우울증 치료 전에 측정한 우울점수이고, 변수 t2는 우울증 치료 3개월 후에 측정한 우울점수이다.
A. x축을 t0, y축을 t2로 하는 산점도를 그리시오(3점)
B. t0가 독립변수이고 t2가 결과변수인 선형회귀분석을 수행하여 회귀직선의 절편과
기울기를 구하시오(3점)
C. 4-A에서 그린 산점도 위에 4-B에서 구한 회귀직선을 그리시오(3점)
본문내용
quantile, IQR 함수를 이용하여 사분위수와 사분위수범위를 구하여 남성과 여성의 데이터의 분포를
파악할 수 있다. 여성의 혈압데이터에서 사분위수는 1사분위수 126.25, 중앙값은 132.50, 3사분위수
138.75, 사분위수 범위는 12.5 이다. 남성의 혈압데이터의 사분위수는 1사분위수 117.5, 중앙값 125.0,
3사분위수 135.0이며 사분위수범위는 17.5이다. 여성의 혈압 중앙값이 남성의 혈압 중앙값보다
높으며 범위의 분포가 남성보다 좀 더 중앙값 쪽으로 밀집되어 있음을 알수 있다.
C. 성별로 혈압의 차이가 있는지 검정
가설은 아래와 같이 세운다.
귀무가설(H0): 남,여의 혈압의 차이는 없다.
대립가설(H1): 남,여의 혈압의 차이는 있다.
성별로 혈압의 차이가 있는지 검정하기 위해 이표본 및 대응표본에 대한 추론에 사용할 수 있는 t.test
함수를 사용한다. t.test 함수를 사용하기에 앞서 남녀 두집단의 모분산이 같은지를 Levene 검정을
통해 검증한다.
참고 자료
없음