소개글
"통계학개론 출석수업과제물"에 대한 내용입니다.
목차
1. 교재 164p 예제 6-10 데이터 활용 실습
(1) 히스토그램 (2점)
(2) 상자그림 (2점)
(3) 다섯수치요약 (2점)
(4) 모평균에 대한 95% 신뢰구간 (단, 대표 모집단이 정규분포 따른다고 가정) (2점)
2. 다음 표를 바탕으로 이 프로그램에 참가한 학생들의 기말고사 수학점수의 평균이 중간고사의 수학점수의 평균보다 높다고 할 수 있는지 단측검정하시오.
(1) 귀무가설은 무엇인가? (2점)
(2) 대립가설은 무엇인가? (2점)
(3) 유의수준 5%에서 가설검정을 수행하시오. 검정통계량은 얼마인가? (2점)
(4) 가설검정 결과를 서술하시오. (2점)
3. 어느 영화관에서 영화를 관람한 고객 200명 중, 입장권을 온라인으로 구매한 사람이 150명, 현장에서 직접 구매한 고객이 50명이었다. 온라인 구매 고객 150명 중 40명이 팝콘을 구매하였고, 현장 구매 고객 50명 중 20명이 팝콘을 구매하였다. 온라인/현장 구매 여부와 팝콘 구매여부는 서로 독립인가? 아래의 단계를 따라 검정하시오.
(1) 귀무가설은 무엇인가? (2점)
(2) 대립가설은 무엇인가? (2점)
(3) 유의수준 5%에서 가설검정을 수행하시오. 검정통계량 값은 얼마인가? (2점)
(4) 가설검정 결과를 서술하시오. (2점)
4. 다음은 어느 도시의 13개 주택의 면적과 가격의 데이터이다. 물음에 답하시오.
(1) 주택의 면적을 가로축으로, 주택의 가격을 세로축으로 하는 산점도를 그리시오. 산점도의 제목으로 본인의 학번을 넣으시오. (2점)
(2) 주택의 면적과 주택의 가격의 상관계수를 계산하시오. (2점)
(3) 주택의 면적을 독립변수로, 주택의 가격을 종속변수로 하는 회귀직선을 구하시오. 회귀직선의 절편과 기울기는 각각 얼마인가? (2점)
본문내용
(1) 히스토그램 (2점)
R에서 히스토그램을 그리기 위해서는 내장 함수인 hist() 함수를 이용하며, 코드는 다음과 같다.
book <- c(5,23,20,1,10,15,15,10,9,13,18,11)
hist(book)
위 코드를 실행하면 다음과 같은 화면이 출력되며, 기본값으로 5씩 단위가 나눠지는 히스토그램이 생성된다.
(2) 상자그림 (2점)
상자그림의 경우, boxplot() 함수를 이용하여 그릴 수 있다.
boxplot(book)
위 코드를 실행하면, 다음과 같이 수직이 기본값인 상자그림이 그려진다. 그래프를 통해 중앙값이 10과 15사이에 있는 값임을 대략적으로 파악할 수 있다.
(3) 다섯수치요약 (2점)
다섯수치요약, 즉 최솟값, 1사분위수, 중앙값, 3사분위수, 최댓값은 fivenum() 함수를 통해 알 수 있다.
fivenum(book)
위 코드를 실행하면, 다음과 같이 1.0, 9.5, 12.0, 16.5, 23.0의 값을 얻을 수 있다.
(4) 모평균에 대한 95% 신뢰구간 (단, 대표 모집단이 정규분포 따른다고 가정) (2점)
모평균에 대한 신뢰구간을 구하기 위해서는 검정함수인 t.test() 함수를 통해 결과에서 신뢰구간만 따로 파악하는 방법이 있다.
t.test(book)
함수를 실행하면, 다음과 같이 검정통계랑, 자유도 등 다양하게 출력이 되는데, ’95 percent ~’ 부분에서 95% 신뢰구간인 8.550659 ~ 16.449341을 확인할 수 있다.
참고 자료
장영재. 2020. “대학수학의 이해”. 한국방송통신대학교출판문화원