통계패키지('19-01) 중간과제물
- 최초 등록일
- 2020.07.12
- 최종 저작일
- 2020.07
- 31페이지/ MS 워드
- 가격 4,500원
목차
없음
본문내용
1장3 번. 다음은 한 도시의 20개 중고교를 대상으로 조사한 흡연율 자료이다. 도시와 농촌별로 흡연율 자료의 기술통계량 및 상자그림을 그리고 비교 분석하라.
소스코드
data aaa;
input area $ composition $ smoking_rate ;
DATALINES;
city M 0.64
city F 0.45
country C 0.70
city M 0.85
country M 0.72
city M 0.78
city F 0.62
city M 0.79
country M 0.75
country C 0.81
country F 0.56
city F 0.48
country M 0.72
city C 0.68
country M 0.79
city M 0.90
country F 0.34
city F 0.48
country F 0.49
country F 0.76
RUN;
PROC MEANS DATa=aaa;
VAR smoking_rate;
class area;
RUN;
PROC SGPLOT DATA=aaa;
VBOX smoking_rate / category=area;
RUN;
비교/분석
기술통계 분석 결과에 근거, 도시, 농촌 모두 흡연율의 평균은 거의 비슷하였다. 하지만 도시가 농촌에 비해 표준편차가 컸다. 즉 도시별 흡연율이 평균을 중심으로 농촌보다는 다소 변동폭이 있는 편이었다. 하지만 최소값과 최대값의 범위는 농촌이 최소 0.34, 최대 0.81로 각각 0.45,0.90을 보여준 도시에 비해서는 넓은 편이었다.
이는 Box Plot에서 뚜렷하게 보인다. 그리고 도시는 박스의 크기를 보면 알 수 있듯이 흡연율의 IQR이 농촌보다 더욱 컸다.
정리하자면 농촌과 도시는 언틋보기에 평균 흡연율은 각각 0.664, 0.667로 비슷한듯 보이나 도시는 도시별로 흡연율의 분포는 표준편차 0.1618676을 기록, 0.1518186을 기록한 농촌보다 넓게 나타나는 편이다.
참고 자료
없음