경제통계학(류근관교수님-2007년 2학기) 엑셀과제 1
*정*
다운로드
장바구니
소개글
경제통계학(류근관교수님-2007년 2학기) 엑셀과제 1입니다.문제가 달라질 수는 있겠으나
풀이 방법이라도 도움이 되었으면 좋겠습니다.
목차
■ 문제 1서울시 아파트 가격자료가 수록된 파일 “APT data.xls”을 http://ezstat.co.kr 로부터 다운로드 받아 아래의 분석을 행하라.
(1) 자료가 수록된 엑셀파일의 sheet1 에는 몇 개의 변수와 몇 개의 관측치가 있는가? 각각의 관측치는 무엇을 나타내는가? 이산적 변수는 어떤 것들이 있고, 질적인 변수는 어떤 것들이 있는가? 각 변수들의 단위를 제시하라.
(2) 가격자료는 상한시세와 하한시세 그리고 그 중간값이 수록되어 있다. 중간값시세의 평균과 표준편차 및 가장 비싼 아파트 가격과 가장 싼 아파트 가격을 엑셀의 “기술 통계법” 도구를 이용하여 구하라.
(3) 역시 “기술통계법” 도구를 이용하여 아파트 규모와 단지 규모 각각의 평균과 표준편차 및 가장 큰 규모와 가장 작은 규모를 구하고 이를 (2)에서 구한 결과를 나타내는 표에 함께 합쳐서 연구자인 자신외의 타인이 보기 편한 표를 만들어라.
(4) 아파트 연령변수의 히스토그램을 그려라. 그리고 아래의 물음에 대한 답변을 히스토그램 위에 함께 나타내라.
■ 문제 2
컴퓨터 가격 자료가 수록된 “compterdata.xls”를 분석하는 문제이다. 역시 http://ezstat.co.kr로부터 다운로드 받아 엑셀을 이용하여 분석하고 답하라.
(1) 컴퓨터 가격 자료에 대해서 “기술통계법” 도구를 이용하여 각 기술통계량을 구하라. 최고가격과 최저가격을 고려하여 적절히 가격의 계급구간을 정하고 가격의 히스토그램을 엑셀을 이용하여 그려라. 각 계급구간은 등간격이 되도록 하고 구간의 오른쪽 경계값을 포함하는 엑셀 “히스토그램” 도구의 특징을 수정하지는 말라. 정규분포로 근사시킬수 있다고 보는가?
(2) 노트북 컴퓨터가 데스크탑 컴퓨터보다 평균적으로 얼마나 더 비싼가? 단위를 제시하면서 답하라. 수록된 가격자료의 단위는 한국 화폐단위인 “원(won)”이다.
(3) 컴퓨터 가격의 표준편차는 얼마인지 단위와 함께 제시하라. 환율이 1달러 = 1,300원 일 때, 컴퓨터 가격의 표준편차를 달러단위로 나타내라. 단 자료를 변환하지 말고 답하라.
(4) CPU 속도의 단위는 MHz 이다. 컴퓨터 CPU 속도와 컴퓨터 가격의 상관계수를 계산하라. 상관계수를 계산하기 전 두 변수의 상관계수에 대한 자신의 예상과 비교하라. 이를 전체 컴퓨터 자료에 대해서 행하고, 노트북컴퓨터와 데스크탑컴퓨터의 각 부분표본에 대해서 행하라. 그리고 세 가지 분석에서 계산된 상관계수를 제시하고 그 차이에 대해 논하라.
본문내용
(4) CPU 속도의 단위는 MHz 이다. 컴퓨터 CPU 속도와 컴퓨터 가격의 상관계수를 계산하라. 상관계수를 계산하기 전 두 변수의 상관계수에 대한 자신의 예상과 비교하라. 이를 전체 컴퓨터 자료에 대해서 행하고, 노트북컴퓨터와 데스크탑컴퓨터의 각 부분표본에 대해서 행하라. 그리고 세 가지 분석에서 계산된 상관계수를 제시하고 그 차이에 대해 논하라.1) CPU속도-컴퓨터가격의 상관계수에 대한 예상
CPU속도는 컴퓨터의 성능에 영향을 미치고, 고성능일수록 가격이 높을 것이므로, 상관계수는 양(0<r<1)일 것이다.
2) 전체 컴퓨터 자료
도구->데이터 분석->상관분석
상관계수= -0.06342
3) 노트북 컴퓨터
[노트북 더미=1]인 자료들만 상관분석
상관계수= 0.551133
4) 데스크탑 컴퓨터
[노트북 더미=0]인 자료들만 상관분석
상관계수= 0.600704
5) 각각의 상관계수 및 그 차이
전체 컴퓨터의 상관계수는 -0.06342, 노트북은 0.551133, 데스크탑은 0.600704이다. 노트북과 데스크탑의 각 부분표본에 대해서는 상관계수가 양(0~1)일 것이라는 예상이 맞았으나, 전체 컴퓨터를 대상으로 한 분석에서는 예상과 다른 결과가 얻어졌다.
이는 일종의 심슨의 역설(Simpson`s paradox)로, 하위집단에서 관찰된 관계는 하위집단들이 결합되었을 때 혼동요인이 통제되지 못하는 경우 그 관계가 바뀌어 나타날 수 있다는 것을 보여준다. 하위집단인 노트북과 데스크탑 컴퓨터에서 CPU속도가 높을수록 컴퓨터가격도 높은 양의 상관관계가 있지만, 저속CPU의 노트북이라도 소형화/일체화/경량화/배터리기술에 들어가는 추가비용 등으로 인하여 고속CPU의 데스크탑보다 가격이 높을 수 있다. 전체 컴퓨터를 대상으로 한 상관분석에는 이러한 혼동요인이 통제되지 못하므로, 음의 상관계수가 얻어졌다고 볼 수 있다.