6.2-a.data gator; input length choice $ @@; cards; 1.24 I 1.30 I 1.30 I 1.32 F 1.32 F 1.40 F 1.42 I 1.42 F 1.45 I 1.45 O 1.47 I 1.47 F 1.50 I 1.52 I 1.55 I 1.60 I 1.63 I 1.65 O 1.65 I 1.65 F 1.65 F 1.68 F 1.70 I 1.73 O 1.78 I 1.78 I 1.78 O 1.80 I 1.80 F 1.85 F 1.88 I 1.93 I 1.98 I 2.03 F 2.03 F 2.16 F 2.26 F 2.31 F 2.31 F 2.36 F 2.36 F 2.39 F 2.41 F 2.44 F 2.46 F 2.56 O 2.67 F 2.72 I 2.79 F 2.84 F 3.25 O 3.28 O 3.33 F 3.56 F 3.58 F 3.66 F 3.68 O 3.71 F 3.89 F
##4장###1. OrchardSprays 자료는 꿀벌(honey)에게 유황의 함량에 따른 스프레이의 효과를 측정한 자료로, 64개의 관측값과 4개의 변수를 가진 데이터프레임이다. 8개의 처리(treatment : A~H)에 따른 용해액의 감소량(decrease)을 상자그림과 띠그래프로 나타내어라.#treatment factor별로 추출하여 이름을 붙인다(A~H)띠그래프는 상자그림과 함께 그린다.위의 방법은 변수를 하나하나 지정하기 때문에 너무 번거롭다. 하지만 겹쳐그릴 수 있다는 장점이 있다.2번째 방법이 훨씬 간결하지만 두 그림을 함께 그릴 수 없다는 단점이 있다.#2. VADeaths 자료는 1940년 미국 버지니아주에서 부그룹별로 인구 1000명당 사망률을 기록한 자료이다. 5행과 4열로 구성된 행렬자료이다. VADeaths 자료에 대해 점도표, 막대그래프, 인구피라미드 그림을 그려라.#(1) 점도표##(2) 막대그래프 ##(3) 인구피라미드 그림#인구피라미드 그림은 Rural과 Urban을 나누어서 하기로 한다.주의할 점! : pyramid 함수는 반드시 데이터프레임형 이어야한다. 따라서 전처리를 다음과 같이 해준다.Rural Urban#3. VADeaths 자료에 대해 파이차트, 도넛차트, 와플차트를 그려라.#(1) 파이차트두 차트가 구분이 잘 되지 않으므로 괄호안에 백분율도 추가하였다.#(2) 도넛차트도넛차트에서 데이터형식은 데이터프레임 이어야한다. 또한 최소한 2개의 행이 있어야 하는데 하나는 label에 나타낼 자료, 하나는 값이어야한다. 따라서 전처리는 다음과 같이 행이름을 없앤다.도넛차트는 Rural Male, Rural Female, Urban Male, Urban Female 별로 나누어서 구한다.먼저 전처리한 data2 데이터에서 Rural Male에 해당하는 값만 추출하여 이름을 dat라고 지정하였다.Rural Female, Urban Male, Urban Female도 이와 마찬가지로 수행한다.#(3) 와플차트도넛차트는 Rural Male, Rural Female, Urban Male, Urban Female 별로 나누어서 구한다.와플형 차트는 숫자형 벡터여야 한다 따라서 전처리는 다음과 같이 수행한다. 먼저 Rural Male을 구해본다.Saving/ ? 에서 ?에 적당한 수를 넣어서 칸수를 조절해야한다.Rural Female, Urban Male, Urban Female도 이와 마찬가지로 수행한다.
표 5.12의 교육비 지출 데이터에 대하여 7.4절의 분석을 수행하여 보아라.변수 X1을 제외한 모든 변수가 유의하지 않다.< 적합값과 표준화잔차 plot> 왼쪽그림을 보면 분산이 증가하는 경향을 보이고 이상치가 보인다.오른쪽 그림에서 이상치를 제외하면 지역별로 분산이 비슷해보인다.먼저 이상치를 찾고 제거한다.6: CT, 30: KY, 32:AL, 44: UT 가 이상치로 판별되었다.이상치를 제거하고 다시 모형의 적합성을 검정한다. 왼쪽그림: 여전히 이분산성을 가진다.오른쪽 그림: 여전히 이분산성을 가진다.이상치를 제거해도 이분산성을 여전히 띄므로 WLS를 적용한다.(1) 북동: 1.199 (2) 북부중앙: 1.468 (3) 남부: 0.438 (4) 서부: 0.934가중최소제곱을 적용한 모형이 적합한지 살펴본다.X3을 제외한 모든 변수가 유의하다. 또한 설명력이 0.7627로 증가하였다. 왼쪽그림: 등분산성을 가진다.오른쪽 그림: 지역별로 분산이 비슷해보인다.표 5.13의 교육비 지출 데이터에 대하여 7.4절의 분석을 수행하여 보아라.OLS 방식을 먼저 수행한다.모든 회귀계수들이 유의하다. 왼쪽그림: 이상치가 있고 분산이 증가하는 패턴을 보인다.오른쪽 그림: 지역3이 분산이 다른 것으로 보인다.먼저 이상치를 찾고 제거한다.이상치가 6:CT, 42: NM, 48:CA, 49:AK로 보인다. 왼쪽: 등분산성을 가진다.오른쪽: 지역3의 분산이 여전히 다르게 보인다. 지역별로 가중치를 각각 다르게 주어야한다.지역별로 가중치를 각각 다음과 같이 주어야한다.(1) 북동: 1.08 (2) 북부중앙: 1.29 (3) 남부: 0.601 (4) 서부: 1.252가중치를 준 모형이 적합한지 검정한다.회귀계수들이 모두 유의하다. 또한 설명력도 0.7939로 증가했다. 왼쪽: 대체적으로 등분산성을 보인다. 오른쪽: 지역별로 분산이 비슷해졌다.따라서 모형식 fit5가 적합한 모형이라고 할 수 있다.표 7.2의 데이터에 대하여 반응변수 Y와 3개의 예측변수 의 회귀모형을 세우고, 지레값, 표준화잔차, Cook의 거리, DFITS를 계산하여라. 또한 각각의 측도에 대하여 적절한그래프를 그려라. 그래프를 통하여 Alaska와 Utah 둘 다 높은 지레점이지만 Alaska만이 영향력 있는 관측개체임을 보여라.1. 지렛값 구하기2. 외적표준화 잔차3. 내적표준화 잔차직접 구하기4. Cook's distance직접구하기5. DIFIS's distance직접 구하기1. Cook's distance graphor 라면 i번째 관측값을 영향력이 있는 관측개체라고 한다. F(4,45,0.5)=0.5451따라서 49: AK 가 영향점이다.2. DFITS라면, i번째 관측값을 영향력있는 관측개체라고 한다.이므로 7: NY, 49: AK가 영향점임을 알 수 있다.3. 외적표준화잔차의 graph이상치는 10: OH 49: AK 이다.4. 지렛값의 graph42: NM, 44: UT는 지렛값이고 10: OH는 이상치 49: AK는 이상치인 동시에 지렛값이다.결론적으로 UT, AK모두 높은 지레점이지만 AK만이 영향력 있는 관측개체라고 할 수 있다.
최초 투자금 A(0)에 대하여 n년도에 발생한 이자를 I(n)이라 한다.A(n) – A(0) = 인 것을 보이고, 이것의 의미를 설명하다.P가 원금이라고 할 때 A(n) – A(0) = P(1+in) – P = Pin은 1년도부터 n년도까지의 이자총액을 의미한다.투자원금 1에 대하여 기간 t+s 동안 벌어들인 단리에 의한 이자 총액은 기간 t 동안 벌어들인 이자 총액과 기간 s 동안 벌어들인 이자 총액의 합니다. 그러므로 임의의 시점 t에서 a(t)가 미분가능하다면 ==== 이므로, = (상수) 인 것을 알 수 있다.따라서 = a(t)-a(0)= a(t)-1 = t a(t)= 1+t 이고, a(1)=1+i 이므로 , 즉 a(t)=1+it , t≥0이다. 그러면 투자원금 P에 대한 임의의 시점 t에서 벌어들인 이자 총액은 Pit 와 같다. 위 문제에서는 t=n일 때 까지이므로 위의 증명은 맞다.I(K)=k 일 떄, m차 연도와 n차 연도 사이에 발생한 이자 총액을 구하라. 단, m