• 통합검색(47)
  • 방송통신대(42)
  • 리포트(4)
  • 시험자료(1)

바로가기

방송통신대 - 2025 방송통신대 리포트 및 과제물 업데이트, 중간고사/기말고사자료
EasyAI “방통대 회귀모형” 관련 자료
외 33건 중 선별하여 새로운 문서 초안을 작성해 드립니다
생성하기

"방통대 회귀모형" 검색결과 1-20 / 47건

판매자 표지는 다운로드시 포함되지 않습니다.
  • 판매자 표지 자료 표지
    한국방송통신대학교 통계데이터과학과 회귀모형 2021년 출석과제(만점)
    출석수업 과제물(평가결과물) 표지(온라인제출용)교과목명 : 회귀모형학 번 :성 명 :강 의 실 : 호연 락 처 :__________________________________________________________________________________1. 연습문제 1장 (p.39) 2번2. 연습문제 2장 (p.86) 2번목 차(Table of Contents)1. 문제 1.22. 문제 223. 참고문헌81. 연습문제 1장 (p.39) 2번1. 자동차의 무게가 무거우면 이를 움직이는 데 더 많은 연료가 소모된다는 것은 알려진 사실이다. 자동차의 무게와 자동차를 1 km 움직이는데 필요한 에너지량과의 함수관계를 정확히 판단하기 위하여 A자동차회사는 다음의 자료를 실험을 통하여 얻었다. 실험비용이 많이 드는 관계로 아홉 번만 실험하였는데 그 자료는 아래와 같다.무게 (단위: 1,000 kg) x에너지 소모량(단위: 1,000Btu) y무게 (단위: 1,000 kg) x에너지 소모량(단위: 1,000Btu) y0.92.01.73.21.32.60.71.82.14.31.22.32.55.81.63.02.45.1(1) x에 의한 y의 회귀직선을 최소제곱법에 의하여 구하여라. 데이터의 산점도를 그리고, 구한 회귀직선을 산점도 위에 그려 넣어라.위 그림에서 두 변수 간에는 X가 증가하면 Y도 거의 직선적으로 증가함을 알 수 있다. 따라서 단순회귀직선이 타당하리라고 생각된다.추정된 회귀식은 ? (에너지 소모량) =-0.1157+2.1626` TIMES X(무게)(2) 분산분석표를 작성하고 회귀직선의 유의 여부를 검정하라(유의수준 α = 0.05 사용) 분산분석표 양식으로 정리하면 다음과 같다.요인자유도제곱합평균제곱F0Pr(F>F0)회귀115.246215.246141.166.798e-06잔차70.75610.108계816.0023회귀방정식이 유의한가에 대한 검정은 분산분석표에 의한 F-검정으로 이루어진다. 분산분석표에서 보면 검정통계량 F0=141.16이고, 이에 대한 유의확률 p-값은 6.798e-06이 매우 작으므로(유의수준 α = 0.05 보다 작으므로) 적합된 회귀선이 유의하다는 것을 알수 있다. (H _{0} = beta _{1} =0 이라는 귀무가설을 기각한다.)(3) 무게가 3,000 kg이 되는 차량의 에너지 소모량은 어느 정도일까를 예측하라.적합된 회귀직선 ? =b _{0} +b _{1} X에서 X대신에 I번째 X의 값 Xi를 사용하면 ?i =b _{0} +b _{1} X _{i} 가 되는데, 여기서 ?i 는 Xi에서의 기댓값 E(Yi)의 추정값이다. 추정된 회귀식은 ? (에너지 소모량) =-0.1157+2.1626` TIMES X(무게)로서, X에 3,000 kg를 대입하여 계산하면 3,000 kg일 때 에너지 소모량의 추정값은 6372.1 Btu이다.(4) 원점을 지나는 회귀직선을 구하라.원점을 지나는 회귀직선의 결과는 아래와 같다.(5) 원점을 지나는 회귀직선을 결정계수를 구하라.(4)번 항목의 결과를 아래와 같이 확인하였을 때 결정계수(R2)은 0.9934로서 이는 총변동 중에서 회귀직선에 의하여 설명되는 부분이 99.34 %라는 의미로서, 추정된 회귀선의 정도가 높다는 것을 알 수 있다.(6) 오차항의 분산이 같지 않다는 것이 밝혀지고,Var( epsilon _{i} )=kx _{i}^{2}으로x _{}^{2}의 크기에 비례한다면 가중회귀를 사용하여야 한다. 가중최소제곱법에 의하여 가중회귀직선을 구하라. 이 경우의 회귀변동(SSR)을 구하라.R 명령에서 가중회귀명령은 lm(y~x, weights=w)와 같이 weight 옵션을 이용하면 된다. 가중회귀적합 결과에서 가중회귀직선방정식은 ? =0.1444+2.0000` TIMES X(무게)이다.가중회귀직선 산점도는 아래와 같다.아래 그림을 확인하였을 때 회귀변동(SSR)은 8.8662임을 알 수 있다.2. 연습문제 2장 (p.86) 2번어떤 공장에서 나오는 제품의 강도(kg/cm2)가 그 공정의 온도와 압력에 어떠한 영향을 받는가를 조사하기 위하여 다음의 데이터를 얻었다.공정온도(℃): X1공정압력(psi): X2강도(kg/cm2): Y1955781.417961122.020560101.720462175.620161150.31845464.82105892.120961113.8(1) 선형회귀모형,Y= beta _{0} + beta _{1} X _{1} + beta _{2} X _{2} + epsilon 이 성립된다고 가정하고 데이터로부터 회귀모형을 추정하라.아래표는 X1(공정온도)과 Y(강도)와의 회귀모형이다.아래표는 X1(공정온도), X2(공정압력) 및 Y(강도)와의 회귀모형이다.추정된 회기식은 ? =-554.5267-0.1743` TIMES X1(온도)+11.8449 TIMES X2(압력)이다.X1(공정온도)의 p-값은 0.8285로서 유의수준 a=0.05보다 크므로 귀무가설을 기각하지 못한다. 따라서, X1(공정온도)는 Y(강도)에 영향을 주지 않는다고 할 수 있다.X2(공정압력)의 p-값은 0.0146으로서 유의수준 a=0.05보다 작으므로 적합된 회귀선이 유의하다는 것을 알수 있다. (H _{0} = beta _{1} =0 이라는 귀무가설을 기각한다.)(2) 오차분산sigma ^{2}을 MSE로 추정하고,Var(b _{0} ),`Var(b _{1} ),`Var(b _{2} )`의 추정치를 구하라.추정값의 표준오차sqrt {MSE} = sqrt {469.36=} 21.66 로서 오차분산sigma ^{2}의 추정치가 21.66이다.Var(b _{0} ),`Var(b _{1} ),`Var(b _{2} )`의 “Std.Error“는 각각 197.2264, 0.7636 및 3.2342로서,Var(b _{0} )`=`197.2264 ^{2} =38898.2529,Var(b _{1} )`=`0.7636 ^{2} =0.5831 및Var(b _{2} )`=`3.2342 ^{2} =10.4600(3) X1 = 200 ℃이고 X2 = 59 psi에서 평균 제품의 강도의 추정치 ??는 얼마인가? 이 ? 의 분산을 추정하라.① 평균 제품의 강도의 추정치 ?회기식 ? =-554.5267-0.1743` TIMES X1(온도)+11.8449 TIMES X2(압력)에 따라 계산한 값은 아래와 같다.-554.5267-0.1743` TIMES 200+11.8449 TIMES 59`=`109.4624즉, X1 = 200 ℃이고 X2 = 59 psi에서 평균 제품의 강도의 추정치 ?? = 109.6 (kg/cm2)이다.② ? 의 분산95% 신뢰구간은 (89.29545, 129.6407)가 된다(위 R데이터 참조). 99% 신뢰구간은 (77.82585, 141.1104)가 된다.(4) 추정된 회귀계수 b1, b2의 의미는 무엇인가?추정된 회기식은 ? =-554.5267-0.1743` TIMES X1(온도)+11.8449 TIMES X2(압력)에서 추정된 회귀계수 b1= -0.1743이고 추정된 회귀계수 b2 = 11.8449이다. 추정된 회귀계수 b1, b2 는 Y(강도)에 미치는 영향을 얼마나 주는지에 대한 수치이다. 즉, X1(온도)과 X2(압력)과 같은 설명변수가 변할 때 종속변수에 영향력을 나타낸다. b2가 11.8449로서 b1인 ?0.1743보다 큰 것은 Y(강도)에 미치는 영향이 더 큰 것을 알 수 있다.(5) 분산분석표를 작성하고 α = 0.05로 F-검정을 행하라.분산분석표는 아래와 같다.요인자유도제곱합평균제곱F0Pr(F>F0)회귀26930.63465.37.3830.03218잔차52346.8469.36계79277.4아래는 R의 분석결과이다.아래는 (1)의 결과의 일부로서 결과를 확인하였을 때 p-값은 0.03218으로서 p-값은 유의수준 a=0.05보다 작다. 따라서 적합된 회귀선이 유의하다는 것을 알수 있다.
    방송통신대 | 12페이지 | 4,000원 | 등록일 2024.07.11
  • 판매자 표지 자료 표지
    [30점 만점] [회귀모형] 2022 1학기 중간과제물 한국방송통신대학교 통계데이터과학과
    회귀모형< 3월 27일 출석수업 과제 >1번. 연습문제 1장 1번(p. 39) 자료를 이용하여 1.7 분석사례와 같이 분석하고, 설명하시오.자료파일 만들기Excel을 이용하여 practice.csv 파일을 만들었다.자료를 읽어 산점도 그리기read.csv를 사용하여 데이터를 읽었고 attach함수를 이용하여 변수이름을 직접 사용하였다. Plot함수를 이용한 산점도에서 사용연도가 증가하면 정비비용이 직선적으로 증가함을 살펴볼 수 있었다.회귀모형 적합하기회귀적합을 시행하였다. 결과에서 회귀계수의 측정값에서 절편은 29.107이고, 기울기는 13.637이 나왔다. 그러므로 단순회귀방정식은 maintenance cost=29.107+13.637 x age of machines가 된다. 기울기에 대한 t value=4.330이고 p value가 매우 작으므로 기울기가 0이라는 귀무가설을 기각한다.결정계수는 0.6098로 60.98%가 회귀방적식으로 설명된다는 것을 나타낸다. F값은 18.75이고 이에 대한 p value는 0.0009779로서 회귀직선이 유의하다는 것을 알 수 있다.분산분석표 구하기F-검정으로 회귀방정식이 유의한지 검정해 보았다. Anova함수를 사용해서 분산분석표를 만들었고 분산분석표에서 F value가 18.753이고 p값이 0.0009779로 매우 작으므로 회귀선이 유의하다는 것을 알 수 있다.잔차 및 추정값 보기잔차그림 그리기잔차를 독립변수 age of machines에 그렸다. 0을 중심으로 일정한 범위 내에 있어 회귀기본 가정을 만족한다고 할 수 있다. X가 증가함에 따른 잔차 변화는 특별히 나타내고 있지 않다.추정값의 신뢰대 그리기추정값에 대한 신뢰대를 그려보았다.2번. 연습문제 2장 3번(p. 87) 자료를 이용하여 2.8 분석사례와 같이 분석하고, 설명하시오.자료파일 읽기엑셀파일을 csv로 저장하여 read.csv를 통해서 자료를 읽었다.기술통계량 및 상관계수 보기Summary와 cor을 활용해서 기술통계량 및 상관계수행렬을 나타내 보았다. Summary함수에서 사분위수, 평균값, 최대 및 최소값을 알 수 있다. 물소비량과 평균온도의 상관계수가 0.949로서 높다는 것을 살펴볼 수 있다.회귀모형 적합하기추정된 회귀방정식은 물소비량=2.409+0.07x평균온도-0.025x작업일수+0.06x작업량 이다. 결정계수가 0.9202로서 회귀모형이 종속변수인 물소비량의 92.02%를 설명하는 것을 보여준다. 추정값의 표준오차는 0.172이다.작업일수와 작업량의 t value는 각각 -0.552,1,161이며, 유의확률 p value는 0.601,0.290 이다. 유의수준 a=0.05에서 작업일수와 작업량은 물소비량에 큰 영향을 준다고 볼 수 없다. 평균온도의 t value는 5.521이며, p vlaue는 0.00149로 유의수준보다 상당히 낮다. 이로써 평균온도는 물소비량을 설명하는데 유의한 독립변수임을 알 수 있다.이는 avPlots를 활용한 추가변수그림에서도 살펴볼 수 있다.> library(car)> avPlots(data.lm)분산분석표회귀제곱합=2.00432+0.00227+0.03988=2.04647이다.요인자유도제곱합평균제곱F회귀32.046470.6821623.05잔차60.177530.02959계92.224F 값=23.05에 대한 유의확률 p value=0.001079로 매우 작아서 중회귀모형이 유의하다는 것을 알 수 있으며, 오차분산 추정치는 MSE=0.02959라는 것을 알 수 있다.잔차산점도 그리기독립변수 평균온도와 잔차 간의 상관관계를 나타내는 산점도를 그려보았다. 특이점으로 의심되는 점은 없으며, 평균온도가 증가할 때 2차곡선의 모양을 갖는 것처럼 보인다. 작업일수와 작업량과 잔차 간의 상관관계를 나타내는 산점도는 다음과 같다.추정값과 잔차의 산점도를 그려보았을 때 뚜렷한 특이 현상은 나타나지 않았다. 특이점이 없는 것으로 보인며, 조사를 할 때에는 6번과 10번 먼저 분석을 하는 것이 좋다고 생각된다.Reference김성수 외 2인, 회귀모형, 한국방송통신대학교출판문화원, p32~38, p78~p85
    방송통신대 | 11페이지 | 5,000원 | 등록일 2023.01.12
  • 방송통신대학교(방통대) 회귀모형(30점 만점)
    『온라인 제출용 출석수업대체과제물 표지』2020 학년도 ( 1 )학기 출석수업대체과제물교과목명 : 회귀모형학 번 :성 명 :연 락 처 :__________________________________________________________________________________사용연도(단위 : 년) x정비비용(단위: 1,000원) y사용연도(단위 : 년) x정비비용(단위: 1,000원) y3*************1153112810557015071864862432676126어떤 큰 공장에서 동일한 기계들의 정비기록에 관한 표본자료를 취하였다. 이는 기계의 사용연도(age of machines)와 정비비용(maintenance cost) 간에 어떤 관계가 있는가를 밝혀 내기 위한 것으로 그 자료는 다음과 같다(표본의 크기 n =14).이 데이터의 산점도를 그려라.> ex1.1 = read.table("C:/Users/user/Documents/ex1.1.txt", header=T)> head(ex1.1)usage_yr cost1 3 392 1 243 5 1154 8 1055 1 506 4 86> plot(ex1.1$usage_yr, ex1.1$cost, xlab="사용연도(년)", ylab="정비비용(1,000원)", pch=19)> title("사용연도와 정비비용의 산점도")최소제곱법에 의한 회귀직선을 적합시켜라.> ex1.1.lm=lm(cost ~ usage_yr, data=ex1.1)> summary(ex1.1.lm)Call:lm(formula = cost ~ usage_yr, data = ex1.1)Residuals:Min 1Q Median 3Q Max-33.204 -20.383 -4.748 13.957 61.433Coefficients:Estimate Std. Error t value Pr(>|t|)(Intercept) 29.107 15.969 1.823 0.093341 .usage_yr 13.637 3.149 4.330 0.000978 ***--. X1과 X2의 SUM을 합하면 634.9+6295.7 = 6930.6으로 회귀의 제곱합을 구할 수 있다. 잔차의 SUM은 2346.8이다. 제곱합을 각 요인의 자유도로 나누면, 3465.3과 469.36이 나온다. 3465.3/469.36로 나누면 F값 7.383을 얻을 수 있다.위 2-1의 회귀 분산 분석 결과를 보면 유의확률 p-값이 0.03218이므로 0.05보다 작으므로 유의하다.요인자유도제곱합평균제곱F0회귀26930.63465.37.383잔차52346.8469.36계79277.4결정계수 R2을 구하라.R2은 SSR/SST로 6930.6/9277.4 = 0.747로 계산할 수 있고, 2-1의 회귀분석 결과에서 Multiple R-squared 값을 읽어서 얻을 수 있다.X1, X2, Y를 모두 표준화시키고, 표준화된 중회귀방정식을 구하라.절편은 0, 표준화계수는 각각 -0.05499279와 0.88251635이다. 표준화된 중회귀방정식은 아래와 같다.Y= -0.05499279X1+ 0.88251635X2X2의 계수가 X1 보다 크므로 상대적으로 X2의 영향이 더 크다.> ex2.2.beta=lm.beta(ex2.2.lm)> print(ex2.2.beta)Call:lm(formula = Y ~ X1 + X2, data = ex2.2)Standardized Coefficients::(Intercept) X1 X20.00000000 -0.05499279 0.88251635> summary(ex2.2.beta)Call:lm(formula = Y ~ X1 + X2, data = ex2.2)Residuals:1 2 3 4 5 6 7 8-5.250 -14.817 -18.742 31.294 17.316 11.768 -3.781 -17.789Coefficients:Estimate Standardized Std. Error t value Pr(>|t|)(Intercept) -554.52670 0.00000 197.22638 -2.812 0.0375 *X1 -0.17415.109+ X6 1 0.01982 44.827 15.431+ X13 1 0.00346 44.843 15.445Step: AIC=13.2Y ~ X9 + X1 + X4 + X8Df Sum of Sq RSS AIC+ X12 1 4.1181 38.215 11.207 42.333 13.198+ X11 1 1.8859 40.447 13.421+ X3 1 1.4051 40.928 13.882+ X13 1 0.6230 41.710 14.620+ X7 1 0.4833 41.850 14.751+ X5 1 0.3969 41.936 14.831+ X2 1 0.3231 42.010 14.900+ X10 1 0.2948 42.039 14.926+ X6 1 0.1400 42.193 15.069Step: AIC=11.21Y ~ X9 + X1 + X4 + X8 + X12Df Sum of Sq RSS AIC 38.215 11.207+ X3 1 1.05617 37.159 12.114+ X6 1 0.40683 37.808 12.790+ X13 1 0.40513 37.810 12.792+ X10 1 0.13528 38.080 13.069+ X11 1 0.10984 38.105 13.095+ X5 1 0.05020 38.165 13.156+ X2 1 0.00796 38.207 13.199+ X7 1 0.00252 38.213 13.205Call:lm(formula = Y ~ X9 + X1 + X4 + X8 + X12, data = ex3.3)Coefficients:(Intercept) X9 X1 X4 X8 X129.94408 0.06428 -0.07405 -0.10510 0.79736 -0.77443뒤로부터 제거법을 이용하여 모형을 선택하라.(X1, X4, X8, X9, X12)이 선택되었다.> step(full.ex.3.3.lm, data=ex3.3, direction="backward")Start: AIC=24.76Y ~ X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8 +a = ex3.3)Coefficients:(Intercept) X9 X1 X4 X8 X129.94408 0.06428 -0.07405 -0.10510 0.79736 -0.77443모든 회귀방법을 이용하여 모형을 선택하라.수정결정계수 2 를 기준으로 하면 2 값이 최대인 (X9, X1, X4, X8, X12)를, Cp를 기준으로 한다면 Cp값이 최소인 값 (X9, X1, X4, X8, X12)를 선택한다. 이 문제에서는 p+1보다 작은 변수가 p=1, p=2를 제외하고 모두 이므로 최소값을 선택하기로 한다.p선택된 변수R22Cp1X90.56554230.553800210.35560132X9, X10.65214530.63282013.31460283X9, X1, X40.70079570.67514970.23569714X9, X1, X4, X80.71756330.68433540.48523395X9, X1, X4, X8, X120.74503800.7064074-0.38301706X9, X1, X4, X8, X12, X30.75208450.70560030.88136107X9, X1, X4, X8, X12, X3, X130.75617260.70111482.45458138X9, X1, X4, X8, X12, X3, X13, X70.75791450.69335834.2727357> ex3.3 = read.csv("C:/Users/user/Documents/p116.csv", header=T)> head(ex3.3)Y X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X131 4.58 4.99 69 8 55 12 10 1.20 0.00 4.6 8 1 0 02 2.86 16.11 73 8 60 12 10 1.43 0.00 4.4 4 1 0 03 3.02 9.75 49 10 60 12 10 1.54 0.00 4.7 4 1 0 04 2.29 10.65 61 13 65 12 10 0.94 0.00 3.8 6 1 0 05 1.61 20.01 28 12 70 12 10 0..707- X10 1 28.3617 134.31 59.902Step: AIC=54.53Y ~ X1 + X4 + X5 + X6 + X8 + X9 + X10Df Sum of Sq RSS AIC- X1 1 3.5373 114.38 53.405 110.84 54.525- X6 1 10.3981 121.24 55.036- X9 1 11.2999 122.14 55.244- X5 1 12.3662 123.21 55.487- X4 1 13.7138 124.56 55.792- X8 1 14.3269 125.17 55.929- X10 1 25.7465 136.59 58.374Step: AIC=53.4Y ~ X4 + X5 + X6 + X8 + X9 + X10Df Sum of Sq RSS AIC- X6 1 7.0923 121.47 53.089- X9 1 7.7804 122.16 53.248 114.38 53.405- X5 1 10.2807 124.66 53.815- X4 1 10.2817 124.66 53.815- X8 1 12.5945 126.97 54.330- X10 1 22.2100 136.59 56.374Step: AIC=53.09Y ~ X4 + X5 + X8 + X9 + X10Df Sum of Sq RSS AIC- X5 1 5.719 127.19 52.378- X8 1 7.134 128.61 52.688 121.47 53.089- X9 1 13.858 135.33 54.114- X4 1 23.777 145.25 56.095- X10 1 76.182 197.65 64.721Step: AIC=52.38Y ~ X4 + X8 + X9 + X10Df Sum of Sq RSS AIC 127.19 52.378- X8 1 13.438 140.63 53.190- X9 1 19.664 146.86 54.403- X4 1 42.517 169.71 58.452- X10 1 227.532 354.72 79.096Call:lm(formula = Y ~ X4 + X8 + X9 + X10, data
    방송통신대 | 28페이지 | 3,000원 | 등록일 2020.07.10
  • 회귀모형 기말 과제물 방송통신대 (만점)
    1번 문제. 62종의 동물에 대한 평균 두뇌무게와 몸무게를 나타낸다. 두뇌무게를 몸무게의 함수로 보고 함수관계를 찾고자 한다.(1) 두뇌무게를 Y로 놓고 몸무게를 X로 하여 Y와 X의 산점도와 잔차산점도를 그리고 이를 논하라. 변수에 대한 변환이 필요한지, 그리고 필요하면 그 이유는 무엇인지 논하라.산점도와 잔차산점도 도식화(1) 산점도 및 잔차산점도 도식화# 산점도 및 잔차 산점도animal
    방송통신대 | 18페이지 | 5,000원 | 등록일 2021.05.23 | 수정일 2021.05.30
  • 판매자 표지 자료 표지
    방통대 통계데이터과학과 회귀모형 A+
    1번. 연습문제 1장 1번(p. 39) 자료를 이용하여 1.7 분석사례와 같이 분석하고, 설명하시오.Age of machinesMaintenance costAge of machinesMaintenance cost3*************115311281055701507186486243267612(1) 자료 읽어 산점도 그리기> AB avPlots(B.lm)추가 변수 그림을 통해 물소비량과 평균온도에 대한 선형성이 강한 것을 볼 수 있다.이는 회귀모형에 매우 유의하다는 것을 알 수 있다.(4) 분산분석표자유도제곱합평균제곱F0회귀32.046470.682223.0551잔차60.177530.02959계92.224(5) 잔차산점도 그리기PAGE \* MERGEFORMAT2
    방송통신대 | 8페이지 | 3,000원 | 등록일 2024.01.25 | 수정일 2024.02.19
  • 판매자 표지 자료 표지
    회귀모형 방송통신대 2021학년1학기 3학년 회귀모형 출석수업과제물 만점
    방송통신대 | 13페이지 | 무료 | 등록일 2022.04.10 | 수정일 2024.12.01
  • 판매자 표지 자료 표지
    방송통신대 2023년 1학기 회귀모형 출석수업과제물
    다고 할 수 있습니다. 즉, 회귀모형이 데이터에 적합하게 설명하고 있다고 판단할 수 있습니다.참고 문헌김성수, 강명욱, 강위창, “회귀모형”, 한국방송통신대학교출판문화원 ... :___________________________________________________________________________사용연도가 증가함에 따라 정비비용이 증가하는 듯한 선형성이 보이는 듯합니다. 보다 더 정확한 추정을 위해 회귀모형을 적합 ... 성을 나타내며, 이 값이 유의한 경우 회귀분석 모형이 전체적으로 의미있는 예측모형이라고 할 수 있습니다.추정된 회귀식: 정비비용 = 29.107 + 13.637 * 사용연도사용연도가 1
    방송통신대 | 15페이지 | 7,000원 | 등록일 2023.05.07
  • 30점 만점 방통대 회귀모형 2024-1학기
    출석수업 과제물(평가결과물) 표지(온라인제출용)교과목명 : 회귀모형 (2024년도 1학기)연습문제 1장2번X에 대한 Y의 회귀직선을 구하시오. 이 자료의 산점도를 그리고, 회귀직선을 산점도 위에 그려 넣으시오.파일을 불러오기 위한 경로를 설정 후, data 파일인 ex1-2.csv이 제대로 불러오기가 되었는지 read.csv()를 통해 확인하였다.1) 이를 car로 정의한 후, lm(Y ~ X, data=car)로 회귀모형 적합 후, summary()를 통해 회귀직선을 구하였다.1) 회귀직선은 y=-0.12+2.16x이다.산점도는 plot() 명령어를 사용하였으며, abline()으로 회귀직선을 산점도 안에 그려넣었다.1)분산분석표를 작성하고 회귀직선의 유의 여부를 검정하시오(유의수준 alpha=0.05 사용)분산분석표를 작성하는 명령어는 anova()이며, 유의수준 alpha=0.05 수준에서 Pr(>F) 값이 0.05보다 작으므로 귀무가설을 기각하며, 구해진 회귀직선이 유의함을 알 수 있다.1)무게가 3,000kg이 되는 차량의 에너지 소모량은 어느 정도일지 추정하시오.회귀직선은 y=-0.12+2.16x이며, x값의 단위가 1,000kg이므로 무게인 3,000kg의 차량 에너지 소모량의 추정 값은 x값에 3을 넣었을 때의 y값으로 6.36으로 6360Btu이다.5번회귀모형을 구하기 위해 lm() 명령어를 사용하였으며, 반응변수 y는 Mort, 독립변수 x는 Lat로 입력하였다.1) 적합된 회귀모형은 y=389.19-5.98x이며, Pr 값을 고려하면 기울기가 0인 귀무가설을 기각한다.연습문제 2장4번Fish.csv 데이터를 불러오기 하였으며, head(fish)로 data가 잘 불러오기 되었는지 확인하였다.1) Species의 종류를 살펴보기 위해 table() 명령어를 활용하여 Brean, Parkki, Perch, Pike, Roach, Smelt, Whitefish 총 7개임을 확인하였다.1)Bream각 종류별로 species 이름으로 data를 설정하였으며, 이 때 data인 fish에서 Species 열 중 해당 Species만 선택되도록 정의하였다.1)Bream 종에 해당하는 중회귀모형을 적합하기 위해 lm() 명령어에 반응변수 Y는 weight, 독립변수는 Length 1, Length 2, Length 3, Height, Width 로 입력하여 회귀모형을 적합하였다.1) 독립변수를 각각 X1, X2, X3, X4, X5라고 할 때, 적합된 회귀모형은 y = -939.44 + 16.19X1 + 17.97X2 - 21.19X3 + 64.20X4 + 57.05X5이다. 이 모형에 대한 결정계수 R2=0.943으로 중회귀모형이 weight의 변동을 94%정도 설명하고 있다는 것을 나타낸다. Height에 대해서는 p-value가 0.00118이므로 H0:ß4=0을 기각한다. Height은 Weight을 설명하는데 유의한 변수이다.ParkkiParkki 종에 해당하는 중회귀모형을 적합하기 위해 lm() 명령어에 반응변수 Y는 weight, 독립변수는 Length 1, Length 2, Length 3, Height, Width 로 입력하여 회귀모형을 적합하였다.1) 독립변수를 각각 X1, X2, X3, X4, X5라고 할 때, 적합된 회귀모형은 y = -195.78 + 225.59X1 - 71.86X2 - 129.76X3 + 12.55X4 + 134.42X5이다. 이 모형에 대한 결정계수 R2=0.990으로 중회귀모형이 weight의 변동을 99.0%정도 설명하고 있다는 것을 나타낸다. 이 중 ß5 인 Width에 대해서는 p-value가 0.012521이므로 H0:ß5=0을 기각한다. Width는 Weight을 설명하는데 유의한 변수이다.PerchPerch 종에 해당하는 중회귀모형을 적합하기 위해 lm() 명령어에 반응변수 Y는 weight, 독립변수는 Length 1, Length 2, Length 3, Height, Width 로 입력하여 회귀모형을 적합하였다.1) 독립변수를 각각 X1, X2, X3, X4, X5라고 할 때, 적합된 회귀모형은 y = -556.59 - 3.13X1 - 38.50X2 + 42.92X3 + 65.66X4 + 64.90X5이다. 이 모형에 대한 결정계수 R2=0.943으로 중회귀모형이 weight의 변동을 94.3%정도 설명하고 있다는 것을 나타낸다. 이 중 ß4 인 Height에 대해서는 p-value가 0.0333이므로 H0:ß4=0을 기각한다. Height은 Weight을 설명하는데 유의한 변수이다.PikePike 종에 해당하는 중회귀모형을 적합하기 위해 lm() 명령어에 반응변수 Y는 weight, 독립변수는 Length 1, Length 2, Length 3, Height, Width 로 입력하여 회귀모형을 적합하였다.1) 독립변수를 각각 X1, X2, X3, X4, X5라고 할 때, 적합된 회귀모형은 y = -1704.83 - 396.22X1 + 211.14X2 + 203.47X3 + 147.30X4 -274.95X5이다. 이 모형에 대한 결정계수 R2=0.986으로 중회귀모형이 weight의 변동을 98.6%정도 설명하고 있다는 것을 나타낸다. 이 중 ß4 인 Height에 대해서는 p-value가 0.0333이므로 H0:ß4=0을 기각한다. Height은 Weight을 설명하는데 유의한 변수이다.RoachRoach 종에 해당하는 중회귀모형을 적합하기 위해 lm() 명령어에 반응변수 Y는 weight, 독립변수는 Length 1, Length 2, Length 3, Height, Width 로 입력하여 회귀모형을 적합하였다.1) 독립변수를 각각 X1, X2, X3, X4, X5라고 할 때, 적합된 회귀모형은 y = -335.96 – 18.70X1 – 0.33X2 + 26.04X3 – 7.16X4 + 76.34X5이다. 이 모형에 대한 결정계수 R2=0.868으로 중회귀모형이 weight의 변동을 86.8%정도 설명하고 있다는 것을 나타낸다. 이 중 p-value가 유의한 독립변수는 없다.SmeltSmelt 종에 해당하는 중회귀모형을 적합하기 위해 lm() 명령어에 반응변수 Y는 weight, 독립변수는 Length 1, Length 2, Length 3, Height, Width 로 입력하여 회귀모형을 적합하였다.1) 독립변수를 각각 X1, X2, X3, X4, X5라고 할 때, 적합된 회귀모형은 y = -13.19 – 4.80X1 + 4.49X2 + 0.94X3 + 3.58X4 +3.52X5이다. 이 모형에 대한 결정계수 R2=0.982으로 중회귀모형이 weight의 변동을 98.2%정도 설명하고 있다는 것을 나타낸다. 이 중 p-value가 유의한 독립변수는 없다.WhitefishWhitefish 종에 해당하는 중회귀모형을 적합하기 위해 lm() 명령어에 반응변수 Y는 weight, 독립변수는 Length 1, Length 2, Length 3, Height, Width 로 입력하여 회귀모형을 적합하였다.1) 독립변수를 각각 X1, X2, X3, X4, X5라고 할 때, 적합된 회귀모형은 y = -2658.3 – 401.1X1 – 156.6X2 + 536.8X3 + 183.5X4 -112.5X5로 나오나, data 수가 6개이고, 독립변수 개수는 5개로 잔차 자유도가 0인 경우 ‘no residual degrees of freedom!’ 오류가 발생했다.이에 독립변수를 하나씩 제거한 회귀모형을 차례로 whitefish_reg1, whitefish_reg2, whitefish_reg3, whitefish_reg4, whitefish_reg5로 정의하여 재 실행한 결과 적합된 회귀모형 중 유의한 경우는 length2를 제외한 모형인 whitesifh_reg4이다. 회귀모형은 y = -5776.02 – 509.19X1 + 492.06X3 + 162.26X4 – 98.89X5 이다. 이 모형에 대한 결정계수 R2=0.9989으로 중회귀모형이 weight의 변동을 99.9%정도 설명하고 있다는 것을 나타낸다. 이 중 p-value가 유의한 독립변수는 없다.5번estate.csv 데이터를 불러오기 하였으며, lm() 명령어에 반응변수는 Y(house price of unit area), 독립변수는 X2(house age), X3(distance to the nearest MRT station), X4(number of convenience stores)를 +로 연결하여 입력한 후, 회귀모형을 적합하였다.1) 적합된 회귀모형은 y = 42.98 – 0.26X2 – 0.01X3 + 1.30X4 이다. 이 모형에 대한 결정계수 R2=0.541으로 중회귀모형이 Y(house price of unit area)의 변동을 54.1%정도 설명하고 있다는 것을 나타낸다. 이 중 ß2, ß3, ß4인 house age, distance to the nearest MRT station, number of convenience stores에 대해서는 p-value가 모두 0.05보다 작으므로 H0:ß2=0, H0:ß3=0, H0:ß4=0을 기각한다. House age, distance to the nearest MRT station, number of convenience stores은 집값을 설명하는데 유의한 변수이다.References김성수·강명욱·강위창 공저, 2024, R을 이용한 회귀모형, 한국방송통신대학교 출판문화원
    방송통신대 | 14페이지 | 5,000원 | 등록일 2024.12.24
  • 방통대 2021 출석대체과제물 회귀모형입니다.
    출석대체 과제물(평가결과물) 표지(온라인제출용)교과목명 : 회귀모형학 번 :성 명 :강 의 실 :연 락 처 :__________________________________________________________________________________○ 과 제 명[1장 단순회귀모형] 연습문제 1번[2장 중회귀모형 ] 연습문제 2번, 3번[1장 연습문제 1번]어떤 큰 공장에서 동일한 기계들의 정비기록에 관한 표본자료를 취하였다. 이는 기계의 사용연도(age of machines)와 정비비용(maintenance cost) 간에 어떤 관계가 있는가를 밝혀내기 위한 것으로 그 자료는 다음과 같다(표본의 크기 n=14).사용연도(단위: 년) x정비비용(단위: 1,000원) y사용연도(단위: 년) x정비비용(단위: 1,000원) y*************51055086676935726901401127018643126(1) 이 데이터의 산점도를 그려라.사용연도(age)에 따른 정비비용(cost) 산점도를 보면, 대략 직선의 관계로 사용연도가 증가하면 정비비용도 증가한다는 사실을 알 수 있다.(2) 최소제곱법에 의한 회귀직선을 적합시켜라.위의 회귀적합 결과에서 회귀계수 추정값(Coefficients: Estimate)은 절편은 29.107이고 기울기는 13.637임으로, 추정된 회귀식은 아래와 같다.hat { cost} = 29.107 + 13.637 TIMESage(3) 추정치의 표준오차 sy·x를 구하라.S _{Y BULLET X} = sqrt {MSE} = sqrt {847.2} =29.1067위의 회귀분석 결과에서 “Residual standard error: 29.11” 로 추정치의 표준오차를 확인할 수 있다.(4) 결정계수와 상관계수를 구하라.- 결정계수 R2:R ^{2} = {SSR} over {SST} = {15887} over {26053}=0.6098 결정계수 R2 값은 “Multiple R-squared: 0.6098” 로, 총변동 중에서 회귀방정식의 설명력은 60.98% 이다.- 상관계수 r :r=± sqrt {R ^{2}} =0.780897추정된 회귀선의 기울기가 양수이므로r= sqrt {R ^{2}} 으로 양의 상관계수를 가진다.(5) 분산분석표를 작성하고 회귀직선의 유의 여부를 검정하라(유의수준 α=0.05 사용).요인자유도제곱합평균제곱F0Pr(F>F0)회귀11588715887.218.7530.0009779잔차1210166847.2계1326053위의 분산분석표를 보면 F0 = 18.753이고, 이에 대한 유의수준 α=0.05에서 유의확률 p-값=0.0009779이 매우 작으므로 적합된 회귀선이 유의하다는 것을 알 수 있다.(6) 사용연도가 4년인 기계의 평균정비비용은 어느 정도인가를 추정하라.위의 추정 값 결과를 보면 사용연도가 4년인 기계의 평균 정비비용은 약 83.66*1,000원이다.(7) 잔차e_{ i}=y_{ i}-{hat{y _{ i} }} 를 구하여 잔차의 합이 영임을 확인하라.(8) 잔차들의 xi에 대한 가중합,sum _{ } ^{ } x_{ i}e_{ i} 을 구하라. (잔차 성질 확인)(9) 잔차들의{hat{y _{ i} }} 에 대한 가중합,sum _{ } ^{ } hat { Y} _{ i}e_{ i} 을 구하라. (잔차 성질 확인)(10) 두 변수 x, y를 표준화된 변수로 고친 후 회귀직선을 적합시키고, 그 회귀계수가 두 변수 x, y간의 상관계수가 같음을 밝혀라.두 변수 x, y를 표준화된 변수로 고친 후 회귀직선을 적합하였더니, 기울기가 7.809e-01 즉, 0.7809로 상관계수 r값과 같았다.[2장 연습문제 2번]어떤 공장에서 나오는 제품의 강도(kg/cm2)가 그 공정의 온도와 압력에 어떠한 영향을 받는가를 조사하기 위하여 다음의 데이터를 얻었다.공정온도(℃): X1공정압력(psi): X2강도(kg/cm2): Y195179205204201184210209576160626154586181.4122.0101.7175.6150.364.892.1113.8(1) 선형회귀모형, Y=β0+β1X1+β2X2+ε이 성립된다고 가정하고 데이터로부터 회귀모형을 추정하라.위의 데이터를 사용하여 변수 X1(temp)과 변수 X2(pressure)에 따른 Y 의 산점도를 구해보았다.중회귀모형을 적합하여 회귀분석 결과에서 추정된 회귀식은 아래와 같다.{hat{Y}} =-554.5267-0.1743 BULLET temp+11.8449 BULLET pressure이모형에 대한 결정계수는 R2 값은 “Multiple R-squared: 0.747” 로서 중회귀모형이 종속변수 strength의 총변동을 74.7%로 설명하고 있다는 것을 나타낸다.변수 temp의 t값은 ?0.228이고, 유의확률 p-값은 0.8285 으로, 유의수준 α=0.05에서 귀무가설을 기각하지 못하므로, 변수 temp는 strength를 설명하는데 큰 영향을 준다고 할 수 없다.변수 pressure의 t값은 3.662이고, 유의확률 p-값은 0.0146 으로, H0:β2=0을 기각시킨다. 따라서 변수 pressure은 strength를 설명하는데 유의한 변수라고 볼 수 있다.(2) 오차분산 σ2을 MSE로 추정하고, Var(b0), Var(b1), Var(b2)의 추정치를 구하라.- MSE의 기댓값 E(MSE) = σ2 으로 MSE는 σ2 의 불편추정량이 된다. 위의 회귀적합 결과에서sqrt {MSE}의 값은 “Residual standard error: 21.66 on 5 degrees of freedom” 로 σ의 추정치가 21.66임을 알 수 있다.- 회귀적합 결과에서 각 계수의 “Std.Error” 값의 제곱이 회귀계수의 분산 추정값이다. 따라서 Var(b0), Var(b1), Var(b2)는 각각 38898.25, 0.5831, 10.46이다.(3) X1=200℃이고, X2=59psi에서 평균 제품의 강도의 추정치{hat{Y}}는 얼마인가? 이{hat{Y}}의 분산을 추정하라.{hat{Y}} =-554.5267-0.1743 BULLET 200+11.8449 BULLET 59=109.4624위의 추정 회귀식에 따라, X1=200℃이고, X2=59psi에서 평균 제품의 강도의 추정값은 109.5(kg/cm2)이다.{hat{Y}}의 분산의 추정은 predict 함수를 사용하여 신뢰구간을 구하였다.(4) 추정된 회귀계수 b1, b2의 의미는 무엇인가?추정된 회귀식{hat{Y}} =-554.5267-0.1743 BULLET temp+11.8449 BULLET pressure 에서 추정된 회귀계수 b1=-0.1743과 b2=11.8449는 각각 변수 temp와 pressure이 변수 Y에 미치는 영향력을 의미한다. 여기서 변수 pressure의 계수 b2가 변수 temp의 계수보다 크므로 상대적으로 pressure의 영향이 더 큼을 알 수 있다.(5) 분산분석표를 작성하고 α=0.05 로 F-검정을 행하라.요인자유도제곱합평균제곱F0회귀26930.63465.37.383잔차52346.8469.36계79277.4위의 분산분석표를 보면 F-값=7.383이고, 이에 대한 유의확률 p-값=0.03218으로 유의수준 α=0.05에서 유의하게 적합된 중회귀모형이라고 할 수 있다. 참고로 F-검정의 기각치 F(2, 5; 0.05)의 값은 이므로, F0=7.383 > F(2, 5; 0.05)가 성립되어 가정된 중회귀방정식이 이 데이터를 설명하는데 유의함을 알 수 있다.(6) 결정계수 R2을 구하라.- 결정계수 R2:R ^{2} = {SSR} over {SST} = {6930.6} over {9277.4} =0.747결정계수 R2 값은 “Multiple R-squared: 0.747” 로, 종속변수 strength의 총변동 중에서 중회귀방정식의 설명력은 74.7% 이다.(7) X1, X2, Y를 모두 표준화시키고, 표준화된 중회귀방정식을 구하라.lm.beta() 함수를 사용하여 표준화된 중회귀직선을 적합한 결과에서 회귀계수 추정값은 절편은 0이고, 변수 X1, X2에 대한 표준화계수는 ?0.05499, 0.88252이다. 따라서 표준화된 중회귀방정식은 아래와 같다.{hat{Y}} =-0.05499Z_1 + 0.88252Z_2여기서 Z2의 계수가 Z1보다 크므로 상대적으로 변수 Z2 의 영향이 더 큼을 알 수 있다.[2장 연습문제 3번]어떤 공장에서 물의 소비량을 조사하기 위하여 매달의 물소비량(Y), 평균온도(X1), 작업일수(X2)와 작업량(X3)에 관한 다음의 데이터를 얻었다.물소비량(Y)(단위: 1,000톤)평균온도(X1)(단위: ℃)작업일수(X2)(단위: 일)작업량(X3)(단위: 1,000톤)2.81027643.92426723.92528804.42826883.11530813.11824453.52227463.62225693.01227543.3152539(1) 데이터로부터 회귀방정식,{hat{Y}} =b _{0} +b _{1} X _{1} +b _{2} X _{2} + b _{3} X _{3} 를 구하라. 어째서 이모형이 선택되었는가에 대하여 토의하라.회귀모형을 추정하기 전에 위의 데이터를 사용하여 변수 X1(평균온도)과 변수 X2(작업일수) 변수 X3(작업량)에 따른 Y 의 산점도를 구해보았다. 변수 X에 따른 Y의 산점도를 보면, 변수 X1(평균온도)에 따른 Y의 변화가 가장 선형에 가까웠다. 데이터의 중회귀방정식,{hat{Y}} =b _{0} +b _{1} X _{1} +b _{2} X _{2} + b _{3} X _{3} 는 아래 R을 사용하여 구해보았다.
    방송통신대 | 7페이지 | 4,000원 | 등록일 2021.05.21
  • 판매자 표지 자료 표지
    방송통신대학 2021학년도 1학기 3학년 회귀모형 기말과제 만점
    네 가지 방법에 의하여 선택된 모형을 비교해 보면, 앞으로부터 선택법과 단계별 회귀방법으로 선택된 모형은 동일한 모형을 최종 모형으로 선택한 것으로 나타났다. 두 모형 모두 변수 X5, X1, X3을 포함하는 모형을 최종 모형으로 선택하였다. 변수 X5는 서로 다른 네 가지 방법에 의하여 선택된 모든 모형에서 공통적으로 포함되어 있었다. 뒤로부터 제거법은 변수 X5, X6, X8을 포함하고 있으며, 세 개의 변수가 모두 종속변수를 유의하게 설명하고 있는 것으로 나타났다. 모든 회귀방법을 이용한 모형선택법에 의해 최종모형으로 선택된 모형은 뒤로부터 제거법에 의해 선택된 모형에서 X3을 추가한 모형이 최종적으로 선택되었다. 이 모형에서는 X5와 X8만이 종속변수를 유의하게 설명하고 있는 것으로 나타났다. > #연습문제 3 장 4 번> #install.packages("leaps")> #library(leaps)>> #1. 앞으로부터선택법> #절편만을 포함하는 모형> start.lm=lm(Y~1, data=p118)> #전체> full.lm=lm(Y~ ., data=p118)> step(start.lm, scope=list(lower=start.lm, upper=full.lm), direction="forward")Start: AIC=115.94Y ~ 1 Df Sum of Sq RSS AIC+ X5 1 847.73 278.32 73.217+ X1 1 817.71 308.33 76.494+ X2 1 808.89 317.16 77.397+ X3 1 678.37 447.67 88.427+ X4 1 522.48 603.57 97.988+ X7 1 496.53 629.52 99.335+ X8 1 405.15 720.90 103.672+ X10 1 341.78 784.27 106.369
    방송통신대 | 46페이지 | 무료 | 등록일 2022.04.10 | 수정일 2024.12.01
  • 방송통신대학교 통계데이터학과) 회귀모형 출석과제물 (30점 만점 A+)
    ..FILE:mimetypeapplication/hwp+zip..FILE:version.xml..FILE:Contents/header.xml^1.^2.^3)^4)(^5)(^6)^7^8^1.^2.^3)^4)(^5)(^6)^7^8..FILE:BinData/image1.png..FILE:BinData/image2.bmp..FILE:BinData/image3.png..FILE:BinData/image4.png..FILE:BinData/image5.png..FILE:BinData/image6.png..FILE:BinData/image7.png..FILE:BinData/image8.png..FILE:BinData/image9.png..FILE:BinData/image10.png..FILE:BinData/image11.png..FILE:BinData/image12.png..FILE:BinData/image13.png..FILE:Contents/section0.xml회귀모형 출석과제물 (2024학년도)(줌강의: 4/28)학과: 통계데이터학과이름: 오 영 택학번: 202435-368368출석대학: 서울지역대학(강의실: ZOOM 7)1장 연습문제2. 자동차의 무게가 무거우면 이를 움직이는 데 더 많은 연료가 소모된다는 것은 알려진 사실이다. 자동차의 무게와 자동차를 1km 움직이는 데 필요한 에너지의 양과의 함수관계를 정확히 판단하기 위하여 A 자동차회사는 다음의 자료를 실험을 통하여 얻었다. 실험비용이 많이 드는 관계로 9번만 실험하였다.1)수식입니다.x에 대한수식입니다.y의 회귀직선을 구하시오. 이 자료의 산점도를 그리고, 회귀직선을 산점도 위에 그려 넣으시오.답:R코드:> setwd("C:/R")> read.csv("C:/R/regdata/연습문제/ex1-2.csv")x y1 0.9 2.02 1.3 2.63 2.1 4.34 2.5 5.85 2.4 5.16 1.7 3.27 0.7 1.88 1.2 2.39 1.6 3.0> car energy summary(energy)Canecticut 41.8 159 1 72.8> skin_lm summary(skin_lm)Call:lm(formula = Mort ~ Lat, data = skin)Residuals:Min 1Q Median 3Q Max-38.972 -13.185 0.972 12.006 43.938Coefficients:Estimate Std. Error t value Pr(>|t|)(Intercept) 389.1894 23.8123 16.34 < 2e-16 ***Lat -5.9776 0.5984 -9.99 3.31e-13 ***---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1Residual standard error: 19.12 on 47 degrees of freedomMultiple R-squared: 0.6798, Adjusted R-squared: 0.673F-statistic: 99.8 on 1 and 47 DF, p-value: 3.309e-13그림입니다.원본 그림의 이름: 스크린샷 2024-05-15 140452.png원본 그림의 크기: 가로 756pixel, 세로 587pixel위 결과에 따른 회귀추정식은수식입니다.y= 5.98수식입니다.x+ 389.19 이다.해석:위도(Latitude)에 대한 회귀계수는 5.9776이고 절편은 389.1894이다. 회귀계수는 위도(Latitude)가 한 단위씩 증가하면 피부암 사망자 수는 평균적으로 약 5.98명 감소한다는 것을 의미한다. 따라서 위도가 높아질수록 피부암 사망자 수가 감소하는 경향이 있음을 의미한다. 이는 햇빛에 대한 노출이 피부암 발생에 영향을 미칠 수 있음을 시사한다. 분산분석표에 의한 F-검정에 따르면, 위 결과에서 F-검정통계량 99.8에 대한 유의확률(p-value)이 유의수준 0.05보다 매우 작으므로 적합된 회귀방정식이 유의하다는 것을 알 수 있다. 결정계수(multiple R-squared)는 0.6798로, 총변동 중에서 67.2})는 강도를 설명하는데 유의미한 영향을 준다고 할 수 있다.2) 오차분산수식입니다.sigma ^{2}을 MSE로 추정하고,수식입니다.Var(수식입니다.{hat{beta _{0}}}),수식입니다.Var(수식입니다.{hat{beta _{1}}}),수식입니다.Var(수식입니다.{hat{beta _{2}}})의 추정값을 구하시오.답:그림입니다.원본 그림의 이름: 스크린샷 2024-05-16 125409.png원본 그림의 크기: 가로 691pixel, 세로 647pixel위를 통해, 추정값의 표준오차수식입니다.sqrt {MSE}= 21.66로서수식입니다.sigma의 추정값이 21.66임을 알 수 있다.또한, (수식입니다.Var( {hat{beta }} )`=(X`'X) ^{-1} sigma ^{2} =(X`'X) ^{-1} MSE식을 통해서수식입니다.Var( {hat{beta _{0}}} ),수식입니다.Var( {hat{beta _{1}}} ),수식입니다.Var( {hat{beta _{2}}} )값을 구할 수 있다.R코드:> X=strength[, c(1,2)]> X=cbind(1, X)> X=as.matrix(X)> Y=strength[,3]> Y=as.matrix(Y)> XTX=t(X)%*%X> XTXI=solve(XTX)> XTXI1 X1 X21 82.8749894 -0.134598917 -0.945973490X1 -0.1345989 0.001242266 -0.001887521X2 -0.9459735 0.001887521 0.022285408> anova(strength_lm)Analysis of Variance TableResponse: YDf Sum Sq Mean Sq F value Pr(>F)X1 1 634.9 634.9 1.3526 0.29730X2 1 6295.7 6295.7 13.4133 0.01456 *Residuals 5 2346.8 469.4---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.107이므로,수식입니다.t(n-k-1; alpha /2) sqrt {x`'(X`'X) ^{-1} xMSE}= 20.17265수식입니다.t(n-k-1; alpha /2)=수식입니다.t(8-2-1;0.05 /2)=수식입니다.t(5,`0.025)= 2.570582 [R 코드: qt(0.975, 5)]따라서,수식입니다.sqrt {x` prime (X` prime X) ^{-1} xMSE}= 20.17265 / 2.570582 = 7.8475즉,수식입니다.Var( {hat{Y}} )=Var(x prime {hat{beta }} )`=`x prime Var( {hat{beta }} )x`=`x prime (X` prime X) ^{-1} x sigma ^{2}=수식입니다.x`'(X`'X) ^{-1} xMSE=수식입니다.( sqrt {x` prime (X` prime X) ^{-1} xMSE} ) ^{2}= (7.8475)^2 = 61.583따라서,95% 신뢰구간에서수식입니다.{hat{Y}}의 분산 추정값은 61.583이다.* 99% 신뢰구간에서의수식입니다.{hat{Y}}의 분산 추정값은 위와 같은 방법으로 구했을 때,R코드:> pred_x = data.frame(X1=200, X2=59)> pc99 = predict(strength_lm, int="c", level=0.99, newdata=pred_x)> pc99fit lwr upr1 109.4681 77.82585 141.1104수식입니다.E(Y)=수식입니다.{hat{Y}}수식입니다.+-수식입니다.t(n-k-1; alpha /2) sqrt {x` prime (X` prime X) ^{-1} xMSE}= 109.4681수식입니다.+-수식입니다.t(n-k-1; alpha /2) sqrt {x` prime (X` prime X) ^{-1} xMSE}= [77.82585, 141.1104]즉, 109.4681 -수식입니다.t(n-k-1; alpha /2) sqrt {x` prime (X` prime X) ^{-1} xMSE}=68 -3.781 -17.789Coefficients:Estimate Standardized Std. Error t value Pr(>|t|)(Intercept) -554.52670 NA 197.22638 -2.812 0.0375X1 -0.17427 -0.05499 0.76359 -0.228 0.8285X2 11.84488 0.88252 3.23418 3.662 0.0146(Intercept) *X1X2 *---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1Residual standard error: 21.66 on 5 degrees of freedomMultiple R-squared: 0.747, Adjusted R-squared: 0.6459F-statistic: 7.383 on 2 and 5 DF, p-value: 0.03218그림입니다.원본 그림의 이름: 스크린샷 2024-05-16 013432.png원본 그림의 크기: 가로 760pixel, 세로 786pixel이를 통해 적합된 표준화 회귀계수 모형은수식입니다.{hat{Y}} ^{*}= -0.05499수식입니다.Z _{1}+ 0.88252수식입니다.Z _{2}가 된다. 여기서수식입니다.X _{1}의 표준화계수가수식입니다.X _{2}의 표준화계수보다 작으므로 상대적으로수식입니다.X _{2}의 영향이 더 큼을 알 수 있다.5. 다음은 거래된 집값에 대한 자료의 일부이다. 독립변수 (수식입니다.X _{2},수식입니다.X _{3},수식입니다.X _{4})를 이용하여 집값수식입니다.Y를 추정하고자 한다. 회귀모형식을 적합하고 결과를 설명하시오.X1 transaction dateX2 house ageX3 distance to the nearest MRT stationX4 number of convenience storesX5 latitudeX6 longtitudeY house price of unit area그림입니다.원본 그림의 이름: 스크린샷 20다.
    방송통신대 | 15페이지 | 5,000원 | 등록일 2024.12.11
  • 판매자 표지 자료 표지
    (방송대) 회귀모형, 출석수업 과제물 (2023 1학기, 30점 만점)
    출석수업 과제물 평가결과물 표지 온라인제출용교과목명학 번성 명강 의 실 zoom연 락 처__________________________________________________________________________________1. 연습문제 1장 1번(p. 39) 자료를 이용하여 1.7 분석사례와 같이 분석하고, 설명하시오.(참고: 교재 수정 p.37 p.x = data.frame(price=c(1:45))연습문제 1장 1번의 자료를 메모장을 활용해 machine.txt 파일로 만들었다.[그림1] 메모장에 수집한 데이터machine.txt 파일의 자료를 아래 [그림2]와 같이 read.table함수를 통해 R로 불러왔고, 해당 자료를 활용해 산점도를 그렸다.[그림2] 메모장의 파일을 R로 불러와 산점도를 그리는 코드- 1 -[그림3] 사용연수와 정비비용 간의 산점도[그림3]의 산점도를 통해 사용연수가 증가함에 따라 정비비용도 증가함을 확인할 수 있다. 따라서 단순회귀직선이 타당하다. lm()함수를 통해 단순회귀모형을 생성하고 회귀모형을 적합하였다.[그림4] 회귀모형 적합 결과회귀모형 적합 결과는 [그림4]와 같다. 회귀계수의 추정값은 절편  =29.107이고, 기울기  =13.637로단순회귀방정식은cos = 29.107 + 13.637 * year- 2 -가 된다. 기울기에 대한 t-값이 4.330이고, p값은 0.000978로 매우 작으므로 =0이라는 귀무가설을 기각한다. 결정계수  =0.6098로 총변동 중에서 60.98%가 회귀방정식으로 설명되는 회귀변동이 차지하고 있다는 것을 나타낸다. F값은 18.75이고, 이에 대한 p값=0.0009779로 적합된 회귀 직선이 유의하다고 판단할 수 있다. 회귀방정식이 유의한가에 대한 검정은 분산분석표에 의한 F검정으로 이루어진다. 다음은anova함수를 활용하여 도출한 분산분석결과이다.[그림5] 회귀 모형에 대한 분산 분석검정통계량 F값은 18.753이고, 이에 대한 유의확률인 p값은 0.0009779로 적합된 회귀선은 유의하다고할 수 있다.각 케이스에서 잔차 및 추정값을 출력하기 위한 방법은 아래와 같다. 여기에서 names(machine.lm)은회귀적합 결과 변수를 알아보기 위한 함수이다. cbind를 통해 변수를 결합해 잔차와 추정값을 출력하였다.[그림6] 잔차 및 추정값 출력- 3 -아래 코드를 통해 잔차를 독립변수 year에 대해 그려보았다.plot(machine$year, machine.lm$resid, pch=19)abline(h=0, lty=2)잔차는 0을 중심으로 대체로 랜덤하게 분포하기 때문에 이 회귀 모형은 적합하다고 판단할 수 있다.[그림7] 잔차그림아래 코드를 통한 추정값에 대한 기댓값의 신뢰대 그림은 [그림8]과 같다.p.x = data.frame(year=c(1:12))pc = predict(machine.lm, int="c", newdata = p.x)pred.x=p.x$yearplot(machine$year, machine$cost, ylim = range(machine$y, pp))matlines(pred.x, pc, lty=c(1,2,2), col="BLUE")- 4 -[그림8] 신뢰대2. 연습문제 2장 3번(p. 87) 자료를 이용하여 2.8 분석사례와 같이 분석하고, 설명하시오.어떤 공장에서 물의 소비량을 조사하기 위해 얻은 물소비량(water), 평균온도(temp), 작업일수(wday),작업량(wload) 데이터를 그림과 같이 엑셀파일로 저장하였다.[그림9] 엑셀에 저장한 연습문제 데이터엑셀 파일을 R로 불러와 읽기 위해 xlsx 패키지를 설치하여 waterconsumtion변수에 저장하였다. 불러온 코드와 데이터는 [그림10], [그림11]과 같다.- 5 -[그림10] 엑셀 데이터를 R로 불러오는 코드[그림11] waterconsumtion 데이터summary()함수를 통해 분석에 이용되는 변수들의 기술통계량을 확인하고 cor()함수를 통해 독립변수인 평균온도, 작업일수, 작업량과 종속변수인 물소비량 간의 상관관계를 파악하였다. 상관계수 분석을통해 평균온도와 물소비량 간의 상관 계수가 0.9493으로 가장 높다는 것을 파악할 수 있었다.[그림12] 물 소비량 데이터의 기술통계량과 각 변수간 상관관계- 6 -lm()함수를 통해 회귀 모형을 적합하였다. 적합한 회귀모형은 [그림13]과 같다.[그림13] 회귀모형 적합 결과R결과를 통해 나타난 회귀방정식은 다음과 같다.= 2.4092 + 0.0698*temp – 0.0248*wday + 0.0059*wload이 모형에 대한 결정계수   = 0.8803으로 중회귀모형이 종속변수 water(물소비량)의 총 변동을88%정도 설명하고 있다는 것을 나타낸다. 또한, 추정값의 표준오차가 0.172로서 σ의 추정치가 0.172임을 알 수 있다.변수 temp(평균 온도)의 t값은 5.521이므로 유의 확률 p값=0.001임을 보여준다. 따라서 변수 temp는귀무가설을 기각시킬 수 있다. 즉, 변수 temp는 종속변수 water를 설명하는데 유의한 변수 임을 알 수있다.변수 wday(작업일수)의 t값은 –0.552이므로 유의확률 p값=0.601임을 보여준다. 따라서 변수 wday는귀무가설을 가각하지 못한다. 즉, 변수 wday는 종속변수 water를 설명하는데 큰 영향을 미치지 못한다.변수 wload(작업량)의 t값은 1.161이므로 유의확률 p값=0.290임을 보여준다. 따라서 변수 wload는귀무가설을 기각하지 못한다. 즉, 변수 wload는 종속변수 water를 설명하는데 큰영향을 미치지 못한다.이와 같은 사실은 [그림14]의 추가변수그림에서도 알 수 있다. 변수 temp에 대한 추가 변수 그림이 선형성이 강한 것을 보아 이 변수가 회귀 모형에 유의하다는 사실을 알 수 있다.- 7 -[그림14] 물 소비량 데이터의 추가 변수 그림이 회귀모형의 분산분석결과는 다음과 같다.이 결과에서 [표1]과 같은 분산분석표를 정리할 수 있다.요인회귀잔차계자유도제곱합2.04650.17752.224평균제곱0.68223623.04730.029611[표1] 회귀모형의 분산분석표- 8 -분포의 자유도가 (3,6)이므로 유의수준 0.05하에서의 임계값은 4.76이다. 따라서 F통계량이 23.05이기 때문에 귀무가설을 기각할 수 있다. 따라서 중회귀모형은 유의하다고 할 수 있다.독립변수 temp, wday, wload 와 water의 추정값과 잔차간의 관계를 그리기 위한 산점도는 그림과같다. temp에 대한 산점도는 대체적으로 랜덤하게 퍼져있어, 사용된 중회귀모형이 적절하다고 판단할수 있다.[그림16] temp에 대한 잔차 산점도wday에 대한 산점도는 x축이 증가할수록 y축이 감소하는 방향으로 분포가 생겼다. 분산이 일정하지않다고 판단할 수 있으므로 가중회귀를 쓰거나 종속변수를 변환시켜 회귀분석하는 것이 바람직하다.[그림17] wday에 대한 잔차 산점도wload에 대한 산점도는 작업량이 증가할 때 잔차가 2차곡선 모양을 갖는 것처럼 보인다. 이 경우에는독립변수의 제곱항을 추가하는 것이 해결방법이 될 수 있다.- 9 -[그림18] wload에 대한 잔차 산점도- 10 -
    방송통신대 | 10페이지 | 4,000원 | 등록일 2024.03.10
  • [30점 만점] 회귀모형 통계학과 방송대 출석 대체 과제물
    (본 과제는 MacOS 환경 및 주피터노트북(Jupyter Notebook) IDE 환경에서 실습 및 실행되었습니다.)1장 1번준비 단계 – 데이터 프레임 생성코드 age
    방송통신대 | 16페이지 | 5,000원 | 등록일 2020.11.10
  • 방통대) 회귀모형 출석대체 과제물 (A+받은 자료, 코드있음)
    『온라인 제출용 출석수업대체과제물 표지』2020 학년도 ( 1 )학기 출석수업대체과제물○ 과 제 명 : 회귀모형 출석 대체 과제물1. 1장-1번1-(1) plot(cost$x,cost$y,xlab="사용연도(x)", ylab="정비비용(y)",pch=19)[그림 1 ][그림 2 ]1-(2)(이 결과 중 회귀계수의 추정값은 coefficients: Estimate에서 볼 수 있다.추정된 회귀식은hat{y} =29.107+13.637X 이다.산점도에 회귀직선을 그리면 [그림2]와 같다.1-(3)잔차평균제곱 MSE는sigma ^{2}의 불편추정량으로, 추정값의 표준오차S_{ Y BULLETX }는 다음과 같다.S _{Y BULLET X}= sqrt { MSE}= sqrt { { SSE} over {n-2 } }= sqrt { 847.2}=29.111-(4) 결정계수R^{ 2}은 다음과 같이 구할 수 있다.R^{ 2}= { SSR} over {SST }=1- { SSE} over {SST }= { 15887} over {26053 }=0.6098이는 총변동 중에서 회귀직선에 의하여 설명되는 부분이 61%라는 의미이다.상관계수 r은 추정된 회귀선의 기울기가 13.637로 양의 값을 가지므로 다음과 같이 구할 수 있다.sqrt { R ^{2} } = sqrt { {SSR} over {SST}} = sqrt { 1- {SSE} over {SST} } = sqrt { {15887} over {26053} } = sqrt {0.6098} =0.7808941-(5) R을 통해 분산분석표를 정리하면 다음과 같다.요인자유도제곱합평균제곱F_{ 0}Pr(F>F_{ 0})회귀잔차1121*************7.2847.218.7530.0009779계1326053유의수준alpha=0.05에서 F-기각역(1, 12; 0.05)의 값은>qf(0.95, 1, 12)= 4.747225 이다.F_{ 0}=18.753>F(1, 12; 0.05)=4.75 이므로, 귀무가설H_{ 0}: beta _{769963*10 ^{ -15}로 0이다.1-(9)잔차들의hat{y} _{i}에 대한 가중합은sum _{} ^{} hat { y} _{i} e _{i}=sum _{} ^{} (b _{0} +b _{1} X _{i} )e _{i} =b _{0} sum _{} ^{} e _{i} +b _{ 1} sum _{} ^{} X _{i} e _{i} 로앞서 구한 값에서 잔차의 합sum _{} ^{} e _{i} =0, 잔차들의x_{ i}에 대한 가중합sum _{} ^{} X _{i} e _{i}=0 이므로잔차들의hat{y} _{i}에 대한 가중합은sum _{} ^{} hat { y} _{i} e _{i}=0이다.1-(10) r을 통해 표준화한 x, y에 대한 회귀직선은 y=0.7809x +0임을 알 수 있다.2. 1장-5번(1) 앞의 회귀곡선hat{y} =29.107+13.637X 에서의 주어진 X에서 Y의 기댓값을E(Y) = mu _{ y BULLETx }라고 하면,mu _{ y BULLETx }= beta _{ 0}+ beta _{ 1}X가 성립된다. n개의 관찰점(X_{ i},Y _{ i}) 에서 적합된 회귀직선을hat { Y}=b _{ 0}+b _{ 1}X 라고 하자.(hat{Y} =mu _{ y BULLETx },b_{ 0}= beta _{ 0},b_{ 1}= beta _{1})회귀계수 기울기beta _{ 1}에 대한 추정량beta _{ 1}= { sum _{ } ^{ } (X _{ i} - bar { X}) ( Y _{ i} - bar { Y})} over { sum _{ } ^{ } (X _{ i} - bar { X}) ^{ 2} }은 표본으로부터 추출된 것으로 기댓값(E(b_{ 1})) 과 분산(Var(b_{ 1}))을 가진다.E(b_{ 1})=beta _{ 1}, Var(b_{ 1})={sigma ^{2}} over {sum _{} ^{}\(X _{ i}- bar {X}) ^{ 2}}sigma ^{ 2}의 추정값은 MSE에 의해 구해지므로b_{ 1}의 분산의 신뢰구간은hat { Y} +-t(n-2; alpha/2) sqrt { { MSE( { 1} over { b}+ { (bar { X}- bar { X} ) } ^{ 2} over { S _{ XX} } )} }으로mu _{ y BULLETx } =[113.8313, 162.5767] 이다.(2)유의수준alpha=0.01에서 F-기각역(1, 12; 0.01)의 값은>qf(0.99, 1, 12)= 9.330212 이다.F_{ 0}=18.753strength=data.frame()>fix(strength)>X=strength[,c(1:2)]>X=cbind(1,X)>Y=strength[,3]>X=as.matrix(X)>Y=as.matrix(Y)>XTX=t(X)%*%X>TXI=solve(XTX)>XTY=t(X)%*%Y>beta=XTXI%*%XTY>beta=round(beta,3)>beta따라서hat {Y } = hat { beta _{0} }+ hat {beta _{1} } X _{1} + hat { beta _{2}} X _{2} =-554.53-0.174 X1+11.845 X2 가 된다.3-(2) 오차분산sigma ^{2} (Var( epsilon )) 를 MSE로 추정 할때, R에서 anova 함수를 이용해 만든 표 1에 따라, 오차 분산sigma ^{2}의 평균= MSE =469.4 임을 알 수 있다.3-(3)X_{ 1}=200℃이고X_{ 2} =59 psi에서평균 제품의 강도의 추정치hat { Y}의 값은 109.4681 값을 가지며, 95%신뢰구간은 [89.29545, 129.6407] 로 다음과 같이 R을 통해 구할 수 있다.hat { Y}의 분산을 추정하면Var(hat { Y})=x'(X'X) ^{ -1}x sigma ^{ 2}=0.1312068로 다음과 같이 R을 통해 구할 수 있다.3-(4) b1 은 X1의 회귀계수, b2는 X2의 회귀계수로,b1은 X2값을 고정할 때, X1 증가에 따른 Y의 증가량,b2는 X1을 고정할 때, X2의 증가에 따른 Y 같다.Y_{ i} ^{ *}= { Y _{ i}- bar {Y} } over { sqrt { S _{ YY} } },Z_{ ij} = { X _{ i}- bar {X} } over { sqrt { S _{ jj} } }표준화된 변수Y_{ i} ^{ *},Z_{ ij} 로 이루어진 중회귀모형을 R을 통해 구하면X_{ 1},X_{2} 의 표준화계수는?0.05499279, 0.88251635 이다.= ?0.05499279 1 + 0.88251635 24. 2장-3번4-(1) 회귀방정식을 R을 통해 구하면 다음과 같다.위를 통해 X2, X3의 회귀계수가 유의하지 않으므로따라서 회귀방정식은hat{Y} =1.955187+0.078786X1 이다.4-(2)b1은 X2, X3가 고정 되었을 때 X1의 변화에 따른 Y의 변화 값을 나타낸다.b2는 X1, X3가 고정 되었을 때 X2의 변화에 따른 Y의 변화 값을 나타낸다.b3은 X1, X2가 고정 되었을 때 X3의 변화에 따른 Y의 변화 값을 나타낸다.4-(3) 앞의 summary(w1.lm) 을 통해 =0.9202 임을 알 수 있다.요인자유도제곱합평균제곱F_{ 0}Pr(>F)회귀잔차182.004320.219682.004320.0274672.9892.713e-05계99277.44-(4) (X1=20, X2=27, X3=60) 일때 E(hat{Y}) 는 다음과 같이 구할 수 있다. E(hat{Y}) =3488.141 ton5. 3장-3번5-(1) Y = 9.94408 + 0.06428 9 ? 0.07405 1 ? 0.10510 4 + 0.79736 8 ? 0.77443 12>start.lm=lm(Y~1, data=acc)>full.lm=lm(Y~.,data=acc)>step(start.lm,scope=list(lower=start.lm, upper=full.lm), direction="forward")5-(2) Y = 9.94408 ? 0.07405 1 ? 0.10510 4 + 0.79736 8 + 0.06428 9 ? 0.7514970.23569714X1, X4, X8, X90.71756330.68433540.48523395X1, X4, X8, X9, X120.74503800.7064074-0.38301706X1, X3, X4, X8, X9, X120.75208450.70560030.88136107X1, X3, X4, X8, X9, X12, X130.75617260.70111482.45458138X1, X3, X4, X7, X8, X9, X12, X130.75791450.69335834.27273575-(5)앞으로부터 선택법을 이용한 경우 변수(X9, X1, X4, X8. X12) 을 사용하였고뒤로부터 제거법을 이용한 경우 변수(X1, X4, X8, X9, X12) 을 사용하였고단계별 회귀방법을 이용한 경우 변수(X9, X1, X4, X8, X12) 을 사용하였고모든 회귀방법을 이용한 경우 변수(X1, X4, X8, X9, X12) 을 사용하였다.6. 3장-4번>motor=read.csv("C:/R/p118.csv", header=T)>motor.lm=lm(Y~X1+X2+X3+X4+X5+X6+X7+X8+X9+X10, data=motor)6-(1) Y = 38.75179 ? 3.16697 5 ? 0.94162 1 ? 0.01804 3>start.lm2=lm(Y~1, data=motor)>full.lm2=lm(Y~.,data=motor)>step(start.lm,scope=list(lower=start.lm2, upper=full.lm), direction="forward")6-(2) Y = 9.618 ? 3.917 5 + 1.226 6 + 2.936 8>step(full.lm2, data=motor, direction="backward")6-(3) Y = 38.75179 ? 3.16697 5 ? 0.94162 1 ? 0.01804 3>step(start.lm2,scope=list(upper=full.lm2), data=motor, direction="both")6-(4) Y = 9
    방송통신대 | 10페이지 | 3,000원 | 등록일 2020.08.04 | 수정일 2020.08.07
  • 방통대 정보통계학과 회귀모형 기말 대체 과제물 (A+받은 과제입니다, 코드 있음)
    2020학년도 1학기 기말시험(온라인평가) 제출용?과제명:회귀모형1. 다음 표는 62종의 동물에 대한 평균 두뇌무게와 몸무게를 나타낸다. 두뇌무게를 몸무게의 함수로 보고 함수관계를 찾고자 한다.번호동물이름몸무게(kg)두뇌무게(g)1Arctic fox3.38544.52Owl monkey0.4815.53Mountain beaver1.358.14Cow4654235Gray wolf36.33119.5...............................................................................................................58Brazilian tapir16016959Tenrec0.92.660Phalanger1.6211.461Tree shrew0.1042.562Red fox4.23550.4(1) 두뇌무게를Y`로 놓고 몸무게를X`로 하여Y`와X`의 산점도와 잔차산점도를 그리고 이를 논하라. 변수에 대한 변환이 필요한지, 그리고 필요하면 그 이유는 무엇인지 논하라.산점도잔차산점도코드A=read.csv("C:/R/animal.csv", header=F)attach (A)plot(bwt, br, pch=20)plot(bwt, A.lm$resid, pch=19)abline(h=0, lty=2)회귀모형에서 얻어진 MSE(i)를 사용한 표준화 잔차값(스튜던트화 잔차) 는 자유도가 n-k-2인 t-분포가 따르며,+-2보다 크면 이상치일 가능성이 높다. Bonferonni t 검정을 통해 특이값 검정을 해 보면 다음과 같이 18,33,32 번에서 bonferroni pA$logbwt A$logbr A.log=cbind(A,A$logbwt,A$logbr)>A.log.lm=lm(A$logbr~A$logbwt, data=A.log)회귀식을 구하면 다음과 같다. Y=0.75169X+2.13479기울기에 대한 t-값=26.41 이고 p-값=2X10-16 이므로 귀무가설(H_{ 0}: beta _{ 1}=0)을 기각한다.결정합된 회귀선이 유의하다.2. 다음은 자동차들의 연비(1 갤론당 주행 마일)를 알아보기 위하여 예상되는 열 개의 설명변수를 얻은 자료이다. (자료파일 : www.knou.ac.kr/~sskim의 자료실 autodata.csv )Y`:연비(mile/gallon)X_1 `:실린더의 수X_2 `:배기량X_3 `:마력X_4 `:최종구동장치비(최종기어비)X_5 `자동차 무게X_6 `:순간가속도X_7 `:엔진형태 (0: V자형, 1: 직선형)X_8 `:기어의 종류 (0: 자동, 1: 수동)X_9 `:기어속도의 수X_10 `:기화기의 수Y`X _{1} `X_2 `X_3 `X_4 `X_5 `X_6 `X_7 `X_8 `X_9 `X_10 `21.06160.01103.902.62016.46014421.06160.01103.902.87517.02014422.84108.0933.852.32018.61114121.46258.01103.083.21519.44103118.78360.01753.153.44017.02003218.16225.01052.763.46020.221031.........................................................................................................................................19.76145.01753.622.77015.50015615.08301.03353.543.57014.60015821.44121.01094.112.78018.601142(1) 앞으로부터 선택법을 이용하여 최적모형을 구하라.>start.lm=lm(Y~1, data=Au)>full.lm=lm(Y~.,data=Au)>step(start.lm,scope=list(lower=start.lm, upper=full.lm), direction="forward")Y =38.75179 - 0.94162 X1-0.01804 X3-3.16697 X5(2) 뒤로부터 제거법을 이용하여 최적모형을 구하라.>.>step(start.lm,scope=list(upper=full.lm), data=Au, direction="both")Y = 38.75179 -0.94162 X1 -0.01804 X3 -3.16697 X5(4) 위의 세 가지 방법에 의하여 선택된 모형을 비교하라.앞으로부터 선택법을 이용한 경우 각 변수 중 반응 변수와 가장 상관관계가 높은 변수를 선택 후 유의성 검정을 한다. 여기에 나머지 설명변수를 하나씩 추가한 후 각 모형에서 추가된 설명변수에 대한 AIC가 가장 작은 설명변수가 선택되며, 이는 미리 정해진 유의 수준에 의해 유의성 검정을 할 때, 검정의 결과가 유의하지 않을 때까지 설명변수를 추가한다. 여기서 X5가 가장 먼저 선택되었고, X1, X3 순으로 추가되었다.뒤로부터 제거법을 이용한 경우 각 설명변수를 모두 포함하는 중회귀모형을 적용시킨 후 각각의 설명변수를 제거할 때 AIC를 계산하여, 가장 작은 값을 갖는 변수를 유의성 검정을 통해 유의하지 않으면 제거하는 방법을 반복한다. 여기에서는 X1, X7, X10, X9, X4, X2, X3 순으로 제거되어 변수 X5, X6, X8만 남았다.단계별 회귀방법을 이용한 경우 앞으로부터 선택법에서 일단 선택된 설명변수는 새로운 설명변수가 포함되어 중요도가 상실되더라도 제거될 수 없는 단점을 보완한다. 가령 앞으로부터의 선택법에서는 X1이 선택되었으나, 뒤로부터 제거법을 이용한 경우 X1은 선택되지 않았다. 이는 처음에 선택된 후에는 제거되지 못한다는 점 때문에 발생한 것이다. 이런 문제점은 뒤로부터 제거법을 이용한 경우에서도 마찬가지로 나타난다.단계별 회귀방법은 이를 보완한 것으로 변수들 중 가장 반응변수를ㄹ 잘 설명하는 변수를 선택 후 , 앞으로부터 선택법처럼 나머지 설명변수를 하나씩 추가시킨 후 유의하면 추가시키고 유의하지 않으면, 현재 모형에 포함되어있는 각가의 설명변수에 대해 유의성 검정을 통해 유의하지 않은 설명변수를 제거한다.여기서는 변수(X1, X3, X5) 가 채택되었다.3. 한 대학 1=조교수, 2=부교수, 3=정교수, 최종학위변수에서는 0=석사, 1=박사, 성별(SEX)변수에서는 1=여자, 0=남자로 기록하였다.(자료파일 : www.knou.ac.kr/~sskim의 자료실 pfsalary.csv )(1) 성별을 표시하는 기호를 이용하여 월급액과 근속연수에 대한 산점도를 그려라.(2) 월급액에 대하여 근속연수와 성별을 설명변수로 하는 회귀모형을 구하라.성별은 질적자료로 인자변수를 설정하여 모형을 만든다. #YR과 SEX를 factor 변수로 바꾸기attach(pf)#숫자변수를 인자변수로pf$SEX=factor(pf$SEX, levels=c(0,1), label=c("Male","Female"))#남녀의 차이를 알아보기 위해 선형회귀식을 만들면Y= beta _{ 0}+beta _{ 1}x+beta _{ 2}SEX+ epsilon#남자의 경우 SEX=0이므로Y= beta _{ 0}+beta _{ 1}x+epsilon#여자의 경우 SEX=1이므로Y= beta _{ 0}+beta _{ 1}x+beta _{ 2}+ epsilon위 두 회귀선의 절편에서beta _{ 2}만큼 차이가 나므로Y= beta _{ 0}+beta _{ 1}x+beta _{ 2}SEX+ epsilon에서H_{ 0}: beta _{ 2}=0를 기각하는 경우 성별에 따른 월급에 차이가 난다고 할 수 있다.pf.lm=lm(SL~YR+SEX, data=pf)summary(pf.lm)이 결과 적합된 회귀모형은 다음과 같다.hat { Y}=18065.4+759YR+201.5SEX따라서 기울기가 동일하다고 가정하는 경우 회귀모형 적합에서 두 성별에 따른 차이는 201.5가 됨을 알 수 있다.(3) (2)의 결과에 의하면 성별에 따라 월급액과 근속연수의 관계가 다르다고 할 수 있는가를 설명하라.지시변수 SEX와 월급 SL에서 일어나는 교호작용을 반영하는 XSEX변수를 포함하면Y= beta _{ 0}+beta _{ 1}X+beta _{ 2}SEX+ beta _{3}XSEX+ epsilon남자on기울기의 동질성 여부를beta _{ 3}=0에 대한 F-검정을 통해 시행하면,교호작용항의 경우, 회귀계수의 추정값은 169.1이고,t_{ 0}값에 대한 유의 확률은 0.664로서 유의수준 0.05보다 크므로 유의하지 않다. 따라서 성별에 따라 월급액과 근속연수의 관계가 다르다고 할 수 없다.(4) 월급액에 대한 근속년수의 회귀모형에 성별, 직위, 최종학력을 포함시킨 경우와 포함시키지 않는 경우를 비교하는 검정을 실시하라.성별, 직위, 최종학력을 포함시키고 구한 회귀 제곱합이 포함시키지 않은 회귀제곱합에 비해 얼마나 커졌는지 확인하면,p value 유의한 차이가 있다.(5) 월급액을 반응변수로 하는 최적모형을 유도하고 성별에 의한 월급액의 차이가 있는 지 여부를 판단하라.단계별 회귀방법을 통해 최적 회귀모형을 찾아보면 다음과 같다.각각의 설명변수에 유의성 검정을 했을 때 가장 월급을 잘 설명하는 변수는 RK(직위)이며, 그 다음으로 월급을 잘 설명하는 변수는 YR(근속연수) 이다. 그 외에 유의성 검정에서 탈락되는 변수로는 SEX(성별). YD(최종학위) 이다. 따라서 성별에 따른 월급 차이는 유의하지 않음을 알 수 있다.4. 교재 249페이지 연습문제 3번표7.5를 적용하면read.table("C:/R/sugar_glider.txt", header=T)glider_g=read.csv("C:/R/sugar_glider_binomial_g.csv")y=cbind(glider_g$cases, glider_g$count-glider_g$cases)logit_mg=glm(y~glider_g$p_size_med, family=binomial(link=logit))summary(logit_mg)추정된 로지스틱 회귀모형은 다음과 같다log( {hat{pi }} over {1- hat{pi }} )= hat{ beta _{0}} +hat{ beta _{1}} x _{ 1}=-2.539+0.022*x _{ 1}pi (x) 를 x에 대해 미분하면 다음과 같다.pi prime
    방송통신대 | 10페이지 | 3,000원 | 등록일 2020.08.04 | 수정일 2020.08.07
  • 회귀모형 2025년 1학기 방송통신대 출석수업대체과제물)2024년 교재 연습문제 1장 1번, 2장 1번 문제, 중회귀모형을 행렬-벡터 표기로 표현하면 다음과 같다 등
    ", lwd=1.5) # 회귀선 추가, lwd 선굵기# 회귀직선# 선형 회귀모형 적합model ... , 회귀직선을 적합시키시오. (2점)①R코드# 산점도yearOfUse ... ummary(model)②결과위 회귀분석 결과에 따라, 회귀계수로서 절편 추정치는 29.107이고 기울기의 추정치는 13.637이다. 따라서 추정된 회귀식은 다음과 같다. 편의상 독립
    방송통신대 | 11페이지 | 15,000원 | 등록일 2025.04.16
  • [30점 만점][회귀모형]방송통신대 정보통계학과 3학년 2학기 출석수업과제물(서울지역)
    출석수업 과제물(평가결과물) 표지(온라인제출용)교과목명 : 회귀모형학 번 :성 명 :강 의 실 :연 락 처 :__________________________________________________________________________________○ 과 제 명[1장 단순회귀모형] 연습문제 1번, 2번[2장 중회귀모형 ] 연습문제 2번, 3번[1장 연습문제 1번]어떤 큰 공장에서 동일한 기계들의 정비기록에 관한 표본자료를 취하였다. 이는 기계의 사용연도(age of machines)와 정비비용(maintenance cost) 간에 어떤 관계가 있는가를 밝혀내기 위한 것으로 그 자료는 다음과 같다(표본의 크기 n=14).사용연도(단위: 년) x정비비용(단위: 1,000원) y사용연도(단위: 년) x정비비용(단위: 1,000원) y*************51055086676935726901401127018643126(1) 이 데이터의 산점도를 그려라.사용연도(age)에 따른 정비비용(cost) 산점도를 보면, 대략 직선의 관계로 사용연도가 증가하면 정비비용도 증가한다는 사실을 알 수 있다.(2) 최소제곱법에 의한 회귀직선을 적합시켜라.위의 회귀적합 결과에서 회귀계수 추정값(Coefficients: Estimate)은 절편은 29.107이고 기울기는 13.637임으로, 추정된 회귀식은 아래와 같다.hat { cost} = 29.107 + 13.637 TIMESage(3) 추정치의 표준오차 sy·x를 구하라.S _{Y BULLET X} = sqrt {MSE} = sqrt {847.2} =29.1067위의 회귀분석 결과에서 “Residual standard error: 29.11” 로 추정치의 표준오차를 확인할 수 있다.(4) 결정계수와 상관계수를 구하라.- 결정계수 R2:R ^{2} = {SSR} over {SST} = {15887} over {26053}=0.6098 결정계수 R2 값은 “Multiple R-squared: 0.6098” 로, 총변동 중에서 .2계1326053위의 분산분석표를 보면 F0 = 18.753이고, 이에 대한 유의수준 α=0.05에서 유의확률 p-값=0.0009779이 매우 작으므로 적합된 회귀선이 유의하다는 것을 알 수 있다.(6) 사용연도가 4년인 기계의 평균정비비용은 어느 정도인가를 추정하라.위의 추정 값 결과를 보면 사용연도가 4년인 기계의 평균 정비비용은 약 83.66*1,000원이다.(7) 잔차e_{ i}=y_{ i}-{hat{y _{ i} }} 를 구하여 잔차의 합이 영임을 확인하라.(8) 잔차들의 xi에 대한 가중합,sum _{ } ^{ } x_{ i}e_{ i} 을 구하라. (잔차 성질 확인)(9) 잔차들의{hat{y _{ i} }} 에 대한 가중합,sum _{ } ^{ } hat { Y} _{ i}e_{ i} 을 구하라. (잔차 성질 확인)(10) 두 변수 x, y를 표준화된 변수로 고친 후 회귀직선을 적합시키고, 그 회귀계수가 두 변수 x, y간의 상관계수가 같음을 밝혀라.두 변수 x, y를 표준화된 변수로 고친 후 회귀직선을 적합하였더니, 기울기가 7.809e-01 즉, 0.7809로 상관계수 r값과 같았다.[1장 연습문제 2번]자동차의 무게가 무거우면 이를 움직이는 데 더 많은 연료가 소모된다는 것은 알려진 사실이다. 자동차의 무게와 자동차를 1km 움직이는 데 필요한 에너지량과의 함수관계를 정확히 판단하기 위하여 A자동차회사는 다음의 자료를 실험을 통하여 얻었다. 실험비용이 많이 드는 관계로 아홉 번만 실험하였는데 그 자료는 다음과 같다.무게(단위: 1,000kg) x에너지 소모량(단위: 1,000Btu) y무게(단위: 1,000kg) x에너지 소모량(단위: 1,000Btu) y0.91.32.12.52.42.02.64.35.85.11.70.71.21.63.21.82.33.0(1) x에 대한 y의 회귀직선을 최소제곱법에 의하여 구하여라. 데이터의 산점도를 그리고, 구한 회귀직선을 산점도 위에 그려 넣어라.위의 산점도와 회귀직선을 보면 자동차의 무게(weight)가 와 같이 작성한 분산분석표를 보면 F0 값은 141.16이고, 이에 대한 유의수준 α=0.05에서 F값에 대한 유의확률 p-값이 6.798×10-6이 매우 작은 값이므로 H0:β1=0을 기각한다. 따라서 주어진 회귀직선은 유의하다고 볼 수 있다.(3) 무게가 3,000kg이 되는 차량의 에너지 소모량은 어느 정도일까를 예측하라.어떤 주어진 값 X에서 Y의 기댓값을E(Y)= beta _{0} + beta _{1} X 라고 한다면,hat{Y }}=b _{ 0}+b _{ 1}X 로 추정된다. 또한{Y}_{"new"} 에 대한 점추정값은 추정된 회귀선hat{Y }}=b _{ 0}+b _{ 1}X 를 사용한다. 따라서 위의 데이터에서 추정된 회귀선은{hat{energy}} =-0.1157+2.1626 TIMES weight 이므로 무게가 3,000kg일 때 차량의 에너지 소모량의 예측값은 6372.1 Btu 이다.(4) 원점을 지나는 회귀직선을 구하라.원점을 지나는 회귀직선을 아래와 같이 구하여 산점도 위에 파란색 점선으로 표시해보았다.위에서 추정된 원점을 지나는 회귀식:{hat{energy}} =2.09924 TIMES weight(5) 원점을 지나는 회귀직선의 결정계수를 구하라.원점을 지나는 회귀직선의 결정계수 R2 값은 “Multiple R-squared: 0.9934” 로, 총변동 중에서 위의 회귀방정식의 설명력은 99.34% 이다. (1)번에서 구한 추정된 회귀식({hat{energy}} =-0.1157+2.1626 TIMES weight)의 결정계수(0.9528) 보다 원점을 지나는 회귀직선의 결정계수 값이 크므로 더 설명력이 좋은 회귀선이라고 말할 수 있다.(6) 오차항의 분산이 같지 않다는 것이 밝혀지고, Var(εi)=kx2i으로 x2의 크기에 비례한다면 가중회귀를 사용하여야 한다. 가중최소제곱법에 의하여 가중회귀직선을 구하라. 이 경우의 회귀변동(SSR)을 구하라.위의 가중회귀적합결과에서 가중회귀직선방정식은{hat{energy}} =0.1444+2.0m2): Y195179205204201184210209576160626154586181.4122.0101.7175.6150.364.892.1113.8(1) 선형회귀모형, Y=β0+β1X1+β2X2+ε이 성립된다고 가정하고 데이터로부터 회귀모형을 추정하라.위의 데이터를 사용하여 변수 X1(temp)과 변수 X2(pressure)에 따른 Y 의 산점도를 구해보았다.중회귀모형을 적합하여 회귀분석 결과에서 추정된 회귀식은 아래와 같다.{hat{Y}} =-554.5267-0.1743 BULLET temp+11.8449 BULLET pressure이모형에 대한 결정계수는 R2 값은 “Multiple R-squared: 0.747” 로서 중회귀모형이 종속변수 strength의 총변동을 74.7%로 설명하고 있다는 것을 나타낸다.변수 temp의 t값은 ?0.228이고, 유의확률 p-값은 0.8285 으로, 유의수준 α=0.05에서 귀무가설을 기각하지 못하므로, 변수 temp는 strength를 설명하는데 큰 영향을 준다고 할 수 없다.변수 pressure의 t값은 3.662이고, 유의확률 p-값은 0.0146 으로, H0:β2=0을 기각시킨다. 따라서 변수 pressure은 strength를 설명하는데 유의한 변수라고 볼 수 있다.(2) 오차분산 σ2을 MSE로 추정하고, Var(b0), Var(b1), Var(b2)의 추정치를 구하라.- MSE의 기댓값 E(MSE) = σ2 으로 MSE는 σ2 의 불편추정량이 된다. 위의 회귀적합 결과에서sqrt {MSE}의 값은 “Residual standard error: 21.66 on 5 degrees of freedom” 로 σ의 추정치가 21.66임을 알 수 있다.- 회귀적합 결과에서 각 계수의 “Std.Error” 값의 제곱이 회귀계수의 분산 추정값이다. 따라서 Var(b0), Var(b1), Var(b2)는 각각 38898.25, 0.5831, 10.46이다.(3) X1=200℃이고, X2=59psi에서 평균 제품의 강도의 회귀계수 b1, b2의 의미는 무엇인가?추정된 회귀식{hat{Y}} =-554.5267-0.1743 BULLET temp+11.8449 BULLET pressure 에서 추정된 회귀계수 b1=-0.1743과 b2=11.8449는 각각 변수 temp와 pressure이 변수 Y에 미치는 영향력을 의미한다. 여기서 변수 pressure의 계수 b2가 변수 temp의 계수보다 크므로 상대적으로 pressure의 영향이 더 큼을 알 수 있다.(5) 분산분석표를 작성하고 α=0.05 로 F-검정을 행하라.요인자유도제곱합평균제곱F0회귀26930.63465.37.383잔차52346.8469.36계79277.4위의 분산분석표를 보면 F-값=7.383이고, 이에 대한 유의확률 p-값=0.03218으로 유의수준 α=0.05에서 유의하게 적합된 중회귀모형이라고 할 수 있다. 참고로 F-검정의 기각치 F(2, 5; 0.05)의 값은 이므로, F0=7.383 > F(2, 5; 0.05)가 성립되어 가정된 중회귀방정식이 이 데이터를 설명하는데 유의함을 알 수 있다.(6) 결정계수 R2을 구하라.- 결정계수 R2:R ^{2} = {SSR} over {SST} = {6930.6} over {9277.4} =0.747결정계수 R2 값은 “Multiple R-squared: 0.747” 로, 종속변수 strength의 총변동 중에서 중회귀방정식의 설명력은 74.7% 이다.(7) X1, X2, Y를 모두 표준화시키고, 표준화된 중회귀방정식을 구하라.lm.beta() 함수를 사용하여 표준화된 중회귀직선을 적합한 결과에서 회귀계수 추정값은 절편은 0이고, 변수 X1, X2에 대한 표준화계수는 ?0.05499, 0.88252이다. 따라서 표준화된 중회귀방정식은 아래와 같다.{hat{Y}} =-0.05499Z_1 + 0.88252Z_2여기서 Z2의 계수가 Z1보다 크므로 상대적으로 변수 Z2 의 영향
    방송통신대 | 9페이지 | 3,000원 | 등록일 2019.12.17
  • 판매자 표지 자료 표지
    회귀모형 출석수업과제물 (2023, 만점)
    출석수업 과제물(평가결과물) 표지(온라인제출용)교과목명 : 회귀모형학 번 :성 명 :강 의 실 :연 락 처 :___________________________________________________________________________- 이하 과제 작성목차1. 교재 39p 자료(1장 1번)를 바탕으로 분석사례와 같이 분석, 설명하시오.2. 교재 87p 자료(2장 3번) 자료를 바탕으로 분석사례와 같이 분석, 설명하시오.1. 교재 39p 자료(1장 1번)를 바탕으로 분석사례와 같이 분석, 설명하시오.사용연도와 유지비용 간 관계를 알아보기 위해 사용연도(year)와 정비비용(price)을 활용하였다. 교재에 있는 데이터를 바탕으로 데이터 활용을 위해 메모장으로 maintenance.txt 파일을 생성하였다.변수 간 관계를 대략적으로 파악하기 위해 R에서 자료를 불러와 산점도를 그렸다. 사용한 코드는 다음과 같다.> setwd("C:/Users/dkstjdehs/Desktop/개인/regression")> factory head(factory, 3)> attach(factory)> plot(year, price, pch=19)위처럼 그린 산점도 결과를 통해 year와 price 간 어느 정도의 선형 관계가 나타남을 알 수 있다. 이에 단순회귀모형을 적합하는 것이 타당하다고 판단하였다.이후 다음과 같은 코드를 이용하여 회귀적합을 진행하였다.> factory.lm = lm(price ~ year, data=factory)> summary(factory.lm)회귀적합을 통해 회귀계수의 추정값은 절편 =29.107, 기울기 =13.637로 단순회귀방정식은 =29.107+13.637*year 가 됨을 확인할 수 있었다. 기울기(year)에 대한 t-값은 4.330으로, p-값 0.0009779와 비교하였을 때, p-값이 매우 작기 때문에 귀무가설인 을 기각하였다. 즉, 두 변수 간 선형관계가 있다는 대립가설을 채택하는 것이 타당하다고 보인다.나아가, 결정계수 은 0.6098로 약 60.98% 만큼 위의 회귀방정식으로 설명됨을 확인하였다. 즉, 결정계수는 SSR/SST로 전체 중에 회귀변동이 차지하는 비율을 나타내어 회귀방정식의 적합도를 나타낸다고 할 수 잇는데, 본 식은 그 적합도가 약 60.98%로 그리 높지는 않다고 판단되지만, 사용연도가 정비비용에 어느 정도 영향을 미치고 있는 관계임을 파악할 수 있다.다음으로 다음과 같이 회귀적합과 분산분석표를 바탕으로 회귀방정식의 유의성에 대한 검정은 F-검정을 통해 진행하였다.> anova(factory.lm)분산분석표에서 F-값이 18.75이고, 이에 대한 p-값은 0.0009779로 p-값이 F-값보다 확연히 작으므로 회귀방정식이 유의함을 알 수 있다.추가로, 회귀모형이 기본 조건을 만족하는 지 확인할 필요가 있다. 그래서 잔차 그림을 그려 모형진단을 다음과 같은 코드로 실행하였다.> names(factory.lm) #회귀적합 결과 변수 확인> cbind(factory, factory.lm$resid, factory.lm$fitted) #변수 결합> plot(year, factory.lm$resid, pch=19) #독립변수 year에 대한 잔차 그림> abline(h = 0, lty = 2)위 잔차 그림을 봤을 때, 평균 0을 기준으로 일정한 띠모양을 가지고 있으므로 등분산성을 만족한다고 할 수 있고, 어떤 함수 관계가 보이지 않으므로 독립성도 만족한다고 할 수 있다. 따라서 해당 회귀모형은 기본 조건을 만족하여 적합한 회귀모형이라고 결론내렸다.마지막으로, 적합된 회귀직선에 대해 신뢰대를 그려 다음과 같이 추가적인 분석을 진행하였다.> p.x = data.frame(year=c(1:14))> pc=predict(factory.lm, int=’c’, newdata=p.x) #int가 c면 기존 관찰값, p면 새로운 관찰값에 대한 예측> pred.X=p.x$year> plot(factory$year, factory$price, ylim=range(factory$price, pc))> matlines(pred.X, pc, lty=c(1,2,2), col=’BLUE’)2. 교재 87p 자료(2장 3번) 자료를 바탕으로 분석사례와 같이 분석, 설명하시오.여러 가지 독립변수가 물 사용량에 영향을 미치는 지 확인하기 위해 다음 자료를 바탕으로 중회기분석 진행하였다.물소비량(Y)평균온도(X1)작업일수(X2)작업량(X3)2.81027643.92426723.92528804.42826883.11530813.11824453.52227463.62225693.01227543.3152539먼저, R에서 분석하기 위해 해당 데이터를 엑셀 파일(water.xls)로 작업 후 xlsx 패키지를 사용하여 데이터를 불러와서 데이터를 확인하였다.> install.packages(“xlsx”)> library(xlsx)> water = read.xls(“C:/Temp/water.xls”, 1) #sheet 설정을 위해 경로 다음에 1번 시트 지정> head(water)이후, 각 변수 간 관련성이 있는지 파악하기 위해 산점도를 그려보았다.> par(mfrow=c(1,3), pty =”s”)> plot(water$X1, water$Y, pch=19)> plot(water$X2, water$Y, pch=19)> plot(water$X3, water$Y, pch=19)그 결과, 평균온도(X1)을 제외하고는 물소비량(Y)와 큰 관련성이 없는 것처럼 판단할 수 있었다.다음으로, 변수 간 상관관계를 파악하기 위해 기술통계량과 상관계수를 출력하였다.> summary(water)> cor(water)해당 결과를 통해 물소비량(Y)은 특히 평균온도(X1)와 높은 상관관계를 가지고 있으며, 독립변수 간에는 평균온도(X1)와 작업량(X3), 작업일수(X2)와 작업량(X3)이 어느 정도의 상관관계를 가지고 있음을 알 수 있었다.이를 바탕으로 회귀모형을 적합하여 실제로도 연관성이 높은지 확인하고자 하였다.> water.lm = lm(Y ~ X1+X2+X3, data=water)> summary(water.lm)이로 인해 추정된 회귀방정식은 이고, 해당 모형에 대한 결정계수 로서 중회귀모형이 종속변수 Y(물소비량)의 총변동을 92.02% 정도 설명하고 있음을 알 수 있다. 또한 추정값의 표준오차 로서 의 추정치가 0.172임을 알 수 있다.변수 별로 살펴보면, 변수 X1(평균온도)의 t-값은 5.521로서, 유의확률 p-값은 0.00149임을 보여 준다. 따라서 귀무가설이 각 독립변수의 기울기가 0이라고 했을 때, X1의 p-값은 0.05보다 작으므로 귀무가설을 기각, 즉 Y에 영향을 미치는 변수, Y를 설명하는 유의한 변수임을 알 수 있다.반면, X2(작업일수)의 경우, t-값은 -0.552로서 p-값은 0.60060임을 보여 준다. 이는 유의수준 0.05보다 크므로 귀무가설을 기각할 수 없다. 즉, X2(작업일수)는 Y를 설명하는 유의한 변수가 아님을 알 수 있다. 마찬가지로 X3도 t-값은 1.161로서 p-값은 0.28978로 유의수준보다 크기 때문에 귀무가설을 채택하고, Y를 설명하는 데 유의한 변수가 아니라는 결론을 내릴 수 있다.이를 재확인하기 위해 추가변수그림을 그려 다음과 같이 확인할 수도 있었다.> install.packages(“car”)> library(car)> avPlots(water.lm)다음으로, 분산분석표를 출력하여 정리하였다.> anova(water.lm)해당 결과를 바탕으로 다음의 분산분석표를 정리할 수 있었다.요인자유도제곱합평균제곱Pr(>F)회귀32.410.8023.50.001079잔차60.180.03계92.59* F-값은 앞 summary(water.lm)에서 F-통계량, Pr(>F)는 p-value를 의미분산분석표를 통해 F-값=23.5에 대한 유의확률이 0.001079로 상당히 작게 나타나기 때문에, 본 중회귀모형은 매우 유의함을 알 수 있었다. 또한, 오차분산 의 추정치 MSE=0.03임을 알 수 있었다.분산분석표까지를 통해 해당 중회귀모형이 유의함을 알았다. 이에 다음으로는 중회귀모형의 가정이 옳은 지 검토가 필요하여 독립변수 평균온도(X1), 작업일수(X2), 작업량(X3) 및 종속변수 물소비량(Y)의 추정값과 잔차 간 관계를 보기 위해 잔차산점도를 그려 파악하였다.> plot(water$X1, water.lm$resid)> identify(water$X1, water.lm$resid)> plot(water$X2, water.lm$resid)> identify(water$X2, water.lm$resid)> plot(water$X2, water.lm$resid)> identify(water$X2, water.lm$resid)3개의 독립변수 모두 잔차가 비슷한 양상으로 나타난다고 판단하였다.마지막으로, 추정값과 잔차의 산점도를 그려 회귀분석을 마무리 하고자 하였다.> plot(water.lm$fitted, water.lm$resid)> abline(h=0, lty=2)> identify(water.lm$fitted, water.lm$resid)이때, 6과 10번째 케이스를 제외하면 뚜렷한 현상은 없기에 전반적으로 살펴볼 때 해당 케이스에 대한 조사로 특이점으로 판명된다면 해당 케이스를 제외하고 재분석하는 것이 좋을 것이라고 판단된다.김성수∙강명욱∙강위창, 회귀모형, 2023, 한국방송통신대학교출판문화원
    방송통신대 | 10페이지 | 4,000원 | 등록일 2023.09.06 | 수정일 2023.09.11
  • 판매자 표지 자료 표지
    기말시험(온라인평가) 문제
    . (20점)3. 회귀분석 결과에서 다음 괄호(㉮~㉱)에 적합한 값을 작성하고, 이 회귀분석 모형이 유의수준alpha=0.05에서 통계적으로 유의미한지 결정하시오. (20점 ... . (30점)2. 경제적 주문량 모형과 두 가지 재주문점 모형의 가정은 각각 무엇인지 제시하시오. 또한 세 가지 가정의 차이로 인해 나타나는 모형의 결과 차이에 대하여 논하시오
    시험자료 | 1페이지 | 1,500원 | 등록일 2022.10.07
해캠 AI 챗봇과 대화하기
챗봇으로 간편하게 상담해보세요.
2025년 05월 25일 일요일
AI 챗봇
안녕하세요. 해피캠퍼스 AI 챗봇입니다. 무엇이 궁금하신가요?
5:05 오전
문서 초안을 생성해주는 EasyAI
안녕하세요. 해피캠퍼스의 방대한 자료 중에서 선별하여 당신만의 초안을 만들어주는 EasyAI 입니다.
저는 아래와 같이 작업을 도와드립니다.
- 주제만 입력하면 목차부터 본문내용까지 자동 생성해 드립니다.
- 장문의 콘텐츠를 쉽고 빠르게 작성해 드립니다.
- 스토어에서 무료 캐시를 계정별로 1회 발급 받을 수 있습니다. 지금 바로 체험해 보세요!
이런 주제들을 입력해 보세요.
- 유아에게 적합한 문학작품의 기준과 특성
- 한국인의 가치관 중에서 정신적 가치관을 이루는 것들을 문화적 문법으로 정리하고, 현대한국사회에서 일어나는 사건과 사고를 비교하여 자신의 의견으로 기술하세요
- 작별인사 독후감