R을 이용한 DATA 분석 (t-test, ANOVA, 독립성 검정, 회귀분석)
- 최초 등록일
- 2009.01.14
- 최종 저작일
- 2007.12
- 8페이지/ 한컴오피스
- 가격 3,000원
소개글
통계 프로그램 R을 이용하여 주어진 데이터 파일(automobile.txt)에 여러가지 통계적 분석을 시행하였습니다. 시행한 통계 기법은 1변수 t테스트, 독립 2변수 t테스트, 카이제곱 돕립성 검정, 아노바 검정(분산분석), 단순 선형 회귀 분석, 다중 선형 회귀 분석 등입니다.
레포트의 분석 과정에는 가설설정, 알파 set, 결론, R 코드소스, 컴파일 결과 등이 모두 포함되어 있습니다. 또한 분산분석에는 Tukey 시행과 그에 따른 그래프가 포함되며, 회귀분석은 회귀직선이 그려진 그래프도 첨부됩니다. R을 이용해 통계 분석을 해보고자 하시는 분들께 도움이 되길 바랍니다.
(1~7페이지는 레포트이고, 마지막 8페이지에는 분석에 사용된 데이타를 첨부하였습니다.)
목차
1. 1 sample t-test
2. Independent 2 sample t-test
3. x^2(카이제곱) Independence test
4. One-way ANOVA
5. Simple Regression
6. Multiple Regression
본문내용
> data=read.table("automobile.txt",header=T,sep="t")
> attach(data)
> names(data)
[1] "ID" "symboling" "normalized.losses" "make"
[5] "fuel_type" "aspiration" "num_doors" "body_style"
(중략)
1. 1 sample t-test
------------------------------------------------
> mean(price,na.rm=T) # price 자료의 평균
[1] 13207.13
> sd(price,na.rm=T) # price 자료의 표준편차
[1] 7947.066
> length(price) # price 자료의 개수 (결측치 포함)
[1] 205
------------------------------------------------
_ price 의 평균이 13000 인지 검정해보자.
① 가설설정
_ H0 : mu(price)=13000
_ H1 : mu(pirce)13000
② =0.05
③ t-test 수행
------------------------------------------------
> t.test(price,alt="two.sided",mu=13000)
One Sample t-test
data: price
t = 0.3695, df = 200, p-value = 0.7121
alternative hypothesis: true mean is not equal to 13000
95 percent confidence interval:
12101.80 14312.46
sample estimates:
mean of x
13207.13
------------------------------------------------
④ 결론 : p-value=0.7121 >> 이므로 Do not reject H0.
가격의 평균은 13000이라 볼 수 있다.
참고 자료
없음