전북대학교 통계정보학 개념 정리·족보
- 최초 등록일
- 2019.11.26
- 최종 저작일
- 2019.09
- 12페이지/ 한컴오피스
- 가격 3,300원
소개글
각 항목에 대해 자세히 나와있습니다.
목차
1. 기술통계
2. 확률변수
3. 정규분포
4. t분포
5. 검정-가설
6. 분산분석
7. 단순회귀분석
8. 다중회귀모형
본문내용
1.기술통계
기술통계란 자료의 특징을 알고자 할 때 사용한다. 두 변인 간의 관계를 추측하기 전에, 기술통계를 통해 각 변인에 대한 특정 표본 전체의 전반적인 속성을 정확하게 파악하는 것은 거의 모든 통계 분석의 일부분이다. 또한 엄청난 양의 데이터가 갖는 속성을 합리적인 방법으로 요약해 줌으로써 속성을 이해하기 쉽게 도와준다.
기술통계량에는 ①대표값 ②산포도 ➂분포 등이 있다.
① 대푯값
1) 최빈치: 가장 횟수가 많은 것이 대표
2) 중앙값 : 산술적 가치에 따라 서열을 매겨 나열했을 때 가장 가운데 위치한 통계량이다.
3) 평균 – 산술평균: 일반적
- 기하평균: 기준점 대비
- 조화평균: 원하는 년도 비율
But 이는 데이터의 퍼져 있음, 즉 산포 정도까지는 설명하지 못한다.
② 산포도
산포도는 용어 그대로 표본의 속성을 나타내는 데이터의 퍼져 있는 정도를 설명하는 기술통계로서 주요한 통계량으로 최댓값, 최솟값, 범위, 분산, 표준편차, 표준오차 등이 있다.
- 범위: 최대 및 최솟값 간 차이
But 최댓값, 최솟값, 범위는 데이터의 전반적인 흩어짐과 변화량에 대한 정확한 정보를 제공해 주지 못한다. 따라서 분산, 표준편차, 표준오차가 필요하다.
편차
1 2 3 4 5
평균 = 3
편차 = (1-3)+(2-3)+(3-3)+(4-3)+(5-3)=0
= -2 –1 0 1 2
평균편차(|편차|): 2 1 0 1 2 = 6/5
분산(편차^2): 4 1 0 1 4 = 10/5 = 2
*표준편차는 루트분산이다. 이는 현실적 데이터 특징을 가장 잘 보여주는 값이다.
*표준오차는 표본 평균의 표본추출 분포에 대한 표준편차이다,
참고 자료
없음