ADSP대비 요점정리(4과목 데이터 분석中 3장 정형 데이터 마이닝)
- 최초 등록일
- 2020.05.10
- 최종 저작일
- 2017.12
- 7페이지/ 한컴오피스
- 가격 2,000원
소개글
"ADSP대비 요점정리(4과목 데이터 분석中 3장 정형 데이터 마이닝)"에 대한 내용입니다.
목차
I. 제 3장. 정형 데이터 마이닝
제 1절. 데이터 마이닝 개요
제 2절. 분류 분석
제 3절. 군집 분석
제 4절. 연관 분석
본문내용
제 1절. 데이터 마이닝 개요
데이터 마이닝
● 흔히 ‘데이터 베이스에서의 지식발견’ 이라 불림
● 거대한 양의 데이터 속에서 쉽게 드러나지 않는 유용한 정보를 찾아내는 과정
데이터 마이닝 대표적 6가지 기능
1. 분류(Classification)
- 새롭게 나타난 현상을 검토하여 기존의 분류, 정의된 집합에 배정하는 것을 의미(예/아니요)
- 의사결정나무
2. 추정(Estimation)
- 수입, 수준, 신용카드 잔고 등 연속된 변수의 값을 추정하는 데 사용(가족 구성원의 총 수입)
- 신경망 모형
3. 예측(Prediction)
- 미래 양상 예측하거나 미래 값 추정
- 장바구니 분석, 의사결정나무, 신경망
4. 연관 분석(Association Analysis)
- 같이 팔리는 물건과 같이 아이템의 연관성을 파악하는 분석
5. 군집(Clustering)
- 이질적인 모집단을 동질성을 지닌 그룹 별로 세분화하는 것을 의미
6. 기술(Description)
-데이터가 가지고 있는 의미를 단순하게 기술하는 것도 의미 파악하는 것만큼 중요
데이터 마이닝 추진 단계
목적 정의-> 데이터 준비-> 데이터 가공 ->데이터 마이닝 기법 적용 ->검증
데이터 마이닝 추진 단계
목적 정의-> 데이터 준비-> 데이터 가공 ->데이터 마이닝 기법 적용 ->검증
제 2절. 분류 분석
로지스틱 회귀모형
- 반응변수가 범주형인 경우 적용(성공/실패, 예/아니요, 남/여, 등 2가지 범주가 기본)
- 새로운 설명변수(또는 예측변수)값이 주어질 때 반응변수의 각 범주에 속할 확률을 추정
- str() : 행,열, 오브젝트개수, 변수개수 등 전체적인 정보 파악
- glm() : 일반화선형모형, lm() 함수와 유사하나, 추가로 familly라는 인수 지정
예) glm(종속변수~독립변수, data=a, family=binomial)
⁜ binomial : 이항분포
참고 자료
없음