[데이타베이스]data warehouse와 data mining
- 최초 등록일
- 2005.07.03
- 최종 저작일
- 2005.02
- 8페이지/ MS 워드
- 가격 1,000원
소개글
데이타베이스에서 꼭 이해하고 넘어가야 하는 data warehouse와 data mining의 정의 및 특성들 및 process에 대해서 조사하였습니다.
목차
1. data warehouse
1.1 data warehouse의 시작
1.2 date warehouse의 정의
1.3 data warehouse의 특성
1.4 data warehouse의 Process
2. Data mining
2.1 정의
2.2 데이터 마이닝 프로세스
2.3 데이터 마이닝의 결과
2.4 데이터 마이닝 수행시 고려 사항
본문내용
2.1 정의
데이터마이닝이란 자동화되고 지능을 갖춘 데이터베이스 분석기법으로 90년대 초반부터 지식발견(KDD: Knowledge Discovery in Databases), 정보발견, 정보수확등의 이름으로도 소개되어 왔는데 일반적으로 “대량의 데이터로부터 새롭고 의미있는 정보를 추출하여 의사결정에 활용하는 작업”이라 정의된다. 용어에 ‘채굴하다’라는 의미는 ‘mining’을 포함시킨 이유는 데이터로부터 정보를 찾아내는 작업이 마치 금이나 다이아몬드를 발견하기 전에 수 많은 양의 흙과 잡석들을 파헤치고 제거하는 것과 유사하다는 데에 기인한다.
22 데이터 마이닝 프로세스
일반적인 데이터 마이닝의 단계는 여러 연구자에 의해서 제안되었다. 8단계로 구성되어 있으며 각 단계는 여러 태스크로 분할 가능하며. 상이한 단계들 또는 태스크들 사이를 반복적으로 수행하는 것이 일반적이다.
(1) 1단계 : 요구 분석
대상문제에 대한 명세화 또는 데이터 마이닝의 목표에 대한 명확한 정의를 내린다. 이 단계의 산출물은 이후 단계들의 준비와 실행에 관한 전략적 계획이다.
(2) 2단계 : 도메인 분석
응용 돔인, 데이터, 환경적 특성에 관한 지식을 분석하여 초기 데이터마이닝 계획을 수립하다.
(3) 3단계 : 데이터 집합 정의
데이터 마이닝의 대상이 될 데이터 집합 또는 변수집합을 정의한다.
(4) 4단계 : 사전처리
기법 적용 전에 필요한 모든 태스크가 포함된다. 여기에는 데이터의 적재, 변환 및 클리닝이 포함된다.
(5) 5단계 : 데이터 탐구
감독/무감독(Directed/Undirected0 데이터 마이닝과 가설검정에 적용할 데이터에 대한 통찰과 흥미있는 데이터 또는 특성 부분집합을 파악한다.
참고 자료
없음