[데이터웨어하우스] 데이터웨어하우스의 ETT
- 최초 등록일
- 2005.04.28
- 최종 저작일
- 2004.11
- 11페이지/ 한컴오피스
- 가격 1,000원
소개글
데이터웨어하우스 수업때 제출한 레포트입니다.
목차
1. ETT의 정의
2. ETT의 형태
3. 추출(Extraction)
4. 변환(Transformation)
5. 전송(Transportation)
6. ETT의 중요성
7. 데이터의 정제 (data cleansing)
8. ODS(Operational Data Store)
9. Meta data
10. Index
11. 비트맵 인덱싱(bitmap indexing)
12. 분할(Partitioning)
13. Granularity
본문내용
ETT는 데이터의 추출(Extraction), 가공(Transformation), 전송(Transportation)의 약자인데, 데이터를 소스시스템에서 추출하여 데이터 웨어하우스에 로드 시킨 상태에서 정제 작업에 이르는 전 과정을 말한다.
ETT 방법은 소스 시스템의 종류, 데이터의 추출주기, 데이터의 양, 로딩속도, 소스 데이터의 질, 과거 데이터의 형식, 사용자의 요구 조건 , 소스 시스템의 역할 등에 따라서 달라진다.
ETT의 형태는 사실 테이블과 요약 테이블을 어떤 쪽에서 만들 것이냐에 따라서 달라진다. 두 가지 테이블을 소스시스템에서 미리 만들어 주거나, 데이터를 추출하여 데이터 웨어하우스에서 사실 테이블과 요약 테이블을 만드는 방법이 있다.
소스시스템은 대개의 경우 회사의 중요한 운영계 시스템일 경우가 많다. 이 시스템에 부하가 많아져 다운되거나 성능이 저하되면 업무가 제대로 이루어지지 않을 수 있다. 그러므로 운영 시스템에서 데이터를 추출하여 데이터 웨어하우스에서 사실 테이블과 요약 테이블을 만드는 방법을 사용한다.
대개의 경우 매일, 또는 매달 소스 시스템에서 데이터를 SAM 파일로 만들어서 데이터 웨어하우스로 보내는 오프라인 방식이나, 소스 시스템 DB와 데이터 웨어하우스 DB를 연결하여 DB내에 있는 데이터를 직접 로딩하는 온라인 방식을 택한다.
상세정도가 높으면 어떠한 질문에 자세하게 대답할 수 있으나 데이터의 크기가 커지게 된다. 반대로 상세정도가 낮으면 데이터의 크기가 작으므로 다루기 쉬우나 요약정보의 한계가 있을 수 있다. 둘 사이의 적절한 조화와 균형(trade off)가 필요하다
참고 자료
없음