발주처 소개포도나무의 평균 나이 : 50년, 손으로 수확17 ~ 20 개월 (전량 새 오크통 사용)숙성 기간 :발효기간 : 3 주토양 : Gunz빙하기 (160만년전-1만년전) 초기의 퇴적자갈토생산 : 180,000 병밀도 : 10,000 그루/ha까베르네 소비뇽 80 % 메를로 15 %, 까베르네 프랑 4 % 쁘띠 베르도 1%품종별 분포:포도원 면적 : 약 30 ha지역 : Medoc- Ct.Dongkour -문제점고유의 전통과 가치가 지니는 자존심 고수자연에 순응하는 생산 방식각각의 브랜드 만이 가지는 개성과 품격을 자랑But- 빈티지에 따라 와인의 품질이 달라짐 - 생산 비용의 증가 - 신세계 와인에게 시장잠식신세계 와인의 도전- 미국풍부한 자본과학적 기술마케팅품질 향상가격 경쟁력Ch.Dongkour의 개선책R D 부서의 신설 – 토양 샘플 분석, 화학성분 분석, 기상예측 2. 생산 지원 소프트웨어 발주 – 과학적 기술의 도입으로 생산기술 현 대화 3. 브랜드의 재정비 – 고유의 개성을 확립하여 경쟁업체들과 차별화고품질의 제품을 최적의 비용으로 생산시스템 개요1.소개환경요소의 영향을 최소화하여 빈티지에 관계없이 매년 일정한 품질의 와인을 생산할 수 있도록 포도의 제조, 재배 과정에서의 의사결정을 지원2.목적샤또. 동구르의 브랜드 고유의 개성을 표출할 수 있는 고품질의 와인을 효율적으로 생산3.시스템의 기능Viticulture(포도 재배), Vinification(와인 제조) 공정의 각 단계별 프로세스에 대한 생산자의 의사결정을 지원시스템 아키텍쳐사용자MBMS사용자 인터페이스DBMS계량 모델통계 모델운영 모델환경재배제조기상청R D데이터 베이스모델 베이스데이터데이터수분 당분 알코올 무기성분 쓴맛: 페노릭 탄닌재배지역 온도 일조시간 강우량 토양 서리 우박 해발고도포도품종 식수량 수확량 수확시기 숙성토양샘플분석 화학성분분석 각종 예측정보핵심기능 - 재배MBMS (계량모델)포도 화학성분 분석자료 (R D 팀)기상 DB재배 DB2005.10.1 1%의 산도 18~1용1차 발효압착앙금 분리2차 발효블랜딩숙성병 입병 숙성출하파쇄수확DBMSMBMS침용의 기간으로 탄닌 함유량 조절 의사결정: 침용 기간효모를 첨가하여 포도즙을 발효 당분 - 알코올 + 탄산가스 10~32도에서 효율적으로 발효 의사결정: 발효 기간 온도, 농도 조절포도즙을 오크통에서 발효 (유산발효) 사과산 - 유산 + 이산화탄소 (와인의 맛이 부드러워짐) 매개물로 박테리아배양하여 첨가 의사결정: 발효 기간, 박테리아 첨가유무 또는 양참나무 오크통에 담아 숙성 기간에 따라 향과 맛에 영향 진동이 없으며, 숙성온도 약 12~14도, 숙성 습도 약 70%, 기간은 약 1~2년 의사결정: 온도와 습도 조절 기간 설정환경요소에 의해 숙성이 끝난 와인들에 발생한 미묘한 차이를 보완 까베르네 쇼비뇽 + 메를로 + 쁘띠보르도 or 프랑병입후 숙성을 통해 와인을 안정시키고, 거친맛 최소화 숙성온도 약 10~15도 습도 약 75% 약 3~24개월 의사결정: 적정 온도 및 습도 숙성 기간시스템은 사용자 ID/PW 설정, 관리가 가능해야 한다.운영환경 요구사항프로그램 사용법 교육 대상 : 중간관리자 이상 방법 : 주2회 2주간 4회 강의실습식 교육(테스트 바로 실시)교육훈련 요구사항다음 년도 씨뿌리기가 시작되기 전에 설치가 되어야 한다.이행 요구사항사용자 수준과 역할에 따른 인터페이스 - 쉬운 조작법, 논리적 보안(Log-in) 인터페이스 요구사항 - 그래픽 뷰 기능, 네비게이션 기능 H/W 요구사항 - CPU : Intel Pentium4 이상 - RAM : 512MB 이상사용자 인터페이스 요구사항사용자 역할 : 중간 관리자 이상급 사용자수 : 10여명사용자 분포재배 프로세스: 포도를 재배하는 과정에서의 의사결정지원 제조 프로세스 : 수확 후 와인으로 가공하는 과정 지원개념적 프로세스 모델운영 데이터의 일급 보안, 소스코드 제공(escrow agreement)가정 및 제약조건사용자 요구사항컨설턴트 (요구사항 분석)DB 설계자프로그래밍 매니져프로그래머DB 관리자시스템 기획 팀정보 설000 (월/달)1-1고급기술자디자인7M/m*1,000,000원 = 7,000,0001,000,000 (월/달)7-1초급기술자2M/m*1,250,000원 = 2,500,0001,250,000 (월/달)2-1중급기술자1M/m*1,500,000원 = 1,500,0001,500,000(월/달)1-1고급기술자4M/m*20일*230,000원 = 18,400,000230,000 (원/일)1-4특급기술자프로그래밍4M/m*20일*230,000원 = 18,400,000230,000 (원/일)1-4특급기술자요구분석4M/m*20일*230,000원 = 18,400,000230,000 (원/일)1-4특급기술자총괄공급액노임단가M-m인력구분팀별구분*소프트웨어산업진흥법시행령 제 16조(S/W기술자의 등급별 노임단가)의 규정에 의한 소프트웨어사업의 대가기준프로젝트 관리(개발비 산정)제경비 및 기술료194,554,000합계34,424,000(직접인건비+제경비)*0.2기술료84,920,000직접인건비의 110%제경비77,200,000직접인건비비고금액요율항목프로젝트 관리(타당성 분석)개발비 산정117,425,000합계4M/m*25일*112,000원 = 11,200,000112,0004-1초급기술자1M/m*25일*175,000원 = 4,375,000175,0001-1고급기술자테스트4M/m*25일*112,000원 = 11,200,000112,0004-1초급기술자1M/m*25일*175,000원 = 4,375,000175,0001-1고급기술자디자인7M/m*25일*112,000원 = 19,600,000112,0007-1초급기술자2M/m*25일*142,000원 = 7,100,000142,0002-1중급기술자1M/m*25일*175,000원 = 4,375,000175,0001-1고급기술자4M/m*20일*230,000원 = 18,400,000230,0001-4특급기술자프로그래밍4M/m*20일*230,000원 = 18,400,000230,0001-4특급기술자요구분석4M/m*20일*230,000원 = 18,400,구축코딩검토회의시스템 시험교육시스템 설치테스팅 및 유지보수코딩작업제배 DB 구축환경 DB 구축구현아키텍쳐DFD프로토타입설계*************14321월별주차2월1월12월11월프로젝트 관리(위험 관리)프로젝트 후반에 범위 축소필요한 요구사항이 누락빈번하게 추가되는 새로운 요구사항개발이 진행된 후에 범위 정의가 변경프로젝트 관리(위험 관리)아웃소싱의 위험공급업체의 계약 불이행공급업체에 대한 과도한 의존보안유지 곤란실제효과 검증의 어려움수준 미달의 공급업체 선정 가능성해결 방안관리체계 강화 주기적인 성과 평가 파트너 쉽의 형성 계약의 명확화프로젝트 관리(위험 관리)대화 부족의사소통핵심 인력들이 세계 각 지역으로 떨어져 있기 때문에 대화 부족이 발생할 수 있다.원인원인해결 방안해결 방안주기적인 화상 회의로 서로의 의견을 교환한다. (각국의 시차를 고려해야 한다. 프랑스(-8), 인도(-4), 한국(0))같은 용어를 사용하지 않는 프로젝트 참여자용어를 용어집에 정의 명확한 어휘를 사용가. 테이블(Table)정의 나. 열(Column)정의 다. 제품환경에 데이터 구조 적용 라. 엔티티에 대한 업무 규칙 설계 마. 관계(Relation)에 대한 업무규칙 설계 바. 속성에 대한 부가적인 업무 규칙 설계물리적 엑세스 방법의 선택 가. 스캔(scan) 효율성을 위한 튜닝(Tuning) 나. 클러스터링에 대한 순서 정의 다. 해쉬(hash)키 정의 라. 인덱스(index) 추가 2. 물리적 구조 재정의 가. 중복 데이터 추가 나. 열(column) 재정의 다. 테이블 (table) 재정의물 리 적 구 조 전 환데 이 터 베 이 스 튜 닝DB 기 본 설 계DB 상 세 설 계데이터 모델링- 설계산출물에 따라 소스코드를 작성하고 개발자에 의한 모듈 테스트를 수행함 - 디버깅 도구 논리경로감사기(logic path monitors) 메모리덤프(memory dumps) 출력분석기(output analyzer) - 작업내용 프로그램 및 모듈작성 데이터베이스의 구축 및 초기 데이터 로드ester고사양 - 저사양의 PC환경구현 테스트. 각 사양에 주변장치들의 구성 변화 후 테스트. 최소요구사항에서 최종 구성 시험 테스트 수행.구성 시험 시나리오참조문서:상세설계명세서작성단계 : 개발책임자 : Tester- 테스트 데이터 생성.구성 시험 데이터결과 :ISO 9126 (소프트웨어 품질특성과 품질척도규정) 기능성(functionality) 신뢰성(reliability) 사용성(usability) 효율성(efficiency) 유지보수성(maintainability) 이식성(portability)- 작업내용 시스템이전(migration) 운영절차서 또는 매뉴얼의 완성 조직원의 훈련완료 - 산출물 설치된 시스템 및 데이터베이스, 윤영메뉴얼, 훈련된 사용자 - 고려사항 적절한 시기 선정(주말 휴농기) 만약의 사태를 대비한 비상계획 수립 이행후 철저한 확인 및 발생한 에러의 로깅과 해결시스템의 가동준비 및 가동시작 전후의 문제사항해결0경영자기상청R D dep.레포트원시 데이터 레포트사용자 변수분석데이터기상데이터Donkour1.1Context diagram1입력 프로세스3출력프로세스2분석 프로세스경영자기상청R D dep.D1통합 데이터D2분석결과사용자 변수분석결과기상데이터분석데이터통합데이터결과 파일레포트원시 데이터 레포트분석모델별 데이터*Level 1 diagram재배프로세스2.1제조프로세스2.2D1통합데이터D2분석결과사용자 변수분석결과분석결과분석모델별 데이터*분석모델별 데이터*Level 2 diagram침 용2.2.1효모2.2.2블렌딩2.2.5병숙성2.2.62차발효2.2.3숙성2.2.4D1통합데이터D2분석결과탄닌 농도, 색소, 용도포도즙농도, 포도즙온도 탄닌농도, 색소, 발효통종류통종류, 박테리아 배양량,사과산농도,유산농도숙성온도, 습도, 품종, 용도강우량, 일조량, 온도, 수확시기, 병숙성 습도, 숙성기간, 초기가중치 침용기간, 파괴 접촉 기간, 효소량,가지치기와 솎기의 정도, 수확시기숙성온도, 습도사용자 변수Level 3 diagram1 = 강우량, 일조how}
INFLUENCE DIAGRAMS의사 결정 문제를 이해하고 정의하면 분석을 해야 한다. 이 때 구조화된 모델이 사용된다. Flowchart가 컴퓨터 프로그램의 흐름을 그래픽하게 표현하듯이 Influence diagram은 모델의 지도(a map of a model)가 된다. (Effectively a model of a model.) 그리고 Influence diagram은 모델 설계(design), 개발 및 이해(development & understanding)를 도와주는 그래픽한 표현(graphical representation)이고 Model Builder와 Development Team 간에 visual한 의사 소통을 지원해 준다. MSS의 정확하고 본질적인 관계(relationship)을 표현하는 구조(framework)를 제공해주기 때문에 모델의 주요한 면에 초점을 맞출 수 있고 덜 중요한 고려 요소를 제거하는데 도움을 준다. 여기서 Influence란 다른 차원의 변수에 대한 변수의 종속성(dependency)을 의미한다. 그리고 Influence diagram은 여러가지 형식으로 나타난다.{{변수는 연결 방향을 나타내는 화살표로 연결된다. 화살표의 모양은 관계의 형태에 따라 모양이 틀려진다.{한 쌍의 변수의 관계에 따라 한방향, 양방향으로 나타낼 수 있다.Influence diagram은 정교하고 세밀한 정도로 구조화 될 수 있다. 이것은 모델 빌더가 모델의 작용의 방향(direction of the influence) 뿐만 아니라 모든 관계와 변수를 지도화(to map) 할 수 있게 한다.
{제 목 : { AHP를 통한 의사 결정 모델{{과 목 명:{의사결정지원시스템{학 과:학 번:이 름:제 출 일:담당교수:- 목 차 -1. 연구배경 --------------------------------------------- 32. 연구목적 과 방법--------------------------------------- 33. 의사결정모델 ----------------------------------------- 4모델설명 -------------------------------------------- 4모델print -------------------------------------------- 54. 의사결정프로세스 -------------------------------------- 6Intelligence ------------------------------------------ 6Design --------------------------------------------- 13Tree형태 -------------------------------------------- 15Choice --------------------------------------------- 16Best Choice & consistence analysis ---------------------- 20민감도 분석 ------------------------------------------ 225. 결 론 ----------------------------------------------26연구요약&기타설명 ------------------------------------- 266. 참고문헌 -------------------------------------------- 271.연구 배경:{가정용 PC보급률 80%, 인터넷 이용인구 2438만 명, 경제협력개발기구(OECD)국가 중 초고속인터넷 보급률 1위.(2003.정보통신부) 이처럼 우리나라는 초고속 정보통신 인프라를 바탕으2003.12)7.핵심컨텐츠1) 한메일(1997.5) : 온라인 우표제실지, 스팸 제로 시스템 사용으로 스팸 방지2) 다음카페(1999.5) : 개설카페 460만개(2004.4), 국내 최대 규모8.주요컨텐츠1) 인터넷 미디어 비즈니스- 한메일 : 무료 웹 메일 서비스로 최대 회원 보유(3700만명)-비 실명.-다음카페 : 가입자 2천 8백만, 게시실 14억개 보유한 국내 최대 카페(2004.4)- 미디어 다음(2003.3) : 자체 취재진의 생생한 취재.- 다음 검색 : 한국 최고의 검색 서비스(구글, 오버추어와 제휴,2003)- 다음 무선 인터넷(2000년 포털 사이트에서 최초 실시)- CUVE(온라인 종합 멀티미디어 센터) : 매일 100편의 동영상, 드라마등을업데이트(2003.10)2) 온라인 쇼핑 비즈니스- d&shop(2000.3) : 한국전자상거래 종합 쇼핑몰부분 대상(2002),회원수 700만명(2004)- 다음 여행/항공(투어익스프레스)(1999.10)3) 금융 비즈니스- 다음 다이렉트 자동차 보험- 다음 금융프라자(2003.9) : 월 420만명 방문.4) 엔터테인먼트 비즈니스- 오이뮤직 (1999)- JYP엔터테인먼트- 플럭서스뮤직- 미디어2.0(2002.1)9. 목 표 : 사람과 사람, 사람과 사회를 잇는 새로운 커뮤니케이션을 추구 (이메일, 카페 등에 기반한 새로운 인터넷 문화를 선도)10. 다음은?- 다음은 대한민국 포털 사이트 NO.1(이메일, 카페을 통한 최대 회원수 확보(3700만명)- 핵심 컨텐츠를 이용한 사업 다각화 성공. (인터넷 미디어 비즈니스,온라인 비즈니스, 금융 비즈니스, 엔터테인먼트 비즈니스 등)- 신규 컨텐츠 개발 성공(이메일, 카페 등)- 자사 광고를 통한 자사 브랜드 이미지 구축2. 야후(kr.yahoo.com))1. 소 개 : 검색엔진. yahoo는 YET ANOTHER HIERARCHICAL OFFICIOUS ORACLE의 약자(1997.9).미디어 서비스(뉴스, 방송, 검색), 커머스 서비스(쇼핑, 금융정 : 21,623,793 도달률 70.14%)4. 엠파스(www.empas.com)1. 소개 : 검색 포탈(검색엔진), 1996년 9월 설립, 1997년 생활문화정보시티스케이프 서비스 오픈을 시작으로 다양한 인터넷 서비스를 개발, 운영하며 꾸준히 성장해온 인터넷 전문 기업- 엠파스는 통합 검색 서비스- 엠파스는 검색 결과의 질이 뛰어남.- 엄파스 정보는 언제나 살아있다.- 전문 서퍼제로 디렉토리 정보의 질을 한 단계 높였다.2. 사이트 순위 : 7위(인터넷 메트릭스 2004.03)3. 추정 방문자수 : 12,016.000명/월 (KoreanClick 2004.03)4. 방문횟수 : 89,296,000번/월 (인터넷 메트릭스 2003.12)5. 총 페이지뷰 : 775,597,000페이지/월 (인터넷 메트릭스 2003.12)6. 1회 방문 당 체류기간 : 4분 45초(인터넷 메트릭스 2003.12)7. 핵심 컨텐츠 :1) 검색 서비스- 사용자가 원하는 단어나 문장 등 생각나는 대로 검색어를 입력할 수 있다.- 자연언어 검색, 고급검색, 업무문서 파일, 압축파일, MP3파일, 동영상파일, 이미지 파일 검색 등 다양한 검색 방식을 지원한다.- 검색어 추천 기능을 지원, 사용자의 손쉬운 검색을 도와준다.- 특정 검색어를 제외하고 검색하는 등 엠파스는 다양한 검색 기능 및 사용 자에게 편의를 제공2) 온라인 게임 서비스 : 온라인 게임 서비스에서는 고스톱, 맞고, 세븐포커, 하이로우, 밀맨, 토익넷 등의 무료의 다양한 게임과 개성 있는 아바타를 만들어가는 재미가 있다. 현재 베타 서비스를 실시 중, 앞 으로 게임과 더불어 채팅, 음악방송이 더해지고, 열혈맞고, 블랙잭, 바카라 등의 게임을 함께한다.8. 주요 컨텐츠- 검색, 쇼핑, 뉴스, 엠팔, 포토, 사전, 교육, 생활, 엔터테인먼트,컴퓨터/인터넷9. 목표 : 최고의 인터넷 미디어 회사10. 엠파스는?- 사용자가 단어나 문장을 생각나는 대로 입력하여 검색할 수 있는 국내 최 초, 최고의 문장으로 찾는 검색엔진.-사용자가rea" 선정기준 평가영역96년 최초로 시행되어 현재 2회까지 시행된 베스트 웹 코리아는 경향신문, 한국정보 문화센터, NAVER가 공동주최 하였으며 평가영역은 다음과 같다.1콘텐츠-내용의 중요도 2최신의 정보 3독창성(기술·내용)4표현성(시각적 효과·디자인) 5사용자편의성(User Interface)- 전자신문사의 "한국인터넷대상(K.I.C)" 평가영역99년에 제 3회의 행사를 맞는 한국인터넷대상(K.I.C ; Korea Internet Cont-test) 은 전자신문사, 한국통신, SBS가 주최하였으며 심사원칙에 쓰인 평가영역은 다음과 같다.1내용충실도 2정보가치성 3표현성 4디자인 5적용기술난이도우리나라 인터넷 환경은 날이 갈수록 발전하고 있다. 인터넷 사용 인구가 기하급수적으로 늘고 있으며 그에 따라 인프라도 발전하고 있다. 이런 환경에서 각 업계에서는 다양한 수익모델을 통해 이윤을 얻고 있다. 따라서 인터넷 환경 방문자의 수가 중요해지고 있다. 왜냐하면 방문자의 수가 많다는 것은 그 만큼 광고의 효과가 크고 수익을 낼 수 있는 가능성이 크기 때문이다. 그렇기 때문에 관문에 해당하는 포털사이트에 관심이 커지고 있으며 포털사이트 업계에서는 선두주자와 후발주자의 경쟁이 치열해지고 있고 특히 업계 선두를 지키거나 탈환하기 위한 경쟁이 불꽃을 튀기고 있다. 또한 기업 합병을 통하여 덩치를 키우며 성장하는 사이트도 있고 차별화된 서비스로 인터넷 유저들을 모으며 성장하는 사이트가 있으나, 점점 하락하거나 침체된 기업도 있다. 이러한 상황에서 User로써 우리가 사용하는 포털사이트를 평가해보는 일은 가치가 있는 일이다. 최고의 포털 사이트를 찾아 보는 것은 소비자가 시장에서 상품을 이리저리 비교하며 선택하는 것과 비슷하다고 할 수 있다. 보다 질이 좋고 싼 제화를 선택하는 것은 현명한 소비자다. 현명한 인터넷 유져라면 넘쳐나는 포털사이트를 비교할 필요가 있다. 각 포털사이트를 비교하므로써 최고의 포털사이트를 찾는 것이 우리조의 과제이다.- Design{포털사이트(p 간: 2004. 2. 1. ~ 2. 29.{다음 카페 서비스의 1월 한달 간 이용자 수는 무려 2천만 명에 육박하고 있으며, 실질적인 이용지표인 이용자 열람 페이지뷰와 체류 시간에서도 여타 포탈 사이트의 커뮤니티 서비스를 크게 압도하고 있다. 한편 싸이월드 미니홈피는 네이트와의 트래픽 통합 이후 이용자 수가 지속적인 증가 추이를 보이고 있어 사이트 통합 시너지 효과를 톡톡히 보고 있는 것으로 나타났다. 사이트 통합 다음 달인 작년 11월에 싸이월드의 이용자 수가 398만 명이었으니 3개월 만에 88.9%의 이용자 수 증가를 보인 것이다.* 대 상: 만 6 ~59세 국내 인터넷 이용자* 기 간: 2004. 2. 1. ~ 2. 29.{네이버 카페는 2월 초 전지현을 모델로 앞세운 TV 광고 등 서비스에 대한 홍보를 강화하면서 서서히 네티즌의 관심을 모으고 있다. 작년 12월 오픈 이후 올 1월까지는 주간 이용자 수가 50만~80만 명 수준이었으나, 캠페인과 이벤트가 동시에 진행된 2월 초 이후 이용자 수가 2배 이상 수준으로 증가한 것으로 나타났다. 네이버 카페의 2월 방문자수는 572만 명으로 일정 수준에 올랐지만 서비스에 대한 이용자의 충성도를 설명하는 이용 일수는 2.2일 정도로 나타나 이후에도 네이버 카페가 성장을 지속하면서 성공적인 커뮤니티 서비스로 남을 지는 아직 미지수이다.{컨텐츠의 양과 질: 다음-네이버-엠파스-네이트-야후컨텐츠 양과 질에 있어서는 단연 다음 카페가 최고이다. 생긴지 오래 되었을 뿐만 아니라 가입자의 수가 워낙 많아 방대하고 필요한 자료가 다른 경쟁 사이트보다 많다. 하지만 네이버와 엠파스의 추격이 만만치 않다. 무한 용량의 물량 공세를 바탕으로 깔끔한 인터페이스와 최근 화두가 되고 있는 블로그를 연결하여 다음 카페를 추격하고 있다. 네이트와 야후는 커뮤니티 부분에서 뒤쳐져 있는 것이 사실이지만 최근 젊은이에게 가장 인기 많은 사이월드를 연계한 네이트와 커뮤니티 사업에 본격적으로 뛰어든 야후의 추격 또한 만만치 않다.스펨메일 : 다.
1. ETT의 정의ETT는 데이터의 추출(Extraction), 가공(Transformation), 전송(Transportation)의 약자인데, 데이터를 소스시스템에서 추출하여 데이터 웨어하우스에 로드 시킨 상태에서 정제 작업에 이르는 전 과정을 말한다.{ETT 방법은 소스 시스템의 종류, 데이터의 추출주기, 데이터의 양, 로딩속도, 소스 데이터의 질, 과거 데이터의 형식, 사용자의 요구 조건 , 소스 시스템의 역할 등에 따라서 달라진다.2. ETT의 형태ETT의 형태는 사실 테이블과 요약 테이블을 어떤 쪽에서 만들 것이냐에 따라서 달라진다. 두 가지 테이블을 소스시스템에서 미리 만들어 주거나, 데이터를 추출하여 데이터 웨어하우스에서 사실 테이블과 요약 테이블을 만드는 방법이 있다.소스시스템은 대개의 경우 회사의 중요한 운영계 시스템일 경우가 많다. 이 시스템에 부하가 많아져 다운되거나 성능이 저하되면 업무가 제대로 이루어지지 않을 수 있다. 그러므로 운영 시스템에서 데이터를 추출하여 데이터 웨어하우스에서 사실 테이블과 요약 테이블을 만드는 방법을 사용한다.대개의 경우 매일, 또는 매달 소스 시스템에서 데이터를 SAM 파일로 만들어서 데이터 웨어하우스로 보내는 오프라인 방식이나, 소스 시스템 DB와 데이터 웨어하우스 DB를 연결하여 DB내에 있는 데이터를 직접 로딩하는 온라인 방식을 택한다.3. 추출(Extraction)데이터 웨어하우스는 과거 수년간의 데이터를 보관해야 한다. 그리고 시스템을 가동하면 주기적으로 소스 시스템에서 데이터가 넘어오게 된다. 따라서 데이터 웨어하우스에 들어가게 되는 데이터는 초기 데이터와 주기적 데이터로 나눌 수 있다.초기 데이터 - 초기 데이터는 과거 수년간의 데이터이다. 이런 수년간의 데이터를 초기에 데이터 웨어하우스로 로딩 시키는데 이를 초기 로딩(initial loading)이라고 한다. 초기 로딩시에는 많은 데이터를 한꺼번에 올려야 하기 때문에 오프라 인 방식을 사용한다.주기적 데이터 - 시스템이 가동되면 일 단위, 월 mation)소스 시스템에서 추출한 데이터를 데이터 웨어하우스에서 그대로 사용할 수 없다. 왜냐하면 데이터 웨어하우스의 사실 테이블이 특정 포맷으로 되어 있기 때문이다. 그리고 사용자의 요구가 간단치 않기 때문에 여러개의 테이블을 조합해야 한다. 마지막으로 소스데이터의 코드가 일치하지 않기 때문이다. 예를 들은 제품 코드가 매출관이 시스템이나 신용 판매 시스템과 상이하다면 이를 하나로 통일시켜야 한다.Converting dataDeciding which data of multiple sources is the bestSummarizing dataDecoding /encoding dataAltering key structuresAltering physical structuresReformatting dataInternally representing dataRecalculating data5. 전송(Transportation)ETT는 데이터를 전송하는 방법에 따라 오프라인 방식과 온라인 방식으로 나뉜다.오프라인 방식오프라인 방식은 소스 시스템에서 파일 형태로 데이터가 내려오는 것을 말한다.{먼저 소스 시스템에서 SAM 파일을 만든다. 예를 들어 DB2에서 유틸리티를 사용하여 테이블의 데이터를 SAM 파일로 만든다. 이것을 FTP나 다른 저장장치로 데이터 웨어하우스서버에 로드한다. 이것을 하면 데이터 웨어하우스에 소스시스템의 SAM 파일과 똑같은 파일이 생긴다. 이것을 데이터 베이스에 로드한다. SQL Loader는 오라클 데이터 베이스의 유틸리티오써 SAM을 가장 빨리 올릴 수 있고 K*Loader는 데이터 정제를 하면서 동시에 데이터베이스에 올려주는 도구이다.온라인 방식온라인 방식은 소스 시스템 DB에서 데이터 웨어하우스로 직접 데이터를 내리는 방식이다. 이 테이블은 소스 시스템의 테이블과 똑같은 값과 포맷으로 되어 있다. 따라서 사실 테이블은 만들어주기 위해서는 데이터의 변형, 정제작업 등이 오프라인 방식과 동일하게 수행되어야 한다. 이를 위해서 주로 SQL 하드웨어의 조건이 대개의 경우 열 데이터의 질이 떨어진다. (오류가 많음)- 소스 시스템이 여러 개일 경우 데이터를 하나의 테이블로 합하거나 다시 여러 개의 테이블 로 100% 정확한 변환 프로그램을 작성하기 어렵다.- 시간에 따라서 변환된 데이터는 메핑 테이블에 맞추어 최신코드로 바꾸어야 한다.(예, 조직, 제품, 코드)- ETT 도중 문제가 생겼을 때 롤백(roll back)할 수 있는 방법을 마련해야 한다.7. 데이터의 정제 (data cleansing)데이터 웨어하우스에 들어가는 데이터는 100% 정제가 되어야 한다. 데이터가 정확하지 않으면 데이터 웨어하우스를 구축한 의미가 없어지기 때문이다.소스 데이터의 차원 ID(dimension)에 해당하는 값이 차원 테이블과 상이한 경우가 있다. 예를 들어 서울지사 코드가 001인데 소스 데이터에는 0001이라고 되어있을 경우, 이를 고쳐줘야 한다. 그리고 소스 데이터에 비정상적인 값이 들어 있을 수 있다. 예를 들면 날짜가 9월 31일 인 경우가 있는데 이를 고쳐줘야 한다.8. ODS(Operational Data Store)ODS는 집적 데이터베이스, Staging 데이터베이스, 통합 데이터베이스 등 여러 가지 이름으로 불려왔다. ODS는 데이터 웨어하우스의 사실 테이블로 가는 중간단계의 데이터 저장장소이다. ODS는 데이터 가공, 변환, 정제작업을 용이하게 해주고 원시데이터를 가지고 있어서 사용자의 요구 조건의 변화에 신속히 대응할 수 있도록 해준다. 그리고 사실테이블에 문제가 생겼을 때 신속히 복구하게 해준다.{사용자의 요구조건은 끊임없이 변하기 때문에 사실 테이블에 없는 데이터와 차원(dimension)을 요구할 수도 있다. 이때마다 운영계 시스템에서 데이터를 가져와야 한다면 그 프로세스가 복잡할 뿐 아니라 전산실의 사정상 즉각적으로 원하는 데이터를 가져오기가 어렵고 매우 번거롭다. 결국 운영계 시스템에 필요하다고 생각되는 부분의 모든 데이터를 중간단계의 저장고에 넣어둘 필요가 생기게 된다. 실제로 이록된 데이터의 내용, 품질, 조건 및 그 데이터가 갖고 있는 특징을 알려주는 데이터이다. 즉, 데이터에 대한 정보를 말한다. 메타 데이터는 작성한 실무자가 바뀌더라도 변함없는 데이터의 기본 체제를 유지하게 함으로써 일정한 시간이 지나도 일관성 있는 데이터를 이용자에게 제공할 수 있고, 메타 데이터는 데이터를 목록화(indexing)하기 때문에 사용하기에 편리한 정보를 제공한다. 그리고 메타 데이터는 정보공유(data sharing)의 극대화를 도모하여 데이터의 원활한 교환을 지원하기 위한 틀을 제공한다.관리자용 메타데이터 : table, column, index, data length, hierarchy, constraint, mapping info, relation, user access info, summery info, maintenance info, access level etc.사용자 메타데이터 : business subject description, field description, change info etc.{사용자의 요구사항은 계속 변한다. 이 요구 사항이 변할 떠 추출도구, 모델링 도구, OLAP도구, 관리도구의 메타데이터를 모두 바궈야 한다. 따라서 메타데이타를 통일하지 않으면 데이터웨어하우스 관리에 혼란이 온다. 그러나 현실에서는 모든 벤더가 도구를 만들때 통일된 메타데이터를 사용하지 않는다.10. Index인덱스는 포인터를 사용하여 행의 검색을 촉진시킬 수 있는 스키마 객체이며 명시적 또는 자동적으로 생성 할 수 있다. Column에 대한 인덱스가 없으면 한 테이블 전체를 검색하게 되는데 인덱스는 이러한 경우 QUERY의 성능을 향상시키면서 효율성에 기여할 수 있다.특징 - 인덱스는 테이블의 값을 빠르게 액세스 하도록 하는 데이터베이스 객체.인덱스를 만들면 사용자가 직접 조작할 필요가 없다.인덱스는 논리적으로도 물리적으로도 테이블과는 독립적이다.언제든지 삭제할 수 있으며 이는 테이블이나 다른 인덱스에 영향을 주지 않는다는 의미이다{{{{것으로 예상될 때■이와 같은 경우 인덱스를 생성하게 되면 필요한 자료만을 검색 하게 되므로 쿼리에 효율성을 가져오게 된다.- 인덱스의 생성이 비효율적일 때테이블이 작을 때컬럼이 질의 조건으로 잘 사용되지 않을 때대부분의 질의가 10-12% 이하를 읽을 것으로 예상될 때테이블이 자주 갱신될 때■이와 같은 경우 인덱스를 생성하게 되면 인덱스의 갱신에 더 시간을 빼앗기게 되므로 비효율적인 케이스가 된다.11. 비트맵 인덱싱(bitmap indexing)비트맵 인덱싱은 데이터 웨어하우스를 구축하는데 없어서는 안되는 중요한 기능이다. 특히 데이터의 변화정도(cardinality)가 크지 않을 경우 반드시 사용해야한다. 예를 들어 성별(cardinality=2)과 같이 변화 정도가 아주 작을 경우 기존의 인덱싱을 쓰면 수행속도가 아주 느려지기 때문에 아예 인덱스를 안 쓰기도 한다. 특히 데이터의 변화정도가 작은 데이터베이스 마케팅 분야, 고객분석 분야에 적합하다. 고객의 성별, 연령대별 분석(대개 5살에서 10살 단위이므로 전체 변수가 10단계정도), 직업별분석, 고객의 구분(우수고객, 보통고객, 악성고객, 이탈고객..)등 단계, 또는 등급을 나누어 분석할 때 그 변화정도가 20개 미만이어서 비트맵 인덱싱을 최적으로 사용할 수 있기 때문이다.다음 테이블 PROD에는 20건의 자료가 있으며, 한 컬럼의 이름이 제품명이고 가능 변화 정도는 4, 즉 TV, VCR, 카메라, 오디오 이다.CREATE BITMAP INDEX PROD_INDEX ON PROD(PNAME);{이때 TV비트맵과 VCR 비트맵끼리 논리적으로 OR를 해주면 결과치가 나오고 이 결과의 수를 세면 전체 답이 나온다. 컴퓨터 내부에서 논리적 연산보다 빠른 것은 없다.12. 분할(Partitioning)사실테이블이 매우 큰 경우 분할될 수 있는데 분할은 하나의 커다란 사실 테이블을 두 개 이상의 보다 작은 테이블로 쪼개는 과정을 말한다.분할의 이점 : 데이터를 논리적인 단위로 쪼갬으로써 질의에 응답하기 위해 검.
● Phase of the decision-making process의사결정이란 문제 해결을 위한 여러 대안들 가운데 하나를 선택하는 것이다. 그러나 가장 적절한 선택을 위한 결정을 하기 위해서는 그에 필요한 정보가 수집되어야 하고 또한 문제 해결에 적합한 대안이 마련되어야 한다.Simon (H. A. Simon, 1960 ) 이 개발한 모형에 따른 의사결정과정은 Intelligence, Design, Choice의 세가지 단계로 나뉘고, 후에 Implementation과정을 추가하였다. 의사 결정 단계가 잘 진행되어 올바른 결론을 가질 수 있는지를 확인하는 Monitoring 단계는 의사 결정 과정의 feedback의 형태를 취하게 되는데, 이 단계는 Intelligence 단계에 포함되는 것으로 보았다. 이러한 Simon의 Model은 가장 간결하고 합리적인 의사 결정의 특성을 표현하고 있다.각 단계의 과정에서, 그 이전 단계의 부족한 자료나 잘못된 결과가 발견되었을 경우 이전 단계로 되돌아가서 다시 진행시키기도 한다. 즉, 의사 결정의 단계를 단순한 순차적 과정이 아닌, 본질적으로 반복적인 과정인 것으로 파악하였다.. 그리고 기본적으로 의사 결정의 각 단계는 이전 단계의 어느 부분으로든 피드백이 가능한 것으로 보았다.Intelligence Phase에서는 문제를 정의하고 그 문제에 대해 책임을 질 수 있는 개인 혹은 그룹을 선정한다(Problem Ownership). Design Phase에서는 시스템을 표현하는 Model이 구축되게 되는데, 이 단계에서는 추상화를 통해 현실을 단순화하고 변화가능성이 있는 모든 것의 관계를 정리하는 과정이 필요하다. Choice Phase는 Model에서 제안된 해결방안들 가운데 가장 적합한 것을 선택하는 단계로써, Solution을 테스트하고 그것의 실현가능성을 확인한다. Implementation Phase에서는, Solution을 실제 적용함으로써, 성공 시에는 현실문제를 해결할 수 있으며, 실패 시에는 첫 번째 단는가는 조직 생산성의 수준을 감시하고 분석함으로써 파악할 수 있다. 조직 생산성을 파악하고 Model을 구축하는 것은 조직이 처한 환경에서 조직이 실제 취급하거나 조직에 관련된 실제 데이터를 기반으로 만들어지게 된다. 따라서 그러한 실제 데이터를 수집하고 평가하여야 하는데, 그러한 부분에서 의사결정자에게 혼란을 주는 사항이 발생하게 되며, 다음과 같은 사항을 주의하여야 한다.우선, 데이터가 실제 사용에 효용이 없는 경우이다. 이러한 데이터를 기반으로 Model이 만들어지게 되면, 정확하지 못한 평가가 이루어지게 된다.또 데이터 수집 비용이 큰 경우이며 데이터가 정확하지 못하거나 잘못된 정보 또는 사실이 아닐 수 있다. 그리고 데이터를 수집할 때, 수집되는 데이터의 범위나 선택에 사람의 주관이 개입될 수 있고, 수집된 데이터가 기밀성이 없을 수 있으며, 결과를 좌우하는 중요한 데이터들이 다소 Qualitative할 수 있다. 데이터 수집의 과정에서 너무 많은 정보로 인해 혼란스러울 수 있다(Information Overload). 또 도출되는 결과나 성과가 예정된 기한을 넘길 수 있다. 예를 들어, 수입∙지출∙수익 등은 시간상으로 봤을 때 다른 때(예를 들어 다음 회기년도)에 기록 될 수 있다. 이러한 어려움을 해결하기 위해서는 Present Value Approach(NPV)를 시도할 수 있다. 그리고 이러한 데이터 수집 시에, 미래를 위한 데이터를 수집하더라도, 과거의 데이터와 유사할 것이라는 가정을 한다. 가정하지 않는다면, 그 변화의 성향이 예견되어야 하며 그 내용이 분석에 포함되어야 한다.Intelligence Phase 초기 단계에서 일단, 이러한 조사가 끝나게 되면, 문제가 실제로 발생하였는가, 어디에서 그 문제를 찾을 수 있는가, 그 내용이 얼마만큼의 중요도를 갖는가를 알 수 있다.2. Problem Classification수집된 문제를 분류하는 것으로써, 어떤 문제의 개념화 단계이며, 정의 가능한 카테고리에 문제를 두기 위한 시도이다. Clas 문제점을 해결할 수 있는 능력이 없고, 반드시 해결해야 할 책임이 없기 때문이다. 즉, 문제에 대한 책임소재(Problem Ownership) 이 있지 않다는 이야기 이다. 따라서, 어느 조직에서 어떤 현상을 문제로 여겨지면, 그것을 다룰 수 있는 사람 혹은 그룹에 할당되어야 한다.● Decision-Making: The Design Phase설계(design)단계는 문제해결을 위한 여러 가지 대안을 계획하는 단계이다. 탐색단계에서 수집된 자료를 기초로 실행 가능한 모든 해결방안(Course of Action)을 모색하는 과정과 대안별 평가 기준에 따라 각각의 대안을 평가하는 과정을 포함한다.이 단계에서는 문제의 이해와 실현 가능성을 타진하기 위해 테스트가 시행되는데, 의사 결정 문제에 대한 Model이 구축되고 그 Model을 테스트하며, Model이 적합한지를 검토하게 된다. 또 Modeling을 통하여 문제를 개념화하고 Quantitative / Qualitative 형태로 문제를 추상화하계 된다. 결국 문제를 추상화하고 단순화 시킴으로써 실제 현실을 Modeling 하는 것으로, 현실에서의 복잡한 문제를 경우에 맞게(Case by Case) 얻을 수 있는 이익과 비용을 고려하여 적정 수준을 정하여 추상화하는 것이다.1. Selection of a Principle of ChoicePrinciple of Choice는 해결책에 대한 수용 가능성을 설명할 수 있는 표준이라고 말할 수 있다. Model에서는 Result Variable에 해당한다. 이러한 Principle Of Choice의 선택은 어떻게 우리가 의사 결정의 목적을 수립하는가, 어떻게 문제가 Model과 연관되는가를 하는 기준을 선택하는 것이다. Principle of Choice에서 중요한 두 가지의 Model은 Normative, Descriptive가 있다.2. Normative ModelsNormative Model은 모든 가능한 대안들 중에 가장 잘 증명된 대안을 이야기한다. 그러. 이러한 경향이 발생하는 이유는, 첫째로 시간적으로 여유를 갖지 못하는 것이 있다. 의사 결정의 속성상 예정된 시간이 지나면 그 가치를 읽어버릴 수 있기 때문에 시간을 넘기지 않기 위해 결정을 마무리 하는 경우이다. 둘째로, 최적화의 수행 능력이 없을 수 있다. 어떤 경우에는 Model을 통해 얻는 결과가 무한정 걸릴 수 있기 때문에 만족스러운 수준에서 결정을 하는 경우이다. 마지막으로, 더 나은 해결책으로 얻을 수 있는 크기가 그 해결책을 얻기 위해 소비되는 비용에 비교하여 가치가 없는 경우이다.이러한 경향은 기본적으로 인간의 제한된 합리성에서 기인한다. 인간의 처리 능력에 한계가 있고, 인간의 스키마(나이, 교육, 환경, 지식, 선호도)가 다르기 때문이다. 많은 의사 결정자가 직관에 의지하는 것은 이러한 요인들 때문이다.5. Developing Alternative문제를 해결하기 위해서는 적절한 대안 설정이 중요하며, 언제까지 대안을 개발할 것인가의 시간적 계획이 중요하다. 대안 설정은 유효성과 정보획득의 비용, 전문가의 지식이 요구된다. 또 발전을 돕는 방향으로 설정되고 평가되어야 한다. 대안을 찾는 것은 대안 평가의 표준이 결정된 후에 시작되는데, 미리 표준을 마련하는 것은 대안 탐색의 시간과 노력을 줄여주며, 마련된 대안을 평가하는 노력을 줄여준다.6. Measuring Outcomes도출된 결과의 평가는 goal 성취도 또는 goal 자체를 평가하는 것을 말한다. 예를 들어, 수익을 최대화한다는 goal에 대해서는 돈을 얼마나 벌었는가를 평가하면 된다. 고객만족이라는 goal에 대해서는 Complain의 감소추이는 어떠하며 충성도의 증가추이를 확인해 보면 된다. 각 조직의 부분, 또는 직책 별로 goal이 상충함에 따라 그에 따른 평가도 다를 수 있다. 따라서 도출된 결과는 일반적으로 복합적인 경우가 많은데, 복합적인 표준을 가진 평가 방법으로는 Analytic hierarchy Process가 있다.7. Scenarios주어진 시간에 특정 시스템 표현하고 있는 문제를 푸는 것과는(solve to a problem) 과는 다르다. 왜냐하면, Model을 풀어나가는 것은 문제에 대한 적합한 Model을 산출하는 것을 뜻하는 것이며, 문제를 해결한다는 것은 산출된 Model을 통한 성공적인 구현을 만들어내는 것을 의미하기 때문이다.즉, 의사결정 Model을 해결하는 것은 적절한 course of action을 찾는 것인데, 그러한 접근법에는 Analytical Techniques, Algorithm, Heuristics, Blind Search 등이 있다. 그리고 발견된 대안들에 대하여도 평가하여야 하며, 만약 여러 개의 목표를 가진 Model이라면, 모두 조사하여야 하고, 그것들 간의 결과를 적절하게 조율해야 한다. Model을 평가하는 방법에는 Sensitivity Analysis와 What-if Analysis가 있다.● Decision-Making: The Implementation Phase실행(implementation)단계는 선택된 대안을 실제로 실행하고 실행되고 있는 의사결정의 실행 과정을 통제하는 단계이다.어떤 문제에 대하여 제안된 해결책의 Implementation은 사실상 새로운 어떠한 것들에 대한 명령이 시작되는 것을 의미하며, 어떠한 변화를 소개하는 것이라고 할 수 있다. 그러한 변화는 관리되어야만 한다. 즉, User Expectation은 변화 관리의 부분으로 관리되어야 한다. 이러한 Implementation의 수준은 해당 업무에 결정된 해결책을 적용하는 것까지를 말하는 것이며, 필수적으로 Computer System까지 구현해야 하는 것은 아니다. 하지만, Computer System의 지원으로 인하여 의사 결정 과정은 개선될 수 있다.● Decision-Making: The Feedback Phase한가지 더 살펴 보아야 하는 것인 피드백(feedback)이다. 서두에서 밝힌 바와 같이 Intelligence 단계에 포함시키기도 하는데, 이 과정은, 대안 실행 후의 의사결정 된다.