R E P O R T[과제 주제] 빅데이터의 특성은 다양한 데이터의 유형(Variety)과 계속 발생하는 데이터(Velocity)를 활용한다는 것을 포함한다. 이와 관련하여 다음 사항에 대하여 토의하라.과 목 명. 경영정보시스템담당교수.학습자명.아 이 디.제출일자.1. 정형 데이터와 비정형 데이터의 개념적 차이를 서술하고, 기업에서 활용하는 각 유형의 예를 3개 이상씩 들어라.정형 데이터는 각 데이터 간에 사전 정의된 스키마에 의해 수집된 의미 있는 정보들의 집합이라고 할 수 있으며, 이들 각각의 정형 데이터 그룹 사이에 적절한 관계를 형성을 통해 분석 예측 등을 할 수 있다.비정형데이터는 다양한 형태로 존재하며, 스키마 등으로 정의될 수는 없으나, 특별한 분석 기법으로 분석 및 예측이 가능한 데이터이다.아래 에는 각각의 특징을 비교하였다. 정형 데이터와 비정형 데이터의 특징 비교데이터의 특징정형 데이터비정형 데이터특성양적 데이터질적 데이터모델사전 정의된 고정형 모델스키마가 없는 유연한 모델포멧제한된 수의 데이터 포멧매우 다양한 데이터 포멧DBSQL 기반의 관계형 DB특정 스키마 없는 NoSQL DB검색DB내에서 검색이 용이함특정 데이터 검색이 어려움분석양적 특성으로 분석이 용이함기존의 도구로 분석이 어려움저장 방법데이터 웨어하우스 사용데이터 레이크 사용정형 데이터의 활용 예시백화점 고객관리 시스템 – 각 고객의 구매시기, 구매가격, 구매상품에 대한 구매정보와 새로운 신상품 입고 정보를 매칭하여, 고객의 관심 상품 입고시 이에 대한 광고 정보를 보내 제품 구매를 유도한다.은행 고객신용관리 시스템 – 각 고객의 예금, 대출 및 상환 정보와 타 금융기관의 연체기록정보 등을 사용하여 각 고객의 신용등급을 결정하고, 이에 알맞는 고객 서비스를 제공한다.학원 학생관리 시스템 – 각 학생의 성적과 생활기록부 정보 및 기타 입시관련 정보와 각 대학의 전년도 입시정보를 분석하여, 적정한 복수의 대학 정보를 제공한다.비정형 데이터의 활용 예시여신상시시스템 - 금감원이 2013년도 1월부터 운영중인 시스템, 매달 전체 저축은행으로부터 여신보고서, 업무보고서와 기업신용정보 입수하여 연관성 분석 기법을 이용하여, 불법, 부실혐의 여신을 16개 유형으로 구분하여 DB를 구축하여, 상시 감시하는 시스템.구글 실시간 자동번역시스템 – 구글의 자동 번역시스템은 문장의 구조와 음운을 이해시키는 것이 아닌 전문가가 번역한 대량의 문건을 DB화 하여 비슷한 문장과 어구를 추론해 나가는 통계적 기법을 통해 구현한 시스템.구글의 ‘플루 트렌드’ - 일반적으로 사람들은 감기에 걸리면 병원 약국에 가기 전 독감이나 같은 단어를 검색하는데 구글은 이러한 점에서 생각해서 2008년부터 검색 정보와 위치를 기반하여 미국의 감기바이러스 확산 상황을 알려주는 서비스를 제공 중에 있다. 즉, 이 시스템은 ‘감기’나 ‘독감’과 같은 검색빈도가 높은 지역을 지도에 표시함으로써 독감의 확산을 예측할 수 있다. 대부분의 보건 기구는 일주일에 한번만 예상 수치를 업데이트하지만 Google 독감 트렌드는 18개 국가를 대상으로 매일 업데이트되므로 기존의 시스템을 보완한 것이다.2. 비정형 데이터의 분석이 경영의사결정에 도움이 될 수 있는 사례를 3개 이상 서술하고, 이것이 어떻게 의사결정의 질을 향상시킬 수 있는지 설명하라(Variety, Velocity, Veracity, Value의 개념에 근거하여 설명할 것).패션브랜드인 자라(ZARA)도 빅데이터를 분석하여 활용하고 있다. 자라의 경우 다품종 소량생산(Value)을 마케팅 판매 전략으로 삼고 있다. 일반적인 패션 브랜드의 상품 종류에 비해 2배 이상의 종류(Velocity)를 생산한다. 또한, 오더부터 생산, 매장에 입점할 때까지 단 6주이내(Variety)로 걸린다. 때문에 수요 예측과 매장 별 재고 산출, 상품별 가격 결정, 운송까지 실시간(Veracity)으로 파악해야 할 필요가 있었고, 이를 위해 MIT연구팀과 연계해 빅데이터를 활용하는 재고관리 시스템을 개발했다.KB국민카드의 경우, 빅데이터 분석을 통해 카드이용서비스 및 편의성을 제공하고 있다. 최근 몇 년 동안 카드 이용객의 행동패턴(Velocity)을 분석하여 “혜택가맹점” 앱을 개발하여 고객에서 맛집 추천 및 비슷한 고객의 상점이용 패턴을 제공함으로써 편리하게 정보(Variety)를 얻을 수 있었다. 또한, 최근에는 “실시간 마케팅시스템” (Veracity)을 개발해서 비즈니스에 적용, 운영하고 있다. 이 시스템을 통해 고객은 자신의 니즈와 위치에 따라 최적화된 카드혜택 및 맞춤형 정보(Value)를 실시간으로 검색하고 받을 수 있다.엔씨소프트에서도 빅데이터 기반의 고객 데이터 분석 시스템을 구현하고 운영 중에 있다. 불법적으로 다른 사람의 자산을 이용하거나 가져가는 행위를 잡기(Value) 위해 오랫동안 연구해 왔고 여기에 빅데이터 기술을 활용하고 있다. 방대한 고객의 행동 및 사용 로그 데이터를 분석(Velocity)하여 사기 탐지(Fraud detection) 알고리즘을 고도화 적용하고 이를 이용하여 불법 행위를 모니터링(Veracity)하고 있다. 수많은 사람들이 게임을 하고 여기서 엄청난 양의 로그 데이터가 쏟아져 나온다. 많은 양의 비정형 데이터를 실시간으로 분석(Variety)하고 알람을 표기하는데 빅데이터는 꼭 필요하다. 또한, 고도화된 사기탐지 알고리즘을 개발하기 위해 Data Mining기법 및 기계학습기술을 적극 활용하고 있다.3. 빅데이터의 활용이 향후 기업경영을 어떻게 변화시킬 수 있는지 설명하라(예, 기업전략, 조직구조, 인적자원 관리 등).빅데이터의 활용은 아래의 4가지 관점에서 기업의 경영을 변화시킬 수 있다.생산성 향상 – 전사적인 자원관리 시스템, 공급사슬 관리시스템, 판매시점 관리 시스템을 통해 생산성을 높일 수 있다.발견에 의한 문제 해결 - 구글 애널리틱스(Google Analytics), 구글 트렌드(Google Trends), 구글 상관관계(Google Correlate)등을 이용해 데이터를 추출하고, 분석하여 기존의 모델을 개선할 수 있다.의사결정 향상 - 과학화, 자동화를 통해 소스 데이터에 접근, 데이터 통찰과 관리, 데이터 분석과 결과 제시, 결과의 발견과 개선이라는 수순으로 과거의 의사결정 과정에서 발생하는 확증편향, 매몰비용오류, 기점화와 조정의 오류에서 벗어날 수 있다.새로운 가치 창출 스마트 비즈니스 - 새로운 비즈니스 창출은 다음과 같은 다섯 가지 기회의 확대 혹은 역량의 증가에 기인한다.고객 소비행동 및 일상행동 정보 수집으로 고객의 행태를 반영한 사업창출상황 혹은 맥락 인식 능력이 향상센서 중심의 자동화된 판단(의사결정)자원 이용을 최적화(스마트화)를 광범위하게 활용복합적인 자동 시스템을 실현참고문헌1. 2. 학위논문(박사), 기업의 빅데이터 활용 유형별 적용 방안 및 효과 분석저자: 이재성, 발행정보: 한신대학교 2014년3. 4.