데이터 마이닝 실습사례
- 최초 등록일
- 2013.04.24
- 최종 저작일
- 2012.12
- 17페이지/ 한컴오피스
- 가격 2,000원
목차
Ⅰ.프로젝트의 개요
1. 프로젝트의 목적
2. 프로젝트의 방법
Ⅱ.분석 방법 및 도구
Ⅲ. 팀원 업무분담 내역
Ⅳ.프로젝트 추진 일정
Ⅴ.분석과정 및 결과
1. 의사결정나무 분석을 통해 유의한 독립변수를 선별한다.
2. 로지틱스회귀분석을 통하여 고객의 구매여부 예측
Ⅵ. 결 론
본문내용
프로젝트의 개요
1. 프로젝트의 목적
남산쇼핑몰은 유기농식품과 건강식품 등을 온라인으로 판매하는 기업이다. 남산쇼핑몰의 CCO(Chief Customer Officer)인 최동국 이사는 최근에 비만인구의 증가에 따라 다이어트를 원하는 고객이 폭발적으로 증가하고 있다는 신문기사를 보고 다이어트 식품과 기타 보조식품 등을 대표상품으로 한 공격적인 신규고객확보전략을 실행할 것을 고려중이다. 다이어트 식품과 기타 보조식품은 남산쇼핑몰에서 판매하고 있는 상품 중 가장 이윤이 많이 남는 상품이기에 최근의 영업이익률 하락 추세를 만회하기 위해서도 판매를 촉진하여야 하는 상품이다. 특히 최 이사는 정교한 데이터 마이닝 모형의 구축을 통해 다이어트 식품과 기타 보조식품의 상품 구매 가능성이 높은 고객 군의 성향을 파악하여 이를 기반으로 신규고객에 대한 공격적 확보전략을 실행한다면 마케팅 비용을 최소화하면서도 보다 효과적인 신규고객 확보를 할 수 있을 것으로 기대하고 있다. 남산쇼핑몰의 기존 고객 700명 중 다이어트 식품과 기타 보조식품을 구매한 적이 있는 고객과 구매 경험이 없는 고객의 데이터를 이용하여 구매가능성이 높은 고객의 특성을 찾아서 아직 미가입고객인 일반인 300명 중에서 다이어트 식품 등을 실제 구매할 가능성이 높은 고객을 찾아내는 것이다.
< 중 략 >
분석 방법 및 도구
남산쇼핑몰의 마케팅 활동의 반응 고객을 예측하기 위해 다양한 데이터마이닝 기법을 이용한다. 이분형 로지스틱 회귀분석과 의사결정나무분석을 사용하기로 결정하였으며, 의사결정나무분석을 우선적으로 수행하여 여러 독립변수들 중 종속변수의 값에 큰 영향을 미치는 변수와 영향을 덜 미치는 변수를 찾아낸 후, 이분형 로지스틱 회귀분석을 통해 앞서 찾아낸 변수들을 적용하여 고객의 구매여부를 예측해 보기로 한다. K-means 군집분석은 실험해 본 결과 캠페인 반응여부를 예측하는 데에 적절하지 않다고 판단하고 사용하지 않기로 한다.
실제 결과 도출 과정에서는 수 없이 많은 의사결정나무분석과 로지틱스회귀분석이 사용하였고 이를 모두 보고서에 포함시키기에는 의미 없는 자료의 중첩이라고 판단하여 결론을 도출하는데 있어서 큰 영향을 준 변수들이 포함된 자료들만을 첨부하여 의미 없는 자료로 보고서가 난해하지 않도록 하였다.
참고 자료
없음