• 캠퍼스북
  • LF몰 이벤트
  • 파일시티 이벤트
  • 서울좀비 이벤트
  • 탑툰 이벤트
  • 닥터피엘 이벤트
  • 아이템베이 이벤트
  • 아이템매니아 이벤트

데이터마이닝2

*슬
개인인증판매자스토어
최초 등록일
2011.01.20
최종 저작일
1997.01
41페이지/파일확장자 압축파일
가격 4,500원 할인쿠폰받기
다운로드
장바구니

소개글

데이터마이닝 수업을 들으며 수행했던 과제 내용입니다. 자세한 방법과 풀이과정이 적혀 있으므로 참고하셔서 사용하시면 좋을것 같습니다.9개 엑셀파일과 총정리한 1개 한글파일이 있습니다.

목차

제2장
문 제 1
1 회귀분석
-의사결정트리
-회귀분석과 의사결정트리의 차이점

2 고객관계관리방안
-인공신경망
-클러스터링-KMEANS
-CRM을 위한 조원토의

제2장
문 제 2
1 가장좋은방법론:베이지안
2 다른방법론과의 변수관계로본 차이
-회귀분석
-의사결정트리
-인공신경망

본문내용

제1장 1번문제
(문제1) 주어진 자료에서 CCAvg(Avg. Spending on Credit Cards per month, 이하 CCAvg)를 설명하는 변수를 회귀분석과 의사결정트리(Regression Tree이용)로 찾아서 서로 비교하시오. 차이가 발생한다면 그 이유는 무엇인가?

1. 회귀 분석(Regression)
데이터의 전처리를 Data Partition 하였다. Data Partition을 선택하였으나 과제의 주어진 자료의 row가 2500이어서 체험판에서는 사용이 불가능 하다는 것이다. 600개 이상의 row를 초과할 수 없기 때문에 처음 600개로만 데이터를 처리하고자 한다고 한다는 내용으로 지난 중간고사 대체과제시에 나타났던 문제와 동일한 것이다. 현재 본 학생(경영03이광우)의 컴퓨터로 작업을 하고 있고 오후에 학교에서 정식판으로 분석해 그 값의 의미를 약간 추가하고자 한다.
일단 모든 변수들을 Partition 대상에 집어넣었고 문제에서 주어진 대로 specify percentages에서 Training Set, Validation Set, Test Set의 비율을 50% : 30% : 20%으로 설정하려고 하였으나 여기에서도 문제가 발생했다. Training Set의 자료는 200개를 초과할 수 없다는 다음과 같은 창이 생겼다.
600개의 자료를 가지고는 Training Set의 비율을 최대 33.%로 밖에 할 수가 없다는 문제가 발생한 것이다. 그래서 이대로 과제를 수행한다면 처음 600개의 자료만 가지고 과제를 수행하는 것도 문제이거니와 문제의 요구사항 대로 Training Set, Validation Set, Test Set의 비율을 50% : 30% : 20%으로 설정하지 못하기 때문에 다르게 접근하였다. Training Set의 자료는 200개를 초과할 수 없기 때문에 Training Set의 비율을 50%로 가져가기 위해서는 자료가 400개가 필요한 상황이다. 즉 이말은 전체 2500개의 자료 중에서 Data Utilities를 이용하여 400개의 자료를 랜덤하게 뽑아서 그것을 바탕으로 과제를 수행하는 방법을 사용하더라도 통계적으로 큰 문제가 없을 것으로 보아 이 방법을 고려해 보게 되었다. 아래의 그림처럼 Data Utilities에서 Sample from Worksheet를 사용하여 400개의 자료를 표본추출하였다.

참고 자료

없음

압축파일 내 파일목록

과제2차-1번(신용관련)엑셀/과제1-1의사결정트리(정식판).xls
과제2차-1번(신용관련)엑셀/과제1-1회귀분석및트리(체험판).xls
과제2차-1번(신용관련)엑셀/과제1-2인공신경망(체험판).xls
과제2차-1번(신용관련)엑셀/과제1-2클러스터링(정식버전).xls
과제2차-2번문제(치료효과)엑셀/2-2번정리베이지안.xls
과제2차-2번문제(치료효과)엑셀/과제2-2-2공신경망.xls
과제2차-2번문제(치료효과)엑셀/과제2_RT_NODE2.xls
과제2차-2번문제(치료효과)엑셀/과제2_regeressiontree.xls
과제2차-2번문제(치료효과)엑셀/문제2_회귀재분석.xls
마이닝2차과제15조.hwp
*슬
판매자 유형Bronze개인인증

주의사항

저작권 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

찾던 자료가 아닌가요?아래 자료들 중 찾던 자료가 있는지 확인해보세요

  • 파워포인트파일 경영데이터마이닝 데이터 기초분석 발표자료 23페이지
    문제 2 DATA MINING 문제 3 데이터 소개 4 데이터 기초분석 ... 분석하여 직원들의 니즈를 반영한 맞춤형 인사관리를 하려고 한다. 2 DATA ... TERM PROJECT FINAL 경영데이터마이닝 INDEX 1 BUSINESS
  • 한글파일 데이터마이닝을 정의(1)하고 데이터마이닝 활용분야(2)에 대하여 3가지를 설명하시오 4페이지
    Data mining이란 “방대한 데이터에 내재하는 의미 있는 상관관계, ... 처리 능력 항상으로 Data Mining을 위한 대량 처리 실행 가능 2) ... Data Mining 문제점 1) 시스템 관점 ?데이터 정제 ?
  • 한글파일 데이터마이닝2(4장) 5페이지
    컴퓨터공학부 2004185029 김성태 데이터마이닝 레포트 4.6 분석사례 ... 이산화 (구간화) : Interactive Grouping 노드 Input Data ... Set Attribute 노드의 설정 Variables 탭(Data Set
  • 한글파일 데이터마이닝 과제2 7페이지
    결과 이용 : 군집 분석은 대용량 데이터에 대해 데이터마이닝을 수행하기 위한 ... (가) 부록 2에서 데이터세트에 포함되어 있는 변수들을 살펴보고, 어떠한 ... 군집3의 연봉이 가장 높으며 군집2의 연봉이 가장 낮은 것을 알 수 있다
  • 파워포인트파일 데이터마이닝2장숙제 3페이지
    0.25 ( 위음성율 ) a) 데이터를 학습용 집합과 평가용 집합으로 분할하는 ... 집합과 평가용 집합으로 분할하는 이유는 학습용 집합으로 모델을 구축후 원 데이터를 ... 민감도 0.341 특이도 0.966 4.2 번문제 A.
더보기
최근 본 자료더보기
탑툰 이벤트
데이터마이닝2
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업