• 파일시티 이벤트
  • LF몰 이벤트
  • 서울좀비 이벤트
  • 탑툰 이벤트
  • 닥터피엘 이벤트
  • 아이템베이 이벤트
  • 아이템매니아 이벤트

데이터마이닝 6장 연습문제

*바*
최초 등록일
2007.11.14
최종 저작일
2007.11
13페이지/한글파일 한컴오피스
가격 1,500원 할인쿠폰받기
다운로드
장바구니

소개글

자유아카데미 데이터마이닝 방법론의 6장 연습문제를 SAS-Eminer 프로그램을 이용하여 푼 것입니다.

목차

제 6장. 예측모형에 대한 평가
분석사례 1 : 리프트 그래프를 이용한 모형평가
분석사례 2 : 사전확률과 이익을 고려하기
분석사례 3 : Threshold-based 그래프

본문내용

p206 <교차(Cross) 리프트 그래프 (Cumulative %Response)>
위의 그래프는 회귀노드에 대해 분석용, 검증용, 테스트 데이터에 관한 리프트 그래프를 함께 표현한 교차 리프트 그래프이다. 최고의 예측력을 가지도록 학습이 이루어진 연습용 데이터의 성능이 가장 높고 그 다음이 테스트용, 검증용 데이터 순임을 알 수 있다. 그러나 전반적으로 세 데이터 간의 리프트 그래프들이 크게 다르지 않은 것으로 보아 안정성(일반화 가능성) 있는 예측모형이라고 볼 수 있다. 의사결정노드와 신경망 노드에 대한 교차 리프트 그래프도 그려서 살펴 본 결과, 역시 위와 유사한 그래프를 가졌다.
p207 < 리프트 데이터 (Regression 노드) >
위의 그림은 리프트 그래프 윈도우에서 리프트 데이터 보기 아이콘을 클릭해 리프트 그래프 관련정보들을 데이터 형태로 본 것이다. 여기에서는 각 등급에 해당하는 사후확률의 절단값을 알 수 있는데, 예를 들어 연습용 데이터에 의한 상위 50%에 해당하는 절단값은 0.120이다.

리프트 그래프 윈도우에서 풀다운 메뉴의 형식, 수평축 간격 설정을 선택 후 set horizontal scale 대화상자에서 각각 2%, 20%단위로 수평축 간격을 변경해 보았다.
(1-특이도)를 x축으로 삼고, 민감도를 y축으로 삼아 ROC그래프를 그렸다. 그래프 아래의 면적이 넓을수록(1에 가까울수록) 예측모형의 성능이 좋음을 나타내는데, 육안상으로는 전반적으로 모형들의 성능이 좋으며 그 중에서도 의사결정나무 모형의 성능이 가장 좋은 것을 알 수 있다. 하지만 객관적인 수치로 모형의 성능을 측정하기 위해 실제로 면적을 구하면 다음과 같다.

BUYTEST 데이터세트의 변수 `RESPOND`의 역할을 target으로 삼고, 변수 ‘C1~C7, PURCHTOT`의 역할을 rejected로, 변수 BUY6, 12, 18의 변수측도를 interval로 수정했다.

참고 자료

없음
*바*
판매자 유형Bronze개인

주의사항

저작권 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

찾던 자료가 아닌가요?아래 자료들 중 찾던 자료가 있는지 확인해보세요

  • 한글파일 데이터활용_중국 엔터테인먼트 기업의 경영전략(HYB 기업) 12페이지
    분석 기법 1) 정량적 분석 2) 데이터마이닝 2. 데이터 수집 3. ... 따라서 데이터 마이닝의 필수적인 요소는 신뢰도가 높은 자료이다. ... 왜냐하면 중국의 학술 습관을 큰 환경에서의 산업 동향 또는 장단점 등 범위가
  • 파워포인트파일 국내 에듀테크 TOP 기업 조사 (2022년 버전) 8페이지
    지식재산권 보유 자연언어처리 , 의미기반 정보검색 , 인공신경망 , 텍스트마이닝 ... 평가 AI 영어학습 ( 실시간 발음교정 , 수준별 / 상황별 시나리오 연습 ... 작문 · 기계독해 (MRC), 설명가능한 텍스트 분류기 (XDC) 엔진 6
  • 한글파일 [A+과제]대전과기대 - 4차산업혁명과 미래기술 - 5장 '인공지능 기술' 문제풀이 과제 8페이지
    5주 과제 [제5장 인공지능 기술] 연습문제 1. ... 마이닝 등) 빅데이터 분석 (소셜 분석, 고급 분석, 시각화) 둘째. ... 지도 학습이란 특징(Features)이 정해져있는 데이터(Labeled Data
  • 한글파일 1년 이상 지속되고 있는 코로나19와 관련한 사회문제의 주제를 선정하여 5페이지
    등교시키지 않아 벌금을 부과 받은 뒤 결국 학교를 그만두게까지화관이나 노래연습장 ... 느낀다고 답하였으며 메르스 진료를 했던 의사들의 경우 우울 증상(26.6% ... , 텍스트 마이닝의 방식으로 통해 키워드를 분석하였는데, 코로나 감정과 관련된
  • 한글파일 [아주대학교] 최종보고서 빅 데이터 29페이지
    데이터의 어둠 Ⅲ. 빅 데이터의 전망 6. 프로젝트 결론 7. ... 대표적인 데이터 시각화의 예로 수많은 데이터를 한 장의 그림으로 요약한 인포그래픽과 ... ‘프라이버시’ 침해문제가 유발될 것이다. 2) 데이터 저작권 빅 데이터
더보기
최근 본 자료더보기
탑툰 이벤트
데이터마이닝 6장 연습문제
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업