BRONZE
BRONZE 등급의 판매자 자료

데이터마이닝 과제

방대한 850만건의 자료 중 주제별로 만들수 있는 최적의 산출물을 해피 캠퍼스에서 체험 하세요 전문가의 지식과 인사이트를 활용하여 쉽고 폭넓게 이해하고 적용할수 있는 기회를 놓치지 마세요
8 페이지
한컴오피스
최초등록일 2016.12.31 최종저작일 2016.09
8P 미리보기
데이터마이닝 과제
  • 미리보기

    목차

    1. data( ) 함수를 통해 R에 내장된 기본적인 데이터를 검색해 보라. 이들 중 세가지를 선택하여 변수, 의미, 기술통계량 등을 위주로 선택한 데이터의 특징을 설명하라.
    2. 이항형 목표변수를 가진 데이터를 구해서 로지스틱 회귀모형을 적합해 보라.(단, data는 담당교수 홈페이지 자료실의 타이태닉 데이터(titanic.csv)를 이용하시오. 모형적합 후 적합한 모형을 간단하게 해석해 보시오.)
    3. 두 변수 X1과 X2는 1,2,3 등 세 가지 값을 가지는 데이터가 있다. 이 데이터의 목표변수는 집단의 소속정보를 나타내는 분류분석에 적당한 데이터이다. 2개의 집단이 있다고 할 때, 각 집단별로 X1과 X2에 대하여 분할표를 다음 표와 같이 생성하였다.
    4. 배깅, 부스팅, 랜덤포레스트 중에서 극단값에 더 예민하게 반응하는 앙상블 방법이 무엇인지 그 이유와 함께 서술하라.
    5. 다음은 3개의 부트스트랩 데이터에 의해 생성된 3개의 분류기에 대한 예측결과이다. 분류기별 가중치는 괄호 안에 제시되어 있다.

    본문내용

    4. 배깅, 부스팅, 랜덤포레스트 중에서 극단값에 더 예민하게 반응하는 앙상블 방법이 무엇인지 그 이유와 함께 서술하라.
    앙상블(ensemble)모형이란 주어진 데이터를 이용하여 여러 개의 서로 다른 예측 모형을 생성한 후, 이러한 예측 모형의 예측 결과를 종합하여 하나의 최종 예측결과를 도출해 내는 방법을 말한다. 목표변수의 형태에 따라 분류분석에도 사용 가능하고, 회귀분석에도 사용 가능하다. 분류분석에 사용한다면 분류앙상블, 회귀분석에 사용한다면 회귀앙상블이라 부를 수 있다. 현실적으로 앙상블 모형은 대부분 분류모형에서 사용되고 있는 실정이다. 이유는 데이터마이닝의 영역에서 더 자주 필요로 하는 모형이 분류모형이기 때문이라고 추측된다.
    데이터를 이용하여 생성해 낸 한 분류모형의 결과를 분류기(classifier)라 하자. 예측집단을 종합하는 방법으로는 주도 다수결 방식이 사용되고 있다. 다수결 방식에 따라 아래와 같이 구분할 수 있다.
    ① 단순 다수결 방식: 만약 예측치 중에서 6개의 분류기가 1이라고 예측하고, 5개의 분류기가 0이라고 예측했다면, 다수결 방식에 의해서 이 관찰치는 1이라고 최종 결론을 내린다. 배깅, 랜덤포레스트 방법이 단순 다수결 방식을 사용한다.
    ② 가중 다수결 방식: 각 분류기마다 가중치인 wi를 고려해야 한다. wi는 각 분류기 오류율의 역수 개념이다. 성능이 우수한 분류기에 가중치를 더 부여하는 것이다. 부스팅 방법이 가중다수결 방식을 사용한다.
    앙상블 모형의 종류에 따른 구분은 다음과 같다.
    ① 배깅 방법: 배깅(bagging) 방법은 Breiman(1996)에 의해 개발된 분류 앙상블 방법이다. Bagging은 bootstrap aggregating의 약어로 훈련 데이터로부터 부트스트랩 데이터를 B번 생성하여 부트스트랩 데이터마다 분류기를 생성한 후 그 예측결과를 앙상블하는 방법이다. 배깅 방법은 불안정한 분류방법의 예측력을 획기적으로 향상시킨다고 알려져 있다.

    참고자료

    · 없음
  • 자료후기

      Ai 리뷰
      지식판매자의 자료는 깊이 있는 분석과 명확한 설명이 잘 어우러져 있어 학습에 많은 도움이 되었습니다. 과제 작성 시 유용하게 활용할 수 있었습니다.
    • 자주묻는질문의 답변을 확인해 주세요

      해피캠퍼스 FAQ 더보기

      꼭 알아주세요

      • 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
        자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
        저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
      • 해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.
        파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
        파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

    함께 구매한 자료도 확인해 보세요!

    “통계·데이터과학과” 연관 자료 입니다

    찾으시던 자료가 아닌가요?

    지금 보는 자료와 연관되어 있어요!
    왼쪽 화살표
    오른쪽 화살표
    문서 초안을 생성해주는 EasyAI
    안녕하세요. 해피캠퍼스의 방대한 자료 중에서 선별하여 당신만의 초안을 만들어주는 EasyAI 입니다.
    저는 아래와 같이 작업을 도와드립니다.
    - 주제만 입력하면 목차부터 본문내용까지 자동 생성해 드립니다.
    - 장문의 콘텐츠를 쉽고 빠르게 작성해 드립니다.
    - 스토어에서 무료 캐시를 계정별로 1회 발급 받을 수 있습니다. 지금 바로 체험해 보세요!
    이런 주제들을 입력해 보세요.
    - 유아에게 적합한 문학작품의 기준과 특성
    - 한국인의 가치관 중에서 정신적 가치관을 이루는 것들을 문화적 문법으로 정리하고, 현대한국사회에서 일어나는 사건과 사고를 비교하여 자신의 의견으로 기술하세요
    - 작별인사 독후감
    해캠 AI 챗봇과 대화하기
    챗봇으로 간편하게 상담해보세요.
    2025년 08월 04일 월요일
    AI 챗봇
    안녕하세요. 해피캠퍼스 AI 챗봇입니다. 무엇이 궁금하신가요?
    12:27 오후