• 파일시티 이벤트
  • LF몰 이벤트
  • 서울좀비 이벤트
  • 탑툰 이벤트
  • 닥터피엘 이벤트
  • 아이템베이 이벤트
  • 아이템매니아 이벤트

연세대학교 미래캠퍼스 데이터마이닝 기말고사

*예*
개인인증판매자스토어
최초 등록일
2022.03.16
최종 저작일
2021.12
10페이지/한글파일 한컴오피스
가격 5,000원 할인쿠폰받기
다운로드
장바구니

* 해당 문서는 문제형식의 자료로 각 문제에 대한 답이 포함되어 있지 않습니다.

목차

1. 기말시험 문제지

본문내용

1. 다음 물음에 답하시오.
(1) 연관성 규칙(Association rules)의 장단점을 기술하시오. (5점)
(2) 군집분석의 장단점을 기술하시오. (5점)
(3) 선형회귀분석과 로지스틱회귀분석의 유사점과 차이점에 대해 기술하시오. (5점)
(4) 머신러닝을 통해 분석하고자 하는 데이터에 결측치가 존재할 때 일반적으로 평균 대치(Mean Imputation) 또는 제거(Deletion) 방법을 활용하여 결측치를 처리한다. 평균 대치와 제거 방법을 활용하여 다수의 결측치를 처리할 경우 발생할 수 있는 문제점에 대해 기술하시오. (5점)

2. 다음 자료에 대해 답하시오.
(1) 연관성 규칙 W->O 의 지지도(support)와 신뢰도(confidence)를 구하시오. (5점)
(2) 연관성 규칙 ‘W->O’ 및 ‘W->not O’ 의 향상도(또는 개선도: lift)를 각각 구하시오. (5점)
(3) 연관성규칙의 탐사는 결국 신뢰도(confidence) 또는 향상도(lift)가 높은 규칙을 거래 데이터로부터 도출하는 과정인데, 흔히 Apriori 알고리즘을 사용한다. 최소지지도 조건을 30%로 할 때, 가능한 빈발항목집합을 구하시오. (10점)

3. 다음은 10명에 대한 PC의 사용경력(X1)과 주당 사용시간(X2)이다. 준집수가 K=3이라 가정하여 K-means 알고리즘을 단계적으로 적용하여 최종 군집해를 결정하시오. (10점)
[조건] 무작위 방법을 이용하여, 3개의 객체가 군집 중심좌표로 선정된 세 가지 경우를 고려한다(좌측). 그리고, 각 객체에 대해 3개 군집좌표와의 거리 산출값을 활용한다(우측).

4. UCLA 대학원 진학 데이터를 활용하여 로지스틱회귀분석을 수행하였다. 독립변수는 지원자의 시험점수를 의미하는 gre, 지원자의 대학 평량평균을 의미하는 gpa, 지원자의 대학 등급을 의미하는 rank로 구성되어 있다.

참고 자료

없음
*예*
판매자 유형Bronze개인인증

주의사항

저작권 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

이런 노하우도 있어요!더보기

최근 본 자료더보기
탑툰 이벤트
연세대학교 미래캠퍼스 데이터마이닝 기말고사
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업