데이터마이닝5장숙제
- 최초 등록일
- 2012.06.27
- 최종 저작일
- 2012.06
- 11페이지/ MS 파워포인트
- 가격 2,000원
소개글
과제있는데 어려워서 못푸신분들 참고하세요
목차
없음
본문내용
5.1 보스톤 주택가격 예측하기
데이터를 학습용 집합과 평가용 집합으로 분할하는 이유는 무엇인가? 학습용집합
과 평가용 집합은 어떤 용도로 사용되는가?
데이터를 분할하지 않고 사용하면 과적합화가 이루어지기 때문이다.학습용 집합은 모델을 구축하기 위해 쓰이고 평가용 집합은 그 모델을 평가하기 위해 쓰인다.
다중선형 회귀모형을 CRIM, CHAS 및 RM의 함수로서 주택가격의 중앙값(MEDV)
에 적합시키시오.
B. 모형의 예측변수들로부터 주택가격(중앙값)을 예측하기 위한 식을 작성하시오.
- Y= -23.607 -0.261(CRIM) +2.886(CHAS)+7.508(RM)
C. 찰스강 경계지역에 있지 않고 범죄율이 0.1이고 주택 1가구당 평균 방의수가 6개인
보스톤 지역의 한 구역에 대한 주택가격(중앙값)을 예측한 값은 얼마인가?
그리고 예측오차는 얼마인가?
Y= -23.607-0.261*(0.1)+2.886*(0)+7.508*(6)
=21.414
5.2 소프트 웨어 재판매 이익의 예측
타이코는 게임용과 교육용 소프트웨어 판매. 카탈로그 제품목록 수정으로 1000
건의 구매가 발생 이 데이터를 기초하여 구매고객이 지출한 총 소비금액을 예측
하려 한다.
C. SPENDING을 목표변수로 하는 예측모형을 적합시키기 위해서
가. 1,000개의 레코드를 학습용 집합과 평가용집합으로 분할하시오.
참고 자료
없음