• 파일시티 이벤트
  • LF몰 이벤트
  • 서울좀비 이벤트
  • 탑툰 이벤트
  • 닥터피엘 이벤트
  • 아이템베이 이벤트
  • 아이템매니아 이벤트

빅데이터, 데이터베이스 - knn 예측 (R studio)

아두
최초 등록일
2019.06.19
최종 저작일
2018.06
16페이지/파워포인트파일 MS 파워포인트
가격 1,000원 할인쿠폰받기
다운로드
장바구니

소개글

데이터예측 수업 때 knn예측으로 발표하여 A+ 받은 ppt입니다.
(심화과정 아님, 기초임)

R studio를 이용하여 knn예측법 사용, 최적의 k를 찾아 결과를 비교한다.

비교대상은 UCI(Machine Learning Repository) 홈페이지에서
Kama, Canadian, Rosa라는 씨앗의 크기, 둘레, 길이, 너비 데이터를 받아 결과를 추출

목차

1. 데이터 불러오기
2. 산점도 그려보기
3. BoxPlot 그려보기
4. 데이터 정렬하기
5. 정규화(Nomarlization) 작업
6. Train & Test label
7. knn 실행
8. 결과비교

본문내용

산점도 그려보기
#8열(Seed의 종류)만 뽑아 data.f에 저장

#종류별로 모양을 다르게 찍어내기 위해 factor인 변수를 integer형으로 저장
(변환된 숫자에 맞게 점의 종류가 다르게 찍힘)

#정수형으로 저장한 씨앗의 종류들을 각각 ‘빨강색’, ‘파란색‘, ‘초록색’으로 표현하기 위해 데이터 저장

#속성에 따른 종의 색이 구분되어 plot이 생성
→ 변수 사이의 상관관계를 알 수 있음

Boxplot 그려보기
#분류 해야 하는 8열(씨앗의 종류)을 제외한 seeds[1:7]데이터가 어떻게 생겼는지 확인
‘ 변수 값의 단위가 달라 제각각 ’ → 정규화 작업 필요

참고 자료

http://archive.ics.uci.edu/ml/index.php

자료후기(1)

아두
판매자 유형Bronze개인

주의사항

저작권 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

이런 노하우도 있어요!더보기

최근 본 자료더보기
탑툰 이벤트
빅데이터, 데이터베이스 - knn 예측 (R studio)
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업