R studio 데이터시각화 이론 및 실습 코드 요약
- 최초 등록일
- 2021.06.27
- 최종 저작일
- 2020.12
- 12페이지/ 한컴오피스
- 가격 2,500원
* 본 문서(hwp)가 작성된 한글 프로그램 버전보다 낮은 한글 프로그램에서 열람할 경우 문서가 올바르게 표시되지 않을 수 있습니다.
이 경우에는 최신패치가 되어 있는 2010 이상 버전이나 한글뷰어에서 확인해 주시기 바랍니다.
소개글
데이터시각화 개념 및 R studio 그래프 프로그래밍 코드
ggplot 각종 함수 코드 워드 클라우딩 등 실습 위주 코드 정리
(ggplot, ggplot2, geom 함수 정리)
목차
없음
본문내용
1주차
1. 데이터 시각화란?
정의 : 데이터 분석결과를 해석하여 의사결정을 지원하기 위해 데이터를 그래픽으로 표현하는 것, 메시지 전달을 위해 작성하는 이미지나 다이어그램 혹은 애니메이션 기술
시각화 필요성 : 1) 사고의 도구를 활용하는 인간은 인지 능력이 뛰어남 (사고 – 개인이 자연 및 사회적 관계 속에서 어떤 것을 알기 위해 도구를 활용하는 과정에서 생김) 2) 사고의 도구 : 종이나 펜과 같은 물건, 글쓰기와 그림 그리기 기술 등
시각화 사례 : 바다 속의 등고선 및 수심 측정을 통해 얻은 숫자를 입체적인 모습을 시각화할 수 있음
시각화 이점 : 거대한 양 데이터 쉽게 파악, 예상치 못했던 새로운 특징 파악, 종종 해당 데이터 문제점 나타냄, 크고 작은 특징 동시에 이해하는데 유용, 가설 뒷받침 정보 제공
- 시간 시각화 사례 : 교통사고 발생 건수
- 분포 시각화 사례 : 파이 차트
- 관계 시각화 사례 : 산점도
(교통사고 발생건수와 부상자 수 관계 제시)
- 비교 시각화 사례 : 히트맵 - 지역별 교통사고 부상자, 사망 자, 발생건수 비교 ; 한 눈에 여러변수들
각각 비교 가능, 지역별 차이점 쉽게 비교 가능
- 공간 시각화 사례 : 지도에 전달하고자 하는 정보 나타냄
2주차
1. 시각화 정의 – 데이터 시각화란?
인간의 시각 및 지각 능력을 토대로, 데이터에 대한 이해 및 설득시키는데 도움을 주기 위해, 그림이나 도형 등의 그래픽 요소들을 이용하여 데이터를 있는 그대로 묘사하고 숨어있는 것을 드러내는 표현 하는 것
아주 오래전부터 인간이 종보를 전달하기 위한 수단으로 사용해 온 의사소통 방법으로, 기하나 도형과 같은 양식을 이용하여 데이터의 특징을 잘 설명할 수 있는 모양으로 만들어내는 것이며, 색상, 레이블, 인터랙티브(모니터 클릭하면 움직이는거) 특성을 활용하여 데이터를 표현하는 것
ex. 지역별 교통사고 관련 정보를 표현하는 방법
: 도표 이용 (세부적으로 숨어있는 내용 세부적 설명)
지도에 관련 정보 표시 ( 한눈에 묘사 표현 전체적 윤곽 설명 O 세부적 구체적 X -> 보조적 자료로 사용되는 것이 주목적)
2. 시각화 기능 : 설명, 탐색, 표현으로 구분
- 설명 시각화 : 단일 시각 경험 제공 (객관적 설명)
-> 숨어있는 의미를 끄집어내는 것이 아니라
A는 30% B는 70%
참고 자료
없음