A+ 전산개론 과제 [빅데이터의 정의와 특징 그리고 분석 기술 조사]
- 최초 등록일
- 2021.07.05
- 최종 저작일
- 2020.10
- 6페이지/ 한컴오피스
- 가격 1,000원
* 본 문서(hwp)가 작성된 한글 프로그램 버전보다 낮은 한글 프로그램에서 열람할 경우 문서가 올바르게 표시되지 않을 수 있습니다.
이 경우에는 최신패치가 되어 있는 2010 이상 버전이나 한글뷰어에서 확인해 주시기 바랍니다.
소개글
A+ 받은 전산개론 과목의 "빅데이터의 정의와 특징 그리고 분석 기술 조사" 레포트 입니다.
빅데이터의 기초적인 부분부터 심화 부분까지 모두 다루었습니다. 또한, 직접 제작한 삽화가 포함되어 있기에 빅데이터를 알고 있지만 어떻게 서술해야 할지 감이 안 잡히거나 빅데이터를 깊게 알고자 하시는 분들께 해당 레포트를 추천합니다.
목차
1. 제 1장 서론
2. 제 2장 빅데이터 정의
2.1 빅데이터 정의
2.2 구조화 데이터 & 비구조화 데이터
3. 제 3장 빅데이터 특징
3.1 3V (Volume, Velocity, Variety)
3.2 빅데이터의 4가지 요소 (3V + Veracity)
4. 제 4장 빅데이터 분석기법 및 활용 사례
4.1 분석
4.2 분석 기법
4.3 활용 사례
5. 제 5장 결론
6. 참고 문헌
본문내용
제 1장 서론
빅데이터란 무엇인가? 빅데이터란 정말 ‘큰’ 규모의 데이터이자 저장, 관리, 추출, 처리, 시각화, 분석하는 등의 기술 그 자체를 말한다. 여기에서 ‘큰’ 규모란 대게 수십 TB에서 수십 PB 이상을 말한다. 빅데이터는 기본 수십 테라바이트 이상에 속하며 전 세계 디지털 데이터의 양은 제타 바이트 단위로 매년 폭등하고 있다. 지금, 이 순간에도 늘어나고 있는 어마한 양의 데이터들을 우리는 어떻게 수집하고 처리하는지 그리고 도대체 빅데이터로 무엇을 하는지에 대한 조사를 바탕으로 서술한다.
본고의 구성은 다음과 같다. 2장에서는 빅데이터의 정의와 구조화 데이터, 비구조화 데이터에 관해 설명하고 3장에서는 빅데이터 특징 중 항상 등장하는 3V에 대한 설명 후 추가되는 요소에 관해 설명할 것이다. 4장에서는 빅데이터 분석기법과 현장에서의 빅데이터 활용 사례를 살펴보고 제5장에서는 전반적인 요약과 더불어 결론으로 마무리한다.
제2장 빅데이터 정의
2.1 빅데이터 정의
빅데이터에 대한 정의는 기관마다 약간의 차이를 보인다. 맥킨지는 데이터 규모 자체에 초점을 맞추어 기존의 DBMS의 데이터 수집, 저장, 관리, 분석 역량을 넘어서는 데이터라고 빅데이터를 정의하였으며 업무 수행에 초점을 맞춘 IDC(2011) 기관의 경우에는 다양한 종류(텍스트, 음성, 동영상, 센서 등)의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고 데이터를 빠르게 수집, 발굴, 분석을 지원하도록 만들어진 기술이자 아키텍처라고 빅데이터를 정의하였다. 이처럼 빅데이터의 정의는 어떤 관점으로 보느냐에 따라 조금씩 차이가 생긴다.
2.2 구조화 데이터 & 비구조화 데이터
빅데이터에서 말하는 데이터는 크게 구조화 데이터, 비구조화 데이터로 나뉜다. 구조화 데이터란 형식이 정해져 있는 포멀적인 데이터이다. 사이트 회원 가입이나 제품 구매를 위해 이름이나 주소, 전화번호 등이 형식이 정해져 있고 구조화되어 있는 ‘구조화 데이터’이다.
참고 자료
김지숙. "빅데이터 활용과 분석기법 고찰." 국내 석사학위 논문 高麗大學校 大學院, 2013. 서울, P9-21
Christine Taylor,「Structured vs. Unstructured Data」, datamation,
https://www.datamation.com/big-data/structured-vs-unstructured-data.html, 2020-09-10
Amazon, 「What is Big Data?」, amazon,
https://aws.amazon.com/big-data/what-is-big-data/?nc1=h_ls, 2020-09-10