• 파일시티 이벤트
  • LF몰 이벤트
  • 서울좀비 이벤트
  • 탑툰 이벤트
  • 닥터피엘 이벤트
  • 아이템베이 이벤트
  • 아이템매니아 이벤트

빅 데이터 기술

*용*
개인인증판매자스토어
최초 등록일
2016.09.12
최종 저작일
2016.09
5페이지/워드파일 MS 워드
가격 1,000원 할인쿠폰받기
다운로드
장바구니

소개글

빅 데이터 기술 입니다

목차

1. 수집 기술
2. 저장 기술
3. 분석 기술
4. 결론

본문내용

빅데이터의 수집대상은 로그와 데이터다. 로그는 로그는 서버 컴퓨터에 남아있는 IP주소, OS 등으로 메타데이터로 이해하면 된다.
데이터 소스는 두 곳으로 조직 ‘내부’와 ‘외부’다. 소스에 따라 수집 방법이 다르다.
(1) 내부는 기존의 데이터 베이스에 포함되어 있다면 DBMS를 사용하면 된다.
내부의 비정형 데이터 (문자, 이메일, 게시판 등)에서 데이터를 추출하고자 한다면 ETL을 사용한다. Extraction, transformation, loading의 준말로 추출, 변한, 적재를 뜻한다. 수집하면서 중복은 제거하고 쓸데없는 것은 버리는 정제를 실행한다.
(2) 외부데이터는 공공 데이터, 데이터기업의 데이터 등 두 가지로 구분한다.
데이터 기업은 구글, 페이스북, 네이버 등을 뜻한다. 페이스북은 그 자체로 빅데이터 플랫폼이다.

1.2. 종류
(1) 크롤링 엔진이 있다.
‘크롤링’이란 ‘긴다’는 뜻으로 웹 페이지를 기어다니면서 복사본을 생성한다는 뜻이다. Html parsing(분해한다는 뜻, html 구조는 버리고 내용만 뽑는다.

참고 자료

없음
*용*
판매자 유형Platinum개인인증
해당 판매자는 노하우톡 기능을 사용하는 회원입니다.노하우톡
* 노하우톡 기능이란?노하우 자료를 판매하는 회원에게 노하우 컨설팅, 활용방법 등을 1:1 대화를 통해 문의할 수 있는 기능입니다.

주의사항

저작권 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

이런 노하우도 있어요!더보기

찾던 자료가 아닌가요?아래 자료들 중 찾던 자료가 있는지 확인해보세요

더보기
최근 본 자료더보기
탑툰 이벤트
빅 데이터 기술
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업