(아파치) 하둡이란 무엇인가?

*현

개인인증 판매자스토어

최초 등록일: 2013.11.07
최종 저작일: 2013.11; 10페이지/ 한컴오피스; 가격 3,900원

다운로드

장바구니

상세정보
자료후기 (0)
자료문의 (0)
판매자정보

소개글

빅 데이터를 처리하는 하둡에 대한 레포트입니다.

1. 들어가며

2. 하둡이란?

3. 하둡의 핵심 구성요소
(1) HDFS
(2) Map Reduce

4. 하둡 에코 시스템
(1) Pig, Hive ; 프로그래밍 능력 향상
(2) Hbase, Sqoop, Flume ; 데이터 액세스 향상
(3) Zookeeper, Ooize ; 조정과 워크플로
(4) Ambari, Whirr ; 관리 및 배포
(5) Mahout ; 기계적 학습

5. 나오며

본문내용

1. 들어가며
“구슬 서 말도 꿰어야 보배.” 라는 말이 있다.
빅 데이터는 이런 속담이 가장 잘 들어맞는 분야이다. 빅 데이터의 특징은 흔히 데이터의 양, 이전 시대와 다른 빠른 생성속도, 복잡성의 세 가지로 요약된다. 최근에는 여기에 ‘가치’를 빅데이터의 중요한 성격으로 포함시킨다.

인터넷과 모바일, 심지어 도로에 설치된 CCTV까지 사람들이 남기는 흔적은 상상을 초월할 정도로 엄청난 양이다. 이렇게 엄청난 양의 빅데이터는 기업과 국가 활동의 중요한 자원이 되고 있다. 관건은 이 같은 대규모 데이터를 어떻게 관리하고 분석해서 가치 있는 정보를 찾아내느냐이다. 규모를 가늠할 수 없을 만큼 많은 정보와 데이터가 있더라도 정리와 분석이 안 된다면 빅 데이터는 그저 무용지물의 거대한 쓰레기 산에 불과하다.

하지만 이러한 빅데이터는 ‘하둡’을 만나서 드디어 날개를 펴고 자유로이 날아다닐 수 있게 되었다. 과연 ‘하둡’이란 무엇일까? 또한 하둡을 지탱해주고 있는 것들에는 어떤 것이 있을까?

2. 하둡(hadoop)이란?

대항해 시대는 지중해에서 쓰던 노를 젓는 갤리선과 다른 배들이 만들어졌기 때문에 가능했다. 카라크와 카라벨 같은 범선들이 만들어졌으며, 자체 동력이 없고 바람과 해류를 이용하는 만큼 먼 바다 를 향하는데 효율적이었다. 빅데이터의 대항해 시대는 병렬처리 시스템에 기반을 두고 있다. 기존의 데이터 처리는 고성능 컴퓨터를 이용했지만 빅데이터를 처리하기 위해서는 병렬처리 시스템, 흔히 클라우딩 컴퓨팅이라고 부르는 기술을 사용할 수밖에 없는 것이다.. 하둡(hadoop)은 바로 이 클라우딩 컴퓨팅을 이용해 안정적이고 효과적으로 빅데이터를 처리할 수 있게 해준다.

하둡은 바로 대용량의 데이터 처리를 위해 개발된 오픈소스 소프트웨어다.
하둡은 야후(Yahoo)의 재정지원으로 2006년부터 개발되었으며 현재는 아파치(Apache) 재단이 개발을 주도하고 있다. 하둡은 구글의 분산 파일 시스템(GFS) 논문 공개 후 본격적으로 개발되었는데 구글의 시스템과 대응되는 체계로 구성되어 있는 것이 그 특징이라 하겠다.

참고 자료

빅 데이터, 어떻게 활용할 것인가 - 오라일리 심층 보고서
빅 데이터 플랫폼 전략 : 빅 데이터가 바꾸는 미래 비지니스 플랫폼 혁명
네이버 지식백과 : 빅 데이터 기술
Hadoop : hadoop.apache.org
The Hadoop :　www.hadoop.co.kr
HADOOP 완벽 가이드 클라우드 컴퓨팅 구축을 위한 실전 안내서
경영정보시스템
빅데이터 분석의 ‘하둡’, 새로운 역사 쓰다 2011.7.21. [블로터 닷넷]
국가과학기술위원회 : 넘쳐나는 빅 데이터, 노란 코끼리 ‘Hadoop’이 해결한다! 2012.6.29.
아파치 하둡 : incubator.apache.org/

환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류	중복자료	저작권 없음	설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우	다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함)	인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우	자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

이런 노하우도 있어요!더보기

찾던 자료가 아닌가요?아래 자료들 중 찾던 자료가 있는지 확인해보세요

빅데이터(4차 산업혁명의 주요기술)의 특성과 향후 전망 10페이지

그렇다면, 국내 기업들의 빅데이터 분석 도입 수준이 낮은 이유는 무엇일까? ... 정보의 집적이란 데이터의 양을 고도화한다는 의미이고, 정보의 결합이란 다양한 ... 원래 검색의 분산처리를 지원하기 위해 개발된 것으로, 아파치 루센의 하부
빅 데이터 기술 5페이지

수집기 오픈 소스로 아파치 Flume, 페이스북 scribe, 아파치 chukwa ... 앙상블이란 의사결정 나무를 여러개 만들어서 확률은 높이고 오차를 낮추는 방법이다 ... 고객에게 무엇을 추천할 지는 그 때 rmEo 다르다. 가서 알게 된다.