K-means Clustering Algorithm

*예*

개인 판매자스토어

최초 등록일: 2009.10.07
최종 저작일: 2008.12; 9페이지/ MS 워드; 가격 1,500원

다운로드

장바구니

상세정보
자료후기 (0)
자료문의 (0)
판매자정보

소개글

K-means Clustering Algorithm 개념 및 이해 (장, 단점)
알고리즘의 이해
소스코드 설명
응용 프로그램 소개

본문내용

1.1 Introduction

다수의 데이터가 주어졌을 때, 계산을 단순화 하고 수렴을 가속시키기 위한 기법으로 군집화 기법을 사용한다. 그 중 k-means clustering algorithm(k-평균 알고리즘)은 간단하면서도 효과적인 군집화(Clustering) 문제를 해결하는 비교사 학습(Unsupervised Learning) 알고리즘이다. 데이터가 벡터 공간을 이룬다는 가정아래, 각 묶음의 분산도를 최소화하는 k개의 묶음으로 나누는 방법이다.

주어진 데이터 수는 n, 원하는 클러스터 수는 k로 표기한다. 데이터 집합으로부터 무작위로 선택된 k개의 초기 클러스터 중심벡터(μ1, μ2, ..., μk)로부터 클러스터를 구성한다. 각 데이터는 가장 가까운 거리에 있는 초기 중심 벡터를 기준으로 분류된다. 나누어진 각 클러스터에서 평균값으로 중심 값을 새로 갱신하고 이를 반복적으로 수행하여 오차 감소율이 매우 작아지거나, 중심 값이 변하지 않으면, 끝낸다.

1.1.1 장점
 군집분석 이외에도 분류∙예측을 위한 선행작업, 특이 오류 값이나 결손 값 처리작업 등 다양한 분석에 사용할 수 있다.

1.1.2 단점
 속성들의 형태가 다르거나 같은 형태의 속성이라도 값의 범위가 다양할 경우 거리 측정기준을 설정하는데 어려움이 따른다.
 k-means clustering 기법은 사용자가 지정한 K값에 따라 데이터를 K개의 군집으로 나눈다. 그러나 실제 데이터의 구조가 이 값보다 작거나 큰 수의 군집 특성을 갖고 있다면 좋은 결과를 기대하기 어렵다. 실제로 초기 클러스터 센터를 어떻게 정하느냐에 따라서 다른 최종 클러스터가 나올 수 있다. 즉, 안정된 상태의 클러스터는 보장하지만, 최적이라는 것은 보장하지 못한다.
 클러스터의 개수에 해당하는 K 값을 먼저 선택하여야 한다.

참고 자료

[1] 패턴인식 개론 / 한학용 / 한빛미디어
[2] 데이터마이닝 가볍게 따라하기 / 김현철 / 홍릉과학출판사
[3] Pattern Classification (2nd Edition) / Richard O. Duda, Peter E. Hart, David G. Stork / Info-Tech Corea
[4] Datamining / Tan, Steinbch and Kumar / Addison Wesley

이 자료와 함께 구매한 자료

k-means clustering algorithm 0페이지
[프로그래밍](자바)java로 구현한 k-means 클러스터링 프로젝트 13페이지
군집분석(clustering) 5페이지

주의사항

환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류	중복자료	저작권 없음	설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우	다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함)	인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우	자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

이런 노하우도 있어요!더보기

찾던 자료가 아닌가요?아래 자료들 중 찾던 자료가 있는지 확인해보세요

[공학기술]Clustering(k-means) 17페이지

Clustering(k-means) Contents Introduction ... Forgy's Algorithm The k-means Algorithm ... k-means Algorithm Set k=2 and assume that
Segmentation using EM algorithm 16페이지

0.2] Result of experiment applying myEM algorithm ... , (1) Where is a D-dimensional mean vector ... . : [4 4] : [0.2 -0.3; -0.3 0.7] Cluster3
CRM에서 데이터마이닝 기법의 적용 문헌 연구 및 분류 11페이지

데이터마이닝 모형 고객 식별 고객 세분화 분류 DT SOM, MC, DT 군집 K-means ... 데이터마이닝 모형 1:1 마케팅 연관 AR ST, SOM AR, SOM AR, K-means ... ① 연관성 규칙 ② 의사결정 나무 ③ 유전자 알고리즘 ④ 인공신경망 ⑤ K-
인공지능시스템 소논문- 어느 회사에 투자할 것인가? 20페이지

Excel)을 이용하여 Data Base를 좌표에 나타낼 수 있었으며, K-means ... Hunt's Algorithm은 정해진 클래스의 조건에 따라 각 데이터별 ... 저희는 Classification의 여러 방법 중 Hunt's Algorithm을
Neural Network 26페이지

(1) Clustering ; C-means Algorithm (Hard ... C-means) Specify 'C' Choose 'C' points at ... PARENTS CROSS OVER MUTATION NEW POPULATION O K
[생화학, 화학, 생물학]SNP와 DNA 칩, 백혈병에 관해 23페이지

algorithm (Hierarchical clustering, K-mean ... Clustering이란 비슷 한 expression profile을 갖는 ... Clustering을 하기 위해서는 similarity measure (distance에
데이터마이닝 기법 17페이지

눈으로 어느 점이 가까운지를 확인 할 수 없는 4차원 이상부터이다. (1) K-MEANS ... (2) 일단은 몇 개의 군집으로 나눌 것인가를 사전에 정의한다. (3) K-MEANS에서 ... [2] 순차패턴(Sequential patterns) [3] 클러스터링(Clustering