군집분석
- 최초 등록일
- 2009.12.24
- 최종 저작일
- 2009.12
- 22페이지/ 한컴오피스
- 가격 2,000원
소개글
데이터의 구조를 아는 유효한 수단으로서, 그 데이터를 구성하고 있는 관측대상(혹은 속성)을 어떠한 기준에 의해서 분류하는 것을 생각할 수 있다. 군집분석(cluster analysis)은 이와 같은 목적을 위한 기법이다.
목차
1. 군집분석의 기초지식
1) 군집분석의 개요
2) 군집 구성법
2. 군집분석의 시각적 표현
3. 덴드로그램의 작성
4. 판별분석과 군집분석의 차이
본문내용
1. 군집분석의 기초지식
1) 군집분석의 개요
데이터의 구조를 아는 유효한 수단으로서, 그 데이터를 구성하고 있는 관측대상(혹은 속성)을 어떠한 기준에 의해서 분류하는 것을 생각할 수 있다. 군집분석(cluster analysis)은 이와 같은 목적을 위한 기법이다.
군집분석(群集分析)은 무엇을 기준으로 해서 데이터를 분류하느냐에 따라서 수없이 많은데, 다음의 두 가지가 대표적인 방법이다. 그 한 가지는 관측대상간(혹은 속성간)에 정해지는 유사성(similarity)(또는 거리)을 기초로 해서, 소위 비슷한 것끼리를 하나의 그룹으로 해서 전체를 몇 개의 그룹(크러스터)으로 분할하는 것이다. 또 한 가지는 데이터 및 그룹 내의 분산 개념을 기초로, 그룹간의 분리의 정도를 기준으로 해서 분류하는 것이다. 전자(前者)가 실용적이라고 생각되므로 여기에서는 주로 전자에 대해서 설명하기로 한다.
이 분석에서 유의해야 할 점은 데이터가 몇 개의 그룹으로 분류된 결과가 어느 정도 의미가 있는지 어떤지에 대한(가설검정을 실시하는) 논의는 포함되어 있지 않다는 것이다. 즉 분류가 타당한지 아닌지는 얻어진 결과의 해석에서 정해진다. 실제로 응용되고 있는 분야는 매우 넓다. 예를 들면 생명과학의 분야, 의학, 행동과학, 사회과학의 분야는 물론 공학이나 정보과학의 분야에서도 패턴인식, 인공지능, 시스템과학, 사이버네틱스, 전자공학, 정보검색, 경영과학 등에 응용되고 있다. 또한 시장조사나 정치․경제학 등에서도 자주 쓰이고 있다.
다음에 군집분석을 실시하려면 어떠한 데이터가 필요한지를 간단히 기술하기로 한다. 하나는 일반적인 다변량분석(multivariate analysis)과 마찬가지로 관측대상이 갖는 개의 속성(변량)에 대한 값이, 개의 각 관측대상마다 어떤 척도로 측정되어 있는 것이다(<표 5.1> 참조). 이 경우에는 관측대상간 혹은 속성간에 유사성을 정하지 않으면 안 된다. 한편, 데이터로서 처음부터 관측대상간 혹은 속성간에 어떠한 유사성이 얻어지는 경우가 있다(<표 5.2> 참조). 이 경우에는 데이터를 기초로 직접 분류를 실시하는 연산법을 적용할 수 있다.
참고 자료
없음