주성분 분석

  • 주성분분석
    1. 주성분분석 1. 주성분분석의 기초지식 1) 주성분분석의 개요 주성분분석(principal component analysis)이란 해석하고자 하는 다차원의 데이터를 거기에 포함된 정보의 손실을 가능한 한 적게 해서 2 혹은 3차원의 데이터로 축약하는 수법이다. 주성분분석을 활용하면 관측대상이 어떠한 위치에 있는지 시각적으로 파악할 수 있게 된다. 주성분분석은 다음과 같은 목적으로 이용된다. ① 다수의 지표를 통합한 종합적인 지표를 작성한다. ② 관측대상을 몇 개의 그룹으로 나눈다. ③ 중회귀분석이나 판별분석을 위한 데이터를 다른 관점에서 음미한다. 주성분분석의 계산 주성분분석은 수집한 다변량 데이터로부터 새로운 변수를 만들어내는 것을 목적으로 한 수법으로, 중회귀분석이나 판별분석의 경우와 같은 목적변수와
  • 범주형 주성분분석
    범주형 주성분분석 주성분분석의 목적은 원래 변수에 있는 정보의 대부분을 표현하면서도 원래 변수군을 더 작고 상관관계가 없는 성분의 집합으로 축소하는 데 있다. 다변량의 데이터로부터 본질이 되는 소수의 변량을 합성하여 그것으로 데이터를 분석하는 것이 주성분분석이다. 많은 변량에 의해 구성되는 데이터로부터 특징이 되는 본질을 합성하여 그것을 기초로 데이터를 분석할 수 있도록 하는 수단을 부여하는 것이 주성분분석인 것이다. 표준 주성분분석에서는 숫자 변수 사이의 선형 관계를 가정한다. 한편 최적화 척도법을 사용하여 변수를 서로 다른 수준으로 척도화할 수 있다. 범주형 변수는 지정된 차원에서 최적으로 수량화된다. 결과적으로 변수 사이의 비선형 관계도 모형화할 수 있다. 범주형 주성분분석을 사용하여 직업 범주, 직업
  • [주성분분석] 다변량자료분석(주성분분석)
    다변량 자료 분석 주성분 분석 (Principle Component Analysis) 주성분분석 (Principle Component Analysis) 주성분분석(Principal Component Analysis)은 원래 변수들의 선형결합으로 표시되는 새로운 주성분(principal components)을 찾아서, 이를 통하여 자료의 요약과 용이한 해석을 목적으로 한다. 주성분 분석은 분석자체로 어떤 결론에 도달하기 위한 분석이라기보다는 차후의 분석을 위한 수단을 제공하여 주는 단계이다. 대수적인 측면에서 모집단 주성분은 모집단의 공분산 행렬이 알려져 있다는 전제하에서 어떤 판정기준이 최적화 되도록 원래의 변수들을 선형변환 시킨 것이다. 따라서 고려되는 판정기준들과 이에 연관된 주성분의 최적성은 통계적으로
  • [주성분분석] 주성분분석
    <주성분 분석> 아래 자료는 '2003년 삼성증권배 한국프로야구' 상위3개팀(삼성·현대·기아)의 타자들의 타율이 높은 순서대로 각각 10명씩 30명의선수들 타율, 장타율, 출루율, 키, 몸무게, 연봉을 모은자료이다. ※2003년 5월 7일 기준. 경기가 진행중으로 기록이 갱신되므로 현재와는 다름. <http://www.koreabaseball.com>에서 참조함 <변수 설명> ▶타율 - 타자의 타격정확도를 가늠하는 척도로, 안타수를 타수로 나누어 나타내는 율. 소수점 첫째자리부터 차례로 할-푼-리-모의 순서이고 이 수치가 높을수록 강타자임. 타율=안타수/타수 , 일명 타격율 , 배팅에버리지 ▶장타율 - 타자의 장타력을 가늠하는 척도로, 누타수를 타수로 나누어 나타내는 율. 소수점 첫째자리부터 차례로 할-푼-
  • SPSS를 이용한 주성분분석
    Project 1. FatLiver Data Principal Component Analysis Factor Anlaysis 데이터정보학과 2010441047 윤 소 라 관측값 개수 변 수 변수 설명 측 정 변수개수 (P)=13 GENDER 남 (1), 여 (2) C lass SYSBP 수축기 혈압 I nterval DIABP 이완기 혈압 I nterval BMI 체질량 지수 I nterval HB 혈색소 I nterval GOT 간기능검사 수치 1 I nterval GPT 간기능검사 수치 2 I nterval TCHOL 콜레스테롤 수치 I nterval GLUCOSE 당뇨검사 I nterval TG 중성지방 I nterval HDLC HDL 콜레스테롤 I nterval LDLC LDL 콜레스테롤 I nte
  • 주성분분석(Principal Component Analysis)
    Pca 주성분분석(Principal Component Analysis)이란? 해석하고자 하는 다차원의 데이터를 거기에 포함된 정보의 손실을 가능한 작게 해서 2 혹은 3차원의 데이터로 축약하는 수법, 주성분분석을 활용하면 관측대상이 어떠한 위치에 있는지 시각적으로 파악할 수 있다. 그렇다면 언제 주성분 분석을 사용하는가? 데이터 스크린 데이터가 수집되면 열 변량인 경우에는 줄기, 잎 그림 상자.수염 그림 등을 그려 데이터의 분포 형태나 이상치 존재여부를 파악한다. 이 변량인 경우에는 산점도를 그려 두 변수간 함수 관계와 이상치 등을 판단한다. 그럼 변수가 3개 이상인 경우엔 어떻게 할 것인가? 주성분 분석은 이렇게 3개 이상의 변수를 가진 데이터를 저 차원 그래프로 나타내어 특성이나 이상치의 존재여부를 알아
  • R을 통한 통계분석(주성분분석)
    2.3 주어진 행렬 A= 2 -1 -1 2 에 대하여 A=matrix(c(2, -1, -1, 2), nrow=2) A #(a) 행벡터를 쓰고, 2차원 좌표평면에 나타내어라 plot(c(0,A[1,1]),c(0,A[1,2]), typ='l',xlim=c(-2,3),ylim=c(-2,3)) lines(c(0,A[2,1]),c(0,A[2,2])) #(b) 열벡터를 쓰고, 2차원 좌표평면에 나타내어라 plot(c(0,A[1,1]),c(0,A[2,1]),typ='l',xlim=c(-2,3),ylim=c(-2,3)) lines(c(0,A[1,2]),c(0,A[2,2])) #(c) rank(A)를 구하여라 library(Matrix) rankMatrix(A) #(d) A의 고유값과 고유벡터를 구하여라 eigen(A) #
  • [다변량분석] 주성분분석
    주성분분석 [문제] 미국 위스콘신주 메디슨 시에서 추출된 14개 지역에 대해 총 인구수, 교육중위수, 총 고용인수, 보건의료 종사자수 및 소득 중위수 등 5가지 사회경제적 변수들을 측정하여 얻어진 자료가 <표 3.1>에 주어져 있다. 이 자료에 대해 SAS/PROC PRINCOMP를 이용하여 주성분분석을 하고 그 결과를 해석해라. [프로그램] data so1; input no $1-2 x1 x2 x3 x4 x5; datalines; 1 5.935 14.2 2.265 2.27 2.91 2 1.523 13.1 0.597 0.75 2.62 3 2.599 12.7 1.237 1.11 1.72 4 4.009 15.2 1.649 0.81 3.02 5 4.687 14.7 2.312 2.50 2.22 6 8.044 15.
  • 다변량분석중 주성분 분석과 인자분석의 차이에 대해
    다변량 분석에 대한 정의와 사례 I. 다변량 분석의 정의와 목적 1. 다변량 해석이란 다변량 데이터의 가시화나 변량간의 관계를 고려하여 분석하는 해석법 신장 데이터 -1 변량 신장과 체중 데이터 – 2변량 앙케이트 조사 등에서는 복수의 질문 항목이 존재 – 다변량 다변량 데이터의 경우, 4차원 이상의 공간에 데이터를 표현하여도 그 특성을 이해하기가 어렵기 때문에 데이터 처리가 필요하다 변량들은 상호간 영향을 미치므로 변량간의 관계를 고려. * 2. 다변량 해석이 필요한 이유 데이터가 多변량일 경우 (Data are invariably multivariate) 데이터 양이 큰 경우 huge data sets 다변량 해석 지극히 유용한 통계적 수법 과거 : 고가의 컴퓨터를 사용할 수 있는 연구자에 국한됨. 현재
  • 프로야구 선수들로본 주성분 분석
    <주성분 분석예제> 경영학부 아래 자료는 ‘20xx년 한국프로야구’ 상위3개팀(삼성?SK?두산)의 타자들의 타율이 높은 순서대로 각각 10명씩 30명의선수들 타율, 장타율, 출루율, 키, 몸무게, 연봉을 모은자료이다. 여기서 선수들의 성적도 높고 체격도 크고 연봉도 많이 받는 선수와 그 반대인, 성적도 낮고 키도작고 몸무게도 작고 연봉도 작은 선수들을 알아보기 위해서 sas 주성분 분석을 해보았다. <sas프로그램> data set1; input name $ batavg longbat goout height weight salary; label name='선수이름' batavg='타율' longbat='장타율' goout='출루율' height='키' weight='몸무게' salary='연봉'; cards
이전10개 1 2 3 4 5 6 7 8 9 10 다음10개