「국가지식자원관리지수 개발 연구」 분석 보고서1. 양적효과성, 질적효과성, 비용효율성의 타당성 평가1) 양적효과성의 타당성정부와 공공 기관은 국가를 관리함에 있어서 효율성을 높이고 싶어 한다. 현대 사회에서의 지식자원의 관리가 중요해 짐에 따라 지식관리를 이용한 효율성 고취가 특히나 중요한 문제로 대두되고 있다. 국가지식자원관리의 효율성을 높이기 위해서는 무엇보다 이를 측정할 지표가 필요하다. 이를 위해서 지식의 양을 측정하는 것은 필수적인 요소이다.국가가 통제하고 있는 지식이 많을수록 국가는 성장 동력을 갖는다. 국가가 발전하는데 있어서 지식은 밑거름이 되기 때문이다. 선진국 일수록 지식의 양이 많고 관리체계가 잘 이루어져 있다. 아래의 그래프를 통해 각 나라의 지식자산 규모를 비교해 볼 수 있다.여기서 괄호 안의 수치는 국가별 지식 자산의 상대 지수로서 OECD, IMD, UN 등에서 10점 만점을 기준으로 상대 평가한 점수들을 가중 평균한 값이다. 즉 지식자산의 총량은 지식자산의 크기를 괄호 안의 상대지수는 지식자산의 활용 정도를 나타내는 것이다. 우리나라의 지식 자산 규모는 위와 같이 9,600억 달러로 평가되고 있지만, 미국이나 일본 등의 선진국에 비해 훨씬 적은 것으로 나타나고 있다. 이를 통해 지식자산의 규모의 국가의 발전 정도는 어느 정도 상관관계를 가지고 있음을 알 수 있다. 따라서 정부와 공공기관은 국가지식자원관리의 양적 효과성에 본질적으로 관심을 가질 수밖에 없다.2) 질적 효과성의 타당성국가지식자원관리의 양적 효과성만을 측정한다면, 이는 겉핥기식의 측정이 될 수 있다. 책장에 책이 잔뜩 꽂혀져 있어도 그 책들이 모두 지하철에서 무료로 나눠 주는 광고 책자라면 이는 지식자산이 풍족하다고 말할 수 없다. 따라서 양적 효과성뿐만 아니라 질적인 면에서 지식을 측정할 필요가 있다. 즉, 이 지식이 얼마나 가치가 있는 것인가에 대한 논의가 필요하다.3) 비용효율성의 타당성정부와 공공 기관은 기업들과는 다르게 사적인 이익을 추구하는 집단이 아니다. 하지만 이들 역시도 한정되어 있는 예산을 가지고 좋은 성과를 내야 한다는 점은 공통된 부분이다. 지식을 돈의 가치에 비하여 평가한다는 것은 어폐에 맞지 않는 것처럼 보일 수도 있다. 지식의 무형의 자산이고, 개인에 따라 느끼는 가치가 다르기 때문이다. 하지만 정부와 공공 기관 입장에서는 이들의 투자에 대한 성과를 측정해야 할 의무가 있다. 그래야지만 후의 투자 방향과 투자의 타당성을 판단 할 수 있기 때문이다.국가지식자원관리지수는 위에 언급한 양적효과성, 질적효과성, 비용효율성의 가중치를 하여 얻어낸 결과이다. 지식관리에 있어서 꼭 필요한 3가지 요소를 다 고려하였다. 하지만 모든 측정 방법은 취약점을 가지고 있게 마련이고, 국가지식자원관리지수 역시도 그렇다. 막대한 예산을 들여 이 지수를 측정한다고 해도, 평가 방법이 큰 취약점을 갖고 있다면, 이 지수는 아무런 쓸모가 없는 정보가 된다. 이는 노력과 예산의 큰 낭비이다. 따라서 이제부터 측정방법의 취약점을 파악하고 발전 방향을 제시하려 한다.2. 각 지표체계의 취약점 및 발전 방향1) 양적효과성의 취약점 및 발전 방향지식의 양을 측정하는 일은 아무래도 어려운 일이다. 지식은 무형의 자산이기 때문에 어쩌면 양을 측정하려는 시도 자체가 어리석을 일 일지도 모른다. 하지만 위에서 언급했듯이 이는 꼭 필요한 작업이기에 우리는 가장 적절한 방법을 이용하여 합당하게 받아들일 수 있는 지식의 양을 측정하기 위해 끊임없이 노력해야 한다.이러한 관점에서 국가지식자원관리지수의 취약점을 찾아보았다. 우선, 측정 대상 기관의 지식정보자원 관리자가 기관용 설문지를 작성하게 된다. 그 설문지에는 지식정보자원의 건수를 기입하게 되어 있다. 이 점에서 반문이 생긴다. 그렇다면, 책이나 논문, 동영상이 많은 기관은 지식정보자원이 풍족한 것인가? 만약, 기관의 한 쪽 벽면이 모두 책으로 채워져 있다면 그 기관은 양적 효과성이 높은 것인가? 양적 효과성이 높다고 단언하기는 힘들다.지식은 정보와 다르다. 정보를 얻어 그것을 자신의 것으로 만들고 더 유용한 곳에 쓸 수 있을 만큼 체득이 되었을 때, 진정한 지식이 쌓였다고 본다. 그러므로 책장에 책이 많이 꽂혀져 있다고 해서 지식정보자원이 풍족한 것은 아니다. 아무도 읽지 않는다면, 아무런 쓸모가 없다면, 그것은 종이 더미에 불가한 것이다. 물질적인 건수를 측정할 것이 아니라, 얼마나 많은 조직원들이 그것을 열람하는지, 열람 횟수나 사용 횟수가 얼마인지를 측정하는 것이 진정한 의미의 양적 효과성이 될 것이라고 본다.또 다른 취약점은 유형별 상대적 가치를 정하는데 있어서 동영상 1건의 합산이 논문 6건이 되는 일 때문에 발생한다. 지식의 가치를 측정하는 것은 지극히 주관적이고 개인적인 일이다. 누군가에게는 논문 1건이 동영상 6건의 가치가 될 수도 있다. 하지만, 기관의 관리자가 기관이 보유하고 있는 지식 자원들의 가치를 혼자서 결정해 버린다. 조직원에게는 중요한 지식자원이지만 관리자에게는 중요하지 않을 수 있는 것이고, 반대의 경우도 그렇다. 따라서 조사 대상을 그 기관의 조직원 전체로 늘리는 것이 바람직하다고 본다.2) 질적효과성의 취약점 및 발전 방향가장 큰 취약점은 위에서도 언급하였듯이 관리자가 자신의 기관에서 소유하고 있는 지식자원들의 가격을 매긴다는 것이다. 이 지표를 이용해서 각 기관 당 지식자원관리 실태를 파악한다는 것을 관리자가 모를 리 없다. 자신의 기관이 낮은 점수를 받게 되면, 어떤 조치가 취해질 줄 모르는 상황에서 관리자는 자신의 기관 소유의 지식자원의 가치를 높게 측정할 것이다. 객관성이 결여된 상태에서 이뤄지는 지적자원의 질적효과성 측정은 아무런 타당성을 가지지 못한다. 내사를 해줄 팀을 기관에 파견하는 것은 많은 비용이 드는 일이지만, 조사의 객관성 유지를 위해서는 불가피한 조치라고 본다.계속 언급하고 있지만, 기관용 설문지의 조사 대상이 측정 대상 기관의 지식정보자원 관리자 혼자라는 것은 조사의 객관성을 잃게 만드는 조건이다.3) 비용효율성의 취약점 및 발전 방향비용효율성은 투입된 비용 전체를 구하는 것이 힘들기 때문에 1년 동안은 시범 기간으로서 비용효율성을 산출 하지 않고, 2년째부터 양적효과성과 질적효과성의 변화정도를 조사하여 구한다. 즉, 얼마의 비용이 들어가서 지식 자원이 양적, 질적으로 증가하였는가를 측정하는 지표이다. 하지만 이 지표를 사용하기 위해서는 지식은 변하지 않는, 축적되는 가치여야 한다. 그래야지 더 많은 비용을 들일 때 1년 시범기간의 지식자원에 더해져 새로운 지식자원이 창출됨을 알 수 있기 때문이다. 그렇다면 지식은 변하지 않는, 축적되는 가치인가? 아니다. 작년의 지식자원이 올 해는 별로 쓸모없을 수 있는 것이다. 예를 들어, 작년에 원유가가 폭락하여 외교통상부에서는 원유 폭락과 관련된 자료들을 사람들이 많이 필요로 하였다. 하지만 올 해, 원유가가 급등하여 고유가 시대에서 살아남기 위한 방법에 대한 지식들이 필요하게 되었다. 즉, 작년의 지식자원들은 별 쓸모가 없게 된 것이다. 이러한 상황에서 투입된 비용에 대한 지식자원의 양적, 질적 변화량을 따지는 것이 의미가 있을까?2년차 지식자원의 질적, 양적 효과성을 따져볼 때, 1년차 지식자원관리지수를 다시 측정해 볼 필요가 있다. 양적효과성 면에서는 크게 변화 될 것이 없지만, 질적효과성 면에서는 급변하는 시대 상황에 따라 지식의 가치는 떨어질 수 있는 것이다.위의 3개 지표체계를 가중치하여 최종적인 국가지식관리지수를 도출한다. 이 가중치는 전문가 6인을 대상으로 설문조사를 통해 얻어낸 것이다. 전문가 6인이라는 표본의 크기가 너무 작아서 객관적인 가중치가 도출될 지 의문이다.
지식 자산의 가치 측정 사례 조사 및 분석사례 1. 스칸디아 네비게이터지식경영의 선두 그룹인 스칸디아 보험회사가 스웨덴의 금융위기를 겪으면서 가장 주목 했던 무형자산은 그들의 모집조직, 협력사, 고객, 종업원과의 관계였다. 보험회사들은 지식과 정보 흐름의 토대가 되는 관계 네트워크를 이용하여 조직 내·외부의 관계자산의 효과적 운용에 관심을 기울였다. 스칸디아가 분류한 보험회사의 가치체계, 즉 지식자산의 분류는 다음과 같다.스칸디아 보험회사는 콘라드 그룹의 IBS(Invisible Balance Sheet)의 개념과 카플란과 노턴의 균형성과표의 아이디어를 결합하여 지식자산의 가치측정모형을 개발, 스칸디아 비즈니스 네비게이터(Skandia Business Navigator)라 명명하였다.IBS(Invisible Balance Sheet): 스웨덴의 콘라드 그룹에 의해 1988년 발표된 것으로 기업의 자산을 재무자본 이외에 인적자본, 구조적 자본으로 파악하였다. 고객에 따라 차별화된 창조적인 서비스를 제공하는 기업을 지식 기업 또는 노하우 기업이라 정의하고, 노하우 기업에서 중요한 인적자본과 구조적자본에 대한 정보 공개가 필요하며, 이를 촉진하는 차원에서 측정지표를 제시하였다.카플란과 노턴의 균형 성과표: 현재와 미래의 경쟁 환경에서 성공하는 데 필수적인 것은 바로 지식과 역량이며, 이러한 장기적인 경쟁 역량을 구축해야만 한다는 저항할 수 없는 힘과 전통적인 원가재무회계모형의 확고한 목표를 통합한 모형이다. 그들은 지식 자산의 가치가 재무회계모형 내에서 평가할 수만 있다면 지식자산의 증가 및 역량의 고갈을 대차대조표와 손익계산서에 나타낼 수 있으나, 실제로는 신상품 경로나 프로세스 역량, 근로자의 기량 및 사고의 유연성, 고객충성도, 데이터베이스, 시스템과 같은 자산들에 신뢰할 만한 재무적 가치를 부여하는 데에는 어려움이 있어 현재로서는 대차대조표에서 이를 인식하는 것은 불가능하므로 이를 전체적 볼 수 있는 대안으로서 이 모형을 개발한 것이다.< 균형성과표의 변형 산모니터와는 달리 지식자산 가치뿐만 아니라 전통적인 재무자산 가치와의 결합을 시도하였다. 네비게이터는 지식자산을 재무관점, 고객관점, 프로세스관점, 인간관점, 개선 및 발전 관점에서 측정하며, 각 부문별 지표들은 종업원 개인의 소유인 인적자본(human capital)이 기업의 소유인 구조적 자본(structural capital)으로 얼마나 효율적으로 전환되었는지를 측정하는데 중점을 두고 있다. 재무관점의 지표들은 대차대조표에 포함된 과거 성과를 측정하는 것으로 자산규모, 영업규모, 투자금액, 이익 등을 포함한다. 고객관점의 지표들은 고객만족도, 기업과의 신뢰도, 구매성향 등 고객과의 관계를 측정하며, 인간관점에서는 종업원의 훈련, 역량 등의 개발을 위한 투자의 가치를 측정한다. 재무관점이 과거 조직의 성과에 의한 것이라면, 개선 및 발전관점은 미래의 기회를 포착하기 위하여 지금 기업이 무엇을 준비하고 있는가를 측정한다.언어가 조직의 목표나 문제에 대해 공통된 정의를 내리는 데에 부정확한 도구임을 알기에 이러한 이유에서 스칸디아도 최초의 지식자산보고서를 사례가 아닌 수치로 제시하기로 결정했다. 스칸디아는 지식자산보고서를 작성하면서 숫자가 국제 기업 활동에서 통화의 역할을 한다는 점, 서술형식의 지식자산보고는 재무제표와 부록 형식의 보고가 가지는 문제점을 교정하고자 했던 지식경영프로젝트의 본래 의도를 살리지 못하리라는 점, 숫자로 보고하는 경우 그 실체가 더 확연하고 역동적으로 이용될 수 있다는 점을 인식했던 것이다. 지식자산의 수량화는 조직구성원들에게 명확한 의사소통 수단이 된다.스칸디아는 여러 가지 구성성분을 측정한 후 이것들을 종합할 수 있는 지표인 지적 자본의 효율성계수를 구하고 여기에 임의로 산정한 지식자산 절대치를 곱하여 지식 자산 가치를 절대적 수치로 나타냈다.* 지식자산 = (효율성계수) X (지식자산절대치)지식자산의 절대치는 측정 자산의 미래에 대한 측면을 강조한데 반해 효율성 계수는 측정지식자산의 현재성과를 나타내는 것으로 시장 점유율, 고객94년 초기 스칸디아는 재무적 지표(20), 고객초점(18), 개선 및 발전초점(18), 인간초점(13) 등 상당히 많은 지식자산의 가치측정지표를 제시하였다. 그러나 이 측정지표들은 가능한 많은 측정지표를 개발한다는 취지였으며, 지식자산의 가치를 측정하려는 기업은 자사의 환경에 맞게 일부를 선택하여 적용하고 있다. 아래의 표는 스칸디아링크사(SkandiaLink)의 1997년 연차 보고서에 제시된 측정 지표들이다.이를 통해 다음의 수치적인 결과를 얻었다.사례 2. KVA를 활용한 EXODUS COMMUNICATIONS INC.Exodus는 웹호스팅 서비스의 선도 기업이다. 이 회사는 데이터 센터, 인터넷 접속, 서비스 관리를 포함한 일련의 서비스를 제공한다.다음은 Exodus의 재무 정보를 요약한 것이다.가격52-주 범위공모주(MM)주당이익99A주당이익2000EP/E시장 총 자본액$34$15-$89412.4$(0.36)$(0.6)유의하지 않음24,820.26 millionExodus는 전통적인 재무 비율과 배율 방법에 의해 의미 있게 평가될 수 없는 전형적인 인터넷 인프라 기업이다. 예를 들어, 주가 수익률은 회사가 순수익이 없기 때문에 이끌어낼 수가 없다.이 회사의 주식 장부 가치는 44.59이다. 반면, 이 비율에 대한 산업평균은 단지 16.69이고 S&P 500은 9.66이다. Exodus의 주가/유형 자산 비율은 67.99인 반면, 산업 평균은 단지 20.51이고 S&P 500은 12.77이다. 이는 Exodus 주식은 S&P 500의 경우보다 자산의 주식가치가 시장에서 상대적으로 더 풍부하게 인식되고 있는 것을 나타낸다. 이는 회사 가치의 대부분이 전통적인 회계 보고서에는 반영되지 않는, 회사 구조와 문화에 내재된 기초 지식자산으로부터 나온다는 것을 보여주는 좋은 예이다.이 회사에게 지식자산 측정은 그만큼 중요한 문제였다. 이들은 측정을 위해 KVA(지식부가가치 방법론)을 적용하였다. KVA는 그 동안 경영진과 이사진들이 갈망하던 일, 즉 종업원, 정A의 본질은 기업 핵심 프로세스에서 이용되는 지식을 숫자 형식으로 전환하는 것이다. 이 전환은 그 지식을 사용하는 비용뿐만 아니라 수익까지도 지식에 의해 부가된 가치에 비례하도록 배분한다. 지식의 순익 영향을 측정하면서 지식이 가치로 변환되는 과정을 추적하는 것은 경영자가 중요한 자산의 생산성을 증가시키도록 하는 데 큰 도움을 준다.◎ KVA의 과정평균 학습시간 추정치와 각 하부 프로세스를 수행하는 데 필요한 프로세스 지침의 숫자를 얻기 위해, 프로세스 내용 전문가와 인터뷰하고 관찰하고, 프로세스 종업원과 매니저들과 얘기한다. 종업원의 수와 비용과 같은, 총 레벨 분석을 위한 수의 일부는, 1999년 재무제표로부터 나온 연단위로 전환된 숫자이다.1. 핵심 영역을 결정하라.- 경영은 재무와 전략적 경영을 포함하고 판매와 일반관리(S&GA)는 인적 자원, 공공 관계, 그리고 마케팅과 같은 모든 지원 기능을 포함한다. 또 운영은 판매지원과 디자인, 서비스 선택과 네트워크 구조 설계(NAD), 조달, 통합, 고장수리, 그리고 최종 테스팅을 포함한다.2. 학습시간 접근법을 사용해 각 핵심 영역에 내재된 지식의 양의 데이터를 수집하라.1) 순위매기기- 회사 경영진은 배우기에 가장 어려운 혹은 쉬운 것 세 영역, 혹은 가장 복잡한 것이나 단순한 세 영역의 순위를 매겨야 한다. 이 순위 매기기 방법은, 각 영역에서 창조된 지식의 양에 대한 일차적 분석을 하는 프레임 워크를 제공한다. 이는 또한 100달의 학습 시간 측정치와 상관관계를 갖는 지식 측정치를 제공한다. 상관관계의 수준은 측정의 정확성의 표시이다.2) 학습시간 측정- 경영진은 그리고 나서 100달 접근법을 이용하여 각 핵심 영역의 산출물을 생산하는 방법을 일반적인 사람이 배우는데 얼마의 시간이 걸리는지를 추정해야 한다. Exodus에서 연 수익을 발생시키는 데 필요한 모든 영역을, 평균적인 사람이 배우는 데는 단지 총 100달이 있다고 가정한다. 경영진은 평균적인 사람이 각 핵심 프로세스를 배우기 위해 전체 100을 계산하라.- 이 때 그 프로세스를 지원하는 기술에 포함된 지식도 포함해야 한다. 각 프로세스에서 지식의 양은 '종업원 수'를 '상대적 학습시간'에 곱한 후 '자동화된 지식의 양'을 더한 것이다. 그리고 나서 이 비율에 근거해서 각 프로세스에 수익을 할당할 수 있다.4) 비용 추정을 산출하기 위해서, 사용되는 각 핵심 프로세스 혹은 영역에 연간 예산을 배분하라.5)각 프로세스의 지식자산에 의한 부가가치를 추정하기 위한 ROK(지식 수익)를 계산하라.이와 같은 과정을 통해서 Exodus의 1999년 성과의 연단위로 환산한 총괄적 분석 결과를 얻어 낼 수 있었다.1열2열3열4열5열6열7열8열9열10열11열핵심영역배우기 어려운 순서(1=가장쉬움,3=가장 어려움)상대적 학습시간-총 100달종업원 수자동화 비율자동화에 내재된 지식의 양총 지식량지식 할당 비율연간 수익할당(US dollar 백만)연간 비용(US dollar 백만)ROKS&GA12085580%13,68030,78034.18%$82.7$118.870%운영3456006016,20043,20047.98116.1197.259경영235255807,14016,06517.8443.251.085총1001,71037,02090,045100%$242.0세 가지 핵심기능 영역 가운데, 운영의 성과(59%)는 S&GA(70%)와 관리(85%)에 비교할 때 상대적으로 낮다. 수익성 있는 회사 운영을 위해서, KVA 분석은 어느 프로세스의 지식 자원을 개발해야 회사 전체의 산출물을 더 효율적이고 효과적으로 생산할 수 있는지 파악할 수 있도록 해준다. 운영 내의 어떤 영역이 향상이 필요한지를 조사하기 위해서, 우리는 운영 프로세스 내에서의 지식의 분배와 공헌을 분석해야 한다. 현재 판매 준비 프로세스는 Exodus의 운영 프로세스의 핵심 프로세스 중의 하나이다. 이는 데이터 저장에 대한 수요의 폭발적인 성장으로, 사업이 팽창할 것으로 예상된다. 그러나 그것은 자동화의 부족 때문에 고객 전환이 가장 느린 영역이다. 판매준비 프로세스
지식경영을 시행하고 있는 국내외 기업 중 제조업 분야의 1개 기업과 서비스 분야의 1개 기업을 각각 선정, 해당 기업의 지식경영 체계를 요약하고 지식경영이 각 기업의 성과에 미친 영향을 비교 분석주제: ‘포스코건설’과 ‘우리 은행’의 지식경영정보산업공학과0440007 유은영< 목 차 >Ⅰ. 포스코건설의 지식경영 체계 요약EDMS 도입과 문제점 봉착KMS 구축방향의 수립직원들의 지식공유 심리를 반영한 시스템현업 수행 시 유용하고 쉽게 쓸 수 있는 시스템열린 광장을 통해 신뢰문화를 촉진하는 시스템기존 시스템의 보완KMS의 구축 및 활용Ⅱ. 우리은행의 지식경영 체계 요약지식 경영 도입 배경 및 개요지식경영 추진 목표 및 전략지식경영 추진 방향지식 경영 목표와 그에 따른 전략지식 경영 세부 실천 과제KMS 구축3.1평가 및 보상 제도지식 맵Ⅲ. 성과 비교 분석포스코건설의 지식경영 성과우리은행의 지식경영 성과두 기업의 성과 비교 분석Ⅰ. 포스코건설의 지식경영 체계 요약EDMS 도입과 문제점 봉착1999년 5월 포스코 건설의 철강 Eng 본부는 자체적으로 프로젝트 자료와 체계적인 관리를 통해 엔지니어링 기반기술을 구축한다는 취지 아래 EDMS를 도입하였다. 도입 당시만 해도 개인들은 업무와 관련된 자료들을 자체 PC, 캐비닛, 사내 사이트 등에 보관하고 있었으며 체계화 되지 않은 상태로 관리하고 있어 이에 대한 획기적인 개선이 요구되었다. 따라서 모든 문서를 전산화하자는 취지 하에 전산화 대상 문서를 선정하여 EDMS에 등록한 후 향후 다른 프로젝트에 활용하려는 계획을 추진하였다. 도입 초기부터 EDMS에 거는 기대가 상당히 컸으며 다음과 같은 기대효과를 홍보하며 직원들을 독려하였다.직원들의 경험을 자료로 정리하고 공유, 각 개인 지식 자원의 조직 지식 자원화성공사례 및 실패사례 등 특이사항을 Data base화 하여 기술정보로 이용엔지니어링 기술에 대한 자료를 창고에 체계적으로 축적하고 집중화고객의 입맛에 맞는 맞춤정보 생산으로 제안형 수주활동 전개전문가형 조직을 지향을 설계하였다. 그리고 Work Flow와 SSO(Single Sign On)을 활용하여 현업을 수행하는 장소에서 필요한 지식과 정보를 제공받고 활용할 수 있는 메커니즘을 구상했다.해당 비즈니스 수행에 필요한 정형 혹은 비정형 지식 및 정보자원을 비즈니스 모델별로 통합하거나 링크하여, 한 화면에서 관련 시스템으로 신속하게 이동하고 연결할 수 있는 포털 형태에서 메커니즘을 설계하였다.현업에서 필요한 지식과 정보자원을 손쉽게 검색할 수 있도록 지식 Map을 구정하고, 지식 컨텐츠의 활용도와 신선도에 따라 우선 제공될 수 있는 구조를 가지며, 강력한 검색도구를 활용하여 찾고자 하는 정보나 지식이 어느 시스템 혹은 어느 지역의 서버에 존재하든지 통합 검색과 상세검색을 할 수 있는 메커니즘을 구상했다.열린 광장을 통해 신뢰문화를 촉진하는 시스템지식경영 중 지식공유 활동의 성공 여부는 조직과 구성원, 구성원과 구성원간의 신뢰 여부에 좌우되므로 이를 위해 다음과 같이 운영한다.조직 내 상하좌우간 커뮤니케이션을 촉진하기 위한 열린 공간을 만들어 운영하여, 직원들의 의견과 아이디어를 적극 수렴하여 개선하고 지식경영에 대한 비전을 공유하고 공감하는 장으로 운영한다.이러한 열린 공간을 통해 조직과 구성원간의 신뢰 및 자율문화 변화 추이를 측정하는 메커니즘을 설계한다.지식활동의 공헌도를 평가하고 이를 정량적으로 지표화하고 이를 토대로 칭찬하고 보상하는 메커니즘을 구성한다.기존 시스템의 보완앞에서 언급한 지식경영 시스템의 설계방향을 토대로 기존 시스템을 어떻게 보완하여 사용해야 할 지에 대한 검토가 시작되었다. 지식경영 팀, 기술정보 팀, 각 본부/실 지식경영 담당자들은 EDMS와 KMS 두 가지 시스템이 공생할 수 있는 방법을 모색한 결과, 모든 자료는 1차적으로 EDMS를 지식창고로 활용하여 등록하고, 그 중 전사적으로 공유할 가치가 높은 지식은 검증을 거쳐 KMS에 등록하는 것이 바람직하다는 결론에 도달하였다.EDMS를 사용할 때 보상이 주어지는 KMS와 연계해서 사용하면 활용 부서와 팀으로 구분되어 독자적인 업무를 수행 할 수 있도록 하였다. 각 부서별로 의견 공유가 필요한 사랑, 공동 프로젝트의 진행, 기술정보, 법률 및 규정, 그리고 업무 노하우 등 많은 부분의 정보를 공유할 수 있도록 원활한 업무협조 체제를 구축하여 지식관리 및 공유능력을 향상시키고자 하였다. 사내 업무 진행상 발생하는 정보공유의 필요성을 충족시키기 위해 다양한 체계를 두고 설계하였다.전사적으로 지식을 통합관리하고 공유를 할 수 있도록 도와주는 지식 맵, 업무별, 부서별로 독자적 커뮤니케이션 공간으로 활용될 수 있는 공지사항, 공식적 커뮤니티를 조직하여 운영할 수 있도록 한 교류회, 질문과 답을 얻을 수 있는 Q&A, 다양한 분야의 전문가 선정 및 운영, 지식획득 및 공유를 통한 평가 및 보상체계 등을 제공함으로써 지식의 원활한 공유가 이루어 질 수 있도록 했다.업무의 효율을 향상시키기 위해서는 사내 문서를 일괄적으로 통합 관리하는 것도 중요하지만, 그 보다 더 중요한 것은 어떻게 활용하는가에 있다고 할 수 있다. 또한, 문서의 본문 즉 전문에서 검색용어와 문장으로 검색할 수 있는 전문 검색엔진을 통해 보다 정확한 문서 검색 환경을 제공했다.Ⅱ. 우리은행의 지식경영 체계 요약지식 경영 도입 배경 및 개요1980년대 후반부터 금융 자율화의 추세에 따라 금융 산업이 대형화/겸업화 되고, 정보기술의 발달로 디지털화가 가속화되면서, 국제화를 통한 기업 간 글로벌 경쟁은 점차 심화되고 금융시장 전반의 Risk가 증가하는 추세로 변화하고 있다. 이러한 금융시장의 불확실성에 대비하여 우리은행은 표준화된 정보접근과 업무 효율성 향상을 위한 지식화 기반을 구축하고, 전문적인 지식을 바탕으로 경영혁신을 이루고자 최근 지식경영시스템 도입을 적극적으로 추진하였다.경영환경글로벌경쟁의 가속화, 전문적인 지식을 바탕으로 하는 지식기업 추구 등업무 프로세스업무 프로세스에 필요한 지식이 용이하게 사용되어야 함, 고객 요구사항에 대한 효과적인 처리 및 고객지식의 효과적인 관리 필요조직 및 부여 및 이에 대한 Follow up 성과 목표 부여 행원들 대상 핵심지식 산출물화 및 동기부여 인센티브제도 시행KMS 구축우리은행은 원하는 지식정보를 신속하게 찾아보고 활용할 수 있도록 ‘금융시장 지배력 강화’, ‘지식 경쟁력 강화’, ‘효율적인 지식경영체계 구축’ 이라는 KMS 구축 목적을 세우고 지식경영 시스템을 구현하였다. 이 시스템은 지식지도 관리, 협업 활동 지원, 전문가 관리 및 인증통합(SSO)을 통한 그룹웨어와의 밀접한 연동 등을 구현한 것으로, 지식경영 솔루션은 (주)온더아이티의 ‘Knowledge Plus 3.5’ 패키지를 사용하였다. ‘Knowledge Plus 3.5’는 현재 약 40여 개의 다양한 업종 및 분야에서 구축되어 활용되고 있으며, 템플릿 기반의 Plug-in 방식으로 설계되어 있어 시스템의 변경 및 확장이 용이하다는 장점이 있다.이제 우리은행의 전 사원은 KMS를 통해 웹 브라우저만으로 모든 시스템에 접근할 수 있게 되었으며, 지식이나 문서 등 각종 업무 노하우나 첨부 내용까지도 통합검색이 가능하게 되었다. 뿐만 아니라 기안 문서나 사외에서 입수되는 각종 기술정보, 경영정보 등이 서로 밀접하게 연계되어 모든 업무 활동의 결과가 지식으로 축적, 관리됨으로써 전 직원의 지식 근로자화, 전 인프라의 지식 시스템화, 전 업무의 지식 기반화를 위한 토대를 마련하였다.3.1평가 및 보상 제도지식경영이 성공적으로 수행되기 위해서는 개인과 집단의 지식경영에 대한 공정한 평가체계와 차별적 보상체계가 필요하다. 우리 은행은 평가체계를 크게 정성적 평가와 정량적 평가 두 가지로 구분하였다. 정성적 평가는 지식활동 전 과정에 중점을 둔 것으로 지식기여도 평가항목과 지표를 통해 수행되었고, 정량적 평가는 지식활동의 결과물에 중점을 둔 것으로 지식 마일리지를 통해 평가되었다. 이러한 평가체계를 기준으로 업무 노하우나 지식을 적극적으로 공유한 사원들에게는 인센티브를 제공하였다. 여기에는 상품권, 포상금, 예산지원 등의 금전적 보상(monetary r 자신에게 부족한 경험과 노하우를 동료들에게 부탁해서 얻는 것으로, 매월 평균 500여견 정도의 Q&A가 이뤄진다. ‘진귀한 정보와 자료가 나오는 마법 항아리’로써 Q&A 코너는 현재 건설 현장 관리자에서 본사 책상에 앉아 있는 직원들까지 폭넓게 활용되고 있다.두 번째로 기업이나 개개인의 미래성장을 위해서는 지식공유를 바탕으로 학습 조직형 지식 교류회 활동을 통해 경쟁력 있는 지식창출이 촉진되었다. 물론 이것은 시스템 구축만으로 되는 것이 아니고 시스템을 토대로 코드화된 ‘지식’에 코드화 되기 어려운 ‘직감’과 ‘ 상상력’을 잘 융합할 수 있도록, 신속하고 효율적으로 지식과 정보를 공유하고 분석하여 활용하는 것으로부터 가능한 것이었다. 예를 들어보면, 업무와 사업수행에 필요한 지식과 정보를 시스템을 통해 통합적으로 공유함으로써, 필요한 지식과 정보를 검색하고 획득하는 시간이 단축되어 절감효과를 보이는 것으로 나타났으며, 학습조직형 지식교류회 활동을 토대로 납기 단축, 비용 절감, 신기술 개발, 사고 절감, 품질향상 등 실제적인 성과로 연동하는 활동이 가능해졌다.우리은행의 지식경영 성과우리은행은 지식관리시스템 구축을 통해 다음과 같은 정성적 기대효과를 기대할 수 있었다. 첫째, 고객만족 관점에서 고객에 대한 이해도가 증진하여 고객 서비스가 향상되고, 고객 접점의 지식 대응 능력이 강화되었다. 둘째, 재무적 관점에서 지식을 활용한 신규 서비스/프로세스의 개발로 매출액이 증대되었다. 셋째, 학습 및 성장관점에서 학습조직 지원으로 지식수준이 향상되고 정보의 수평이동이 강화되어 업무에 필요한 지식이 체계적으로 제공되었다. 넷째, 업무처리 관점에서 소모성 정보수집 시간이 획기적으로 단축되고 우수사례 공유로 업무의 품질이 향상되었으며, 통합정보의 제공으로 업무 프로세스가 개선되었다.지식경영 활동 전지식경영 활동 후• IMF이후 종업원 상호간의 신뢰 와해직원 일체감• 조직원의 직장에 대한 충성도 향상• 경영 측의 일방적인 상부 하달 식의조직 운영경영개선• 커뮤니케이션을 통해
< 자료 분석 >다중회귀 분석 이론 정리정보 산업 공학과0440007 유은영< 목차 >0. 정규성 검정1. 다중 회귀 모형과 회귀 계수 추론2. 다중회귀모형의 적합성 검정3. 회귀진단3.1 잔차분석3.2 영향력 관찰값3.3 다중공선성4. 변수 선택4.1 모든 가능한 회귀4.2 축자제곱합과 부분 제곱합4.4 후진 소거법4.3 전진 선택법4.5 단계별 선택법0. 정규성 검정대부분의 통계적 추론은 관심대상 모집단이 정규분포를 따르며 추출된 자료들이 서로 독립이라는 가정하에서 수행된다. 따라서 추론 결과가 의미를 갖기 위해서는 먼저 추출된 자료가 정규분포를 따르는지, 독립인지 등을 검토해야 한다.정규성 검정은 자료가 정규분포를 따르는지의 여부를 검정하는 것으로, 자료의 수가 2000개 이하일 때는 Shapiro-Wilk 검정을 수행하고, 그 이상일 때는 Kolmogorov-Smirnov 검정을 한다.또한 줄기 잎 그림과 상자 그림을 통해서 정규성에 대한 구체적인 결과를 얻을 수는 없지만, 양상을 살펴 볼 수는 있다. 정규 확률도는 자료의 분포가 정규분호를 따르는지를 나타내는데, 관측치는 *로 표시 되고 정규분포의 기준은 +로 나타내고 있다. 따라서 *들이 + 주위에 밀집되어 있으면 정규분포를 따른다고 할 수 있다.1. 다중 회귀 모형과 회귀 계수 추론는번째 측정된 종속변수의 값.는번째 측정된 독립변수의 값.는 모집단 회귀계수.는번째 측정된의 오차항으로 서로 독립이며 N(0,)을 따른다.종속 변수 y에 영향을 미치는 독립 변수가 k개인 경우의 다중회귀모형을 다음과 같이 나타낸다.다중회귀분석에서는 식의 표현이나 계산을 편리하게 하기 위해 일반적으로 행렬과 벡터를 사용한다. 위의 다중회귀모형을 행렬과 벡터를 이용하여 다음과 같이 쓸 수 있다.이 때 회귀 계수의 최소제곱추정량은 다음과 같이 구해진다.다중회귀분석에서 회귀계수의 추론은 t-통계량을 이용하여 실시한다.검정통계량 :신뢰 구간 :그리고 이를 이용하여에 대한 검정통계량과에 대한 100(1-)% 신뢰구간은 다음과 같이 주어진다.2. 다중회귀모형의 적합성 검정다중회귀모형의 적합성 검정은 단순회귀모형의 경우와 동일하다. 즉, 종속변수 y의 총변동 SST는 추정된 회귀식에 의해 설명되는 변동 SSR과 잔차에 의한 변동 SSE로 분해된다. 이러한 변동으로부터 다음의 분산분석표를 얻을 수 있다.요인자유도제곱합평균제곱F-값회귀kSSRMSR=SSR/k=MSR/MSE잔차n-k-1SSEMSE=SSE/(n-k-1)합n-1SST분산분석표에 주어진 F-값은 설정된 다중회귀모형식의 유의성 검정에 사용되는데 이때의 귀무가설은 다중회귀 모형이 적합하지 않다는 것이다. 즉,: 적어도 한 개 이상의는 0이 아니다.F-값이이면 유의 수준에서 귀무가설을 기각한다.3. 회귀진단다중회귀분석에서는 회귀모형의 적합성을 검정하고, 이상점, 영향력 관찰치, 다중공선성 등의 존재여부를 파악하여 회귀모형의 타당성을 검토하는 과정을 회귀 진단이라고 한다.3.1 잔차분석설정된 모형의 적합성을 보다 정확하게 판단하기 위해서는 단순회귀 분석에서 모형의 기본 가정들을 반드시 검정해봐야 한다. 즉, 오차의 독립성, 등분산성, 정규성을 검토해봐야 한다. 하지만 오차항들은 관측될 수 없으므로 이들의 일종의 추정량인 잔차를 통하여 이들 가정의 타당성을 검토해본다.(1) 오차의 독립성오차항의 독립성에 대한 가정은 DW 검정을 통해 검토한다. 오차항의 독립성 가정의 위배는 시계열 자료인 경우 종종 나타나는 것으로 자기 상관의 존재에 기인한다. 오차항의 1차자기상관성을 검정하는 한 방법이 DW 검정이다. DW 검정통계량 값은 0에서 4의 값을 갖는다. D값이 2에 가까우면 오차항들 사이에 무자기 상관, 즉 오차항들은 서로 독립임을 의미한다. 만일 D 값이 4에 가까우면 인접한 오차항들 간의 음의 자기 상관이, 0에 가까우면 양의 자기 상관이 존재한다고 할 수 있다.(2) 오차의 정규성오차항의 정규성에 대한 검토는 잔차에 대한 정규확률도를 작성하여 시각적으로 판단하거나, Shapiro-Wilk 또는 Kolomogorov-Smirnov 검정을 통하여 할 수 있다.(3) 오차의 등분산성오차항의 등분산성의 여부는 독립변수와 잔차들 간의 산점도를 통하여 시각적으로 검토 할 수 있다. 만일 오차항의 등분산성에 대한 가정이 만족 된다면 x출을 중심으로 잔차들이 같은 폭으로 랜덤하게 퍼져있게 된다.이처럼 잔차분석의 경우는 단순회귀 모형의 경우와 같고, 추가적으로 잔차, 표준화 잔차, 또는 표준화 제외잔차와 같은 통계량을 이용하여 이상점 여부를 판단 할 수 있다.3.2 영향력 관찰값영향력 관찰값이란 모수의 추정에 영향을 미치는 관찰값을 의미하며, 분석에서 제외여부에 따라 얼마만큼 차이가 있는지를 고려하여 결정한다. 만일 제외했을 때와 포함했을 때, 큰 차이를 나타내면 영향력 관찰값으로 판단한다.(1) Hat 행렬Hat 행렬의 주대각선 원소를 이용하여 이상점 여부를 판단한다. 일반적으로 크지 않은 데이터들로부터 회귀진단을 실시할 경우 주대각선 원소의 값이 2(k+1)/n보다 크면 이상점으로 판단하며, 이 값을 지렛대 값이라 한다.(2) COVRATIO공분산 비율 COVRATIO는 I번째 관찰값을 제외시킨 경우의 분산과 포함시킨 경우의 분산의 비율로 나타낸다. 이 값이 클수록 I번째 관찰값은 영향력 관찰값이다.(3) DFFITS이 값을 I번째 관찰값을 제외시킨 경우의 예측값의 변화를 표준화한 값으로서 이 값이 클수록 영향력 관찰값으로 판단한다.이 값은 일반적으로 보통 크기의 자료의 경우 DIFFTS의 절대값이 1보다 클 때 영향력 관찰치로 판정하며, 만일 데이터의 양이 많은 경우에는보다 클 때 영향력 관찰값으로 판정한다.(4) DFBETAS이 값은 I번재 관찰값을 제외시킨 경우에 회귀계수의 추정값의 변화를 표준화시킨 값으로 변화가 클수록 영향력 관찰값으로 판단한다.보통 크기의 자료일 경우 DFBETA의 절대값이 1보다 클 때, 크리가 큰 자료일 경우에는 2/보다 클 때 영향력 관찰값으로 판정한다.(5) COOK's DI번째 관찰값이 n개의 적합 값 전체에 미치는 영향을 크기로 측정한 통계량으로서 관찰한 값이다.이 때,>F(k+1, n-k-1, 0.5)이면 영향력 관찰값으로 판정한다.3.3 다중공선성다중공선성은 설명 변수들 간의 선형 종속성에 의해 추정회귀계수의 값이 급격히 변화하는 문제를 발생시킨다. 이와 같은 다중공선성 여부를 판단하는 통계량들로는 다음과 같은 것들이 있다.(1) VIF(Variance Inflation Factor)분산 팽창계수로서 VIF 값은 다음과 같이 정의된다.=VIF값을 기준으로 다중공선성 여부를 판단할 때에는 최대 VIF, 값이 10 이상이면, 다중공선이 존재한다고 할 수 있다.(2) Eigen Value고유값으로 다중공선성 여부를 판단하기는 곤란하지만, 대개의 경우 다음과 같은 기준으로 사용하여 다중공선성 여부를 진단 할 수 있다. 즉, 고유값들 중 최소값100인 경우의 다중공선성이 존재하는 경우로 판정하기도 한다.(4) Variance Proportion각 설명변수에 대응되는 회귀계수의 분산에 대해 각 고유벡터에 따라 할당된 분산의 비율로서 이 값이 클 때 다중 공선성이 존재한다고 판단한다.4. 변수 선택다중회귀모형의 분석에서 적절한 설명변수의 선택은 변수의 절약 측면에서 매우 유용한 방법이다. 이와 더불어 불필요한 변수를 모형에 포함시킴으로서 다중공선성과 같은 부수적인 문제점이 발생할 여지가 있으므로 종속변수와 가장 밀접한 연관성이 있는 몇 개의 변수만을 선택하여 이를 회귀모형에 포함시키는 방법이 변수 선택법이다. 변수를 선택하는 방법에는 다음과 같은 방법들이 있다.4.1 모든 가능한 회귀모든 가능한 설명변수들의 조합을 통해 가장 적합한 모형을 선택하는 방법이다. 이 방법에서 사용되는 통계량들은 다음과 같다.(1) 수정된 결정계수(Adjusted-)모형에 설명변수가 추가되면 항상값은 증가한다. 따라서 이러한 문제점을 보완한 값으로 수정된값을 이용하며, 이는 MSE가 가장 적은 모형을 최적의 모형으로 선택한다.(2) Mallow통계량Mallow판정 기준은 적합된 모형의 추측 능력을 수량화하여 최적의 모형을 선택하는 방법으로, 많이 사용되고 있다.추정된값은 k+1이며, 이 값에 가장 근접한 모형을 최적의 모형으로 선택한다.(3) AIC(Akaike's Information Crierion)작은 값을 갖는 모형을 최적의 모형으로 선택한다.
1. 개요 및 data의 입력2. 표본의 특성과 정규성 검정① data의 정규성 검정② 수정된 data의 정규성 검정3. 상관 분석① 산점도② x, y의 상관계수, 모상관 계수H_0 : rho=0의 검정4. 회귀 분석① 회귀분석의 기본 가정 및 모형② 회귀 계수의 추정③ 회귀 계수의 적합성④ 신뢰구간5. 잔차 분석① 오차의 독립성② 오차의 정규성③ 오차의 등분산성1. 개요 및 data의 입력아래의 독립 변수 X와 종속 변수 Y를 이용하여 두 변수간의 관계를 알아본다. 선형회귀 모델을 기본으로 가정하고, 산점도 분석부터 잔차 분석까지 자세한 분석을 할 예정이다.x: the height of the husbandy: the height of the wife데이터 처리와 회귀직선의 추정에는 SAS 9.1 프로그램을 이용하였다.주어진 data를 SAS 프로그램에 아래와 같이 입력한다. Data의 양이 방대함으로 중간 부분은 생략하기로 한다.data height;input x y;cards;1861*************4186166(생략)18*************16*************1**************************170run;-SAS code2. 표본의 특성과 정규성 검정① data의 정규성 검정대부분의 통계적 추론은 관심대상 모집단이 정규분호를 따르며 추출된 자료들이 서로 독립이라는 가정하에서 수행된다. 따라서 추론 결과가 의미를 갖기 위해서는 먼저 추출된 자료가 정규분포를 따르는지, 독립인지 등을 검토해야 한다.- SAS codeProc univariate data=height normal plot;var y x;run;- Output(Y에 대한)SAS 시스템UNIVARIATE 프로시저변수: y정규성 검정검정통계량p-값Shapiro-WilkW0.982735Pr D>0.1500Cramer-von MisesW-Sq0.045075Pr >W-Sq>0.2500Anderson-DarlingA-Sq0.359258Pr >A-Sq>0.2500- 배경 지식이 외에도 많은 output이 나왔지만, 여기서는 정규성 검정과 줄기 잎 그림, 상자 그림만 분석하기로 한다.정규성 검정에 대한 검정통계량 값과 그에 대응하는 p-값을 출력한 것이다. 정규성 검정은 자료가 정규분포를 따르는지의 여부를 검정하는 것으로, 자료의 수가 2000개 이하일 때는 Shapiro-Wilk 검정을 수행하고, 그 이상일 때는 Kolmogorov-Smirnov 검정을 한다. 여기서는 자료가 96개임으로 Shapiro-Wilk 검정의 결과를 보면 된다.줄기 잎 그림과 상자 그림을 통해서 정규성에 대한 구체적인 결과를 얻을 수는 없지만, 양상을 살펴 볼 수는 있다. 정규 확률도는 자료의 분포가 정규분호를 따르는지를 나타내는데, 관측치는 *로 표시 되고 정규분포의 기준은 +로 나타내고 있다. 따라서 *들이 + 주위에 밀집되어 있으면 정규분포를 따른다고 할 수 있다.- 분석변수 y에 대한 정규성 검정으로 Shapiro-Wilk의 검정통계량 값은 0.982735, p-값은 0.2391임을 알 수 있다. 이는 유의 수준 0.05하에서 귀무가설 ‘H _{0}:정규분포를 따른다’를 Accept한다. 0.05보다 0.2391가 크기 때문이다. 따라서 y값들은 정규분포를 따른다.줄기 잎 그림은 정규 분포의 모양과 비슷하고, 상자 그림을 통해서는 이상값이 없다는 것을 확인 할 수 있다. 정규 확률도를 분석해 보면, *들이 + 주변에 밀집해 있음을 볼 수 있다. 따라서 이는 위에 정규성 검정 결과인 y가 정규분포를 따른다는 사실을 뒷받침해 준다.- Output(X에 대한)정규성 검정검정통계량p-값Shapiro-WilkW0.970459Pr DW-Sq0.0196Anderson-DarlingA-Sq0.899799Pr >A-Sq0.0218- 분석변수 x에 대한 정규성 검정으로 Shapiro-Wilk의 검정통계량 값은 0.970459, p-값은 0.0288임을 알 수 있다. 이는 유의 수준 0.05하에서 귀무가설 ‘H _{0}:정규분포를 따른다’를 Reject한다. 0.05보다 0.0288이 더 작기 때문이다. 따라서 x값들은 정규분포를 따른다고 할 수 없다.줄기 잎 그림 역시 정규 분포의 모양이라 하기 힘들다. 정규 확률도를 분석해 보면, 대부분의 *들이 + 주변에 밀집해 있지만, 아닌 표본도 있다는 것을 알 수 있다. 이는 위에 정규성 검정 결과인 x가 정규분포를 따르지 않는다는 사실을 뒷받침해 준다.정규성을 만족하지 않은 경우에는 자료가 정규분포를 따르도록 변환을 해야 한다. 이를 위해서 잔차 분석을 하도록 하겠다.(번외) X에 대한 잔차 분석- SAS codeproc reg data=height;model x=y/r;run;- Output(분량이 많음으로 주요 부분만 편집하였다.)SAS 시스템The REG ProcedureModel: MODEL1Dependent Variable: xOutput StatisticsObsDependentVariablePredictedValueStd ErrorMean PredictResidualStd ErrorResidualStudentResidual??-2-1?0?1?2Cook'sD12178.0000160.25001.394417.75006.3162.810|??????|*****?|0.19216188.0000176.07550.677611.92456.4321.854|??????|***???|0.01939156.0000172.74380.6744-16.74386.433-2.603|?*****|??????|0.03744181.0000166.91340.924114.08666.4022.200|??????|****??|0.05063185.0000171.07800.718313.92206.4282.166|??????|****??|0.029- 분석비교적 Student Residual이 큰 값들을 제하고 Data를 다시 만들어 준다.② 수정된 data의 정규성 검정- OutputSAS 시스템UNIVARIATE 프로시저변수: x정규성 검정검정통계량p-값Shapiro-WilkW0.973494Pr D0.0117Cramer-von MisesW-Sq0.138771Pr >W-Sq0.0346Anderson-DarlingA-Sq0.779679Pr >A-Sq0.0429SAS 시스템UNIVARIATE 프로시저변수: y정규성 검정검정통계량p-값Shapiro-WilkW0.981024Pr D>0.1500Cramer-von MisesW-Sq0.049466Pr >W-Sq>0.2500Anderson-DarlingA-Sq0.381321Pr >A-Sq>0.2500- 분석x와 y 모두 Shapiro-Wilk의 p-값이 0.05보다 크다. 이는 유의 수준 0.05하에서 귀무가설 ‘H _{0}:정규분포를 따른다’를 Accept한다. 따라서 x와 y는 정규분포를 따른다고 할 수 있다.이제 정규성을 갖게 된 data를 바탕으로 분석을 계속해 나갈 것이다.3. 상관 분석① 산점도회귀 분석을 하기 전, 대략적인 양상을 알기 위해 산점도를 그려 본다.- SAS codeProc Plot data = height;Plot y*x='+';RUN;- Output- 배경 지식산점도를 보고 직관적으로 느낄 수 있지만, 선형회귀 분석이 잘 되려면 두 변수 사이의 관계가 눈으로 보아서도 직선에 가까워야 한다. 두 변수 사이의 관계가 직선에 가깝다는 말은 곧 두 변수 사이의 선형 연관 관계의 측도인 피어슨 상관계수의 절대값이 1에 가깝다는 것을 의미한다. 결론적으로, 회귀 분석으로 자료 해석을 하려면 반드시 피어슨 상관 계수가 음이든 양이든 1에 가까워야 좋은 결과를 얻을 수 있다. 또한, 회귀선이 자료에 잘 적합된다는 것은 두 변수 사이에 선형 상관도가 높음을 뜻한다.이러한 배경지식을 바탕으로 이제 상관 계수를 구해보자.- 분석산점도의 결과로부터 X와 Y가 서로 비례하는 관계임을 알 수 있다. 따라서 양의 상관이 있을 것이라는 판단이 가능하다.② x, y의 상관계수, 모상관 계수H_0 : rho=0의 검정- SAS codeProc Corr data= height NOSIMPLE;VAR x y;RUN;-OutputSAS 시스템CORR 프로시저2 변수:x y피어슨 상관 계수, N = 91H0: Rho=0 검정에 대한 Prob >|r|?xyx1.000000.82696