1장경영이란? 예측(정규분포)을 기반으로 계획하고, 계획한대로 자원을 조달하고, 배분하고, 할당한 후 운영하고, 감독하고, 통제하며, 관리 및 평가, 진단하는 것.경영의 목적 : 고객만족이 궁극적 목표시스템 정의 : 투입물을 제품이나 서비스와 같은 산출물로 변환시키는 변환하는 과정시스템다이나믹스 : 투입물을 제품이나 서비스와 같은 산출물로 변환시킨 후 다시 투입물과 공정기술의 통제를 위한 피드백을 하는 과정시스템의 목적 : 균형을 유지시키기 위해통계학의 역할 목적 : 미래에 대한 의사결정결과의 불확실성을 추정해 의사결정 결과를 사전에 예측하여 의사결정에 따른 위험을 최소화할 수 있게 한다.기술통계 : 상세한 분석을 수행하기 전에 수집된 데이터를 묘사라고 정리하기 위한 방법으로 정리된 데이터를 의사결정자에게 보고할 목적으로 수행하는 통계분석방법즉 의사결정을 내릴 때 요구되는 정보에 대한 성질을 기술,요약해준다. 예를 들어 수집된 데이터를 정리하여 그 내요을 쉽게 파악할 수 있도록 도표작성 및 그래프화하는 것.추론통계 : 표본으로부터 획득된 정보를 바탕으로 전체 집단의 특성에 대한 결론을 도출하는 것을 목적으로 하는 통계분석 방법2장필요한 데이터를 획득하기 위해서는 척도(측정도구)가 필요// 어떤 척도를 사용하여 데이터를 수집하느냐에 따라 데이터를 4가지로 나눔 이유는 데이터의 구분에 따라 사용되는 통계적 기법이 다름.// 수치화된 정보(=데이터)명목척도 : 측정대상이 속한 범주나 종류에 따라 분류될 수 있도록 측정대상에 수치나 부호를 부여하는 방법. 예를 들어 남자는 1 여자는 2 , 단지 분류만 목적으로 사용. 산술적의미 없음.명목데이터 : 명목척도로 측정해 획득한 데이터집단의 성질은 “최빈치” 로 나타냄 (통계기법 적용불가능)서열척도 : 변수의 상대적 크기(서열)를 나타내는 형태의 척도서열데이터 : 서열척도로 측정하여 얻은 데이터 , 서열데이터의 수치는 상대적인 크기를 나타내지만 수치들 간의 간격이 동일하지 않음.사칙연산은 의미 없고 비교가 가능하다는 점에서포돌르 측정하기 위해서는 백분위수 사분위수 이용. (비모수통계)구간척도 : 수치들간의 간격이 동일해 숫자간의 간격이 의미를 지닌다. 하지만 ‘없음’이라는 0의 원래 의미를 나타내지 않아 숫자간의 비율은 의미가 없다.구간데이터 : 구간척도에 의해 얻어진 데이터 예) 온도,IQ,물가지수,주가지수..대표치는 “평균,분산” 일반적인 통계기법 적용가능비율척도 : 절대원점을 갖기 때문에 산술적 의미를 가진다. 절대원점(매출액이 0이라면 매출이 전혀 없음 나타내는 것)비율데이터 : 비율척도로 측정하여 획득한 데이터. 예) 키,몸무게,압력,매출액 등 숫자로 관측되는 대부분의 데이터.대표치는 “중앙값, 최빈치, 평균, 분포” 모든 통계적 기법을 적용가능분포? 수집된 데이터를 특정 발생 결과별(이벤트:발생 가능한 결과)로 정리한 것도수분포 : 이벤트별로 그 발생 빈도를 정리하여 놓은 것확률분포 : 이벤트별로 그 발생 확률을 정리하여 놓은 것 (=상대도수분포) 도수를 전체 데이터수데 나눈 것. 데이터의 성질을 파악하기 위해 정리해 놓은 표나 그래프*도수분포보다 확룰분포를 많이 사용하는 이유?확률분포가 실제로 발생횟수에 상관없이 일관되게 그 데이터의 성질을 표시해 주기 때문이다. 즉 발생횟수를 전체 횟수로 나눔으로써 데이터의 크기와는 상관없이 발생 횟수에 대한 표준화가 되어 있어 일관되게 사용하는 것이 가능하기때문이다. 예를 들어 표본조사할 때 같은 성질의 표본데이터라면 표본의 크기와 상관없이 같은 분포로 표시되기를 원한다. 이 경우 확률분폰느 표본크기와 상관없이 그 표본데이터의 성질을 일관되게 나타내준다상대도수분포표 : 도수분포표에서 기록된 구간별 빈도수를 총 관측값 개수로 나누어 비율로 표시누적상대도수 : 각 구간에 포함된 빈도수와 그 구간보다 앞에 위치한 구간에 포함된 빈도수를 모두 합한 누적빈도가 전체게 차지하는 비율.수치와 할수 있는 데이터 : 양적 데이터 / 범주형(비계량화)데이터 : 질적데이터3장분포는 항상 수많은 데이터를 가지고있고 이 데이터를 하나의 숫자로 그 데이 분포가 가지고 있는 중요한 특성을 수치로 나타낸 것분포의 특성 : 중심경향도,산포도,비대칭도1. 중심경향도 : 데이터가 어느 위치를 중심으로 분포되어 있는지 (즉,데이터의 중심이 어디인가?)1)평균 :모든 데이터의 합을 관측수로 나누어 계산되는 값 (데이터크기+빈도) 명목,서열척도 안됨2)중앙치 : 데이터를 크기 순서대로 분류하여 데이터의 중앙에 위치하는 값.데이터의 값 중 극단적으로 큰(작은) 값이 있는 경우 평균은 상당히 변화하지만 중앙치는 변화하지 않는다. 평균의 경우 극단적으로 큰(작은)값이 포함되면 데이터의 합이 커져(작아져) 평균이 커지게(작아지게)된다. 결과적으로 평균의 과민 반응으로 인해 평균이 데이터의 대표값으로 사용하기 부적절한 경우가 있다. 이런경우 중앙치가 보다 적절한 데이터의 대표값으로 사용될 수 있다.3)최빈치 : 데이터의 빈도만을 고려해 빈도가 가장 많은 값을 데이터의 중심점으로 제시한다.관츶값이 모두 다른 경우에는 개개의 관측값이 모두 한번씩 나타나기 때문에 최빈치가 존재하지 않을 수 있다.2. 산포도 : 데이터가 그 중심점을 중심으로 얼마나 흩어져 있는가 하는 정도를 나타냄1)분산 : 평균을 사용할 때, 평균의 대표성을 측정하여 주는 것(데이터가 평균에서 얼마나 떨어져있나) 분산이 크면 클수록 데이터가 평균에서 멀리 흩어져 있어 평균의 대표성은 약해짐 즉, 평균을 사용하면 데이터의 정보가 많이 누락되는 것각 데이터와 평균 간의 거리를 제곱하여 그 평균으로 값을 측정 (반드시 평균값을 알아야 계산됨)표준편차 : 편차의 제곱으로 나타나므로 분산의 단위는 원래의 데이터보다 큰 단위의 값을 지니게되 본래의 단위로 환원시키려면 분산의 제곱근 즉 표준편차를 구한다. 소수점이하가 길게 나와 불편2)범위 : 최댓값 – 최솟값 (범위가 클수록 산포도는 크다.)분포상태와 상관없이 최댓값과 최솟값에 의해 결정되므로 어느 한 값이 극단적인 값을 갖게 되면 범위의 값이 크게 변화. 따라서 적절한 척도 불가3) 사분위수와 사분위수 범위 : 범위의 문제점하는 값을 제1사분위수,3/4에 해당하는 값을 제 3사분위수, 2/4에 해당하는 값은 중앙치로 이때 사분위수 범위는 제3사분위수 – 제1사분위수를 말한다.3. 비대칭도 : 데이터가 대칭상태를 기준으로 왼쪽 혹은 오른쪽으로 얼마나 치우쳐 있는지(분포보다 명확)1) 평균, 중앙치, 최빈치 비교평균 〈 중앙치 〈 최빈치 : 왼쪽으로 긴 꼬리 : 약간의 극단적으로 작은 값이 평균을 끌어내리고 있으나 중앙치는 극단적으로 작은 값에 의해 영향을 받지 않는다.최빈치 〈 중앙치 〈 평균 : 오른쪽으로 긴 꼬리 : 약간의 극단적으로 큰 값이 평균을 끌어올리고 있으나 중앙치는 극단적으로 큰 값에 의해 영향을 받지 않는다.2)피어슨 비대칭계수 : 3(평균-중앙치)/표준편차 , 비대칭계수를 수치화4장확률 : 전체의 사건 중에서 우리가 관심 있는 특정 사건이 얼마나 발생했는가에 대한 상대적인 빈도수 이는 어떠한 경우에도 확률은 0보다 작을수 없으며 모든 가능한 경우에 대해 확률의 합은 정확히 1이 된다.확률분포 : 과거의 경험을 계량화하여 미래에 대한 예측을 보다 정교하게 수치로 표시해 주는 것 즉 모든 데이터를 이벤트 별로 그 확률을 정리하여 놓은 표나 그래프이산형 : 나타나는 이벤트를 셀수있는 도수로 나타낸 것. 이산형변수의 확률을 구할때 각각 사건별로 나타나는 확률값의 합이산확률변수 : 유한하고 이산적인 사건 값만을 취하는 변수연속형 : 모든 데이터 실수의 값. 모든 합은 면적과 동일연속확률변수 : 무한히 많은 값 중 아무값이나 취할 수 있는 확률변수변수 : 숫자임에는 틀림없으나 그 값이 정해져 있지 않은 숫자확률변수 : 변수의 개념을 확률분포로 나타낼 때 사용,즉 이벤트의 수치화평균(=기대값) : 그 데이터의 중심점이 어디 있는가분산 : 기대값이 데이터의 성질을 어느 정도 잘 나타내고 있는가공분산 : 두 확률변수의 산포도를 이용하여 그들 사이의 연관(선형)관계를 측정하는 것단지 성형관계만을 나타낼뿐이며 다른 비선형관계에 대해서는 알 수 없다. 이는 공분산을 계산 할 때 데이터낸다.공분산은 선형관계여부나 방향만을 나타내 주지만 그 관계 정도를 나타내주지는 못한다. 그이유는 측정 단위에 따라 그값이 크게 변화할 수 있기 떄문이다. 따라서 다양한 데이터를 서로 비교하기 위해서 측정단위의 영향을 배제하기 위한 단위의 표준화를 하는 데 이를 상관계수라 한다.상관계수 : 공분산의 값을 각각의 표준편차로 나누어주는 것상관계수는 -1~1사이의 값을 가지며 1이면 두변수의 관계는 완전한 양의 선형관계이며-1이면 두변수간의 관계의 완전한 음의 선형관계이다. 0에 가까우면 두변수간에는 별다른 선형관계가 없다고 할 수 있다.5장균등분포 : 결과에 대해 전혀 지식이나 경험이 없어 예측이 불가능한 상태. 모두 같은 확률을 갖는 것. 모수는 최솟값과 최댓값4M(사람,장비, 1E(이런 원인들을 찾기 위해서 그런 유형들의 원인들이 어디에서 발생하는지 과거의 데이터가 이루어놓은 것 조사 정리 요약경영 예측(정규분포)을 기반으로 계획을 하는 것계획하기 - 모든 수요에 대한 정보가 우리 회사의 수요가 아님어느 정도의 수요를 가지고 대응할 것인가를 찾고 그것에 맞춰 계획함 얼마나 생산?바탕으로 주어진 시간 동안에 발생할만한 수요에 대응할 만한 서비스,제품을 제공 그러기 위해서 시설 장비 인적자원 필요 공장규모? 서비스할 규모? 일반적으로 수요예측 이 수요는 정규분포 평균에서 켐파서티 설정 필요자원 조달 성과물 검사(표본조사로 전체 데이터아웃풋 변동은 어디서? 프로세스에 변동이 일어나 아웃풋에 변동 일어남 현대 경영학에서는 내부에서 문제를 찾음 작업자 원자재 부품 설비 장비 문제 없음 외부환경 영향 또는 인풋에 영향품질경영을 할 때도 대부분 확률분포 사용 즉 정규분포 사용 미래 발생할 확률을 구하기 위해선 과거 데이터 필요과거 자료가 없거나 또는 과거 데이터가 소용없을 때 : 균등분포 정보 (모수 : 최댓값,최솟값)최솟값( 1로 발생 ) 손실은 나겠지만 경험 쌓임 최댓값 (어느 정도 발생할 것인가)특수사항 나타나는 이벤트의 결과가 두 가지 여행사 보험이 사고가 얼마나 .