총 88개
-
연속확률분포에 대한 요약2025.01.151. 정규분포 정규분포는 평균 μ와 표준편차 σ로 정의되며, 종 모양의 곡선을 갖는다. 정규분포의 확률밀도함수는 f(x)= {1} over {sigma sqrt {2 pi }} (- {(x- mu ) ^{2}} over {2 sigma ^{2}} )으로 정의된다. 정규분포는 많은 자연현상에서 나타나며, 중심극한정리에 의해 중요한 역할을 한다. 정규분포는 사람의 키, 시험 점수, 측정 오류 등을 모델링하는 데 사용되며, 금융 분야에서 자산의 수익률 분포를 설명하는 데 사용된다. 2. 균등분포 균등분포는 모든 구간 내의 값이 균등...2025.01.15
-
확률과 통계 관련 탐구 주제-통계(통계적 추정)2025.01.151. 통계적 추정 황제펭귄은 지구상에 존재하는 모든 펭귄 중에서 가장 큰 종이다. 남극에서 서식하는 황제펭귄은 몇 마리나 될까? 또 북극에 서식하는 북극곰은 몇 마리나 될까? 이와 같이 전혀 알 수 없을 것 같은 동물이나 어류의 개체 수도 통계적 방법을 사용하면 추정할 수 있다. 관련 연구에 대한 내용을 알아보고 탐구해 보자. 2. 정규분포 정규분포를 처음 발견한 사람은 프랑스의 수학자 드므아브르이다. 그가 쓴 노트에는 이항분포의 확률을 n에서 충분히 클 때 정규분포에 근사시켜 구하는 방법이 제시되어 있다.(드무아브르-라플라스 정리...2025.01.15
-
만 7세 남자 아동의 평균 몸무게 추정 및 췌장암 환자 데이터 분석2025.01.261. 모집단, 표본, 모수, 통계량 만 7세 남자 아동 전체는 모집단이고, 여기서 모집된 만 7세 남자 아동 100명은 표본이다. 모집단인 7세 남자 아동 전체에서 뽑은 100명의 표본을 대상으로 계산한 평균 몸무게는 통계량(statistic)을 의미한다. 2. 췌장암 환자 데이터 분석 R을 이용하여 데이터를 읽고 저장하며, 범주형 변수를 factor 형태로 저장하였다. 수축기 혈압(SBP)의 분포를 나타내는 히스토그램을 그렸다. 또한 데이터에 포함된 156명 전체의 수축기 혈압 중앙값과 95% 신뢰구간을 구하였다. 3. 가설검정 ...2025.01.26
-
생산 공정에서의 불량 모델링2025.05.121. 이항분포 이항분포는 독립적인 베르누이 시도의 결과를 모델링하는데 사용되며, 시도 횟수와 성공 확률을 고려합니다. 예를 들어, 압력을 증가시킬 때 불량이 발생하는 확률이 일정한 값으로 유지된다고 가정하면, 이러한 상황을 이항분포를 이용하여 모델링할 수 있습니다. 2. 포아송분포 포아송분포는 일정한 단위 시간 또는 공간에서의 사건 발생 횟수를 모델링하는데 사용됩니다. 압력이 증가함에 따라 불량이 발생하는 횟수가 드물게 변하는 상황에서는 포아송분포를 활용하여 불량율을 근사할 수 있습니다. 포아송분포는 독립적인 사건 발생을 가정하고,...2025.05.12
-
평가 데이터를 활용하여 기존 모델을 업데이트하는 베이지안 추론 2 (파이썬코드 예제포함)2025.05.091. 베이지안 추론 베이지안 추론은 데이터 분석과 예측에 널리 사용되는 강력한 통계적 방법론입니다. 이 리포트에서는 평균값만을 다루는 것이 아니라, 실제로 우리가 필요로 하는 분포 함수를 얻기 위해 어떤 데이터를 어떻게 활용하는지에 대해 다룹니다. 평균값만으로는 분포의 전체적인 특성을 충분히 반영하기 어렵기 때문에, 추가적인 데이터와 분포 추정 기법을 활용하여 우리가 원하는 분포 함수를 구성하는 방법에 대해 탐구합니다. 2. 사전 분포와 사후 분포 이 리포트에서는 사전 분포와 관측 데이터를 기반으로 사후 분포를 추정하는 방법에 대해...2025.05.09
-
표본의 크기와 표본 오차에 관해 설명하시오2025.05.111. 표본 크기와 표본 오차 표본을 추출하는 데 있어 가장 중요한 것은 추출된 표본이 모집단을 얼마나 정확히 대표할 수 있는가이다. 많은 사람들은 표본의 크기를 크게 하면 할수록 표본의 대표성이 증가하는 것으로 생각하지만 반드시 그런 것은 아니다. 표본크기를 결정하는 데 있어 고려하여야 할 사항들로는 표본추출오류, 연구가설, 모집단의 동질성 등이 있다. 표본크기를 늘리면 표본추출오류가 작아지게 되어 표본의 추정치가 모수와 점점 비슷해지므로 좀 더 정확한 추정이 가능해진다. 하지만 표본크기를 크게 할수록 표본추출과 자료수집에 소요되는...2025.05.11
-
이산확률분포: 이항분포, 포아송분포, 초기하분포의 특징 및 예시2025.05.091. 이산확률분포 확률분포는 가능한 모든 확률변수와 이것이 일어날 확률을 나타낸 것을 말한다. 이산확률분포는 확률변수 X가 가질 수 있는 값이 유한 집합이거나 가산집합일때 확률변수 X에 대응하는 확률분포이다. 즉, 확률변수 X가 1,2,3,4, … 이나 2,4,6,8,… 등과 같이 하나씩 셀 수 있는 값을 취하는 것을 말한다. 2. 이항분포 이항분포는 연속되는 n번의 독립적 시행에서 각각의 시행의 확률이 p를 가질 때의 분포이며, 이러한 시행을 베르누이 시행이라 말할 수 있다. 이항분포는 시행횟수(n)이 고정되어 있고, 각 시행에서...2025.05.09
-
확률변수와 확률분포에 대한 학습2025.01.221. 이산확률분포 이산확률분포는 확률변수에 대한 확률분포로 확률변수의 값의 확률이 어떻게 분포되었는지를 보여주는 분포입니다. 이산확률변수의 확률함수는 두 가지 조건을 만족해야 합니다. 이산확률분포에는 베르누이분포와 이항분포가 있습니다. 2. 이항분포 이항분포는 성공확률 p인 베르누이시행을 n번 반복했을 때 성공횟수 X의 분포를 나타냅니다. 이항분포는 n과 p에 의해 확률구조가 결정되며, 이 두 값이 이항분포의 모수가 됩니다. 이항분포의 특성 중 하나는 성공 확률이 동일하고 서로 독립인 이항 확률변수 합도 이항분포를 따른다는 것입니다...2025.01.22
-
기술통계(descriptive statistics)와 추론통계(inferential statistics)의 차이점2025.05.141. 기술통계(descriptive statistics) 기술통계는 측정과 실험 등에서 수집한 자료의 정리, 표현 및 요약과 해석 등을 통해 자료가 가지는 특성을 규명하는 통계적 방법입니다. 즉, 수로 측정된 부분과 현상 등을 요약 및 설명하는 역할을 하는 통계학의 분야입니다. 기술통계에서는 모집단과 샘플을 구분하지 않으며, 확보한 데이터 자체에 의미가 있습니다. 2. 추론통계(inferential statistics) 추론통계는 특정한 실험의 발견에 있어서 신뢰성과 일반성 등을 결정하는 절차에 해당합니다. 추론통계에서는 모집단과 ...2025.05.14
-
2023년 2학기 표본조사론 출석수업 중간과제 리포트 30점 만점2025.01.251. 표본조사론 표본조사론은 모집단에 대한 정보를 얻기 위해 모집단의 일부분을 선택하여 조사하는 방법론입니다. 이 과제에서는 표본 추출 방법, 표본 크기 결정, 추정량 계산 등 표본조사론의 핵심 개념들을 다루고 있습니다. 2. 모집단 및 표본 특성 이 과제에서는 모집단 규모 N=10,000, 층별 약국 수, 표본 평균, 표본 표준편차 등 모집단 및 표본의 특성을 다루고 있습니다. 이를 바탕으로 비례배분과 네이만배분 등 표본 추출 방법을 적용하고 있습니다. 3. 추정량 및 오차 계산 이 과제에서는 모집단 추정량, 추정량의 분산, 오차...2025.01.25
