
총 714개
-
데이터로부터 분포 추정하기2025.05.091. 분포 추정 데이터 분석에서 가장 기본적인 작업 중 하나는 주어진 데이터로부터 분포를 추정하는 것입니다. 분포 추정은 데이터의 특성과 패턴을 이해하고, 통계적 추론과 예측을 위한 기반을 마련하는 핵심 과정입니다. 분포 추정은 주로 확률분포를 가정하고 해당 분포의 파라미터를 추정하는 과정으로 수행되지만, 때로는 데이터가 정규분포나 다른 특정한 분포를 따르지 않는 경우도 있습니다. 이럴 때는 비모수적인 방법이나 시각적인 평가를 통해 분포를 추정하는 것이 필요합니다. 2. 비모수적 방법 비모수적 방법은 통계학에서 사용되는 개념으로, ...2025.05.09
-
비중계시험 입도분포곡선 데이터2025.05.101. 비중계시험 비중계시험은 입도분포곡선을 측정하는 실험 방법입니다. 이 데이터에는 물의 점성계수, 비중 보정, TRLD, 입도 등의 정보가 포함되어 있습니다. 이를 통해 입도분포곡선을 분석할 수 있습니다. 2. 입도분포곡선 입도분포곡선은 입자의 크기 분포를 나타내는 그래프입니다. 이 데이터에는 입도에 따른 TRLD, Ft, Fs, Fm, k, Ws, Rcp 등의 값이 제공되어 있어 입도분포곡선을 작성할 수 있습니다. 3. 물성 데이터 이 데이터에는 물의 점성계수와 비중 보정 값이 포함되어 있습니다. 이러한 물성 데이터는 입도분포 ...2025.05.10
-
데이터를 가지고 정규분포 근사하기2025.05.111. 정규분포 근사 데이터의 분포를 정규분포에 근사시키는 과정은 데이터 분석에서 중요한 부분을 차지합니다. 데이터의 정규성을 평가하는 첫 번째 단계로 시각적 확인이 필요하며, 히스토그램과 QQ 플롯을 통해 데이터와 정규분포의 일치 정도를 확인할 수 있습니다. 또한 샤피로-위크스 검정과 같은 수치적 정규성 검증 방법을 통해 데이터가 정규분포를 따르는지 통계적으로 평가할 수 있습니다. 정규성 검정은 통계적 분석의 기반이 되며, 적절한 모델링 선택과 데이터 변환 등의 조치를 취하는데 도움을 줍니다. 2. 정규분포 가정의 중요성 많은 통계...2025.05.11
-
방송통신대학교 통계데이터학과) 엑셀데이터분석 출석과제물 (30점 만점 A+)2025.01.261. 엑셀 데이터 분석 제공된 자료에는 A 지역과 B 지역의 1990년부터 2023년까지의 연간 강수량 데이터가 포함되어 있습니다. 이 데이터를 엑셀과 KESS를 사용하여 분석하고, 두 지역의 강수량 추세, 기술통계량 비교, 줄기-잎 그림과 상자그림 비교, 두 지역의 강수량 차이 등을 확인하였습니다. 2. 이항분포 농구 선수의 자유투 성공률이 80%이고, 20번의 자유투를 시도할 때 성공한 횟수를 확률변수 X로 정의하면, X는 이항분포를 따릅니다. 이를 바탕으로 18번 이상 성공할 확률과 14번 이하 성공할 확률을 계산하였습니다. ...2025.01.26
-
로그 정규분포 실습해보기 (파이썬예제 포함)2025.05.101. 로그-정규분포 로그-정규분포는 양수값을 모델링하기에 적합한 분포입니다. 불량율을 로그 변환한 후, 정규분포를 사용하여 모델링할 수 있습니다. 이 분포는 자연로그를 취한 값이 정규분포를 따른다고 가정하는 것이기 때문에, 불량율이 양수인 경우에 유용합니다. 로그 정규분포는 실제로 많은 현상에서 관찰되는 분포로서, 소득 데이터와 같은 경제적인 현상에서 자주 사용됩니다. 소득 분포의 경우, 대부분의 개인들이 상대적으로 낮은 소득을 가지지만, 일부 특정 개인들이 다른 사람들보다 훨씬 높은 소득을 가지는 경우가 발생할 수 있습니다. 로그...2025.05.10
-
다양한 사회문제나 경영활동 중에 수집되는 자료의 확률분포 특성 분석2025.01.231. 확률분포 확률분포는 확률변수가 어떤 값을 가질지에 대한 확률을 나타내는 개념입니다. 이산확률분포와 연속확률분포가 있으며, 대표적인 확률분포에는 이항분포, 푸아송 분포, 정규분포, 지수분포, 로그정규분포 등이 있습니다. 이러한 확률분포는 각각의 특성과 수학적 성질을 가지고 있어, 실제 데이터 분석 시 적절한 확률분포를 선택하는 것이 중요합니다. 2. 자료 수집 방법과 분석 다양한 자료 수집 방법(조사, 실험, 설문조사, 데이터베이스 활용 등)이 있으며, 각각의 장단점이 있습니다. 자료를 수집하는 방법은 분석 결과와 의사 결정에 ...2025.01.23
-
산술평균, 분산, 표준편차의 개념 및 의의, 특징 및 장단점, 산출방법2025.01.251. 산술평균 산술평균은 데이터 집합의 중심 경향성을 나타내는 대표값으로 활용된다. 이는 주어진 데이터 집합의 모든 값들을 더한 후 데이터의 개수로 나누어 계산된다. 이 값은 데이터의 분포와 집중되어 있는 위치를 파악하는 데에 유용하다. 그러나 산술평균은 이상값의 존재로 인해 왜곡될 수 있으며, 특히 데이터가 정규분포를 따르지 않을 때 문제가 될 수 있다. 2. 분산 분산은 데이터의 흩어진 정도를 나타내는 측도로, 각 데이터 값과 평균의 차이를 제곱하여 모두 합한 후 데이터의 개수로 나눈 값이다. 이는 주어진 데이터가 얼마나 평균 ...2025.01.25
-
이산확률분포에 대하여 요약하여 정리하시오2025.05.021. 이산확률분포 이산 확률 분포는 이산 랜덤 변수의 각 가능한 결과의 확률을 설명하는 통계 개념입니다. 이산 랜덤 변수는 값이 유한하거나 셀 수 없을 정도로 무한한 수의 값만 가질 수 있는 변수입니다. 이산 확률 분포에는 이항분포, 초기하분포, 포아송분포 등이 있습니다. 2. 이항분포 이항 분포는 고정된 수의 독립 시행에서 특정 수의 성공 확률을 설명하는 이산 확률 분포입니다. 각 시행은 두 가지 가능한 결과(성공 또는 실패)만 있고 성공 확률은 모든 시행에 걸쳐 일정합니다. 이항 분포는 시행 횟수(n)와 각 시행에서의 성공 확률...2025.05.02
-
경영통계학_연속확률분포에 대하여 요약하여 정리하시오.2025.01.191. 연속확률분포의 정의 연속확률분포는 연속형 확률변수가 특정 구간 내의 값을 가질 확률을 나타내는 분포이다. 확률밀도함수를 통해 확률을 정의하며, 특정 값에서의 확률은 0이지만 구간 내의 확률은 양의 값을 가진다. 2. 주요 연속확률분포 대표적인 연속확률분포로는 정규분포, 지수분포, 균등분포가 있다. 정규분포는 평균과 표준편차를 매개변수로 가지며, 지수분포는 대기 시간이나 수명 데이터를 모델링하는 데 사용된다. 균등분포는 일정 범위 내의 모든 값이 동일한 확률을 가지는 분포이다. 3. 연속확률분포의 응용 연속확률분포는 품질 관리,...2025.01.19
-
30점 만점 방통대 데이터정보처리입문 2023-1학기2025.01.261. 출생성비 추이 1990년부터 2021년까지의 전국, 서울, 부산의 연도별 출생성비 추이를 시계열 도표로 나타냈다. 전국적으로 1990년 116.5에서 점차 감소하여 2021년 105.1까지 감소하는 경향을 보였으며, 서울과 부산도 유사한 추이를 보였다. 다만 2000년대 중반 이전에는 부산의 출생성비가 서울보다 높았으나 이후 큰 차이가 없어졌다. 2. 합계출산율 추이 1993년부터 2021년까지의 전국 합계출산율 추이를 시계열 도표로 나타냈다. 합계출산율은 1993년 1.654에서 점차 감소하여 2021년 0.808까지 감소하...2025.01.26