총 86개
-
MCMC를 활용한 베이지안 추론 - 동전 던지기 문제의 확률 추정 (파이썬예제풀이 포함)2025.05.091. MCMC(Markov Chain Monte Carlo) MCMC는 머신러닝과 통계학 분야에서 중요한 역할을 하는 AI(인공지능) 기법 중 하나입니다. MCMC는 복잡한 확률분포를 추정하거나 샘플링하기 위해 사용되며, 특히 베이지안 추론과 관련된 문제에 유용하게 적용됩니다. MCMC는 몬테카를로(Monte Carlo) 방법과 마코프 체인(Markov Chain)을 결합한 알고리즘으로, 마코프 체인을 이용하여 탐색 공간을 효과적으로 탐색하고 샘플링을 수행합니다. 2. 동전 던지기 문제 동전 던지기 문제는 간단하면서도 직관적인 문제...2025.05.09
-
외생변수 통제방법 중, 외적 통제방법 6가지 설명2025.05.011. 외생변수 통제방법 1) 대조군 설정: 특정 처치에 따른 효과를 찾아내기 위해서는 처치를 가한 집단(실험군)과 그렇지 않은 집단(대조군)을 두고 서로 특정결과를 비교하여 효과를 검증하게 된다. 2) 환경통제: 연구환경이 모든 대상자에게 일관적으로 조성될 수 있도록 환경적 요인에 대한 올바른 규명과 효과적인 통제가 이루어져야 한다. 3) 시간적 고려: 연구의 주제에 따라 시간요인이 연구 결과에 중요한 영향을 미치기도 하기 때문에 시간적 고려가 이루어져야 한다. 4) 동일한 처치: 실험연구의 경우에는 대상자들에게 적용되는 처치의 내...2025.05.01
-
이공계생을 위한 확률과 통계 2판 5장 연습문제 풀이 (7,8,9,10,12,16,19번)2025.05.091. 정규분포 정규분포의 특성을 이용하여 확률을 계산하는 문제들이 제시되어 있습니다. 정규분포의 표준화, 평균과 표준편차를 이용한 확률 계산 등이 다루어지고 있습니다. 2. 가설검정 두 집단의 평균 차이에 대한 가설검정 문제가 포함되어 있습니다. 표본평균과 표준편차를 이용하여 검정통계량을 계산하고, 이를 바탕으로 가설을 검정하는 과정이 설명되어 있습니다. 3. 신뢰구간 모평균에 대한 신뢰구간 추정 문제가 포함되어 있습니다. 표본평균과 표준편차를 이용하여 신뢰구간을 계산하는 방법이 다루어지고 있습니다. 1. 정규분포 정규분포는 통계학...2025.05.09
-
30점 만점 방통대 데이터마이닝 2024-1학기2025.01.261. 데이터마이닝 방법론 데이터마이닝의 방법은 크게 모수적 모형 접근 방법과 알고리즘 접근 방법으로 나뉜다. 모수적 모형 접근법은 기존 데이터를 기반으로 모수를 추정하는 방법이며, 알고리즘 접근방법은 정해진 알고리즘에 따라 데이터를 학습하는 방법이다. 각각의 장단점이 있으며, 상황에 따라 적절한 방법을 선택해야 한다. 2. 모수적 모형 접근법 모수적 모형 접근법은 단순 선형 회귀분석, 로지스틱 회귀모형 등이 해당된다. 기본 모형 식이 존재하며, 모수를 추정하는 방식으로 결과가 복잡하지 않고 해석이 용이하다. 그러나 데이터가 가정한 ...2025.01.26
-
단 3개의 데이터만 가지고 모델 추정하기 (베이지안 추정, Python source code 예제 포함)2025.05.131. 베이지안 추정 베이지안 추정은 제한된 데이터를 활용하여 미지의 모델 매개변수를 추정하는 방법입니다. 이 예제에서는 PyMC3 라이브러리를 사용하여 베이지안 모델을 정의하고, MCMC 샘플링을 통해 매개변수의 사후 분포를 추출합니다. 이를 통해 불확실성을 고려하면서도 가능한 모든 시나리오를 종합적으로 고려하여 예측의 중심 경향을 나타낼 수 있습니다. 2. PyMC3 PyMC3는 확률적 프로그래밍 라이브러리로, 베이지안 모델링과 추론을 수행할 수 있습니다. 이 예제에서는 PyMC3를 사용하여 베이지안 모델을 정의하고, MCMC 샘...2025.05.13
-
방송통신대학교 통계데이터학과)바이오통계학 중간과제물 (30점 만점 A+)2025.01.261. 모집단, 표본, 모수, 통계량 모집단은 우리가 알고 싶은 대상 전체를 의미하며, 표본은 모집단의 일부를 실제로 관측한 것을 말한다. 모수는 모집단 전체의 특성을 나타내는 값이고, 통계량은 표본의 특성을 나타내는 값이다. 이 문제에서 모집된 만 7세 아동 100명은 표본에 해당한다. 2. 히스토그램 그리기 R 프로그래밍을 이용하여 수축기 혈압(SBP)의 분포를 나타내는 히스토그램을 그렸다. 이를 통해 데이터의 분포 특성을 시각적으로 확인할 수 있다. 3. 중앙값 구하기 R 프로그래밍을 이용하여 이 데이터에 포함된 156명 전체의...2025.01.26
-
광운대 영어와 통계 정리 추정2025.05.091. 추정 기술통계 표본으로부터 통계량(평균, 분산, 표준편차)를 구하고 통계량 차이를 파악하는 것을 의미합니다. 2. 추론통계 표본을 통해 모집단의 성격을 파악하고, 모수를 특정 수치(점 추정) 또는 수치의 범위(구간 추정_신뢰구간이용)로 추정하는 것을 의미합니다. 3. 추정치 모수를 추정하기 위해 표본 관찰값에서 도출한 통계량(평균, 분산, 표준편차 등)을 의미합니다. 4. 추정량 표본을 모두 설명할 수 있는 방식(공식, 함수식)으로 표현된 추정값을 의미합니다. 5. 점 추정 모수를 특정 수치로 추정하는 방법이지만, 오차를 동반...2025.05.09
-
30점 만점 방통대 중간과제물, 바이오통계학, 2023-2학기2025.01.261. 모집단, 표본, 모수, 통계량 만 20세 성인 여성 전체는 알고 싶은 대상 전체인 '모집단'에 해당하며, 모집된 100명의 여성의 평균 신장은 표본의 특성을 나타내는 '통계량'에 해당한다. 2. 혈액형 분포 막대그래프 ggplot2 패키지를 사용하여 혈액형의 분포를 나타내는 막대그래프를 그렸다. 3. 평균 신장 계산 mean() 함수를 사용하여 30명 전체의 평균 신장을 계산한 결과는 166.77이다. 4. 중앙값 계산 median() 함수를 사용하여 30명 전체의 신장 중앙값을 계산한 결과는 166이다. 5. 95% 신뢰구간...2025.01.26
-
표본의 크기에 대하여2025.01.111. 표본의 크기 표본이란 모집단을 대표하는 집단으로 연구에 실제 참여하는 집단을 말한다. 표본의 크기, 즉 몇 개의 표본을 뽑아야 모집단을 대표할 수 있는가는 매우 중요한 문제다. 표본의 수가 너무 적다면 모집단에 대한 잘못된 추정을 하기 쉽고, 반대로 표본의 수가 필요 이상으로 많으면 시간과 비용을 쓸데없이 낭비하는 것이 된다. 표본추출에서 일반적으로 중요한 것은 그 표본이 얼마나 모집단을 잘 대표할 수 있는가(대표성), 그리고 그 표본을 수집하는 데 있어서 경제성과 정확성 사이에서의 줄타기를 얼마나 잘 하는가(적절성)의 두 가...2025.01.11
-
바이오통계학 중간과제물 (2023, 만점)2025.01.241. 모집단, 표본, 모수, 통계량 만 20세 성인 여성의 평균 신장을 추정하기 위하여 100명의 만 20세 성인 여성을 모집하여 신장을 측정하고 평균을 계산하였다. 만 20세 성인 여성 전체는 모집단이며, 모집된 100명의 여성의 평균 신장은 통계량이다. 만 20세 성인 여성의 평균 신장은 모수이다. 2. 혈액형 분포 R 명령문을 이용하여 성인 30명의 성별, 혈액형, 신장 데이터를 객체 dd에 저장하고, 이를 활용하여 혈액형의 분포를 나타내는 막대그래프를 그렸다. 3. 평균 신장 계산 30명 전체의 평균 신장은 R의 mean()...2025.01.24
