
총 31개
-
새빨간 거짓말 통계 - 핵심정리 - 빌 게이츠 TED 강연 중 추천도서 - Lie of Statistics 통계 너마져?2025.01.181. 통계학의 기초 개념 통계학은 데이터의 수집, 분석, 해석, 발표 및 조직화에 관한 학문이다. 통계학의 기본 지식과 주요 개념으로는 모집단과 표본, 변수, 기술 통계, 추론 통계, 확률, 확률분포, 표본 분포, 평균, 중앙값, 모드, 분산, 표준편차, 귀무가설과 대립가설, 유의수준, p-값, 검정 통계량, 단순 회귀 분석, 다중 회귀 분석, 상관계수, 표본 추출 방법 등이 있다. 2. 통계학의 중급 개념 통계학의 중급 개념에는 가설 검정, 회귀 분석, 분산 분석, 비모수적 방법, 표본 크기 계산, 상관 분석 등이 포함된다. 이러...2025.01.18
-
선형회귀(Linear Regression)는 통계인가 머신 러닝인가?2025.05.081. 선형회귀 선형 회귀는 연속 값을 예측하는 데 사용되는 통계 방법입니다. 선형 회귀 모델은 두 변수 간의 관계를 설명하는 선형 방정식을 찾는 통계적 방법입니다. 선형 회귀 모델은 통계, 공학, 마케팅, 금융, 제조를 포함한 다양한 분야에서 사용됩니다. 선형 회귀는 데이터를 설명하고 미래를 예측하는 데 사용할 수 있는 가장 널리 사용되는 방법입니다. 2. 통계와 머신러닝 머신러닝의 등장으로 선형회귀는 주로 '지도 학습' 문제에서 사용됩니다. 선형회귀는 입력 변수와 출력 변수 사이의 선형적인 관계를 모델링하여 새로운 입력에 대한 출...2025.05.08
-
메타분석의 개념과 특징2025.04.291. 메타분석의 개념 메타분석은 전체 연구 결과에 대한 양적인 요약을 제공하는 통계적 검증기술로, 더 정확한 중재 효과에 대한 결정의 가능성을 제공하여 관련된 연구 분야에 걸쳐 통계적인 추정치를 제공한다. 메타분석은 분석들의 분석(analysis of analysis)으로 개별 연구의 결과를 통합할 목적으로 통계적 방법을 사용하여 분석하는 것을 말한다. 2. 메타분석의 특징 메타분석의 특징은 첫째, 수량적이고, 둘째, 효과크기를 계산하기 위하여 서로 상이한 연구들이 한 데 모아지게 되며, 셋째, 이러한 메타분석을 통해 일반적인 결론...2025.04.29
-
베이즈데이터분석 2024년 2학기 방송통신대 기말과제물2025.01.261. 밀도함수 기댓값 추정 중요도 추출 알고리즘을 이용하여 밀도함수 f(x) = 1/C * exp(-x) * x^(2-1) * (1-x)^(3-1)의 기댓값을 추정하였다. 제안분포 g(x)를 BETA(2, 3)으로 설정하고 1000개의 샘플을 추출하여 가중치를 계산한 후 I.hat2 추정량을 사용하여 기댓값을 0.3662329로 추정하였다. 상수 C를 계산할 수 있다면 I.hat1 추정량을 사용하여 기댓값을 0.364345로 추정할 수 있다. 2. 태풍 개수 모형 분석 2011년부터 2020년까지 우리나라에 영향을 준 연도별 태풍 ...2025.01.26
-
베이즈 정리를 기반으로 한 의사결정의 합리성2025.05.141. 베이즈 정리 베이즈 정리는 확률에 대한 새로운 해석을 제공하는 방법론이다. 고전적인 확률 정의와 달리 베이즈 정리는 어떤 사건이 일어날 것이라는 합리적 기대의 척도로 확률을 해석한다. 베이지안 추론은 이전의 경험과 현재의 증거를 토대로 사건의 확률을 추론하는 통계적 방법이다. 이를 통해 코로나 자가검사 키트의 정확도와 감염자의 확률을 계산할 수 있다. 2. 확률의 정의 확률에는 다양한 정의가 있다. 고전적인 확률 정의는 사건의 발생 가능성을 전체 사건 수에 대한 유리한 사건 수의 비율로 정의한다. 이와 달리 베이즈 확률론은 확...2025.05.14
-
연속확률분포에 대하여 요약하여 정리하시오2025.04.271. 확률분포 확률분포란 확률변수가 특정한 값을 가질 확률을 나타내고 있는 함수를 의미한다. 확률분포는 확률변수 종류에 따라 이산확률분포와 연속확률분포로 구분된다. 2. 균등분포 균등분포는 모든 확률분포 중에서 가장 단순한 형태의 분포이다. 이는 이산확률분포 형태로도 정의할 수 있지만, 많은 경우에는 연속확률분포로서의 균등분포를 다루게 된다. 3. 정규분포 정규분포는 통계이론에서 가장 중요하고 현실적으로 가장 많이 적용되는 분포이다. 정규분포는 많은 자연현상과 사회적 현상을 설명하는데 적합하며, 대부분의 통계분석기법들도 모집단의 분...2025.04.27
-
양적분석기법의 의의와 학습 필요성을 논하시오2025.05.141. 양적분석의 개념 양적 연구는 통계적으로 분석할 수 있는 계량화된 자료를 활용한다. 계량화된 자료를 활용함으로써 일반화할 수 있고 객관적으로 검증할 수 있는 가설이나 이론, 보편적 법칙을 도출하는 것을 목적으로 한다. 양적 분석은 일반화할 수 있는 결과를 산출할 수 있어서 재정의 지원이나 출판에 용이한 자료를 제공한다는 장점이 있지만, 조사의 결과가 풍부하지 못하고, 이것을 과연 일반화 할 수 있느냐는 의문의 도전을 받게 된다. 또한 모든 결과를 계량화하려고 하기 때문에 조작적으로 정의할 수 없는 현상이나 대상에 대해서는 근본적...2025.05.14
-
빅데이터와 통계학_탐구보고서_확통(세특)2025.01.111. 빅데이터와 통계학 빅데이터는 기존의 데이터 베이스 관리도구의 데이터 수집, 저장, 관리, 분석의 역량을 넘어서는 대량의 정형 또는 비정형의 데이터 세트 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 의미한다. 정보 통신 기술의 발달, 빅데이터에 대한 효율적인 저장 및 분석의 가능, 국가간 기술 격차 감소로 인해 빅데이터에 대한 관심이 높아지고 있다. 의료산업, 맞춤형 마케팅, 제조업 등 다양한 분야에서 빅데이터가 응용되고 있다. 따라서 빅데이터 시대에 가치를 추출하고 결과를 분석하는 분야와 밀접한 관련이 있는 ...2025.01.11
-
데이터 사이언티스트 인터뷰 준비2025.01.201. 데이터 전처리 데이터셋에 존재할 수 있는 결측값과 이상치를 처리하는 것이 중요하다. 결측값은 평균, 중앙값 등으로 대체하거나 제거할 수 있으며, 이상치는 상자 그림이나 Z-점수를 사용해 식별하고 제거하거나 대체할 수 있다. 또한 데이터의 스케일을 맞추기 위해 정규화 작업이 필요하다. 2. 머신러닝 모델 과적합 방지 과적합을 방지하기 위해 교차 검증, 정규화 기법(L1, L2), 조기 종료 등의 방법을 사용할 수 있다. 교차 검증을 통해 데이터를 최대한 활용하고 모델의 일반화 성능을 평가할 수 있으며, 정규화 기법은 모델의 복잡...2025.01.20
-
딥러닝의 통계적 이해 출석 수업 과제물 (2023, 만점)2025.01.241. Teachable Machine을 이용한 머신러닝 모델 구축 Teachable Machine을 활용하여 이미지를 학습시켰다. 사용한 이미지는 구글 이미지에서 '귀멸의 칼날'이라는 애니메이션의 주인공 4명의 다른 사진들을 각각 10장씩 찾은 뒤 머신러닝의 입력값으로 사용하였다. 본 머신러닝으로 실제로 가지고 있는 피규어 사진을 찍어 이 사진을 입력하면 애니메이션 캐릭터를 정확하게 분류할 수 있는지 파악하고자 하였다. 다양한 하이퍼파라미터 조정을 통해 최적의 정확도를 얻고자 하였으나, 설정에 따른 결과 비교를 대량으로 진행하여 거...2025.01.24