본문내용
1. 한글수식작성
1.1. 정규모집단에서의 표본평균 bar X 의 분포
정규모집단에서의 표본평균 bar X 의 분포는 다음과 같다. 모집단이 정규분포 N(μ, σ²)를 따를 때, 랜덤표본 X₁, ..., Xₙ의 표본평균 barX는 정규분포 N{(μ, σ²/n)}을 따른다. 즉, barX ~ N{(μ, σ²/n)}이다. 따라서 표준화된 barX의 분포는 표준정규분포를 따르며, Z = (barX - μ) / (σ/√n) ~ N(0,1)이다. 이는 표본평균 barX가 정규분포를 따르고 그 분산이 모분산 σ²을 n으로 나눈 값이기 때문이다. 이를 통해 표본평균의 분포와 성질을 알 수 있다.
1.2. 표본평균 barX의 분포
모집단이 정규분포 N(μ, σ²)을 따를 때, 랜덤표본 X₁, ⋯, Xn의 표본평균 barX는 정규분포 N{μ, σ²/n}을 따른다. 즉, barX ~ N{μ, σ²/n}이다. 따라서, 표준화된 barX의 분포는 표준정규분포를 따른다. 즉, Z = (barX - μ) / (σ/√n) ~ N(0,1)이다. 표본평균 barX는 정규모집단에서 발췌한 표본으로부터 얻은 평균값이므로, 이 표본평균 barX가 정규분포를 따르게 되는 이유는 중심극한정리에 의한 것이다. 이는 표본크기 n이 충분히 클 경우에 성립한다. 즉, 모평균 μ와 모분산 σ²가 알려져 있을 때, 표본평균 barX는 정규분포를 따르게 되는데, 이 때 평균은 모평균 μ이고 분산은 모분산 σ²를 n으로 나눈 값 σ²/n이 된다. 따라서 표준화된 표본평균 (barX - μ) / (σ/√n)은 표준정규분포 N(0,1)을 따르게 된다. 이러한 성질을 이용하면 표본평균 barX의 분포에 대한 통계적 추론을 할 수 있다.
2. 데이터정보처리입문 과제물
2.1. 연도별 전국 총출생성비 시계열도표 작성 및 경향
1990년부터 2020년까지의 연도별 전국 총출생성비는 감소 후 일정 수준을 유지하는 경향을 보이고 있다. 1990년(116.5)부터 1997년(108.2)까지 다소 가파르게 감소(8.3명)하였고, 이후 1998년(110.1)부터 2011년(105.7)까지는 완만한 감소세(4.4명)를 보였다. 2011년 이후부터 2020년(104.8)까지는 비교적 작은 폭의 변화와 더불어 미약한 감소세를 나타내고 있다. 과거 높은 출생성비는 베이비붐 세대 이후의 인구 산아제한 정책과 한국의 전통적인 남아 선호사상 간의 충돌이 주요한 요인이다. 1980~90년대 태아의 성별을 미리 감별할 수 있는 초음파 기기의 상용화로 인해 여아에 대한 낙태가 빈번히 발생하여 자연적인 범위를 벗어난 출생성비가 나타났다. 그러나 시간이 흘러 문화적인 인식이 개선되고, 2005년 생명윤리법 제정으로 태아의 성별 감별 및 출산이 금지되면서 2006년 이후에는 자연적인 성비 수준이 유지되는 경향을 보이고 있다.
2.2. 연도별 서울, 경상북도 총출생성비 시계열도표 작성 및 비교
경상북도는 대부분 서울의 출생성비보다 높은 수치를 보이고 있다. 경북의 출생성비는 서울보다 이 기간 동안 평균 4.6명 높았다. 가장 높은 차이를 보였던 1990년도에는 무려 17.3명이 더 높았으며, 2018년까지는 경북의 출생 성...