
2024년 1학기 방송통신대 출석수업대체과제물 데이터정보처리입문
본 내용은
"
2024년 1학기 방송통신대 출석수업대체과제물 데이터정보처리입문)교재 14쪽의 예제 1.1에 제시된 과정을 따라 엑셀을 활용하여 다음 그래프를 작성하시오 1990년부터 2022년까지의 연도별 전국 총출생성비를 시계열도표로 나타내고 전체적인 경향 등
"
의 원문 자료에서 일부 인용된 것입니다.
2024.04.08
문서 내 토픽
-
1. 연도별 전국 총출생성비 분석1990년부터 2022년까지의 연도별 전국 총출생성비를 시계열도표로 나타내고 전체적인 경향을 설명하였다. 총출생성비는 여아 100명당 남아의 수를 나타내는 것으로, 1990년 이후 지속적으로 감소하는 추세를 보이고 있다. 다만 1990년대 중후반 이후에는 하락 속도가 다소 완화되고 있는 것으로 나타났다.
-
2. 서울과 부산의 총출생성비 비교1990년부터 2022년까지의 연도별 서울과 부산의 총출생성비를 하나의 시계열도표에 나타내고 비교하였다. 대체로 2005년 이전에는 부산이 서울보다 총출생성비가 높았지만, 2005년 이후에는 두 도시가 비슷한 수준의 총출생성비를 보이고 있다. 서울과 부산 모두 총출생성비가 지속적으로 감소하는 추세적 경향을 보이지만, 2005년 이후에는 감소 속도가 완화되면서 소폭의 등락 양상을 나타내고 있다.
-
3. 연도별 전국 합계출산율 분석1993년부터 2022년까지의 연도별 전국 합계출산율을 시계열도표로 나타내고 전체적인 경향을 설명하였다. 전국 합계출산율은 1993년 1.654에서 2022년 0.778로 지속적인 하락 추세를 보이고 있다. 특히 1993~2002년 사이의 하락폭이 상대적으로 크게 나타나고 있으며, 2002년 이후에는 1.2를 중심으로 소폭의 등락을 보이다가 2015년 이후에는 다시 하락 속도가 커지고 있다. 2018년에는 처음으로 합계출산율 1이 무너지면서 현재까지 1를 회복하지 못하고 있어 인구소멸 우려까지 낳고 있다.
-
4. score.txt 데이터 분석교재 75쪽에 제시된 데이터 score.txt에 대해 R을 이용하여 분석하였다. 평균, 중앙값, 표본분산, 표본표준편차, 변동계수를 구하여 분포의 특징을 설명하였다. 또한 줄기-잎 그림, 히스토그램, 상자그림을 그려 분포의 특징을 추가로 분석하였다. 줄기-잎 그림에서는 50점대의 빈도수가 가장 많고 대칭 형태가 아닌 오른쪽에 꼬리가 있는 모양을 보였다. 히스토그램과 상자그림에서도 이러한 특징이 확인되었으며, 상자그림에서는 특이값(outlier)인 99가 존재하는 것도 확인되었다.
-
1. 주제2: 서울과 부산의 총출생성비 비교서울과 부산의 총출생성비 비교 분석은 지역 간 인구 구조와 출산 동향의 차이를 이해하는 데 도움이 될 것 같습니다. 두 도시는 우리나라 최대 도시로서 인구 규모, 산업 구조, 사회경제적 특성 등이 상이하기 때문에 출생성비에도 차이가 있을 것으로 예상됩니다. 이러한 지역 간 격차를 분석하여 그 원인을 규명하고, 이에 따른 차별화된 정책 수립이 필요할 것 같습니다. 예를 들어 대도시와 중소도시, 농촌 지역 간 출생성비 차이를 분석하여 지역 특성에 맞는 출산 장려 정책을 수립할 수 있을 것입니다.
-
2. 주제4: score.txt 데이터 분석score.txt 데이터 분석은 해당 데이터셋의 특성과 내용을 이해하고, 이를 바탕으로 다양한 분석을 수행할 수 있는 기회가 될 것 같습니다. 데이터의 구조와 특성을 파악하고, 이를 통해 데이터의 의미와 활용 가능성을 탐색할 수 있습니다. 예를 들어 데이터 내 변수 간 상관관계, 이상치 및 결측치 분석, 통계적 추정 및 가설 검정 등을 수행하여 데이터의 특성을 심도 있게 이해할 수 있습니다. 이를 통해 데이터 기반의 의사결정 및 정책 수립에 활용할 수 있는 유의미한 정보를 도출할 수 있을 것으로 기대됩니다.