
총 13개
-
30점 만점 방통대 데이터정보처리입문 2023-1학기2025.01.261. 출생성비 추이 1990년부터 2021년까지의 전국, 서울, 부산의 연도별 출생성비 추이를 시계열 도표로 나타냈다. 전국적으로 1990년 116.5에서 점차 감소하여 2021년 105.1까지 감소하는 경향을 보였으며, 서울과 부산도 유사한 추이를 보였다. 다만 2000년대 중반 이전에는 부산의 출생성비가 서울보다 높았으나 이후 큰 차이가 없어졌다. 2. 합계출산율 추이 1993년부터 2021년까지의 전국 합계출산율 추이를 시계열 도표로 나타냈다. 합계출산율은 1993년 1.654에서 점차 감소하여 2021년 0.808까지 감소하...2025.01.26
-
출석수업에서 다룬 데이터 분석 과정과 빅데이터 분석에 대한 이해2025.01.241. 데이터 분석 과정 출석수업에서는 R 프로그래밍 언어를 이용하여 'The Billion Prices Project'의 공개 데이터 'Our Public Data'를 분석했습니다. 데이터의 구성을 살펴보고, 국가별 가격 데이터 개수의 히스토그램을 그렸습니다. 또한 온라인과 오프라인 가격 차이를 비교하고, 국가 간 가격 차이의 표준편차를 구해 히스토그램으로 나타냈습니다. 2. 빅데이터 분석의 특징 빅데이터는 volume, variety, velocity, variability, veracity의 5가지 특징을 가집니다. 데이터의 규...2025.01.24
-
방송통신대학교 통계데이터학과) R컴퓨팅 출석과제물 (30점 만점 A+)2025.01.261. R 프로그래밍 제출된 자료에는 R 프로그래밍을 활용한 다양한 작업이 포함되어 있습니다. 이를 통해 R 언어의 기본 문법과 통계 함수 사용법, 데이터 처리 및 분석 기법 등을 익힐 수 있습니다. 특히 학번을 이용한 벡터 생성, 결측치 처리, airquality 데이터셋 활용 등의 내용이 포함되어 있습니다. 2. 통계 데이터 분석 제출된 자료에는 통계 데이터 분석과 관련된 내용이 포함되어 있습니다. 벡터 데이터의 평균, 분산, 중앙값 계산, airquality 데이터셋의 결측치 확인 및 분석 등을 통해 통계 데이터 처리 및 분석 ...2025.01.26
-
(방송대) 다변량분석, 출석수업 과제물 (2023 1학기, 30점 만점)2025.01.251. 다변량분석 이 자료는 R 프로그래밍을 사용하여 다변량 분석을 수행하는 방법을 설명합니다. 다변량 분석은 여러 개의 변수를 동시에 분석하는 통계 기법으로, 변수들 간의 관계를 파악하고 이해하는 데 유용합니다. 이 자료에서는 R에 내장된 'longley' 데이터셋을 사용하여 산점도 행렬, 별그림, 얼굴그림 등의 시각화 기법을 통해 변수 간 상관관계를 분석하고 해석하는 과정을 보여줍니다. 1. 다변량분석 다변량분석은 여러 개의 변수들 간의 관계를 동시에 분석하는 통계 기법입니다. 이 기법은 복잡한 현실 세계의 문제를 이해하고 해결하...2025.01.25
-
방통대 통계데이터학과 R컴퓨팅 A+2025.01.241. R 프로그래밍 이 프레젠테이션은 R 프로그래밍 언어를 사용하여 다양한 통계 작업을 수행하는 방법을 다룹니다. 주요 내용으로는 벡터 생성, 통계 함수 사용, 결측치 처리, 데이터 추출 및 조작, 성적 등급 부여, 반복문 활용 등이 포함됩니다. 2. 통계 데이터 분석 이 프레젠테이션은 R 프로그래밍을 통해 통계 데이터를 분석하는 방법을 소개합니다. 주요 내용으로는 USArrests 데이터셋을 활용한 데이터 추출 및 통계량 계산, 모의시험 점수 데이터를 이용한 성적 등급 부여 등이 포함됩니다. 3. 반복문 활용 이 프레젠테이션은 f...2025.01.24
-
30점 만점 방통대 R컴퓨팅 2023-1학기2025.01.261. 데이터 생성 및 활용 오늘날 데이터의 중요성이 매우 높아졌으며, 이를 활용하여 의사결정에 활용하는 것이 중요하다. 하지만 데이터 활용 수준에 따른 격차로 인해 사회적 불평등이 발생할 수 있다. 따라서 데이터의 의미를 찾고 해석하기 위해 통계 프로그램인 R이 사용되고 있다. 2. R 프로그래밍 언어 R은 오픈소스 프로그램으로 무료로 사용할 수 있어 접근성이 높다. 또한 커뮤니티가 활성화되어 있어 코드 및 분석 정보를 공유할 수 있으며, 시각화 능력이 뛰어나다는 장점이 있다. 다만 초보자의 경우 함수와 패키지가 다양하여 프로그램 ...2025.01.26
-
2023년 1학기 방통대 R컴퓨팅 출석수업 중간과2025.01.251. R 프로그래밍 R은 약 20년 전 어문계 사범대학을 졸업하고 이후 제약회사의 국내외 업무를 하다가 금년도 이렇게 방송통신대학교 통계-데이터과학과에 편입하고서야 처음 접하게 되는 프로그래밍 언어입니다. 이전까지는 R의 R자도 들어보지 못하였고, 첫학기(한학기)의 중반이 넘어가고 있는 지금에도 아직 생경한 것이 사실입니다. 다행인 것은 이 R컴퓨팅 과목뿐만 아니라 함께 수강하고 있는 몇 과목들, 예를 들어 통계학개론이나 정보처리입문과 같은 과목에서 R에 대해 부분적으로 반복적으로 배울 수 있어 학습-습득에 도움이 되고 있습니다. ...2025.01.25
-
방통대 [데이터시각화] 2024 출석과제물 (30점 만점 인증 / 표지제외 29페이지 분량 / 코드 및 해설 포함)2025.01.251. 워드 클라우드 워드 클라우드는 텍스트 데이터에서 단어의 빈도 수가 높을수록 큰 글씨로 표현하는 시각화 기법이다. 주제나 핵심 키워드를 쉽고 효과적으로 전달할 수 있다는 장점이 있다. SNS 데이터에서 인기 키워드를 찾거나 연설문에서 핵심 내용과 주제를 찾는데 유용하게 사용될 수 있다. 또한 온라인 게시글에서 여론을 찾아내기도 하며 고객 리뷰에 대한 요약을 제공하기도 한다. 특히나 미국 대선 때 사용되는 워드 클라우드에서는 각 후보자의 핵심 공약이나 정책 방향, 이슈, 유권자들이 중요하게 생각하는 가치관을 직관적으로 확인할 수 ...2025.01.25
-
방송통신대학교 통계데이터학과)바이오통계학 중간과제물 (30점 만점 A+)2025.01.261. 모집단, 표본, 모수, 통계량 모집단은 우리가 알고 싶은 대상 전체를 의미하며, 표본은 모집단의 일부를 실제로 관측한 것을 말한다. 모수는 모집단 전체의 특성을 나타내는 값이고, 통계량은 표본의 특성을 나타내는 값이다. 이 문제에서 모집된 만 7세 아동 100명은 표본에 해당한다. 2. 히스토그램 그리기 R 프로그래밍을 이용하여 수축기 혈압(SBP)의 분포를 나타내는 히스토그램을 그렸다. 이를 통해 데이터의 분포 특성을 시각적으로 확인할 수 있다. 3. 중앙값 구하기 R 프로그래밍을 이용하여 이 데이터에 포함된 156명 전체의...2025.01.26
-
30점 만점 방통대 회귀모형 2024-1학기2025.01.261. 회귀모형 이 자료는 회귀모형 교과목에 대한 과제물로, 회귀직선 구하기, 분산분석표 작성 및 유의성 검정, 회귀모형 추정 등의 내용을 다루고 있습니다. 회귀모형은 독립변수와 종속변수 간의 관계를 분석하는 통계 기법으로, 다양한 분야에서 활용됩니다. 이 자료에서는 R 프로그래밍을 활용하여 회귀모형을 적합하고 분석하는 과정을 보여주고 있습니다. 2. 데이터 분석 이 자료에서는 ex1-2.csv, Fish.csv, estate.csv 등의 데이터 파일을 활용하여 회귀모형을 적합하고 분석하는 과정을 보여주고 있습니다. 데이터 불러오기,...2025.01.26