
총 8개
-
PCA & SVD2025.01.131. PCA (주성분 분석) PCA는 데이터의 분산(variance)을 최대한 보존하면서 서로 직교하는 새 기저(축)를 찾아, 고 차원 공간의 표본들을 선형 연관성이 없는 저차원 공간으로 변환하는 기법입니다. 데이터의 분산을 최대로하는 새로운 기저를 찾기 위해서는 데이터 행렬 A의 공분산 행렬을 구해야 합니다. 공분산 행렬의 고유분해(Eigendecomposition)를 통해 가장 큰 고유값 몇 개를 고르고, 그에 해당하는 고유벡터를 새로운 기저로 하여 데이터 벡터들을 정사영시키면 PCA 작업이 완료됩니다. 2. SVD (특이값 분...2025.01.13
-
경영통계학 ) 최근 1년간 개봉한 영화 30개 분석2025.01.291. 영화 상영 시간 분석 최근 1년간 개봉한 영화 30개의 상영 시간 데이터를 수집하여 분석하였습니다. 빈도분포표와 히스토그램을 작성하여 데이터의 분포를 확인하였고, 평균, 중앙값, 최빈값을 계산하여 중심 경향성을 분석하였습니다. 중앙값이 가장 좋은 중심 측정치라고 판단하였는데, 그 이유는 중앙값이 특이값의 영향을 받지 않고 데이터의 중심을 잘 나타내기 때문입니다. 또한 데이터를 표준화하여 특이값을 확인한 결과, 1개의 특이값이 발견되었습니다. 1. 영화 상영 시간 분석 영화 상영 시간 분석은 영화 산업에서 매우 중요한 부분입니다...2025.01.29
-
최근 1년간 개봉한 영화 30개의 상영 시간 분석2025.01.291. 영화 상영 시간 분석 최근 1년간 개봉한 영화 30개의 상영 시간을 조사하여 빈도 분포표와 히스토그램을 작성하고, 평균, 중앙값, 최빈값을 계산하였다. 데이터를 표준화하고 특이값을 판단하였다. 분석 결과, 대부분의 영화가 100분에서 120분 사이의 상영 시간을 가지고 있으며, 평균보다 짧거나 긴 상영 시간을 가진 영화도 각각 1편씩 존재하는 것으로 나타났다. 1. 영화 상영 시간 분석 영화 상영 시간 분석은 영화 산업에서 매우 중요한 요소입니다. 관객들의 선호도와 관람 행태를 이해하고 이를 바탕으로 영화 제작과 배급 전략을 ...2025.01.29
-
2024년 1학기 방송통신대 출석수업대체과제물 데이터정보처리입문2025.01.251. 연도별 전국 총출생성비 분석 1990년부터 2022년까지의 연도별 전국 총출생성비를 시계열도표로 나타내고 전체적인 경향을 설명하였다. 총출생성비는 여아 100명당 남아의 수를 나타내는 것으로, 1990년 이후 지속적으로 감소하는 추세를 보이고 있다. 다만 1990년대 중후반 이후에는 하락 속도가 다소 완화되고 있는 것으로 나타났다. 2. 서울과 부산의 총출생성비 비교 1990년부터 2022년까지의 연도별 서울과 부산의 총출생성비를 하나의 시계열도표에 나타내고 비교하였다. 대체로 2005년 이전에는 부산이 서울보다 총출생성비가 ...2025.01.25
-
30점 만점 방통대 데이터정보처리입문 2023-1학기2025.01.261. 출생성비 추이 1990년부터 2021년까지의 전국, 서울, 부산의 연도별 출생성비 추이를 시계열 도표로 나타냈다. 전국적으로 1990년 116.5에서 점차 감소하여 2021년 105.1까지 감소하는 경향을 보였으며, 서울과 부산도 유사한 추이를 보였다. 다만 2000년대 중반 이전에는 부산의 출생성비가 서울보다 높았으나 이후 큰 차이가 없어졌다. 2. 합계출산율 추이 1993년부터 2021년까지의 전국 합계출산율 추이를 시계열 도표로 나타냈다. 합계출산율은 1993년 1.654에서 점차 감소하여 2021년 0.808까지 감소하...2025.01.26
-
최근 1년간 개봉한 영화 30개의 상영 시간 분석2025.01.241. 영화 상영 시간 분석 본 과제는 최근 1년간 개봉한 영화 30개의 상영 시간을 분석하여 영화의 상영 시간에 대한 통계적 특성을 파악하는 것을 목적으로 한다. 빈도분포표와 히스토그램을 작성하고, 평균, 중앙값, 최빈값을 계산하여 가장 적합한 중심 측정치를 논의하며, 데이터를 표준화하여 특이값을 분석하고자 한다. 1. 영화 상영 시간 분석 영화 상영 시간 분석은 영화 산업에서 매우 중요한 주제입니다. 관객들의 선호도와 관람 행태를 이해하고 이를 바탕으로 영화 제작과 배급 전략을 수립하는 데 도움이 될 수 있습니다. 상영 시간이 너...2025.01.24
-
[한국방송통신대학교] 2021년도 1학기 컴퓨터과학과 데이터정보처리입문 출석수업과제물 A+ (성적우수졸업)2025.01.251. 전국 총출생성비 추이 2009년부터 2019년까지의 연도별 전국 총출생성비를 시계열도표로 나타내고, 도표를 이용하여 경향을 설명하였습니다. 출생성비는 '(남자 출생아 / 여자 출생아) × 100' 로 계산할 수 있는데, 쉽게 말해 여아 100명당 남아수를 의미합니다. 2011년은 전년도에 비해 다소 큰 감소폭을 보였으나, 이후 5년간은 매우 완만한 감소세를 보입니다. 다만 2017년에는 106.3으로 2016년에 비해 다소 남아가 증가한 모습을 보이는데, 이듬해부터 다시 평년과 비슷한 수치로 돌아왔습니다. 자연 출생성비는 대략...2025.01.25
-
파이썬과R 2024년 2학기 방송통신대 출석수업과제물) 교재 연습문제 3장 1번, 2번, 3번 4장 7번, 8번, 9번 8장 2번2025.01.261. R 데이터프레임 생성 R에서 데이터프레임은 data.frame 함수로 생성한다. 데이터프레임을 구성할 원소를 설정하고, 행의 이름을 지정할 수 있다. 또한 문자열을 'factor'로 처리할지 여부를 선택할 수 있다. 2. 파이썬 딕셔너리 생성 파이썬에서 딕셔너리는 키(key)와 값(value)을 매핑시킨 자료형이다. 키는 불변객체의 자료형이어야 하며, 값은 자료형의 제한이 없다. 리스트나 튜플과 같은 가변객체는 키가 될 수 없다. 3. 파이썬 데이터프레임 생성 파이썬의 판다스 라이브러리를 사용하여 데이터프레임을 생성할 수 있다...2025.01.26