총 12개
-
로버스트 회귀와 비선형 회귀분석2025.11.171. 로버스트 추정량 로버스트 추정량은 모형의 기본 가정(독립성, 등분산성, 정규성 등)의 성립 여부에 민감하지 않은 추정량입니다. 특히 정규성 가정이 성립하지 않아 자료의 분포가 정규분포보다 두터운 꼬리를 가질 때 특이값이 나타날 가능성이 증가합니다. 좁은 의미의 로버스트 추정량은 특이값에 덜 민감한 특성을 가지며, 중심위치 추정 시 중앙값이 표본평균보다 로버스트한 특성을 보입니다. 2. 보통최소제곱추정량(OLSE) 보통최소제곱추정량(OLSE)은 특이값에 민감한 추정량입니다. 이는 값들의 차이를 제곱하여 더 크게 증폭시키는 제곱합...2025.11.17
-
회귀모형의 진단과 수정2025.11.171. 회귀진단(Regression Diagnostics) 회귀진단은 현재 설정된 회귀모형의 타당성을 검토하는 과정입니다. 회귀모형이 반응변수와 설명변수들의 관계를 제대로 반영하는지 확인하고, 모형에 포함된 설명변수들이 중요한지 또는 불필요한 변수들이 있는지를 평가합니다. 이를 통해 모형의 적절성과 신뢰성을 판단할 수 있습니다. 2. 오차항의 가정 검증 회귀모형의 유효성을 위해 오차항이 만족해야 할 세 가지 주요 가정이 있습니다. 등분산성은 오차의 분산이 일정한지 확인하고, 정규성은 오차가 정규분포를 따르는지 검토하며, 독립성은 오차...2025.11.17
-
PCA & SVD2025.01.131. PCA (주성분 분석) PCA는 데이터의 분산(variance)을 최대한 보존하면서 서로 직교하는 새 기저(축)를 찾아, 고 차원 공간의 표본들을 선형 연관성이 없는 저차원 공간으로 변환하는 기법입니다. 데이터의 분산을 최대로하는 새로운 기저를 찾기 위해서는 데이터 행렬 A의 공분산 행렬을 구해야 합니다. 공분산 행렬의 고유분해(Eigendecomposition)를 통해 가장 큰 고유값 몇 개를 고르고, 그에 해당하는 고유벡터를 새로운 기저로 하여 데이터 벡터들을 정사영시키면 PCA 작업이 완료됩니다. 2. SVD (특이값 분...2025.01.13
-
경영통계학 ) 최근 1년간 개봉한 영화 30개 분석2025.01.291. 영화 상영 시간 분석 최근 1년간 개봉한 영화 30개의 상영 시간 데이터를 수집하여 분석하였습니다. 빈도분포표와 히스토그램을 작성하여 데이터의 분포를 확인하였고, 평균, 중앙값, 최빈값을 계산하여 중심 경향성을 분석하였습니다. 중앙값이 가장 좋은 중심 측정치라고 판단하였는데, 그 이유는 중앙값이 특이값의 영향을 받지 않고 데이터의 중심을 잘 나타내기 때문입니다. 또한 데이터를 표준화하여 특이값을 확인한 결과, 1개의 특이값이 발견되었습니다. 1. 영화 상영 시간 분석 영화 상영 시간 분석은 영화 산업에서 매우 중요한 부분입니다...2025.01.29
-
최근 1년간 개봉한 영화 30개의 상영 시간 분석2025.01.291. 영화 상영 시간 분석 최근 1년간 개봉한 영화 30개의 상영 시간을 조사하여 빈도 분포표와 히스토그램을 작성하고, 평균, 중앙값, 최빈값을 계산하였다. 데이터를 표준화하고 특이값을 판단하였다. 분석 결과, 대부분의 영화가 100분에서 120분 사이의 상영 시간을 가지고 있으며, 평균보다 짧거나 긴 상영 시간을 가진 영화도 각각 1편씩 존재하는 것으로 나타났다. 1. 영화 상영 시간 분석 영화 상영 시간 분석은 영화 산업에서 매우 중요한 요소입니다. 관객들의 선호도와 관람 행태를 이해하고 이를 바탕으로 영화 제작과 배급 전략을 ...2025.01.29
-
2024년 1학기 방송통신대 출석수업대체과제물 데이터정보처리입문2025.01.251. 연도별 전국 총출생성비 분석 1990년부터 2022년까지의 연도별 전국 총출생성비를 시계열도표로 나타내고 전체적인 경향을 설명하였다. 총출생성비는 여아 100명당 남아의 수를 나타내는 것으로, 1990년 이후 지속적으로 감소하는 추세를 보이고 있다. 다만 1990년대 중후반 이후에는 하락 속도가 다소 완화되고 있는 것으로 나타났다. 2. 서울과 부산의 총출생성비 비교 1990년부터 2022년까지의 연도별 서울과 부산의 총출생성비를 하나의 시계열도표에 나타내고 비교하였다. 대체로 2005년 이전에는 부산이 서울보다 총출생성비가 ...2025.01.25
-
30점 만점 방통대 데이터정보처리입문 2023-1학기2025.01.261. 출생성비 추이 1990년부터 2021년까지의 전국, 서울, 부산의 연도별 출생성비 추이를 시계열 도표로 나타냈다. 전국적으로 1990년 116.5에서 점차 감소하여 2021년 105.1까지 감소하는 경향을 보였으며, 서울과 부산도 유사한 추이를 보였다. 다만 2000년대 중반 이전에는 부산의 출생성비가 서울보다 높았으나 이후 큰 차이가 없어졌다. 2. 합계출산율 추이 1993년부터 2021년까지의 전국 합계출산율 추이를 시계열 도표로 나타냈다. 합계출산율은 1993년 1.654에서 점차 감소하여 2021년 0.808까지 감소하...2025.01.26
-
벡터와 행렬의 효과적 활용법 및 장점2025.11.151. 행렬을 이용한 선형 방정식 해결 행렬은 여러 개의 선형 방정식을 한 번에 표현할 수 있어 선형 방정식의 해를 구하는 데 유용하다. 행렬의 곱셈을 이용하면 여러 개의 선형 변환을 한 번에 적용할 수 있어 시간과 노력을 절약할 수 있다. 이러한 특성으로 인해 복잡한 계산을 간단하게 처리할 수 있으며, 수학적 문제 해결에 큰 도움이 된다. 2. 데이터 분석에서의 벡터와 행렬 활용 벡터를 사용한 차원 축소 기법은 데이터를 더욱 효과적으로 분석할 수 있도록 해준다. 공분산 행렬은 데이터 간의 상관 관계를 분석하는 데 사용되며, 행렬은 ...2025.11.15
-
고등학교 수학으로 이해하는 무선통신 시스템과 행렬2025.11.141. RIS를 활용한 무선통신 시스템 RIS(재구성 가능한 지능형 표면)는 6G 통신 시스템의 후보기술로, 밀리미터 및 테라헤르츠 대역에서 전파의 경로 감쇄를 보완한다. 위상 제어를 통해 원하는 형태의 빔을 지향하고 낮은 에너지로 반사파를 조절할 수 있다. 원거리 경로 감쇄 모델은 행렬로 표현되며, 메타 물질의 반사 특성을 고려하여 수학적으로 도출된다. 2. 통신신호처리를 위한 행렬 Hadamard 행렬은 직교성을 가지며 음성신호와 영상신호의 변환 및 부호화에 사용된다. 가산과 감산만으로 변환이 가능하여 하드웨어 단순화에 효과적이다...2025.11.14
-
최근 1년간 개봉한 영화 30개의 상영 시간 분석2025.01.241. 영화 상영 시간 분석 본 과제는 최근 1년간 개봉한 영화 30개의 상영 시간을 분석하여 영화의 상영 시간에 대한 통계적 특성을 파악하는 것을 목적으로 한다. 빈도분포표와 히스토그램을 작성하고, 평균, 중앙값, 최빈값을 계산하여 가장 적합한 중심 측정치를 논의하며, 데이터를 표준화하여 특이값을 분석하고자 한다. 1. 영화 상영 시간 분석 영화 상영 시간 분석은 영화 산업에서 매우 중요한 주제입니다. 관객들의 선호도와 관람 행태를 이해하고 이를 바탕으로 영화 제작과 배급 전략을 수립하는 데 도움이 될 수 있습니다. 상영 시간이 너...2025.01.24
