
총 1,106개
-
다중 선형 회귀 (Multiple Linear Regression, MLR)2025.05.091. 다중 선형 회귀 (Multiple Linear Regression, MLR) 다중 선형 회귀(Multiple Linear Regression, MLR)는 하나의 종속 변수를 다수의 독립 변수와의 선형 관계로 설명하는 모델입니다. 단순 선형 회귀가 하나의 독립 변수와 하나의 종속 변수 간의 선형 관계를 모델링하는 것과 달리, MLR은 여러 개의 독립 변수가 종속 변수와의 선형 관계에 영향을 미칠 수 있는 경우를 다룹니다. 예를 들어, 주택 가격을 예측하기 위해 주택의 크기, 방의 개수, 위치, 건물 연식 등 여러 독립 변수들을 ...2025.05.09
-
랜덤 포레스트 (Random Forest Algorithm)2025.05.091. 랜덤 포레스트 (Random Forest Algorithm) 랜덤 포레스트는 특이하고 재미있는 방법론으로, 앙상블 학습(Ensemble Learning)의 한 종류입니다. 앙상블 학습은 여러 개별적인 학습 모델을 조합하여 보다 강력하고 정확한 예측 모델을 구축하는 기법입니다. Random Forest는 이러한 개별 모델로 결정 트리(Decision Tree)를 사용합니다. 하지만 단일 결정 트리를 사용하는 것이 아니라 수백 또는 수천 개의 결정 트리를 생성하고 이들을 조합하여 학습하고 예측을 수행하며, 이들을 결합하여 보다 정...2025.05.09
-
시계열 데이터 분석 기법의 장단점 및 예시2025.01.261. ARIMA 모델 ARIMA 모델은 시계열 데이터의 선형적 관계를 잘 포착하여 비교적 간단한 수식으로 데이터 예측이 가능하다는 장점이 있습니다. 주식 가격 예측, 경제 지표 예측, 수요 예측 등에서 유용하게 사용될 수 있습니다. 그러나 비선형적이거나 계절적 패턴을 가진 데이터에는 적합하지 않으며, 모델의 설정 및 파라미터 최적화가 복잡할 수 있다는 단점이 있습니다. 2. 지수평활법 지수평활법은 데이터의 최신 변화에 빠르게 반응하여 짧은 기간의 예측에 특히 유리합니다. 이 방법은 비교적 간단하고 직관적이며, 데이터가 급격히 변동할...2025.01.26
-
건국대학교 데이터베이스 과목 데이터베이스 조사 리포트2025.01.191. 관계형 데이터베이스 시스템 대표적인 관계형 데이터베이스 시스템 4가지를 조사하고 각각의 특징을 설명했습니다. MySQL Server는 오픈 소스이며 다양한 운영체제와 플랫폼을 지원하고 높은 성능과 안정성을 가지고 있습니다. PostgreSQL은 1986년 UC Berkeley에서 시작된 오픈 소스 프로젝트로, 지속적으로 업데이트되고 있습니다. H2 데이터베이스는 Java로 작성되어 Java 플랫폼에서 실행 가능하며 내장 모드와 서버 모드를 지원합니다. 오라클 데이터베이스는 RAC 기술을 통해 여러 서버를 하나의 클러스터로 구성...2025.01.19
-
[마케팅정보시스템] 마케팅 의사결정 지원 분석시스템2025.01.281. 통계뱅크 통계뱅크(statistical bank)란 자료에서 의미하는 정보를 추출하기 위한 통계적 절차가 모아진 것으로써 여기에는 평균, 분산치 그리고 자료의 비교표를 계산할 수 있는 일상적인 통계적 절차가 포함된다. 이와 더불어, 조사자들은 이들 자료에서 중요한 연관성을 발견하기 위하여 여러 가지 다변량 통계기법을 이용할 수 있는데 가장 중요한 다변량 기법들로는 다중회귀분석, 판별분석, 요인분석, 군집분석, 결합분석 등이 있다. 2. 모델뱅크 마케팅 관리자가 보다 합리적인 마케팅 결정을 하는데 도움이 되는 여러 모델을 모아 ...2025.01.28
-
평가 데이터를 활용하여 기존 모델을 업데이트하는 베이지안 추론 (파이썬코드 예제포함)2025.05.091. 베이지안 추론 베이지안 추론은 데이터를 통해 모델을 업데이트하고 불확실성을 다루는데 유용한 통계적 추론 방법입니다. 특히, 새로운 데이터가 주어진 상황에서 모델의 파라미터를 추정하고 예측하기 위해 사용됩니다. 베이지안 추론은 사전 분포와 관측 데이터를 조합하여 사후 분포를 계산하며, 이를 통해 모델의 불확실성을 업데이트할 수 있습니다. 2. 모델 업데이트 데이터에 대한 정보를 사전 분포에 반영하고, 관측 데이터와 사전 분포를 조합하여 사후 분포를 계산함으로써 신뢰할 수 있는 결과를 얻을 수 있습니다. 이를 통해 기존 모델을 새...2025.05.09
-
선형회귀(Linear Regression)는 통계인가 머신 러닝인가?2025.05.081. 선형회귀 선형 회귀는 연속 값을 예측하는 데 사용되는 통계 방법입니다. 선형 회귀 모델은 두 변수 간의 관계를 설명하는 선형 방정식을 찾는 통계적 방법입니다. 선형 회귀 모델은 통계, 공학, 마케팅, 금융, 제조를 포함한 다양한 분야에서 사용됩니다. 선형 회귀는 데이터를 설명하고 미래를 예측하는 데 사용할 수 있는 가장 널리 사용되는 방법입니다. 2. 통계와 머신러닝 머신러닝의 등장으로 선형회귀는 주로 '지도 학습' 문제에서 사용됩니다. 선형회귀는 입력 변수와 출력 변수 사이의 선형적인 관계를 모델링하여 새로운 입력에 대한 출...2025.05.08
-
30점 만점 방통대 데이터마이닝 2024-1학기2025.01.261. 데이터마이닝 방법론 데이터마이닝의 방법은 크게 모수적 모형 접근 방법과 알고리즘 접근 방법으로 나뉜다. 모수적 모형 접근법은 기존 데이터를 기반으로 모수를 추정하는 방법이며, 알고리즘 접근방법은 정해진 알고리즘에 따라 데이터를 학습하는 방법이다. 각각의 장단점이 있으며, 상황에 따라 적절한 방법을 선택해야 한다. 2. 모수적 모형 접근법 모수적 모형 접근법은 단순 선형 회귀분석, 로지스틱 회귀모형 등이 해당된다. 기본 모형 식이 존재하며, 모수를 추정하는 방식으로 결과가 복잡하지 않고 해석이 용이하다. 그러나 데이터가 가정한 ...2025.01.26
-
정보처리기사 실기 요약본 Part 12025.04.251. 소프트웨어 개발방법론 소프트웨어 생명주기 모델은 시스템의 요구분석부터 유지보수까지의 공정을 체계화한 절차입니다. 대표적인 모델로는 폭포수, 프로토타이핑, 나선형, 반복적 모델이 있습니다. 애자일 방법론은 개발 기간이 짧고 신속하며 즉시 피드백을 받아 유동적 개발이 가능한 특징이 있습니다. 2. 비용산정 모형 소프트웨어 규모 파악을 통해 투입자원과 소요시간을 파악하여 실행 가능한 계획을 수립하기 위해 비용을 산정하는 방식입니다. 대표적인 모형으로는 LoC, Man Month, COCOMO, 푸트남 모형 등이 있습니다. 3. 일정...2025.04.25
-
출석수업에서 다룬 데이터 분석 과정과 빅데이터 분석에 대한 이해2025.01.241. 데이터 분석 과정 출석수업에서는 R 프로그래밍 언어를 이용하여 'The Billion Prices Project'의 공개 데이터 'Our Public Data'를 분석했습니다. 데이터의 구성을 살펴보고, 국가별 가격 데이터 개수의 히스토그램을 그렸습니다. 또한 온라인과 오프라인 가격 차이를 비교하고, 국가 간 가격 차이의 표준편차를 구해 히스토그램으로 나타냈습니다. 2. 빅데이터 분석의 특징 빅데이터는 volume, variety, velocity, variability, veracity의 5가지 특징을 가집니다. 데이터의 규...2025.01.24