총 32개
-
선형회귀(Linear Regression)는 통계인가 머신 러닝인가?2025.05.081. 선형회귀 선형 회귀는 연속 값을 예측하는 데 사용되는 통계 방법입니다. 선형 회귀 모델은 두 변수 간의 관계를 설명하는 선형 방정식을 찾는 통계적 방법입니다. 선형 회귀 모델은 통계, 공학, 마케팅, 금융, 제조를 포함한 다양한 분야에서 사용됩니다. 선형 회귀는 데이터를 설명하고 미래를 예측하는 데 사용할 수 있는 가장 널리 사용되는 방법입니다. 2. 통계와 머신러닝 머신러닝의 등장으로 선형회귀는 주로 '지도 학습' 문제에서 사용됩니다. 선형회귀는 입력 변수와 출력 변수 사이의 선형적인 관계를 모델링하여 새로운 입력에 대한 출...2025.05.08
-
[데이터과학개론] 1. 정형 데이터는 크게 범주형 데이터와 수치형 데이터로 나뉜다.2025.01.261. 범주형 데이터와 수치형 데이터의 비교 범주형 데이터는 말 그대로 범주, 즉 고정된 여러 개의 분류에 해당하는 데이터를 말한다. 이러한 데이터는 수량화가 어려운 데이터로, 특정 대상이 어느 범주에 속하는지를 나타내는 값들로 구성된다. 예를 들어 성별, 국가명, 색상 등이 이에 해당한다. 범주형 데이터는 주로 명목척도나 서열척도와 같은 비수치적 정보를 제공한다. 반면에, 수치형 데이터는 수량적 정보를 나타내며, 실제 값으로 표현되는 데이터를 의미한다. 수치형 데이터는 이산적 데이터와 연속적 데이터로 나뉘며, 이는 수량화가 가능하고...2025.01.26
-
회귀분석을 통한 주택 가격 예측2025.01.161. 회귀분석의 개념 회귀분석은 독립 변수와 종속 변수 간의 관계를 수학적으로 표현하는 방법입니다. 단순 회귀분석은 하나의 독립 변수와 하나의 종속 변수 간의 관계를 분석하고, 다중 회귀분석은 여러 개의 독립 변수를 사용하여 종속 변수를 예측합니다. 회귀분석은 경제학, 의학, 사회과학 등 다양한 분야에서 활용되며, R제곱 값과 잔차 분석을 통해 모델의 성능을 평가할 수 있습니다. 2. 회귀분석의 중요성 회귀분석은 다양한 분야에서 중요한 역할을 합니다. 경제학에서는 소비자 행동 예측과 시장 트렌드 분석에 사용되며, 의학에서는 환자 회...2025.01.16
-
마케팅조사 ) 엑셀을 사용하여 각 질문(변수)들의 기술통계 분석을 실시하고 결과를 간단히 설명하시오. 질문 1, 2를 독립변수, 질문 3을 종속변수로 한 회귀분석을 하고 결과를 해석하시오.2025.01.241. 기술통계 분석 각 질문(변수)들의 평균, 표준편차, 분산, 첨도, 왜도 등 기술통계 분석을 실시하였다. 질문1과 질문2의 평균 응답은 4 근처에 있지만, 질문3의 평균은 4.5에 가깝다. 이는 참가자들이 질문3에 더 높은 평가를 했음을 보여준다. 질문2의 첨도가 가장 크게 음수 값을 가지며, 이는 그 분포가 정규분포보다 평탄하다는 것을 의미한다. 질문2의 응답 분포가 가장 넓게 퍼져 있고, 질문3의 응답은 가장 집중적이다. 2. 성별에 따른 차이 분석 성별에 따라 각 질문에 대한 평균 응답 점수에 차이가 있었다. 성별2 응답자...2025.01.24
-
마케팅조사 데이터 분석2025.01.071. 기술통계 분석 각 질문(변수)들의 기술통계 분석 결과를 살펴보면, 세 질문 모두 중간 값 근처나 그보다 조금 더 높은 값을 향해 치우쳐진 경향을 보입니다. 왜도의 값에 따라, 모든 질문들의 응답은 평균보다 높은 값으로 약간 치우쳐져 있음을 알 수 있습니다. 특히, 질문3의 응답은 가장 높은 평균 값을 갖지만, 분포는 가장 좁게 퍼져 있습니다. 2. 성별에 따른 차이 분석 성별에 따른 각 질문의 평균 차이를 분석한 결과, 성별이 1일 때(남성)와 성별이 2일 때(여성)의 평균값이 상당한 차이를 보입니다. 남성의 경우 각 질문의 ...2025.01.07
-
비즈니스 분석을 위한 통계 원리2025.05.061. 기술 및 추론 통계 기술 통계는 데이터를 설명하고 요약하는 데 사용되는 반면 추론 통계는 데이터를 기반으로 추론 및 예측을 수행하는 데 사용됩니다. 기술 통계에는 평균, 중앙값, 모드, 분산 및 표준 편차와 같은 측정이 포함되며 추론 통계에는 가설 테스트, 회귀 분석 및 분산 분석(ANOVA)과 같은 기술이 포함됩니다. 2. 샘플링 및 데이터 수집 샘플링은 연구에서 전체 모집단을 나타내기 위해 모집단의 하위 집합을 선택하는 프로세스입니다. 데이터 수집은 설문 조사, 실험 또는 관찰 연구와 같은 다양한 소스에서 데이터를 수집하는...2025.05.06
-
상관과 회귀 분석2025.11.131. 상관분석 상관분석은 두 변수 간의 선형 관계의 강도와 방향을 측정하는 통계적 방법입니다. 피어슨 상관계수를 통해 -1에서 1 사이의 값으로 표현되며, 양의 상관은 한 변수가 증가할 때 다른 변수도 증가하는 관계를, 음의 상관은 한 변수가 증가할 때 다른 변수는 감소하는 관계를 나타냅니다. 상관계수의 절댓값이 클수록 두 변수 간의 관계가 강합니다. 2. 회귀분석 회귀분석은 독립변수와 종속변수 간의 함수적 관계를 파악하고 예측하는 통계적 기법입니다. 선형회귀는 가장 기본적인 형태로, 최소제곱법을 이용하여 데이터에 가장 잘 맞는 직...2025.11.13
-
계량경제 - 회귀분석2025.05.051. 회귀분석 이 발표에서는 지구 평균 기온을 종속변수로 하고 연료 사용량, 플라스틱 사용량, 비료 사용량, 쌀 재배량 등을 독립변수로 하는 세미로그 회귀모형을 사용하여 지구온난화의 원인을 분석하였습니다. 발표자는 이러한 변수들이 지구온난화에 영향을 준다는 것을 확인하였으며, 우리 주변에 알려지지 않은 다양한 지구온난화 원인이 존재한다는 점을 강조하였습니다. 또한 강력한 법과 제도만으로는 지구온난화 문제를 해결하기 어려우며, 개인의 인식 변화와 작은 실천이 중요하다고 주장하였습니다. 2. 지구온난화 이 발표에서는 지구온난화의 주요 ...2025.05.05
-
세종대학교 소프트웨어 특강 과제12025.05.101. Linear Regression 주어진 데이터에 대해 가장 잘 맞는 선형 회귀 모델을 찾았습니다. Gradient Descent 알고리즘을 사용하여 모델의 최적 매개변수를 구했으며, 이를 통해 입력 x=15에 대한 y 값을 예측할 수 있었습니다. 또한 회귀선을 데이터 포인트와 함께 시각화하였습니다. 2. Logistic Regression 두 개의 입력 변수(Petal_Length, Petal_Width)를 사용하여 Iris versicolor와 Iris virginica 두 클래스를 구분하는 로지스틱 회귀 모델을 구현하였습니...2025.05.10
-
네 가지 변수 (네 가지 측정의 수준) 만들기2025.05.121. 변수의 종류 연구를 시행하기 위해서는 변수가 필요하며, 연구의 목적에 따라 다른 변수를 구성하는 것이 연구자의 역할이다. 변수의 종류에는 질문 분류 변수, 서열 변수, 등간 변수, 명목 변수, 비율 변수 등이 있다. 2. 질문 분류 변수 노인복지에 대한 찬반 의견을 묻는 질문은 질문 분류 변수의 예시이다. 응답자는 매우 긍정적, 긍정적, 보통, 부정적, 매우 부정적 중 하나를 선택한다. 3. 서열 변수 나이에 대한 질문은 서열 변수의 예시이다. 응답자는 10대, 20대, 30대, 40대, 50대 이상 중 하나를 선택한다. 4....2025.05.12
