총 31개
-
머신러닝에서의 차원축소2025.05.101. 차원 축소 차원 축소는 고차원 데이터를 저차원으로 변환하는 과정으로, 데이터의 복잡성을 줄이고 특징을 추출하거나 시각화하기 위해 사용됩니다. 주요 방법으로는 특징 선택과 특징 추출이 있으며, 차원 축소의 이점은 데이터 시각화, 계산 효율성 향상, 잡음 제거 등입니다. 2. 차원의 개념 차원은 데이터를 표현하기 위해 필요한 축의 수를 의미하며, 각 차원은 데이터의 특정 특성을 나타내는 변수 또는 속성이 됩니다. 차원이 높을수록 데이터의 복잡성과 계산 비용이 증가하므로 차원 축소가 필요합니다. 3. 특징(feature)의 개념 특...2025.05.10
-
다중 선형 회귀 (Multiple Linear Regression, MLR)2025.05.091. 다중 선형 회귀 (Multiple Linear Regression, MLR) 다중 선형 회귀(Multiple Linear Regression, MLR)는 하나의 종속 변수를 다수의 독립 변수와의 선형 관계로 설명하는 모델입니다. 단순 선형 회귀가 하나의 독립 변수와 하나의 종속 변수 간의 선형 관계를 모델링하는 것과 달리, MLR은 여러 개의 독립 변수가 종속 변수와의 선형 관계에 영향을 미칠 수 있는 경우를 다룹니다. 예를 들어, 주택 가격을 예측하기 위해 주택의 크기, 방의 개수, 위치, 건물 연식 등 여러 독립 변수들을 ...2025.05.09
-
PCA & SVD2025.01.131. PCA (주성분 분석) PCA는 데이터의 분산(variance)을 최대한 보존하면서 서로 직교하는 새 기저(축)를 찾아, 고 차원 공간의 표본들을 선형 연관성이 없는 저차원 공간으로 변환하는 기법입니다. 데이터의 분산을 최대로하는 새로운 기저를 찾기 위해서는 데이터 행렬 A의 공분산 행렬을 구해야 합니다. 공분산 행렬의 고유분해(Eigendecomposition)를 통해 가장 큰 고유값 몇 개를 고르고, 그에 해당하는 고유벡터를 새로운 기저로 하여 데이터 벡터들을 정사영시키면 PCA 작업이 완료됩니다. 2. SVD (특이값 분...2025.01.13
-
한국방송통신대학교 통계데이터과학과 다변량분석 2022년 출석과제(만점)2025.01.251. 주성분 분석 데이터의 요약 통계량을 확인하고 Boxplot으로 데이터의 분포를 확인하였다. 상관계수행렬과 산점도 행렬을 보고 변수들 간의 상관관계를 분석하였다. 주성분 분석을 실시하여 제 1주성분과 제 2주성분이 전체 정보의 86.4%를 설명하는 것을 확인하였다. 주성분 계수를 통해 각 변수들의 주성분에 대한 기여도를 파악하였다. 2. 인자분석 Bartlett의 구형성 검정과 KMO 검정을 통해 인자분석의 적합성을 확인하였다. 주성분 인자법을 이용한 인자분석 결과, 2개의 유의한 인자가 도출되었다. 직교회전 방식인 varima...2025.01.25
-
지식부족 간호진단2025.05.011. PCA 사용법 대상자는 IV PCA사용법에 대해 2가지 이상 말할 수 있다. PCA 버튼을 누르지 않아도 일정한 속도로 진통제가 주입되며, 환자가 통증을 느낄 때 버튼을 누르면 다량의 진통제가 주입되 일시적으로 통증을 조절할 수 있습니다. 버튼은 15분에 한번 씩 누를 수 있고 그것보다 일찍 누르면 약제가 주입되지는 않는다고 말했다. 2. 자궁근종 관리 대상자는 3 일이내 자궁근종의 악화 요인에 대해 말할 수 있다. 대상자는 퇴원 전까지 HIFU후 자궁근종의 관리방법에 대해 3가지 이상 말할 수 있다. HIFU후 자궁근종의 관...2025.05.01
-
30점 만점 방통대 다변량분석 2024-1학기2025.01.261. t-분포 난수 생성 및 분석 R과 파이썬을 이용하여 자유도가 5인 t-분포를 따르는 난수 100개를 생성하고 히스토그램, 상자그림, 줄기-잎 그림을 그려 분석하였다. 난수 생성 시 학번 뒤 4자리로 seed를 설정하였으며, R에서는 rt() 함수, 파이썬에서는 np.random.standard_t() 함수를 사용하였다. 히스토그램 결과 -4부터 4 이상 범위에 분포하며 오른쪽 꼬리가 긴 모양이었고, 상자그림 결과 중앙값이 0에 가깝고 제1사분위수와 제3사분위수가 각각 -2보다 크고 2보다 작았다. 줄기-잎 그림 결과 -1과 1...2025.01.26
-
2024년 1학기 방송통신대 출석수업대체과제물 다변량분석) R과 파이썬을 각각 이용하여 작성하시오. 교재 연습문제 1장 3번, 4번 2장 3번 4장 3번 (1)-(3)2025.01.251. t-분포 난수 생성 및 분석 자유도가 5인 t-분포를 따르는 난수 100개를 R과 파이썬을 이용하여 생성하고, 히스토그램, 상자그림, 줄기-잎 그림을 그려 t-분포의 특성을 분석하였다. 히스토그램에서는 0을 중심으로 대칭의 모습을 보이지만 완전한 대칭은 아니며, 상자그림에서는 평균값이 0보다 약간 작은 것으로 나타났다. 줄기-잎 그림에서도 0점대를 중심으로 대칭의 구조를 보이고 있으나 일부 이상치가 확인되었다. 2. Longley 데이터 분석 R에 내장된 Longley 데이터를 이용하여 산점도행렬, 별그림, 얼굴그림을 그려 변...2025.01.25
-
데이터 사이언티스트 인터뷰 준비2025.01.201. 데이터 전처리 데이터셋에 존재할 수 있는 결측값과 이상치를 처리하는 것이 중요하다. 결측값은 평균, 중앙값 등으로 대체하거나 제거할 수 있으며, 이상치는 상자 그림이나 Z-점수를 사용해 식별하고 제거하거나 대체할 수 있다. 또한 데이터의 스케일을 맞추기 위해 정규화 작업이 필요하다. 2. 머신러닝 모델 과적합 방지 과적합을 방지하기 위해 교차 검증, 정규화 기법(L1, L2), 조기 종료 등의 방법을 사용할 수 있다. 교차 검증을 통해 데이터를 최대한 활용하고 모델의 일반화 성능을 평가할 수 있으며, 정규화 기법은 모델의 복잡...2025.01.20
-
[화학공학실험] 유체역학 실험2025.05.101. 베르누이 식 (Bernoulli's equation) 베르누이 식은 점성과 압축성이 없는 이상적인 유체가 규칙적으로 흐르는 경우에 대해, 유체의 속도, 압력, 위치에너지 사이의 관계를 나타낸 공식이다. 베르누이 식은 흐르는 유체에 대하여 유선(streamline) 상에서 모든 형태의 에너지의 합은 언제나 일정하다는 점을 설명하고 있다. 2. 레이놀즈 수 (Reynolds number) 레이놀즈 수는 유체역학에서 사용하는 무차원량으로, 관성에 의한 힘과 점성에 의한 힘의 비이다. 주어진 유동 조건에서 두 종류의 힘의 상대적인 세...2025.05.10
-
작업장에서의 스트레스 요인과 해소 방안2025.05.131. 작업장 스트레스 요인 작업장에서의 스트레스는 조직 내부와 외부 요인으로 구분할 수 있다. 조직 내부 요인은 개인적, 직무적, 조직적 차원으로 나눌 수 있다. 개인적 차원에서는 일과 개인생활의 양립, 개인적 성향과 직무의 불일치 등이 스트레스 요인이 될 수 있다. 직무적 차원에서는 의사결정 부담, 기술 습득 요구, 열악한 작업환경, 과도한 업무량 등이 스트레스를 유발한다. 조직적 차원에서는 상하 간 갈등, 사회적 지원 부족, 열악한 근무환경 등이 스트레스 요인이 될 수 있다. 2. 스트레스의 결과 스트레스는 건강과 업무 성과에 ...2025.05.13
