총 1,038개
-
머신러닝 효과검증2025.05.101. 머신러닝 효과검증 머신러닝 과제의 실제 효과를 보여주기 위해 다음과 같은 방법들을 고려할 수 있습니다: 정량적인 성능 개선, 시간과 비용 절감, 예측 능력 개선, 인사이트 제공, 실제 시스템 통합. 이러한 방법들을 통해 머신러닝 과제의 실제 효과를 증명할 수 있습니다. 과제의 목적과 환경에 따라 적절한 방식으로 결과를 제시하는 것이 중요합니다. 2. 제조 수율영향성 분석 수율 영향성을 분석하는 머신러닝 과제를 위한 분석 툴을 제작하기 위해 다음과 같은 절차를 따를 수 있습니다: 데이터 수집, 데이터 전처리, 특성 선택 및 추출...2025.05.10
-
머신 러닝 학습을 위한 데이터 증량하기2025.05.081. 데이터 증강 데이터 증강(Data Augmentation)은 현대 머신러닝과 딥러닝 분야에서 핵심 개념이 되었습니다. 데이터의 양과 질은 모델의 성능과 일반화 능력에 큰 영향을 미치지만, 현실적인 제약으로 인해 충분한 양의 고품질 데이터를 수집하기 어려운 문제를 해결하기 위해 데이터 증강이 등장하였습니다. 데이터 증강은 기존의 데이터를 변형하여 새로운 데이터를 생성하는 과정으로, 모델의 학습과 예측 능력을 향상시킬 수 있습니다. 2. 데이터 증강 기법 다양한 데이터 증강 기법이 개발되어 있으며, 이를 통해 다양한 유형의 데이터...2025.05.08
-
서포트 벡터 머신(Support Vector Machine, SVM)2025.05.101. 서포트 벡터 머신(Support Vector Machine, SVM) 서포트 벡터 머신(Support Vector Machine, SVM)의 이름은 알고리즘의 기본 원리와 핵심 개념에 기반하여 지어졌습니다. 데이터 포인트들을 분류하기 위해 사용되는 초평면(hyperplane)의 위치는 이 서포트 벡터들에 의해 결정됩니다. 서포트 벡터는 결정 경계와 가장 가까운 데이터 포인트들을 의미합니다. 이러한 포인트들은 결정 경계 주변에서 서로 다른 클래스에 속하는 데이터들을 분리하는 역할을 수행합니다. SVM은 주어진 데이터를 기반으로 ...2025.05.10
-
머신러닝에서의 과적합 문제2025.05.101. 과적합(Overfitting) 과적합은 머신러닝에서 중요한 문제 중 하나입니다. 머신러닝 모델이 훈련 데이터에 너무 특화되어 있어 새로운 입력 데이터에 대한 예측 능력이 저하되는 현상을 말합니다. 이는 모델의 성능과 일반화(generalization) 능력을 감소시키며, 실제 응용에서 신뢰할 수 없는 결과를 초래할 수 있습니다. 2. 과적합의 원인 과적합은 데이터의 특성을 완벽하게 기억하는 것에서 비롯됩니다. 모델은 훈련 데이터에 맞추기 위해 복잡한 패턴과 노이즈까지도 학습할 수 있습니다. 일반적으로 데이터의 양이 적은 경우,...2025.05.10
-
Regression with an Abalone Dataset 코드2025.01.271. 데이터 로딩 및 전처리 train.csv와 test.csv 파일을 pandas 라이브러리를 사용하여 로드했습니다. LabelEncoder를 사용하여 범주형 변수(sex)를 숫자 값으로 인코딩했습니다. 새로운 특성인 size(length x diameter x height)를 만들기 위해 특성 엔지니어링을 수행했습니다. 높이 값이 0인 행을 제거하여 데이터를 정리했습니다. 2. 데이터 변환 대부분의 특성에 대해 np.log1p 함수를 적용하여 로그 변환을 수행했습니다. 이 변환은 데이터 분포를 정규 분포에 가깝게 만들어 모델 성...2025.01.27
-
핸드폰 개발을 위한 설문지 작성2025.01.281. 핸드폰 구매 결정 요인 소비자가 핸드폰을 구매할 때 가장 중요하게 고려하는 요인은 가격, 디자인, 성능(카메라, 배터리 등), 브랜드 신뢰도 등이다. 이를 통해 소비자의 구매 동기와 선호도를 파악할 수 있다. 2. 현재 사용 중인 핸드폰 브랜드 만족도 소비자가 현재 사용 중인 핸드폰 브랜드에 대한 만족도를 평가하는 문항을 통해 브랜드 충성도와 불만 사항을 분석할 수 있다. 3. 핸드폰 기능 사용 패턴 소비자가 가장 자주 사용하는 핸드폰 기능(통화, 메시지, 소셜 미디어, 사진/영상 촬영, 게임 등)을 파악하여 특정 기능에 대한...2025.01.28
-
[보고서]딥러닝 모델링 성능 향상 기법2025.01.241. 손실함수 신경망의 성능을 개선하기 위한 방법 중 하나로 손실함수에 대해 다루었습니다. 연속형 모델의 경우 평균 제곱 오차법(MSE)을, 이산형 모델의 경우 이진 교차 엔트로피(BCE) 손실을 사용하는 것이 적합하다고 설명하고 있습니다. Pytorch에서는 nn.MSELoss()와 nn.BCELoss()를 사용할 수 있습니다. 2. 활성화 함수 신경망 훈련 시 기울기 소실 문제를 해결하기 위해 다양한 활성화 함수에 대해 설명하고 있습니다. 전통적인 시그모이드 함수의 문제점을 지적하고, ReLU와 Leaky ReLU 함수를 소개하...2025.01.24
-
소방 자재사용신고서 검토(내열 절연전선, 신호용 케이블 추가 및 가요전선관)2025.01.131. 내열 절연전선 「김포 아랑 아파트 건설공사 1공구」현장의 소방설비공사에 사용될 내열 절연전선에 대한 품질 보증 및 성능 검토를 수행하였습니다. 내열 절연전선은 KS C 3341, KS C IEC 60502-1, HH01011-4048F, UL 14247 인증을 받은 제품으로 확인되었으며, 시공 시 피복 손상 방지를 위한 보호 조치가 필요한 것으로 나타났습니다. 2. 신호용 케이블 「김포 아랑 아파트 건설공사 1공구」현장의 소방설비공사에 사용될 신호용 케이블에 대한 품질 보증 및 성능 검토를 수행하였습니다. 신호용 케이블은 AW...2025.01.13
-
기계공학과 임펠러의 크기가 미치는 영향 졸업논문2025.05.151. 원심펌프 성능 향상 원심펌프는 다양한 산업분야에서 효용성이 크며 그 효율을 향상시키기 위한 노력이 이어져 왔습니다. 원심펌프 성능에 영향을 미치는 요인 중 하나가 임펠러의 직경 크기입니다. 같은 케이싱 조건에서 임펠러 직경을 감소시키면 펌프 성능(유량)이 저하되지만, 펌프 용량 및 용도 변경이 필요한 경우 임펠러 직경 변화를 통해 원심펌프 성능 향상을 기대할 수 있습니다. 2. 임펠러 크기 변화에 따른 원심펌프 성능 분석 동일한 형상의 케이싱에서 임펠러 직경을 258mm, 254mm, 250mm로 변화시켜 모델링하고 해석을 수...2025.05.15
-
데이터 사이언티스트 인터뷰 준비2025.01.201. 데이터 전처리 데이터셋에 존재할 수 있는 결측값과 이상치를 처리하는 것이 중요하다. 결측값은 평균, 중앙값 등으로 대체하거나 제거할 수 있으며, 이상치는 상자 그림이나 Z-점수를 사용해 식별하고 제거하거나 대체할 수 있다. 또한 데이터의 스케일을 맞추기 위해 정규화 작업이 필요하다. 2. 머신러닝 모델 과적합 방지 과적합을 방지하기 위해 교차 검증, 정규화 기법(L1, L2), 조기 종료 등의 방법을 사용할 수 있다. 교차 검증을 통해 데이터를 최대한 활용하고 모델의 일반화 성능을 평가할 수 있으며, 정규화 기법은 모델의 복잡...2025.01.20
