총 2,577개
-
시계열 데이터 분석 기법과 A/B 검증2025.01.261. 시계열 데이터 분석 기법 시계열 데이터 분석을 위한 대표적인 기법으로 이동 평균법, ARIMA 모델, 지수 평활법, 심층 신경망을 이용한 예측 등이 있다. 각 기법은 데이터의 특성에 따라 장단점이 다르며, 적절한 기법을 선택하여 활용하는 것이 중요하다. 이동 평균법은 단기 변동을 완화하고 장기 경향을 파악하는 데 유용하며, ARIMA 모델은 트렌드와 계절성을 고려한 예측에 적합하다. 지수 평활법은 최근 데이터에 가중치를 두어 변화에 민감하게 반응할 수 있고, 심층 신경망은 복잡한 패턴의 비선형 데이터 분석에 강점이 있다. 2....2025.01.26
-
시계열 데이터 분석 기법과 A/B 검증, 데이터 시각화를 활용한 기후위기 설득2025.01.261. 시계열 데이터 분석 기법 시계열 데이터에는 추세, 순환, 계절, 불규칙 변동요인이 존재한다. 이를 분석하기 위해 평활화(smoothing), 차분(differencing), 변수변환 등의 기법을 활용할 수 있다. 평활화는 주기가 짧은 변동요인을 제거하여 시계열의 기조적 흐름을 파악하고, 차분은 추세변동을 제거하며, 변수변환은 시계열을 선형화하는 데 도움이 된다. 각 기법의 장단점과 예시를 제시하였다. 2. A/B 검증 추천시스템의 성능 평가를 위해 A/B 검증이 활용된다. 전체 고객을 무작위로 A, B 그룹으로 나누고, A 그...2025.01.26
-
머신러닝 효과검증2025.05.101. 머신러닝 효과검증 머신러닝 과제의 실제 효과를 보여주기 위해 다음과 같은 방법들을 고려할 수 있습니다: 정량적인 성능 개선, 시간과 비용 절감, 예측 능력 개선, 인사이트 제공, 실제 시스템 통합. 이러한 방법들을 통해 머신러닝 과제의 실제 효과를 증명할 수 있습니다. 과제의 목적과 환경에 따라 적절한 방식으로 결과를 제시하는 것이 중요합니다. 2. 제조 수율영향성 분석 수율 영향성을 분석하는 머신러닝 과제를 위한 분석 툴을 제작하기 위해 다음과 같은 절차를 따를 수 있습니다: 데이터 수집, 데이터 전처리, 특성 선택 및 추출...2025.05.10
-
머신러닝에서의 과적합 문제2025.05.101. 과적합(Overfitting) 과적합은 머신러닝에서 중요한 문제 중 하나입니다. 머신러닝 모델이 훈련 데이터에 너무 특화되어 있어 새로운 입력 데이터에 대한 예측 능력이 저하되는 현상을 말합니다. 이는 모델의 성능과 일반화(generalization) 능력을 감소시키며, 실제 응용에서 신뢰할 수 없는 결과를 초래할 수 있습니다. 2. 과적합의 원인 과적합은 데이터의 특성을 완벽하게 기억하는 것에서 비롯됩니다. 모델은 훈련 데이터에 맞추기 위해 복잡한 패턴과 노이즈까지도 학습할 수 있습니다. 일반적으로 데이터의 양이 적은 경우,...2025.05.10
-
웹보안실습 강의자료(HTML Injection)2025.01.151. HTML Injection HTML Injection은 공격자가 악의적으로 주입한 데이터를 애플리케이션이 정상적으로 인식하여 실행하여 공격하는 것입니다. 공격방법이나 사용언어에 따라 SQL Injection, HTML Injection, OS Command Injection, LDAP (디렉토리 서비스) Injection 등의 종류가 있습니다. HTML Injection은 Code Injection의 하위 개념으로, 취약한 매개변수에 악의적인 HTML 코드를 삽입하는 공격입니다. 공격자는 사용자가 연결을 요청한 페이지에 HTM...2025.01.15
-
실험 기구의 검정 보고서2025.11.151. 부피 측정 기구 실험에서 부피를 측정하기 위해 사용되는 기구들에 대한 설명입니다. 부피 측정은 실험에서 가장 중요한 작업 중 하나이며, 정확한 측정을 위해서는 적절한 도구와 방법이 필요합니다. 부피와 관련된 시경 기구들은 다양한 용도로 사용되며, 각 기구마다 특정한 사용 방법과 주의사항이 있습니다. 2. 눈금 격정 및 검정 기구의 눈금을 정확하게 격정하는 과정에 대한 내용입니다. 일반적으로 눈금은 정확하게 격정되어야 하며, 눈금이 손상되거나 낡은 경우에는 교체가 필요합니다. 눈금 격정 시에는 표면의 상태를 확인하고, 정확한 측...2025.11.15
-
생산 공정에서의 불량 모델링2025.05.121. 이항분포 이항분포는 독립적인 베르누이 시도의 결과를 모델링하는데 사용되며, 시도 횟수와 성공 확률을 고려합니다. 예를 들어, 압력을 증가시킬 때 불량이 발생하는 확률이 일정한 값으로 유지된다고 가정하면, 이러한 상황을 이항분포를 이용하여 모델링할 수 있습니다. 2. 포아송분포 포아송분포는 일정한 단위 시간 또는 공간에서의 사건 발생 횟수를 모델링하는데 사용됩니다. 압력이 증가함에 따라 불량이 발생하는 횟수가 드물게 변하는 상황에서는 포아송분포를 활용하여 불량율을 근사할 수 있습니다. 포아송분포는 독립적인 사건 발생을 가정하고,...2025.05.12
-
Regression with an Abalone Dataset 코드2025.01.271. 데이터 로딩 및 전처리 train.csv와 test.csv 파일을 pandas 라이브러리를 사용하여 로드했습니다. LabelEncoder를 사용하여 범주형 변수(sex)를 숫자 값으로 인코딩했습니다. 새로운 특성인 size(length x diameter x height)를 만들기 위해 특성 엔지니어링을 수행했습니다. 높이 값이 0인 행을 제거하여 데이터를 정리했습니다. 2. 데이터 변환 대부분의 특성에 대해 np.log1p 함수를 적용하여 로그 변환을 수행했습니다. 이 변환은 데이터 분포를 정규 분포에 가깝게 만들어 모델 성...2025.01.27
-
소프트웨어 개발 보안 취약점 유형 분석2025.11.181. 소프트웨어 개발 보안 취약점의 7가지 유형 행정안전부에서 제시하는 소프트웨어 개발 보안 취약점은 총 7개 영역 49개 항목으로 구성됩니다. 입력데이터 검증 및 표현, 보안기능, 시간 및 상태, 에러처리, 코드오류, 캡슐화, API 오용이 주요 취약점 유형입니다. 각 유형별로 XSS, SQL삽입, 버퍼 오버플로우, 부적절한 인가, 하드코드된 패스워드, 취약한 암호화 알고리즘 등 구체적인 보안 이슈가 발생할 수 있습니다. 2. 입력데이터 검증 및 표현 소프트웨어 개발자가 프로그램 입력값에 대한 검증을 누락하거나 부적절하게 검증할 ...2025.11.18
-
회귀모형의 진단과 수정2025.11.171. 회귀진단(Regression Diagnostics) 회귀진단은 현재 설정된 회귀모형의 타당성을 검토하는 과정입니다. 회귀모형이 반응변수와 설명변수들의 관계를 제대로 반영하는지 확인하고, 모형에 포함된 설명변수들이 중요한지 또는 불필요한 변수들이 있는지를 평가합니다. 이를 통해 모형의 적절성과 신뢰성을 판단할 수 있습니다. 2. 오차항의 가정 검증 회귀모형의 유효성을 위해 오차항이 만족해야 할 세 가지 주요 가정이 있습니다. 등분산성은 오차의 분산이 일정한지 확인하고, 정규성은 오차가 정규분포를 따르는지 검토하며, 독립성은 오차...2025.11.17
