총 321개
-
Autoencoder 기반 추천 시스템 조사2025.05.071. Autoencoder 기반 추천 시스템 Autoencoder는 여러 규제 기법을 적용하여 다양한 application에 적용되고 있으며, 특히 추천 시스템인 collaborative filtering의 성능을 높이는 데 주로 사용된다. 기존 추천 시스템의 한계를 개선하는 방법으로 Autoencoder 기반 추천 시스템이 제시되었다. 본 논문에서는 Autoencoder 기반 추천 시스템에 대한 체계적인 검토를 실시하고 분류 체계를 제안하였다. 2. Autoencoder만을 기반으로 하는 모델 Autoencoder 기반 colla...2025.05.07
-
데이터 사이언티스트 인터뷰 준비2025.01.201. 데이터 전처리 데이터셋에 존재할 수 있는 결측값과 이상치를 처리하는 것이 중요하다. 결측값은 평균, 중앙값 등으로 대체하거나 제거할 수 있으며, 이상치는 상자 그림이나 Z-점수를 사용해 식별하고 제거하거나 대체할 수 있다. 또한 데이터의 스케일을 맞추기 위해 정규화 작업이 필요하다. 2. 머신러닝 모델 과적합 방지 과적합을 방지하기 위해 교차 검증, 정규화 기법(L1, L2), 조기 종료 등의 방법을 사용할 수 있다. 교차 검증을 통해 데이터를 최대한 활용하고 모델의 일반화 성능을 평가할 수 있으며, 정규화 기법은 모델의 복잡...2025.01.20
-
Regression with an Abalone Dataset 코드2025.01.271. 데이터 로딩 및 전처리 train.csv와 test.csv 파일을 pandas 라이브러리를 사용하여 로드했습니다. LabelEncoder를 사용하여 범주형 변수(sex)를 숫자 값으로 인코딩했습니다. 새로운 특성인 size(length x diameter x height)를 만들기 위해 특성 엔지니어링을 수행했습니다. 높이 값이 0인 행을 제거하여 데이터를 정리했습니다. 2. 데이터 변환 대부분의 특성에 대해 np.log1p 함수를 적용하여 로그 변환을 수행했습니다. 이 변환은 데이터 분포를 정규 분포에 가깝게 만들어 모델 성...2025.01.27
-
머신러닝 효과검증2025.05.101. 머신러닝 효과검증 머신러닝 과제의 실제 효과를 보여주기 위해 다음과 같은 방법들을 고려할 수 있습니다: 정량적인 성능 개선, 시간과 비용 절감, 예측 능력 개선, 인사이트 제공, 실제 시스템 통합. 이러한 방법들을 통해 머신러닝 과제의 실제 효과를 증명할 수 있습니다. 과제의 목적과 환경에 따라 적절한 방식으로 결과를 제시하는 것이 중요합니다. 2. 제조 수율영향성 분석 수율 영향성을 분석하는 머신러닝 과제를 위한 분석 툴을 제작하기 위해 다음과 같은 절차를 따를 수 있습니다: 데이터 수집, 데이터 전처리, 특성 선택 및 추출...2025.05.10
-
막분리 공정 실험 예비보고서2025.05.011. 막분리 공정 실험을 통해 역삼투막을 이용한 무기물(NaCl) 분리 공정을 이해하고, 막분리 공정의 원리와 특성을 학습하였다. 막분리 공정은 압력차, 농도차, 온도차를 구동력으로 하여 막을 이용해 물질을 분리, 정제, 농축하는 단위 조작이다. 역삼투 공정은 막분리 공정의 일종으로, 역삼투 현상을 이용해 상온에서 용매를 분리하는 공정이다. 역삼투막은 공경이 약 10Å 내외이고 세공이 거의 없는 비다공성막으로, 유기고분자 micelle 사이의 간격을 통해 물질 투과가 이루어진다. 2. 막 성능 평가 역삼투 공정에서 막 성능은 배제도...2025.05.01
-
텐서플로우 딥러닝 (CNN)2025.05.051. 데이터 세트 학습 데이터에 사용할 영상은 Google에서 이미지 검색으로 꽃을 검색하고, FatKun이라는 크롬 확장 프로그램을 사용하여 영상을 다운로드 받았다. 테스트 데이터에 사용할 영상은 꽃을 직접 구입하여 촬영한 영상 데이터를 사용했다. 학습 데이터는 총 234개, 테스트 데이터는 총 150개이며, 검증 데이터는 훈련데이터의 20%를 사용하여 총 57개이다. 2. 합성곱 신경망 (CNN) 기본적으로 이미지 분류를 하기 위해서는 합성 곱 신경망(CNN)이 필요하다. 2차원 CNN의 특징 추출 부분은 MaxPool2D층과 ...2025.05.05
-
효율적인 텍스트 분류를 위한 fastText 모델2025.01.261. 텍스트 분류 이 논문은 웹 검색, 정보 검색, 감정 분석과 같은 애플리케이션에서 자연어 처리의 필수 작업인 텍스트 분류 문제를 다룹니다. 저자들은 신경망 기반 모델은 정확하지만 훈련과 테스트 단계 모두에서 계산 비용이 많이 들고 느린 경향이 있기 때문에, 대규모 데이터 세트를 처리할 수 있는 확장 가능하고 효율적인 모델이 필요하다고 지적합니다. 이 논문에 적용된 모델인 fastText는 높은 정확도를 유지하면서 텍스트 분류의 계산 비효율성 문제를 해결하도록 설계되었습니다. 2. 데이터 세트 이 논문에서는 텍스트 분류 작업에 잘...2025.01.26
-
머신러닝 2024년 2학기 방송통신대 출석수업과제물 과제 슬라이드 1~7의 코드 및 설명을 참조하여 신경망 구성 및 test accuracy 출력2025.01.261. Fashion MNIST 데이터셋 Fashion MNIST 데이터셋은 옷 이미지 데이터셋으로, 10개의 클래스(T-shirt/top, Trouser, Pullover, Dress, Coat, Sandal, Shirt, Sneaker, Bag, Ankle boot)로 구성되어 있습니다. 이 데이터셋을 사용하여 신경망 모델을 구축하고 학습을 진행합니다. 2. 데이터 전처리 데이터 시각화를 통해 이미지 데이터를 확인하고, 픽셀 값을 0~1 사이의 실수로 정규화하여 모델 학습에 사용합니다. 이미지 데이터를 1차원 벡터로 변환하는 과정...2025.01.26
-
평가 데이터를 활용하여 기존 모델을 업데이트하는 베이지안 추론 (파이썬코드 예제포함)2025.05.091. 베이지안 추론 베이지안 추론은 데이터를 통해 모델을 업데이트하고 불확실성을 다루는데 유용한 통계적 추론 방법입니다. 특히, 새로운 데이터가 주어진 상황에서 모델의 파라미터를 추정하고 예측하기 위해 사용됩니다. 베이지안 추론은 사전 분포와 관측 데이터를 조합하여 사후 분포를 계산하며, 이를 통해 모델의 불확실성을 업데이트할 수 있습니다. 2. 모델 업데이트 데이터에 대한 정보를 사전 분포에 반영하고, 관측 데이터와 사전 분포를 조합하여 사후 분포를 계산함으로써 신뢰할 수 있는 결과를 얻을 수 있습니다. 이를 통해 기존 모델을 새...2025.05.09
-
텐서플로우 딥러닝 (Tic-Tac-Toe)2025.05.051. 데이터 세트 tic-tac-toe.csv 파일에는 TL, TM, TR, ML, MM, MR, BL, BM, BR 속성과 class 속성이 포함되어 있습니다. TL, TM, TR, ML, MM, MR, BL, BM, BR 속성은 각 게임 보드의 위치를 나타내며, 값은 'x', 'o', 'b'로 표현됩니다. class 속성은 게임 결과를 나타내며, 'TRUE'는 x가 이겼음을, 'FALSE'는 x가 졌음을 의미합니다. 2. 2층 신경망 입력 층은 9D(TL, TM, TR, ML, MM, MR, BL, BM, BR)를 받습니다. 은...2025.05.05
