총 140개
-
데이터 사이언티스트 인터뷰 준비2025.01.201. 데이터 전처리 데이터셋에 존재할 수 있는 결측값과 이상치를 처리하는 것이 중요하다. 결측값은 평균, 중앙값 등으로 대체하거나 제거할 수 있으며, 이상치는 상자 그림이나 Z-점수를 사용해 식별하고 제거하거나 대체할 수 있다. 또한 데이터의 스케일을 맞추기 위해 정규화 작업이 필요하다. 2. 머신러닝 모델 과적합 방지 과적합을 방지하기 위해 교차 검증, 정규화 기법(L1, L2), 조기 종료 등의 방법을 사용할 수 있다. 교차 검증을 통해 데이터를 최대한 활용하고 모델의 일반화 성능을 평가할 수 있으며, 정규화 기법은 모델의 복잡...2025.01.20
-
방송통신대학교 통계데이터학과) R컴퓨팅 출석과제물 (30점 만점 A+)2025.01.261. R 프로그래밍 제출된 자료에는 R 프로그래밍을 활용한 다양한 작업이 포함되어 있습니다. 이를 통해 R 언어의 기본 문법과 통계 함수 사용법, 데이터 처리 및 분석 기법 등을 익힐 수 있습니다. 특히 학번을 이용한 벡터 생성, 결측치 처리, airquality 데이터셋 활용 등의 내용이 포함되어 있습니다. 2. 통계 데이터 분석 제출된 자료에는 통계 데이터 분석과 관련된 내용이 포함되어 있습니다. 벡터 데이터의 평균, 분산, 중앙값 계산, airquality 데이터셋의 결측치 확인 및 분석 등을 통해 통계 데이터 처리 및 분석 ...2025.01.26
-
부경대 전자공학과 객체지향프로그래밍 과제2(얼굴 인식)2025.05.101. 얼굴 인식 알고리즘 구현 이 과제는 OpenCV2 라이브러리를 사용하여 웹캠으로 캡처한 얼굴 이미지를 데이터셋으로 구축하고, 이를 이용해 딥러닝 학습을 수행하여 얼굴을 인식하는 것을 목적으로 합니다. 과제 수행을 위해 3단계로 나누어 진행하였습니다. 첫째, 웹캠으로부터 얼굴 이미지를 캡처하여 데이터셋을 구축하였습니다. 둘째, OpenCV의 내장 메서드를 사용하여 데이터셋으로부터 학습을 수행하고 학습 모델을 생성하였습니다. 셋째, 생성된 학습 모델을 이용하여 실시간 비디오 화면에서 얼굴을 인식하고 정확도를 표시하였습니다. 이 과...2025.05.10
-
Autoencoder 기반 추천 시스템 조사2025.05.071. Autoencoder 기반 추천 시스템 Autoencoder는 여러 규제 기법을 적용하여 다양한 application에 적용되고 있으며, 특히 추천 시스템인 collaborative filtering의 성능을 높이는 데 주로 사용된다. 기존 추천 시스템의 한계를 개선하는 방법으로 Autoencoder 기반 추천 시스템이 제시되었다. 본 논문에서는 Autoencoder 기반 추천 시스템에 대한 체계적인 검토를 실시하고 분류 체계를 제안하였다. 2. Autoencoder만을 기반으로 하는 모델 Autoencoder 기반 colla...2025.05.07
-
머신러닝 2024년 2학기 방송통신대 출석수업과제물 과제 슬라이드 1~7의 코드 및 설명을 참조하여 신경망 구성 및 test accuracy 출력2025.01.261. Fashion MNIST 데이터셋 Fashion MNIST 데이터셋은 옷 이미지 데이터셋으로, 10개의 클래스(T-shirt/top, Trouser, Pullover, Dress, Coat, Sandal, Shirt, Sneaker, Bag, Ankle boot)로 구성되어 있습니다. 이 데이터셋을 사용하여 신경망 모델을 구축하고 학습을 진행합니다. 2. 데이터 전처리 데이터 시각화를 통해 이미지 데이터를 확인하고, 픽셀 값을 0~1 사이의 실수로 정규화하여 모델 학습에 사용합니다. 이미지 데이터를 1차원 벡터로 변환하는 과정...2025.01.26
-
R데이터분석 출석수업 과제물 (2023, 만점)2025.01.241. R datarium 패키지 내 jobsatisfaction 데이터셋 분석 1) 직업만족도점수의 상자그림을 성별로 나란히 그렸고, 상자그림을 통해 남성의 직업만족도점수의 중앙값은 여성보다 낮으며, 분포는 여성보다 넓게 퍼진 모습을 확인할 수 있었다. 2) 남성의 직업만족도점수 평균은 7.06, 여성의 직업만족도점수 평균은 6.87이었다. 3) 성별에 따른 직업만족도점수 평균의 차이는 없다고 할 수 있었다. 4) 교육수준에 따른 직업만족도점수 평균에서 적어도 하나 이상은 교육수준에 따라 유의미한 차이가 있다고 결론 내릴 수 있었다...2025.01.24
-
미국센서스 데이터 수입고저분류 분석2025.11.111. 데이터마이닝 고려대학교 데이터마이닝 수업에서 다루는 주제로, 대규모 데이터셋에서 패턴과 의미 있는 정보를 추출하는 기법입니다. 미국센서스 데이터를 활용하여 수입 수준을 분류하는 실제 사례를 통해 데이터마이닝의 실무 적용 방법을 학습합니다. 2. 미국센서스 데이터 미국 인구조사국에서 수집한 대규모 인구통계 데이터로, 개인의 인구통계학적 정보, 경제 상태, 교육 수준 등 다양한 속성을 포함합니다. 이 데이터는 머신러닝 및 분류 모델 개발의 벤치마크 데이터셋으로 널리 활용됩니다. 3. 수입고저분류 개인의 연간 수입을 특정 기준에 따...2025.11.11
-
방송통신대학교 프라임칼리지 AI전공 인공지능 2차 과제(만점 취득)2025.01.241. 텐서플로(TensorFlow) 텐서플로(TensorFlow)는 구글(Google)에서 만든 딥러닝 프로그램을 쉽게 구현할 수 있도록 다양한 기능을 제공해주는 라이브러리입니다. 텐서플로 자체는 기본적으로 C++로 구현되어 있지만, Python, Java, Go 등 다양한 언어를 지원하며, 파이썬을 최우선으로 지원하고 있습니다. 또한 브라우저에서 실행 가능한 시각화 도구인 텐서보드(TensorBoard)를 제공하여 딥러닝 학습 과정을 추적하는데 유용하게 사용됩니다. 텐서플로에서 Tensor(텐서)란 딥러닝에서 데이터를 표현하는 방...2025.01.24
-
랜덤 포레스트 (Random Forest Algorithm)2025.05.091. 랜덤 포레스트 (Random Forest Algorithm) 랜덤 포레스트는 특이하고 재미있는 방법론으로, 앙상블 학습(Ensemble Learning)의 한 종류입니다. 앙상블 학습은 여러 개별적인 학습 모델을 조합하여 보다 강력하고 정확한 예측 모델을 구축하는 기법입니다. Random Forest는 이러한 개별 모델로 결정 트리(Decision Tree)를 사용합니다. 하지만 단일 결정 트리를 사용하는 것이 아니라 수백 또는 수천 개의 결정 트리를 생성하고 이들을 조합하여 학습하고 예측을 수행하며, 이들을 결합하여 보다 정...2025.05.09
-
시모스 셋업2025.01.151. 시모스 셋업 정의 CMOS(Complementary Metal-Oxide Semiconductor)는 읽고 쓰기가 가능한 반도체 형태로, 보통 시모스라고 읽으며 아주 적은 전력만으로도 내용을 계속 유지할 수 있습니다. 시모스 셋업은 시모스에 저장되어 있는 일종의 프로그램으로, 컴퓨터 사용자는 시모스 셋업에서 시모스에 저장된 하드웨어 설정 사항을 제어할 수 있습니다. 2. UEFI 바이오스 UEFI(Unified Extensible Firmware Interface)는 기존 바이오스 인터페이스를 대체하는 새로운 인터페이스로, 마...2025.01.15
