
총 185개
-
한국방송통신대학교 통계데이터과학과 다변량분석 2022년 출석과제(만점)2025.01.251. 주성분 분석 데이터의 요약 통계량을 확인하고 Boxplot으로 데이터의 분포를 확인하였다. 상관계수행렬과 산점도 행렬을 보고 변수들 간의 상관관계를 분석하였다. 주성분 분석을 실시하여 제 1주성분과 제 2주성분이 전체 정보의 86.4%를 설명하는 것을 확인하였다. 주성분 계수를 통해 각 변수들의 주성분에 대한 기여도를 파악하였다. 2. 인자분석 Bartlett의 구형성 검정과 KMO 검정을 통해 인자분석의 적합성을 확인하였다. 주성분 인자법을 이용한 인자분석 결과, 2개의 유의한 인자가 도출되었다. 직교회전 방식인 varima...2025.01.25
-
군집화 (Clustering) 비지도 학습2025.05.101. 군집화 (Clustering) 군집화(Clustering)는 비지도 학습(Unsupervised Learning)의 한 종류로, 데이터를 서로 유사한 특성을 가진 그룹으로 분류하는 기법입니다. 이를 통해 데이터의 숨겨진 구조나 패턴을 찾거나 비슷한 특성을 가진 데이터를 그룹화하여 관측 및 분석할 수 있습니다. 군집화는 다양한 분야에서 활용되며, 고객 세그먼테이션, 이미지 분류, 소셜 미디어 분석 등에 사용될 수 있습니다. 대표적인 군집화 알고리즘으로는 K-평균 군집화, DBSCAN, 계층적 군집화 등이 있습니다. 2. 불량분석...2025.05.10
-
방통대 [다변량분석] 2024 출석과제물 (30점 만점 인증 / 표지제외 29페이지 분량 / 코드 및 해설 포함)2025.01.251. 다변량분석 이 과제물은 방송통신대학교 다변량분석 교과목의 2024년 출석과제물입니다. 과제물에는 R과 Python을 사용한 다양한 다변량분석 기법들이 포함되어 있습니다. 주요 내용으로는 산점도 분석, 주성분분석, 표준화, 계층적 군집분석, K-평균 군집분석 등이 있습니다. 각 분석 기법에 대한 코드와 해설이 자세히 제공되어 있어 다변량분석 학습에 도움이 될 것입니다. 1. 다변량분석 다변량분석은 여러 개의 변수들 간의 관계를 동시에 분석하는 통계 기법입니다. 이 기법은 복잡한 현실 세계를 보다 정확하게 이해하고 예측하는 데 도...2025.01.25
-
30점 만점 방통대 다변량분석 2024-1학기2025.01.261. t-분포 난수 생성 및 분석 R과 파이썬을 이용하여 자유도가 5인 t-분포를 따르는 난수 100개를 생성하고 히스토그램, 상자그림, 줄기-잎 그림을 그려 분석하였다. 난수 생성 시 학번 뒤 4자리로 seed를 설정하였으며, R에서는 rt() 함수, 파이썬에서는 np.random.standard_t() 함수를 사용하였다. 히스토그램 결과 -4부터 4 이상 범위에 분포하며 오른쪽 꼬리가 긴 모양이었고, 상자그림 결과 중앙값이 0에 가깝고 제1사분위수와 제3사분위수가 각각 -2보다 크고 2보다 작았다. 줄기-잎 그림 결과 -1과 1...2025.01.26
-
2024년 1학기 방송통신대 출석수업대체과제물 다변량분석) R과 파이썬을 각각 이용하여 작성하시오. 교재 연습문제 1장 3번, 4번 2장 3번 4장 3번 (1)-(3)2025.01.251. t-분포 난수 생성 및 분석 자유도가 5인 t-분포를 따르는 난수 100개를 R과 파이썬을 이용하여 생성하고, 히스토그램, 상자그림, 줄기-잎 그림을 그려 t-분포의 특성을 분석하였다. 히스토그램에서는 0을 중심으로 대칭의 모습을 보이지만 완전한 대칭은 아니며, 상자그림에서는 평균값이 0보다 약간 작은 것으로 나타났다. 줄기-잎 그림에서도 0점대를 중심으로 대칭의 구조를 보이고 있으나 일부 이상치가 확인되었다. 2. Longley 데이터 분석 R에 내장된 Longley 데이터를 이용하여 산점도행렬, 별그림, 얼굴그림을 그려 변...2025.01.25
-
[충남대] 생태학실험 - 개체들의 공간적 분포2025.01.131. 개체군 생태학 개체군 생태학은 시간에 따라 개체군을 조절하는 인자와 개체군 크기의 변화에 관심을 가진다. 개체군 생태학자들은 개체수와 분포와 같은 통계학을 사용하여 개체군을 설명하고, 개체군 크기에 영향을 주는 생물적, 무생물적 인자 사이의 상호작용을 이용하여 개체군의 역동성을 조사한다. 2. 개체군의 공간적 분포 개체군 내에서 개체들은 임의로, 균일하게 또는 군생으로 분포할 수 있다. 개체들의 공간적 분포 양상은 개체군의 밀도에 중요한 의미를 가지고 있다. 생태학자들은 공간적 패턴을 연구하여 기본 과정의 존재를 추정할 수 있...2025.01.13
-
Metagenomics 미생물 실험보고서2025.05.061. Metagenomics Metagenomics는 현재 약 99%의 미생물배양이 어렵다는 실험적인 한계를 보완하는 방법으로 직접환경샘플에서 DNA를 추출하여 Next-generationsequencing(NGS)를 진행하여 다양한 플랫폼을 이용하여 미생물의 군집구조(microbial community) 및 메타유전체(metagenome)를 분석하는데 이용되고 있다. 2. 토양 샘플 분석 이번 실험에서는 주변환경의 토양 sample을 채취하여 유전체 분석을 하는 방법을 이용했으며, 실험 과정은 토양 sample채취, 토양 samp...2025.05.06
-
미성년자의 성매매와 관련한 조사2025.05.121. 미성년자 성매매 인식 및 이유 조사 이 조사의 주요 목적은 미성년자들이 생각하는 성매매에 대한 인식과 성매매가 발생하는 이유를 조사하는 것입니다. 성매매에 대한 직접적인 경험이나 간접적인 경험(목격 및 고민상담)이 있는 청소년들을 주요 대상으로 하여, 성매매 경험의 이유, 매체, 관심의 이유, 횟수, 지속 여부, 지역사회 내 유흥시설 인지도, 성매매에 대한 위험 인식, 가정환경, 지역사회에 대한 인식, 성매매에 대한 자기인식 등을 조사할 계획입니다. 2. 군집표본추출 및 임의표본추출 방법 이 조사에서는 군집표본추출 방법을 사용...2025.05.12
-
머신러닝의 3가지 학습 방법: 지도학습, 비지도 학습, 강화학습2025.01.041. 지도학습 지도학습은 입력과 출력 간의 관계를 학습하는 방식으로, 정답과 사례를 연결시켜주는 방식으로 이루어집니다. 데이터 집합을 통해 입력과 출력 간의 함수관계를 기계가 배우게 되며, 이렇게 얻어진 함수를 모델이라고 합니다. 지도학습으로 만들 수 있는 대표적인 것은 패턴 분류와 회귀분석입니다. 2. 비지도 학습 비지도학습은 입력 데이터 세트에 레이블을 달아주지 않고, 기계가 데이터를 묶을 수 있는 특징을 스스로 찾아내게 합니다. 비지도 학습은 데이터 집합 속에서 숨겨진 패턴을 배우며, 군집화를 이용해 서로 유사한 데이터를 묶습...2025.01.04
-
Kernel PCA & Spectral Clustering2025.01.131. Kernel PCA Kernel PCA는 편향이 큰 실세계의 데이터를 분석하는데 어려움이 있고, outlier data에 매우 민감한 linear PCA의 단점을 보완하기 위해 kernel trick을 수행한다. 하지만 분산이 가장 큰 축으로 데이터들을 정사영 시킬 뿐, clustering algorithm을 적용하지는 않는다. 2. Spectral Clustering Spectral Clustering은 군집화를 더 쉽게 하기 위해서 유사도 행렬 A를 통해 데이터들을 변형된 공간에 넣고, 후에 clustering algori...2025.01.13