
총 745개
-
체계적 오류와 비체계적 오류 및 오류 감소 방안2025.05.041. 체계적 오류 체계적 오류는 일관적이고 지속적인 오류 패턴으로, 자료 제공자나 수집 방법의 오류, 편견 등으로 인해 발생할 수 있다. 예를 들어 연구자의 가설을 지지하는 응답을 과도하게 반영하는 등의 편향이 발생할 수 있다. 2. 비체계적 오류 비체계적 오류는 일관성 없이 무작위로 발생하는 오류로, 측정 시기나 방법의 차이, 응답자의 이해도 부족 등으로 인해 발생할 수 있다. 비체계적 오류는 예측하기 어려운 특성이 있다. 3. 오류 감소 방안 오류를 줄이기 위해서는 쉽고 편향되지 않은 용어 사용, 사전 검수와 훈련, 신뢰도와 타...2025.05.04
-
국내 프로야구팀에 대한 선호도 측정을 통한 척도(Scale) 개념 설명2025.04.261. 척도(Scale)의 개념 척도란 개념을 구성하는 다양한 측면을 묻는 추상적 개념의 포괄적인 척도를 의미한다. 척도는 측정 대상에 주어진 숫자의 시스템을 말하며, 변수의 정량적 측정을 제공하여 통계적으로 조작할 수 있다. 척도에는 명목척도, 서열척도, 등간척도, 비율척도 등이 있으며, 각각의 특성에 따라 다양하게 활용될 수 있다. 2. 척도의 필요성 사회조사에서는 질문방법, 질문에서 사용된 표현, 질문의 형태, 반응범주의 구성에 따라 반응결과가 크게 달라진다. 이러한 우발적인 오류는 다양한 측정값을 합성하여 단일 측정을 하는 과...2025.04.26
-
빅데이터와 통계학_탐구보고서_확통(세특)2025.01.111. 빅데이터와 통계학 빅데이터는 기존의 데이터 베이스 관리도구의 데이터 수집, 저장, 관리, 분석의 역량을 넘어서는 대량의 정형 또는 비정형의 데이터 세트 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 의미한다. 정보 통신 기술의 발달, 빅데이터에 대한 효율적인 저장 및 분석의 가능, 국가간 기술 격차 감소로 인해 빅데이터에 대한 관심이 높아지고 있다. 의료산업, 맞춤형 마케팅, 제조업 등 다양한 분야에서 빅데이터가 응용되고 있다. 따라서 빅데이터 시대에 가치를 추출하고 결과를 분석하는 분야와 밀접한 관련이 있는 ...2025.01.11
-
생산 공정에서의 불량 모델링2025.05.121. 이항분포 이항분포는 독립적인 베르누이 시도의 결과를 모델링하는데 사용되며, 시도 횟수와 성공 확률을 고려합니다. 예를 들어, 압력을 증가시킬 때 불량이 발생하는 확률이 일정한 값으로 유지된다고 가정하면, 이러한 상황을 이항분포를 이용하여 모델링할 수 있습니다. 2. 포아송분포 포아송분포는 일정한 단위 시간 또는 공간에서의 사건 발생 횟수를 모델링하는데 사용됩니다. 압력이 증가함에 따라 불량이 발생하는 횟수가 드물게 변하는 상황에서는 포아송분포를 활용하여 불량율을 근사할 수 있습니다. 포아송분포는 독립적인 사건 발생을 가정하고,...2025.05.12
-
서비스 기업에서의 통계적 품질관리 기법 활용2025.04.261. 관리도 기법 관리도 기법은 제조 과정에서 이상이 있는지를 빠르게 찾아내고, 불량품이 대량으로 만들어지기 전에 조처를 취해 품질이 좋은 상태를 유지할 수 있도록 하는 기법이다. 계량형 관리도에서는 무게, 길이, 강도 등의 데이터를 사용하며 정규분포 이론을 적용하고, 계수형 관리도에서는 불량률이나 불량 개수 데이터를 이항분포 이론에 적용한다. 2. 샘플링 기법 샘플링 기법은 로트에서 시료를 추출해서 검사하고, 그 결과가 미리 정해둔 판정 기준과 비교했을 때 합격인지 불합격인지 판단하는 방법이다. 계수형 샘플링은 불량 개수나 결점 ...2025.04.26
-
탐색적 자료분석2025.05.061. 데이터 분석 데이터 분석은 대상인 데이터를 어떻게 이해하는가에 따라 모델링 전략이 결정되며, 모델링의 성능도 결정된다. 특히 탐색형 자료분석은 데이터 분석의 시작으로 데이터의 주요 특성을 파악하기 위해 반드시 수행해야 하는 작업이다. 이 과정에서는 기초 통계 분석 및 그래프 분석을 통한 분석작업을 수행한다. 2. 데이터 유형 데이터는 크게 수치형 데이터와 범주형 데이터로 구분할 수 있다. 수치형 데이터는 연속형 데이터와 이산형 데이터로, 범주형 데이터는 순서형 데이터와 명목형 데이터로 나뉜다. 각 데이터 유형에 따라 적절한 분...2025.05.06
-
측정의 4가지 수준, 명목, 서열, 등간, 비율 등에 대해 자세히 설명하고, 각 수준에 따른 척도를 5가지2025.04.281. 명목척도 명목측정은 변수의 속성에 있어 유사점과 차이점에 따라서 범주화시키는 것으로 일정한 순서 없이 상호배타적이고 포괄적으로 범주화시키는 것이다. 명목척도는 같다 혹은 다르다만 구분할 수 있고 통계적으로는 최빈치만 알 수 있으며 교차분석, 빈도분석, 비모수통계 등을 적용할 수 있다. 2. 서열척도 서열측정은 측정하려고 하는 변수의 속성에 대해 서열을 부여하나 서열 사이의 간격은 서로 다르다. 서열측정의 수치는 절대적인 양이나 수, 크기 등을 나타내는 것이 아니기 때문에 분류가 된 범주 사이의 거리, 간격 등에 대한 정보는 알...2025.04.28
-
데이터 마이닝의 정의와 활용 사례2025.01.021. 데이터 마이닝의 이해 데이터 마이닝은 대량의 데이터 세트에서 가치 있는 정보와 통찰력을 추출하는 프로세스입니다. 여기에는 통계 분석, 기계 학습, 패턴 인식 등의 기술을 사용하여 데이터 내 숨겨진 패턴, 상관 관계 및 트렌드를 식별하는 것이 포함됩니다. 데이터 마이닝 프로세스에는 데이터 수집, 정리 및 전처리, 탐색, 모델 구축, 평가, 배치 등의 단계가 포함됩니다. 2. 데이터 마이닝의 응용 데이터 마이닝의 주요 애플리케이션 중 하나는 예측 분석입니다. 이를 통해 기업은 고객 수요를 예측하고 재고를 효율적으로 관리할 수 있습...2025.01.02
-
(방송대) 통계패키지, 중간과제물 (2023 1학기, 30점 만점)2025.01.251. SAS를 이용한 남녀별 기술통계량 분석 이 데이터에서 남성과 여성은 각각 4명, 6명으로 나타났다. 약의 투여용량은 남성은 평균 32.5로 나타났고, 여성은 28.3으로 나타나 남성의 평균 약 투여용량이 여성보다 높았다. 표준편차는 각각 남성 5, 여성 9.8로 나타나 자료의 퍼짐 정도는 여성이 더 높게 나타났다. 혈압의 평균은 남성 127.5, 여성 132.5로 여성이 더 높게 나타났다. 표준편차는 남성 17.1 여성 9.4로 나타나 자료의 퍼짐 정도는 남성이 여성보다 더 높게 나타났다. 나이는 남성 50.3, 여성 58로 ...2025.01.25
-
빅데이터의 기술 요건 네 단계에 대해 설명하세요2025.01.121. 빅데이터 기술 요건 빅데이터의 기술 요건은 빅데이터를 수집, 저장, 처리, 분석하는 데 필요한 기술적인 요구사항을 의미합니다. 빅데이터의 규모와 다양성이 증가함에 따라 이러한 요건은 더욱 중요해지고 있습니다. 빅데이터 기술 요건은 크게 네 가지 단계로 나뉘며, 각 단계별로 필요한 기술이 다양하게 요구됩니다. 2. 데이터 수집 단계 데이터 수집 단계에서는 빅데이터를 생성하고 발생하는 원천 데이터를 수집하는 과정을 의미합니다. 이 과정에서 필요한 기술은 데이터 수집과 전송, 그리고 신속한 처리가 가능한 시스템을 구축하는 것입니다....2025.01.12