기술통계, 추론통계, 가설검정 개념 요약 정리
본 내용은
"
기술통계, 추론통계, 가설검정 개념 요약 정리
"
의 원문 자료에서 일부 인용된 것입니다.
2024.07.20
문서 내 토픽
  • 1. 기술통계
    기술통계는 sample의 데이터를 요약하고 그래프로 보여주는 것이다. 이를 통해 관찰된 데이터의 특징을 알 수 있다. 데이터를 요약하고 시각화하여 raw data를 보는 것에 비해서 데이터의 특징을 한눈에 더 잘 알아볼 수 있게 해준다. 하지만 population에 대한 얘기를 할 수 없다는 한계를 지닌다.
  • 2. 추론통계
    추론통계는 sample의 데이터를 가지고 sample이 추출된 population의 특징을 추론하는 과정과 기법이다. sample의 특징을 population으로 일반화시키는 것이다. 때문에 추론에 사용하는 sample이 population에서 온 것이라는 확신이 있어야 추론통계를 사용할 수 있다. 추론통계는 모수 추정과 가설 검정으로 나뉜다.
  • 3. 가설검정
    가설검정은 population의 특징을 기술하는 상호배반적인 두 가지 명제, 영가설(H0)과 대립가설(H1)을 비교하는 방식으로 이루어진다. 가설검정은 영가설을 기각하는 방식으로 이루어지며, p-value는 영가설이 참일 때 관찰된 데이터 이상으로 극단적인 데이터가 population에서 관측될 확률을 나타낸다. p-value는 연구자의 관심사인 대립가설이 참일 확률을 직접적으로 알려주지 않는다는 한계가 있다.
  • 4. 통계적 유의성과 실질적 유의성
    통계적으로 유의미하다고 해서 실질적으로 유의미하다고는 할 수 없다. 역도 성립한다. 효과가 존재한다고 해서 그 효과가 고려할만한 가치가 있는 것이라고는 할 수 없다. 실질적 유의성을 평가하는데 신뢰구간을 사용할 수 있다.
  • 5. 1종 오류와 2종 오류
    1종 오류는 없는 것을 있다고 하는 False Positive이고, 2종 오류는 있는 것을 없다고 하는 False Negative이다. 1종 오류와 2종 오류는 서로 역의 관계에 있다. 1종 오류는 사전에 통제가 가능하지만 2종 오류는 통제가 불가능하다. 연구자는 1종 오류와 2종 오류 중 어느 것을 더 중요하게 여길지 판단해야 한다.
  • 6. 검증력
    검증력은 존재하는 효과를 정확하게 발견해 낼 확률이다. 검증력을 높이는 방법은 sample size의 증가, variability의 감소, effect size의 증가 등이 있다. 검증력은 sample 크기 결정에도 영향을 미친다.
  • 7. 단방검증과 양방검증
    단방검증은 차이의 방향이 정해져 있어서 분포의 한 쪽을 대상으로 한 p value를 설정한다. 양방검증은 차이의 방향이 정해져 있지 않으며 분포의 양 쪽을 대상으로 p value를 설정한다. 일반적으로 검증을 더 엄격하게 하기 위해서 양방검증을 선호한다.
Easy AI와 토픽 톺아보기
  • 1. 기술통계
    기술통계는 데이터를 요약하고 설명하는 기본적인 통계 기법입니다. 이를 통해 데이터의 특성을 이해하고 분석의 기초를 마련할 수 있습니다. 평균, 중앙값, 표준편차 등의 지표를 활용하여 데이터의 중심경향과 분산을 파악할 수 있습니다. 또한 히스토그램, 산점도 등의 시각화 기법을 통해 데이터의 분포와 패턴을 직관적으로 파악할 수 있습니다. 기술통계는 데이터 분석의 출발점이 되며, 이를 바탕으로 더 심층적인 분석을 수행할 수 있습니다.
  • 2. 추론통계
    추론통계는 표본 데이터를 활용하여 모집단의 특성을 추정하고 가설을 검정하는 기법입니다. 이를 통해 데이터에 내재된 규칙성과 인과관계를 발견할 수 있습니다. 대표적인 추론통계 기법으로는 t-검정, 분산분석, 회귀분석 등이 있습니다. 이러한 기법들은 데이터의 특성과 연구 목적에 따라 적절히 선택되어야 합니다. 추론통계는 데이터 분석의 핵심이 되며, 의사결정을 위한 중요한 근거를 제공합니다. 다만 통계적 유의성과 실질적 유의성을 구분하여 해석할 필요가 있습니다.
  • 3. 가설검정
    가설검정은 통계적 추론의 핵심 과정입니다. 연구자가 설정한 가설을 표본 데이터를 통해 검정하여 모집단의 특성을 추정하고 의사결정을 내리는 것입니다. 가설검정 과정에서는 귀무가설과 대립가설을 설정하고, 검정통계량과 p-값을 계산하여 통계적 유의성을 판단합니다. 이때 1종 오류와 2종 오류의 발생 가능성을 고려해야 합니다. 가설검정은 데이터 분석의 객관성과 신뢰성을 높이는 데 기여하지만, 실질적 유의성과 연구 목적에 맞는 해석이 필요합니다.
  • 4. 통계적 유의성과 실질적 유의성
    통계적 유의성은 표본 데이터를 통해 관찰된 결과가 우연히 발생했을 가능성이 낮다는 것을 의미합니다. 반면 실질적 유의성은 관찰된 결과가 실제로 중요한 의미를 가지는지를 나타냅니다. 통계적 유의성은 표본 크기, 효과 크기, 검정력 등에 영향을 받으므로, 실질적 유의성과 구분하여 해석해야 합니다. 실질적 유의성은 연구 목적, 실용성, 비용-효과 등을 고려하여 판단해야 합니다. 통계적 유의성과 실질적 유의성을 균형 있게 고려하는 것이 중요한데, 이를 통해 데이터 분석 결과를 보다 의미 있게 해석할 수 있습니다.
  • 5. 1종 오류와 2종 오류
    1종 오류는 귀무가설이 참인데도 이를 기각하는 오류이며, 2종 오류는 귀무가설이 거짓인데도 이를 기각하지 못하는 오류입니다. 이 두 가지 오류는 서로 상충되는 관계에 있어, 1종 오류를 줄이면 2종 오류가 증가하고, 2종 오류를 줄이면 1종 오류가 증가합니다. 따라서 연구 목적과 상황에 따라 적절한 유의수준을 설정하여 오류의 균형을 잡아야 합니다. 1종 오류와 2종 오류를 모두 고려하여 가설검정을 수행하는 것이 중요하며, 이를 통해 보다 신뢰할 수 있는 결론을 도출할 수 있습니다.
  • 6. 검증력
    검증력은 귀무가설이 거짓일 때 이를 기각할 수 있는 확률을 의미합니다. 즉, 검증력이 높다는 것은 실제 차이가 있을 때 이를 발견할 수 있는 능력이 높다는 것을 의미합니다. 검증력은 유의수준, 효과 크기, 표본 크기 등에 영향을 받습니다. 연구자는 적절한 검증력을 확보하기 위해 이러한 요소들을 고려하여 실험 설계를 해야 합니다. 검증력이 낮은 경우 2종 오류의 위험이 증가하므로, 이를 적절히 관리하는 것이 중요합니다. 검증력 분석은 연구 설계 단계에서 필수적으로 수행되어야 하며, 이를 통해 보다 신뢰할 수 있는 결과를 도출할 수 있습니다.
  • 7. 단방검증과 양방검증
    단방검증은 연구자가 사전에 예측한 방향으로만 가설을 검정하는 것이며, 양방검증은 양쪽 방향으로 가설을 검정하는 것입니다. 단방검증은 연구자의 가설이 맞을 경우 통계적 유의성을 보다 쉽게 확보할 수 있지만, 예측과 반대 방향의 결과가 나올 경우 이를 간과할 수 있습니다. 반면 양방검증은 예측과 반대 방향의 결과도 고려할 수 있어 보다 객관적인 결론을 도출할 수 있습니다. 연구 목적과 상황에 따라 단방검증 또는 양방검증을 선택해야 하며, 이를 통해 데이터 분석의 신뢰성과 타당성을 높일 수 있습니다.
주제 연관 토픽을 확인해 보세요!
주제 연관 리포트도 확인해 보세요!