• AI글쓰기 2.1 업데이트
PARTNER
검증된 파트너 제휴사 자료

결측치 처리: 어떤 방법이 최선인가? (Handling Missing data: What is the most effective method?)

한국학술지에서 제공하는 국내 최고 수준의 학술 데이터베이스를 통해 다양한 논문과 학술지 정보를 만나보세요.
14 페이지
기타파일
최초등록일 2025.03.17 최종저작일 2005.01
14P 미리보기
결측치 처리: 어떤 방법이 최선인가?
  • 미리보기

    서지정보

    · 발행기관 : 한국체육학회
    · 수록지 정보 : 한국체육학회지 / 44권 / 1호 / 385 ~ 398페이지
    · 저자명 : 박재현, 이진오, 강상조, 강민수

    초록

    그동안 결측치 처리 문제와 관련해서 다양한 방법들이 소개되어 왔지만 스포츠과학 분야의 연구자들이 어떤 결측치 처리방법을 사용하는 것이 최선일까에 대한 답을 주는 실험적 증거와 정보가 부족했었다. 이 연구는 20개 사례로 수집된 자료의 결측치 비율이 5%, 10%, 15% 그리고 20%로 다른 경우 어떤 처리방법이 실제자료를 가장 근접하게 추정하는지를 컴퓨터 시뮬레이션 방법으로 분석하였다.
    이 연구에서 비교한 결측치 처리방법은 윈도우용 SPSS 11.0 버전에서 제공하는 사례제거와 대응쌍제거의 제거방법과 대체방법 중 평균대체, 회귀대체, EM대체의 방법을 대상으로 하였으며, 각각의 방법으로 결측치를 처리했을 때 실제자료와의 어떠한 차이가 발생되는지를 구명하였다. 이때 실제값과 각 방법별 추정치간의 RMSD를 산출하여 원자료의 왜곡정도를 비교하였다. 실제자료와 결측치 처리된 자료의 비교대상은 평균과 분산의 추정치와 그리고 첨도와 왜도의 분포정보를 비교대상으로 하였다. 각 실험조건별 모의실험은 50회 반복 수행하였다. 이 연구에서 얻어진 결론은 다음과 같다.
    첫째, 5%의 자료결측시 회귀대체와 EM대체가 최선이며, 둘째, 10% 자료결측시 회귀대체와 EM대체가 최선이고, 셋째, 15% 자료결측시 EM대체가 최선이다. 그리고 넷째, 20% 자료결측시 EM대체가 최선이다. 다섯째, 결측치 비율이 높을수록 실제값과 추정치간의 차이가 커진다. 따라서 이 연구의 결론을 근거로 스포츠과학 분야의 연구자들은 결측치 처리의 제거방법과 평균대체방법의 사용은 지양하고 회귀대체와 EM대체방법을 사용할 것을 추천한다.
    그러나 이 연구는 사례수 20명, 3개의 변인으로써 변인간 상관계수가 약 .85이상의 비교적 높으며 결측치 기전(형태)이 MCAR인 경우의 연구조건에서 얻어진 결론이기 때문에 이 연구조건에 한정하여 해석할 것을 제안한다.

    영어초록

    Missing data can potentially threaten the validity of a research. The need for a suitable missing data method has been a focus of many researchers, and many methods have been developed for handling missing data, including listwise and pairwise deletion, mean substitution, regression imputation, and expectation-maximization (EM). Most of the research in the past, however, focused on the large sample, which makes it difficult to generalize the findings to the case with a small sample. The purpose of this study was to determine the most effective method to handle missing data with a small sample size of 20. A Monte-Carlo simulation was used to compare the effectiveness of missing data methods. Different proportions of missing values in the data were also examined. The effectiveness of missing data methods was compared at 5%, 10%, 15%, and 20% of missing values in the data and determined by RMSD (Root Mean Square Difference) index on the mean, variance, skewness, and kurtosis. A smaller RMSD represents a more accurate method in handling missing data. The results showed that EM is the most effective method for handling missing data, and the accuracy of handling missing data is better with the smaller number of missing values in the data.

    참고자료

    · 없음
  • 자주묻는질문의 답변을 확인해 주세요

    해피캠퍼스 FAQ 더보기

    꼭 알아주세요

    • 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
      자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
      저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
    • 해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.
      파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
      파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우
문서 초안을 생성해주는 EasyAI
안녕하세요 해피캠퍼스의 20년의 운영 노하우를 이용하여 당신만의 초안을 만들어주는 EasyAI 입니다.
저는 아래와 같이 작업을 도와드립니다.
- 주제만 입력하면 AI가 방대한 정보를 재가공하여, 최적의 목차와 내용을 자동으로 만들어 드립니다.
- 장문의 콘텐츠를 쉽고 빠르게 작성해 드립니다.
- 스토어에서 무료 이용권를 계정별로 1회 발급 받을 수 있습니다. 지금 바로 체험해 보세요!
이런 주제들을 입력해 보세요.
- 유아에게 적합한 문학작품의 기준과 특성
- 한국인의 가치관 중에서 정신적 가치관을 이루는 것들을 문화적 문법으로 정리하고, 현대한국사회에서 일어나는 사건과 사고를 비교하여 자신의 의견으로 기술하세요
- 작별인사 독후감
해캠 AI 챗봇과 대화하기
챗봇으로 간편하게 상담해보세요.
2026년 01월 26일 월요일
AI 챗봇
안녕하세요. 해피캠퍼스 AI 챗봇입니다. 무엇이 궁금하신가요?
11:58 오후