소개글
"최근 1년간 개봉한 영화 30개를 무작위로 골라 영화 제목과 상영시간(분)을 기록"에 대한 내용입니다.
목차
1. 서론
2. 데이터 분석
2.1. 빈도 분포 표와 히스토그램
2.2. 중심 경향 측정치
2.2.1. 평균
2.2.2. 중앙값
2.2.3. 최빈값
2.3. 데이터 표준화
3. 결과 및 논의
4. 참고 문헌
본문내용
1. 서론
최근 2년간 개봉한 영화 30개를 무작위로 골라 영화 제목과 상영시간(분)을 기록하고, 이에 대한 데이터 분석을 실시하고자 한다. 이는 현재 상영되는 영화들의 특성을 이해하고 파악하는데 도움이 될 것이다. 데이터 분석을 통해 영화 상영시간의 빈도 분포와 중심 경향 측정치를 도출하고, 나아가 데이터의 표준화를 실시하여 특이값을 판단할 수 있을 것이다. 이를 통해 최근 개봉영화들의 일반적인 특성과 분포, 나아가 대중들의 선호도를 파악할 수 있을 것으로 기대한다.
2. 데이터 분석
2.1. 빈도 분포 표와 히스토그램
빈도 분포 표와 히스토그램은 데이터의 분포를 파악하는 데 효과적인 도구이다. 최근 2년간 개봉한 영화 30편의 상영시간 데이터를 바탕으로 빈도 분포 표와 히스토그램을 작성하였다.
빈도 분포 표는 데이터를 일정한 계급 구간으로 나누고 각 구간별 빈도를 표로 나타낸 것이다. 이를 통해 영화 상영시간의 범위와 각 구간별 빈도를 확인할 수 있다. 본 데이터의 경우 상영시간의 최소값은 83분, 최대값은 181분으로 나타났으며, 계급 구간의 폭은 19.6분으로 설정하였다. 이에 따르면 122.2분 구간에 가장 많은 10편의 영화가 분포하고 있음을 알 수 있다.
히스토그램은 빈도 분포 표를 시각적으로 표현한 것으로, 각 계급 구간의 빈도를 막대그래프로 나타낸다. 히스토그...
참고 자료
데이터 시각화와 탐색 with POWER BI (마경근, 서주란 저) 영진닷컴 2020.07.31
김홍준, 『경영통계학』, 명진, 2017