소개글
"최근 1년간 개봉한 영화 30개를 무작위로 골려 영화 제목과 상영 시간(분)을 기록하시오. 빈도분포표와 히스토그램을 작성하고, 히스토그램을 설명하시오. 평균, 중앙값, 최빈값을 계산하시오. 어느 것이 가장 좋은 중심측정치인가? 그 이유를 서술하시오. 데이터를 표준화하시오. 특이값을 있는지를 판단하시오"에 대한 내용입니다.
목차
1. 서론
2. 데이터 분석
2.1. 영화 제목 및 상영 시간
2.2. 빈도분포표 및 히스토그램
2.3. 평균, 중앙값, 최빈값 분석
3. 중심 측정치 결정
4. 데이터 표준화 및 특이값 분석
5. 결론
6. 참고 문헌
본문내용
1. 서론
경영 통계학에서는 기업 성과 평가, 품질 개선, 투자 리스크 관리, 예측 모델 개발 등 다양한 분야에서 통계 분석이 활용된다. 이에 본 연구에서는 최근 1년간 개봉한 영화 30편의 상영 시간 데이터를 분석하여 영화 산업에서의 통계적 특성을 파악하고자 한다.
빈도분포표와 히스토그램을 통해 대부분의 영화가 100분에서 130분 사이의 상영 시간을 가지고 있음을 확인할 수 있다. 이는 현재 영화 산업에서 일반적인 영화의 상영 시간이 약 2시간 내외로 집중되고 있음을 의미한다. 또한 상영 시간이 매우 짧거나 길어 특이값을 보이는 영화도 소수 존재한다는 점을 알 수 있다.
평균, 중앙값, 최빈값을 비교한 결과, 데이터의 분포와 특이값 존재를 고려했을 때 중앙값이 가장 적합한 중심 측정치라고 판단된다. 중앙값은 데이터의 정렬 순서에서 중간에 위치한 값으로, 특이값의 영향을 받지 않기 때문에 영화 상영 시간 데이터의 대표값으로서 활용될 수 있다.
이를 바탕으로, 본 연구는 영화 제작자들이 상영 시간을 결정할 때 참고할 수 있는 정보를 제공할 수 있을 것이다. 또한 관객 입장에서도 영화 선택 시 상영 시간에 대한 이해도를 높일 수 있을 것으로 기대된다.
2. 데이터 분석
2.1. 영화 제목 및 상영 시간
최근 1년간 개봉한 영화 30개를 무작위로 골라 영화 제목과 상영 시간(분)을 기록하였다. 덩케르트는 106분, 듄은 155분, 모비우스는 104분, 더 배트맨은 176분, 신비한 동물들과 덤블도어의 ...
참고 자료
김홍준, 『경영통계학』, 명진, 2017
1. 김홍준. (2017). 경영통계학. 명진출판사.