데이터마이닝3장레포트
- 최초 등록일
- 2012.06.27
- 최종 저작일
- 2012.07
- 20페이지/ MS 파워포인트
- 가격 2,000원
소개글
과제있는데 어려워서 못푸신분들 참고하세요
목차
없음
본문내용
A.어느 변수들이 정량적/수치형 변수 또는 순위형, 명목형 변수인가?
정량적/수치형: CALORIES, POTEIN, FAT, SODIUM, FIBER, CARBO, SUGARS
POTASS, VITAMIN, WEIGHT, CUPS, RATING
순위형 : SHELF
명목형: NAME, MFR, TYPE
B.각 정량적 변수들의 평균, 중앙값, 최소값, 최대값, 그리고 표준편차를 포함하는
표를 작성하시오.
C.정량적 변수들에 대한 히스토그램을 작성하시오. 히스토 그램과 요약통계량을
토대로 다음의 질문에 답하시오.
가. 어느변수가 가장 큰 변동성을 가지는가?
SODIUM
나. 어느 변수의 분포가 한쪽으로 치우쳐 있는가?
다. 극단치로 보이는 값이 존재하는가?
막대그래프 중간중간 값이 없으므로 FAT, PROTEIN,FIBER은 극단치가
존재한다고 할 수 있다.
D. 저온용 대 고온용 시리얼에 함유된 칼로리에 비교하는 나란히 근접한
상자그림을 그리시오. 이 그림은 어떤 정보를 보여주는가?
고온용 시리얼은 값이 100 이지만
저온용 시리얼은 극단치를 제외한
최대값이 120 최소값이 약 90
평균이 약 105정도 이다.
결론적으로,
고온용은 소비자가
아무 시리얼이나 고르겠지만
저온용은 소비자가 시리얼의
칼로리를 비교하여 선택할것
이다.
참고 자료
없음