2022 방통대 출석과제 데이터과학개론
- 최초 등록일
- 2022.11.25
- 최종 저작일
- 2022.10
- 4페이지/ 한컴오피스
- 가격 5,000원
소개글
"2022 방통대 출석과제 데이터과학개론"에 대한 내용입니다.
목차
없음
본문내용
대부분의 데이터 분석모형은 숫자만 입력으로 받을 수 있다. 따라서 데이터 형태에 따라 다른 전처리 접근법이 필요하다. 오늘은 범주형 데이터와 수치형 데이터의 특징을 살펴보고 어떤 차이가 있는지 살펴보겠다.
데이터는 참조나 분석을 목적으로 수집된 정보이다. 수집된 정보의 속성은 데이터마다 다르며, 질적이거나 양적일 수 있다. 변수가 양적이면 숫자로 크기의 측면으로 나타낼 수 있으며, 이를 수치형 데이터라고 하는데 사람의 체중, 키, 온도 등을 예로 들 수 있다.
수치형 데이터는 연속형 데이터와 이산형 데이터로 다시 나눠지는데 이산형은 판매량, 나이처럼 데이터와 데이터 간 끊어짐이 있는 값을 말하며, 연속형 데이터는 키, 몸무게와 같이 끊어짐이 없이 연속적인 값을 갖는 데이터를 말한다.
반면, 데이터가 질적인 경우, 크기의 측면으로 나타낼 수 없으며, 변수가 나타내는 값은 범주형의 의미를 지니게 된다. 범주형 자료는 몇 개의 범주 또는 항목의 형태로 나눠진 자료를 말하는데 성별(남/녀), 평점(5점/3점/1점) 등을 예로 들 수 있다.
참고 자료
없음