데이터과학개론 출석수업과제물 (2022, 만점)
- 최초 등록일
- 2023.09.06
- 최종 저작일
- 2022.09
- 12페이지/ MS 워드
- 가격 4,000원
소개글
"데이터과학개론 출석수업과제물 (만점)"에 대한 내용입니다.
목차
1. 과제 1
2. 과제 2
3. 과제 3
4. 과제 4
참고문헌
본문내용
데이터는 크게 정형 데이터와 비정형 데이터, 반정형 데이터로 구분할 수 있으며, 이 중 정형 데이터는 범주형 데이터와 수치형 데이터로 나눌 수 있다. 먼저, 범주형 데이터는 영문 Categorical Data에서도 알 수 있듯이, 데이터 간 겹치지 않는 데이터를 의미한다. 이는 다시 명목형 데이터와 순서형 데이터로 나눌 수 있는데, 둘의 가장 큰 차이점은 순서의 유무이다. 즉, 명목형 데이터는 순서가 없는 어떠한 특성을 가진 데이터이며, 순서형 데이터는 순서가 있고 이로써 비교를 할 수 있는 데이터이다.
명목형 데이터의 사례로는 제품의 로트 번호, 복권의 로또 번호, 전시회장이나 행사장의 부스 번호 등이 있다. 제조사마다 다르지만 제품의 로트 번호를 보면, 어떤 제품의 특성 등 정보를 로트 번호라는 코드로 나타내고 있다. 또한, 로또 복권의 번호는 어떤 의미가 있는 숫자는 아니지만 결과가 발표되었을 때 특정 번호의 조합이 특성을 가지는 데이터이다. 마지막으로 부스번호는 1번 부스, 2번 부스 등 각 부스별 숫자나 코드가 있지만 이것이 어떤 수치적 의미를 갖는 것이 아닌 특정 부스의 정보를 나타내고 있다는 점에서 명목형 데이터라고 할 수 있다.
순서형 데이터의 사례로는 학점, 자격증 등급, 육류 등급 등이 있다. 먼저, 학점을 살펴보면 A+부터 F까지 순서 비교가 가능하다. 또한 자격증, 가령 언어 관련 자격증을 보면 토익스피킹의Level1부터 Level8, JLPT의 N1부터 N4 등급 등 각 등급이 의미하는 바가 있고 순서를 정할 수 있는 데이터이다. 마지막으로 육류 등급을 보면, 가령 미국산 소고기 등급은 프라임, 초이스, 셀렉트, 스탠다드 등으로 나뉜다. 이를 통해 순서의 비교가 가능하다는 점에서 순서형 데이터라고 할 수 있다.
다음으로 수치형 데이터는 수치상으로 그 크기를 관측한 데이터이다. 이는 이산형 데이터와 연속형 데이터로 나눌 수 있는데, 이산형 데이터는 말 그대로 흩어져 있는 수치 데이터이며, 수를 자연수로 셀 수 있는 데이터라고 할 수 있다.
참고 자료
심송용 외. 2020. “데이터 처리와 활용 –DB SQL 및 엑셀 VBA-“. 한국방송통신대학교출판문화원
장영재 외. 2022. “데이터과학개론”. 한국방송통신대학교출판문화원
김선호 외. 2016. 공공데이터 품질관리 성숙 수준에 대한 연구. “대한산업공학회 추계학술대회 논문집”. 159-165p
최혜린 외. 2017. 의료기관 빅데이터 품질관리의 필요성과 사례 분석. “한국빅데이터학회지 제2권 제2호”. 67-74p
정희돈. 2022. ‘의료사고 예방과 스마트 생체인증 기술’. 매일노동뉴스