목차
1. 범주형 데이터 및 수치형 데이터의 특징 및 종류를 기술하고 사례를 제시하고 설명하시오. ( 단, 교재 외의 사례를 제시할 것)(0.5페이지)
2. 빅데이터 시대에 접어들어 인공지능 등 첨단 기술의 발전이 가속화되는 상황에서 데이터 주도권이라는 개념이 강조되고 있다. 교재에서 제시한 데이터 주도권과 관련된 다섯 가지 소양 중 본인의 입장에서 보다 집중적으로 갖추어야할 분야는 어느 것(들)인지 선택하고 그 이유를 기술하시오.(1.5페이지)
3. 데이터베이스 모델이란 무엇인지 설명하고, 계층형, 넽,워크형, 관계형 모델 각각에 대해 교재 외의 사례를 들어 설명하시오.(0.5페이지)
4. 데이터 품질관리의 미흡할 때 발생할 수 있는 문제에 대해 약술하고 이러한 문제가 발생한 (교재외의) 실제 사례를 조사하여 기술하시오.(1.5페이지)
본문내용
1. 데이터는 일반적으로 범주형 데이터와 수치형 데이터로 구분된다. 범주형 데이터는 몇 개의 범주나 항목 등의 형태로 나누어진 자료를 뜻한다. 이는 다시 명목형 데이터와 순서형 데이터로 나뉜다. 명목형 데이터는 순서가 정해져 있지 않고, 단순히 분류를 목적으로 하는 데이터를 의미한다. 명목형 데이터의 예시로는 남자와 여자로 나누어지는 성별의 경우라든지, A형, B형, O형, AB형으로 나누어지는 혈액형의 경우, 갈색, 파란색, 녹색, 검정색 등으로 나뉘는 눈동자 색의 경우를 들 수 있다. 이러한 데이터의 경우에는 데이터가 숫자로 나타내어지는 경우에도 그 숫자가 어떠한 값의 크고 작음을 나타내는 것이 아니라, 단순히 범주를 표시하는 경우이다. 따라서 이러한 데이터의 경우 순서를 매기는 것이 불가능하며, 평균을 계산하는 것이 의미가 없다. 반면, 순서형 데이터의 경우에는 난이도와 평점과 같이 여러 가지 범주에 각각 순서가 주어져있는 것을 의미한다. 이러한 데이터는 연속적으로 분포되어 있는 수치형 데이터와 경우와 같이 정교하게 계량화하는 것은 어렵지만, 순서는 지정할 수 있다. 다시 말해, 순서형 데이터의 수치적인 정밀도는 제한적일 수밖에 없지만 각 데이터 간의 크고 작은 수량적 크기를 비교할 수 있으며, 동시에 의미적인 순서의 비교가 가능한 데이터라고 할 수 있다. 이러한 데이터에는 소형, 중형, 대형 등으로 구분되는 크기 데이터와 매우 불만족, 불만족, 보통, 만족, 매우 만족 등으로 구분되는 만족도에 관한 데이터 등이 있다.
참고 자료
데이터 모델링, 데이터스피어, SAP Business Technology platform,SAP 홈페이지, https://www.sap.com/korea/products/technology-platform/datasphere/what-is-data-modeling.htm
성과를 창출하는 데이터 품질관리 - 데이터 품질관리 시스템구축사례, 배상균, Samsung SDS, 2019, https://www.samsungsds.com/kr/insights/1232752_4627.html
데이터 품질의 개념,데이터및 AI - 솔루션, IBM, https://www.ibm.com/kr-ko/topics/what-is-data-quality
빅데이터 활용에 따른 정보 윤리 의식 함양 방안, 김항인, 2018, 윤리연구, 1(123), 135-158.
Adults’ Media Use & Attitudes report 2020, Ofcom, 2020, Ofcom, 1-19.