데이터과학자는 윤리적 소명의식을 가지고 데이터를 취급할 필요가 있다. 데이터과학자의 역할은 단순히 데이터를 분석하고 그것에서 규칙과 의미를 찾는 것에 그치지 않는다. ... 아울러, 데이터과학자가 빅데이터를 통해 도출한 알고리즘이나 규칙은 인류에 미치는 영향력이 크기 때문에 신중해야 한다. ... 데이터과학자는 자신이 다루고자 하는 데이터가 어떻게 형성되었는지 인지해야 될 뿐만 아니라 수집의 방식도 윤리적으로 구성해야 될 책임이 있다.
누적데이터는 14개임. ... B지역의 경우 중앙값은 1200대에 있으며, 900부터 1100까지 누적데이터는 15개이고, 1300부터 2000까지의 누적데이터는 13개임. ... 출석수업 과제물(평가결과물) 표지(온라인제출용) 교과목명 : 엑셀데이터분석 학 번 : 성 명 : 강 의 실 : 연 락 처 : _______________________________
0 2 > data$X1 data$X2 library(rpart) > data.c data.t print(data.t) n= 39 node), split, n, loss, yval, ... ___________________________________________ 데이터마이닝은 데이터에서 의미를 추출하는 기법을 의미하며, 모수적 모형 접근 방법과 알고리즘 접근 방법이 ... 해석이 대체로 용이하며, 결과가 복잡하지 않음 데이터 복잡성이 높아도 적용이 가능함 단점 가정이나 설정한 식에 부함하지 않는 데이터의 경우, 정확도 등의 성능이 낮을 수 있음 알고리즘의
런던 콜레라지도(교재 p.4)를 조사하고 데이터 시각화의 필요성을 설명하시오. ... 이렇듯 데이터 시각화는 방대한 자료를 한눈에 파악하기 쉽게 요약해주는 것을 넘어 숨어 있던 새로운 정보를 찾아내는 도구가 된다.2. ... 아름답고 의미 있는 데이터 시각화 사례를 발굴하고 그 이유를 정리하시오. 워싱턴 포스트에서 성별이 급여에 미치는 영향을 시각화한 기사를 냈다.
질의어(query): 사용자가 DBMS를 조작할 수 있도록 만들어진 자연어 형태의 명렁어이다.(4) 스키마(schema): 메타데이터라고도 하며, 데이터베이스를 구성하는 데이터 레코드의 ... 크기, 키의 정의, 레코드 간의 관계 등 데이터베이스의 구조 및 조건을 정의한 것을 말한다. ... 물리적인 개체이든 개념적인 개체이든 데이터를 갖고 있는 개체는 하나 이상의 속성(애트리뷰트)을 갖는다.
1. 다음은 두 명의 볼링 선수가 10회 게임을 하여 그 점수를 기록한 것이다.(1) 각 선수의 점수에 대한 기술통계량을 구하여 두 선수의 점수를 비교하시오. - 선수 A와 선수 B 모두 중앙값 175로 같고, 평균도 비슷하나 선수 A는 B에 비해 분산과 표준편차가 크..
교과목명 : 데이터과학개론 ? 학번 : ? 성명 : ? 강의실 : ? ... 그동안 항상 업무를 하면서 특히 data를 관리하고 그것을 바탕으로 계획을 수립하고 관리에 있어 특히 위에 언급한 주요덕목이 매우중요하다는 생각을 하였읍니다. ... 데이터과학가 주도적인 역할을 수행하기 위해 요구되는 사항은 단순히 지식이나 기술적 측면에만 국한되지 않는다 교재에서는 데이터 주도권을 지니기 위해서 갖추어야 할 소양 5가를 제시하고
알고리즘 접근방법은 알고리즘에 의해 정해진 방식을 가지고 데이터를 학습하고 예측하는 것이 다. ... 정해진 분포나 가정을 통해 데이터를 분석하며, 모형의 복잡성보다는 단순성을 추구하며 신뢰도가 중요하다. ... 데이터가 복잡해도 적용 가능하며, 연구자가 미처 인식하지 못한 패턴도 뽑아낼 수 있어 정확 도가 높다.
교재 14쪽의 예제 1.1에 제시된 과정을 따라 엑셀을 활용하여 다음 그래프를 작성하시오. 필요한 통계정보는 KOSIS에서 찾아서 활용하시오.(1) 1990년부터 2019년까지의 연도별 전국 총출생성비를 시계열도표로 나타내고 경향을 설명하시오- 출생 성비는 여자아이 ..
1. 엑셀 함수를 이용해서 다음의 확률 값을 구하여라. (10점)(1) 5개 중 하나를 택하는 선다형 문제가 20문항 있는 시험에서 랜덤하게 답을 써넣는 경우에 다음 물음에 답하여라.① 정답이 하나도 없을 확률은 얼마인가? =BINOM.DIST(0,20,0.2,0)=0..
다음은 흡연과 폐암의 관계를 알아보기 위해, 폐암에 걸린 사람 100명과 그렇지 않은 사람을 각각 100명씩 조사한 사례-대조군 연구(case-control study)의 데이터이다.폐암 ... 정상흡연 70 40흡연 안함 30 60(1) 오즈비(Odds ratio)를 구하시오. (5점)OR = (70*60)/(40*30)=3.5(2) 이 데이터를 이용해서 상대위험률(relative
먼저, 범주형 데이터는 영문 Categorical Data에서도 알 수 있듯이, 데이터 간 겹치지 않는 데이터를 의미한다. ... 출석수업 과제물(평가결과물) 표지(온라인제출용) 교과목명 : 데이터과학개론 학 번 : 성 명 : 강 의 실 : 연 락 처 : 과제 1번. ... 시장의 니즈가 무엇인지, 어떤 마케팅 전략을 펼칠지 등 마케팅 관련 업무에 도움이 되고자 데이터과학을 공부하기 시작했다.
주어진 데이터를 퀵 정렬 하시오. ... 정렬 알고리즘에서 정렬이란 여러 데이터로 구성된 리스트에서 값의 크기 순서에 따라 데이터를 재배치하는 것이다. ... 외부 정렬은 입력의 크기가 주기억장치 용량보다 클 때 모든 데이터를 보조기억장치에 저장하여 그 중 일부 데이터를 반복적으로 주기억장치로 읽어 들여서 정렬하는 방식이다.
것과 같이 현재 우리가 살아가는 시대는 이른바 빅데이터(Big Data)시대로 진입한 것이다. ... 과목명: 빅데이터의 이해 주제: 1. 다음을 설명하시오.(6점) (1) 데이터과학자의 소프트스킬과 하드스킬 (2) 빅데이터 2. ... 데이터과학자가 필요로 하는 스킬 1) 하드 스킬 2) 소프트 스킬 3) 하드 스킬과 소프트 스킬 2. 빅데이터 1) 빅데이터의 개념 2) 빅데이터 특징 3.
“데이터 품질(Data Quality)”이란 “데이터의 최신성, 정확성, 상호연계성 등을 확보하여 이를 사용자에게 유용한 가치를 줄 수 있는 수준”으로 정의한다. ... 뿐만 아니라 이러한 데이터의 활용으로 인한 긍정적?부정적 파급효과까지 예측해야한다. 즉, 데이터 주도권이란 데이터과학자로서 가져야할 태도이자 책무이다. ... 민간영역에서는 특히 의료영역에서 데이터 품질의 중요성이 커지게 되면서 많은 연구와 자본이 투자되고 있다. 1) 데이터과학개론(장영재)
과제명 : 엑셀데이터분석 기말과제 [1번] (1) X~B(20,0.2) 일 때, 문제 1번의 풀이는 아래와 같다. ... 교과목명 : 엑셀데이터분석 ? 학번 : ? 성명 : ? 연락처 : ? 평가유형 : 과제물형 (과제물형, 주관식형, 혼합형(과제물+주관식) 중 해당 유형 표기) ? ... 단순 회귀모형 적합, 모형 비교, 분석 ▲ ( Y 를 반응변수로 하고, X_1 을 독립변수로 한 단순회귀모형) 우선 Y 를 반응변수로 하고, X_1 을 독립변수로 한 단순회귀모형을 데이터분석
데이터과학데이터과학(data science)이란, 데이터 마이닝(Data Mining)과 유사하게 정형, 비정형 형태를 포함한 다양한 데이터로부터 지식과 인사이트를 추출하는데 ... 이 글에서 데이터과학, 빅데이터의 개념과 실제로 오픈소스를 활용한 트렌드 분석, 실제 기업,정부의 빅데이터 활용 사례에 대해 다루었다. Ⅱ. 데이터과학, 빅데이터1. ... 데이터과학은 데이터를 통해 실제 현상을 이해하고 분석하는데 통계학, 데이터 분석, 기계학습과 연관된 방법론을 통합하는 개념으로 정의되기도 한다. - 중략 -
시저 로저스 테라데이타 애스터 사업부 수석 마케팅 이사는 빅데이터와 데이터를 나누는 지표로 ‘하둡’을 내세웠다. ... 최근 인공지능의 발전은 데이터과학의 미래에 대해 많은 논쟁을 불러일으키고 있다. ... 데이터과학입문 정보1 목차 1. 빅데이터의 특징을 기존 데이터와 비교하여 설명하시오. (10점) 2. 네플릭스의 추천서비스와 관련한 원리로 협업필터링을 꼽을 수 있다.