[2014 : 방통대 보건정보데이터분석] Health Big data의 정의와 출연배경, 특징 / 상대위험도 / 반복측정분산분석(ANOVA)
*혜*
다운로드
장바구니
과제정보
학과 | 통계·데이터과학과 | 학년 | 3학년 |
---|---|---|---|
과목명 | 보건정보데이터분석 | 자료 | 1건 |
공통 |
1. Health Big data이 정의와 출연배경, 특징을 설명하고 Health Big data를 분석 처리하기 위한 방법과 기술을 설명하라. (10점)
2. 다음과 같은 상대위험도가 산출되었을 때 결과를 해석하라. 또한 인종별(A,B)로 구별한 경과를 ...
1. Health Big data이 정의와 출연배경, 특징을 설명하고 Health Big data를 분석 처리하기 위한 방법과 기술을 설명하라. (10점)
2. 다음과 같은 상대위험도가 산출되었을 때 결과를 해석하라. 또한 인종별(A,B)로 구별한 경과를 분석하고 전체적으로 시사점을 설명하라. (10점) 3. 다음의 주어진 자료를 반복측정 분산분석(Repeated measure ANOVA)을 실시하고 해석하라. (10점) |
소개글
2014 한국방송통신대학교 보건정보데이터분석 중간과제물문제 :
1. Health Big data의 정의와 출연배경, 특징을 설명하고 Health Big data를 분석처리하기 위한 방법과 기술을 설명하라. (10점)
2. 다음과 같은 상대위험도가 산출되었을 때 결과를 해석하라. 또한 인종별(A,B)로 구별한 경과를 분석하고 전체적으로 시사점을 설명하라. (10점)
3. 다음의 주어진 자료를 반복측정분산분석(Repeated measure ANOVA)을 실시하고 해석하라. (10점)
* 참고문헌 및 참고자료를 명시하였습니다.
* 성실하게 작성하여 만점 받은 레포트입니다.
과제물 작성 시, 참고하시면 좋을 것 같습니다.
목차
Ⅰ. 보건의료 빅데이터(Heath Big Data)․1. 보건의료 빅데이터(Health Big data)의 정의 및 출연배경
2. 보건의료 빅데이터(Health Big data)의 특징
3. 보건의료 빅데이터(Health Big data)의 분석처리 기술
1) 텍스트 마이닝
2) 소셜네트워크 분석
3) 군집분석
Ⅱ. 상대위험도(Relative Risk)
1. 상대위험도 산출결과의 해석
2. 인종 별 경과 분석 및 시사점
Ⅲ. 반복측정분산분석(Repeated measure ANOVA) 결과 및 해석
참고자료
본문내용
1. 보건의료 빅데이터(Health Big data)의 정의 및 출연배경디지털 사회에서 소비자들은 PC, 스마트폰, 태블릿, IPTV, 그리고 웨어러블(wearable)컴퓨터에 이르기까지 다양한 멀티스크린으로부터 정보와 서비스를 이용하는 디지털생활을 영위하고 있다. 디지털 생활의 일상화로 인해 우리를 에워싼 데이터의 양이 폭증하였고, 이러한 현상이 데이터의 생산, 유통 및 소비 체계에 큰 변화를 주면서 데이터가 곧 경제적 자산이자 힘이 될 수 있는 빅데이터(Big Data) 시대가 도래하였다. 빅데이터에 관한 많은 정의들이 있지만, 일반적으로 빅데이터란 기존 데이터베이스 관리도구의 데이터 수집·저장·관리·분석의 역량을 넘어서는 대량의 정형 또는 비정형 데이터 집합 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 의미한다. 빅데이터 시대에서 정보통신기술이 여타 다른 산업들과 융·복합되며 방대한 양의 데이터들이 생산되고 있는 가운데 사회변화에 따른 삶의 질에 대한 욕구 및 현안 해결에 있어 빅데이터의 활용은 매우 중요한 과제로 떠오르고 있다.
<중략>
군집분석은 비슷한 특성을 가진 개체를 합쳐가면서 최종적으로 유사 특성의 군집을 발굴하는 데 사용된다. 수많은 데이터 중 유사성이 많은 것만을 모음으로써 그룹 내에서는 단위의 동질성을 극대화하고, 서로 다른 그룹 간에는 그 차이(이질성)를 극대화 시키는 것을말한다.
군집분석 기법의 대표적인 것으로는 두 가지가 있다. 첫째로 비계층적(non-hierarchical) 기법은 N개의 구성인자를 M개의 클러스터로 분류하는 것이다. K-평균알고리즘(K-means algorithm)이 대표적인데, 여기서는 주어진 데이터를 k개의 클러스터로 묶으면서 각 클러스터와 거리 차이의 분산을 최소화하는 방식으로 동작한다.
<중략>
반복측정(Repeated measurements)은 동일한 실험 단위에 대해 여러 번의 측정을 하는 것으로, 보건의료 분야에서는 임상실험 등의 경우에 자주 일어난다. 이처럼 동일한 실험 단위에 대해 반복적으로 측정된 자료를 분석하는 유용한 도구로, 반복측정분산분석(Repeated measure ANOVA)이 활용된다. 본 장에서는 제시된 자료를R프로그램을 활용하여 결과를 출력하고, 그 결과를 분석하도록 한다.
참고 자료
이태림·이재원·김주한·장대흥(2014),『보건정보데이터분석』, 한국방송통신대학교출판문화원, 제1장송영조(2013), 「빅데이터의 진화:스마트데이터」, 한국정보화진흥원, p.2
송태민(2013), 「보건복지 빅 데이터 효율적 활용방안」, 한국컴퓨터정보학회지, p.1
김지현·김흥·손광은·송윤수(2013),「빅데이터의 의학적 활용」, 서울대학교 정보과학회지, p.2
특허청·보건복지부(2013), 「보건의료부문 빅데이터 특허동향」, p.3
조성우(2011), 「Big data 시대의 기술」, KT종합기술원, p.5~7
송태민(2014), 「소셜빅데이터를 활용한 사회위험요인 예측:청소년 자살과 사이버 따돌림을 중심으로」, 한국보건사회연구원, p.2