2019년도 2학기 보건정보데이터분석 중간과제물
먀짱
다운로드
장바구니
과제정보
학과 | 통계·데이터과학과 | 학년 | 3학년 |
---|---|---|---|
과목명 | 보건정보데이터분석 | 자료 | 3건 |
공통 |
1. 보건 빅 데이터(Health big data) 분석에 적용되는 머신러닝 방법을 설명하고국내 외 보건분야 빅데이터 활용 사례를 설명하라. (5점)
2. 보건정보지도(Health Map)에 대해 설명하고 활용예를 설명하라.(5점) 3. 환자들의 혈압...
1. 보건 빅 데이터(Health big data) 분석에 적용되는 머신러닝 방법을 설명하고국내 외 보건분야 빅데이터 활용 사례를 설명하라. (5점)
2. 보건정보지도(Health Map)에 대해 설명하고 활용예를 설명하라.(5점) 3. 환자들의 혈압을 치료 방법에 따라 군을 나누어 조사된 자료가 다음과 같을때 세 군의 분포 특징을 설명하라(5점) 4. 의료정보 고도화의 주요한 한 축인 환자중심 의료정보시스템 설명하라. (5점) 5. 흑색종(melanoma) 환자들에 대한 BCG와 CP(coryne-bacterium parvum)의 생존지속 효과를 비교하기 위한 자료로 두 그룹의 생존분포를 그래프와 함께 비교하라.(5점) 6. 다이어트 제제를 복용하기 전과 후의 혈압치가 다음과 같을 때 다이어트제제가 혈압을 낮추는지 검정하라.(5점) |
소개글
2019년도 2학기 보건정보데이터분석 중간과제물 입니다.목차
Ⅰ. 보건 빅 데이터(Health big data) 분석에 적용되는 머신러닝 방법을 설명하고 국내 외 보건분야 빅데이터 활용 사례를 설명하라. (5점)1) 보건 빅 데이터(Health big data)의 정의
2) 보건정보 빅데이터의 통계분석
3) 국내 외 보건분야 빅데이터 활용사례
Ⅱ. 보건정보지도(Health Map)에 대해 설명하고 활용예를 설명하라.(5점)
1) 보건정보지도(Health Map)의 정의
2) 보건정보지도의 활용
Ⅲ. 환자들의 혈압을 치료 방법에 따라 군을 나누어 조사된 자료가 다음과 같을 때 세 군의 분포 특징을 설명하라(5점)
Ⅳ. 의료정보 고도화의 주요한 한 축인 환자중심 의료정보시스템 설명하라. (5점)
Ⅴ. 흑색종(melanoma) 환자들에 대한 BCG와 CP(coryne-bacterium parvum)의 생존지속 효과를 비교하기 위한 자료로 두 그룹의 생존분포를 그래프와 함께 비교하라.(5점)
Ⅵ. 다이어트 제제를 복용하기 전과 후의 혈압치가 다음과 같을 때 다이어트제제가 혈압을 낮추는지 검정하라.(5점)
본문내용
1) 보건 빅 데이터(Health big data)의 정의보건 빅 데이터란 기존 데이터베이스 관리도구의 데이터 수집, 저장, 관리, 분석의 역량을 넘어서는 대량의 정형 또는 비정형 데이터의 집합 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 의미한다. 다양한 종류의 대규모 데이터의 생성, 수집, 분석, 표현을 그 특징으로 하는 빅데이터 기술의 발전은, 다변화된 현대사회를 더욱 정확하게 예측하여 효율적으로 작동하게 하고, 개인화된 사회 구성원에게 맞춤형 정보를 제공함으로써 관리, 분석을 가능하게 하며, 과거에는 불가능했던 기술을 실현시키기도 한다. 이같이 빅데이터는 정치, 사회, 경제, 문화, 과학기술 등 전 영역에 걸쳐서 사회와 인류에게 가치 있는 정보를 제공하며, 그 중요성 또한 부각되고 있다. 보건분야에서는 보건복지서비스가 공급자 중심에서 수요자 중심의 복지체제로 변화하고 보건복지 관련 데이터량이 기하급수적으로 증가하면서 빅데이터의 전형적이 형태를 갖추고 있으며, 대상이 환자를 포함한 사람이어서 효율적 관리와 활용을 통해 무한한 가치를 창출할 수 있게 된다.
2) 보건정보 빅데이터의 통계분석
- 고차원 회귀분석 및 분류방법
고차원 회귀 및 분류 방법들의 응용분야는 스팸 필터링 알고리즘이나 문자인식 알고리즘을 개발하는 데 응용될 수 있다.
(1) 라소(lasso) : 모형의 예측 성능 향상과 변수선택을 동시에 할 수 있는 기법으로 해를 찾는 효율적인 알고리즘이 중요하다. 회귀분석에서 회귀계수의 추정량을 계산하기 위해 잔차의 제곱함을 최소로 하는 최소제곱ㅂ법을 사용한다. 그러나 설명변수의 개수가 증가하면서 설명변수들 사이의 상관관계로 인한 다중공선성이 존재할 수 있기 때문에 최소제곱 회귀계수 추정량의 분산이 증가하면서 추정회귀식의 예측정확도가 떨어지는 단점이 있다.
(2) 앙상블 : 단순모형을 결합하여 고성능의 모형을 찾는 방법으로..
<중 략>