ADsP 기출 복원
- 최초 등록일
- 2022.03.13
- 최종 저작일
- 2021.07
- 10페이지/ MS 워드
- 가격 2,000원
목차
없음
본문내용
1. 데이터 분석 기반 가치창출
- 도메인과 데이터 이해, 해당 비즈니스에 맞는 분석 모델 개발
- 입력되는 데이터의 정합성, 충실성이 중요
- 실제 비즈니스에 적용하고 에러를 확인한 후에 지속적으로 분석모델을 변경하거나 관리 해야함
2. 효과적 분석 모델 개발 시 고려사항
- 데이터 품질을 분석하여 이상치, 결측치를 처리하고 분석을 수행
- 수행이유가 예측값인지 설명인지에 따라 분석 모델은 달라짐
- 입력변수의 종류를 확인하고 변수들 간에 다중공선성 문제가 있는 경우 변수를 제거하거나 축소해야함
3. 빅 데이터의 정의
- 정형, 반정형, 비정형 데이터를 빅데이터에 저장하여 데이터를 빠르게 분석
- 분산처리 기술을 통해서 과거에 분석할 수 없었던 데이터 분석 가능해짐
- 패이스북, 트위터 등의 텍스트 데이터로 분석을 통해서 평판정보를 획득할 수 있고 이러한 sns데이터를 저장, 분석 가능
- ** 분산처리 기술은 대규모 데이터를 여러개의 스토리지에 분리해서 저장하고 병렬적으로 작업을 처리해서 데이터 처리 속도를 향상 시키는 방법임, 작은 규모의 데이터는 분산처리를 할 필요가 없으므로 하나의 중앙중심형 데이터베이스로 처리
4. 데이터 가치
- 데이터를 정보화, 데이터 정보의 지식화로 가치를 증가시킴
5. 다각적 분석 차원에서의 데이터 사이언티스트의 역량
- 수학, 통계학, 경제학, 심리학, 공학, 의사소통, 가시화 능력
6. 머신러닝 학습방법
- 자율학습(설명) : 연관규칙, 군집분석, 비정형, 요약 -> 군집분석, K-means, SOM, 연관규칙 분석
- 지도학습(예측) : 추정, 분류, 회귀분석, 시계열분석 -> 다중회귀, KNN(K인접기법), 의사결정나무(분류나무[범주형], 회귀나무[연속변수]), 랜덤포레스트(앙상블), SVM, 나이브베이즈필터, 주성분분석(PCA), 신경망
7. 빅데이터 활용 시 필요한 요소
- 데이터, 기술, 인력
8. 데이터 베이스의 종류 중 복잡한 데이터 구조를 표현 및 관리하는 DBMS의 종류
참고 자료
없음