[2019 방통대] 정보통계학 데이터과학의 입문 출석대체 과제 (30점)
- 최초 등록일
- 2020.01.03
- 최종 저작일
- 2019.10
- 7페이지/ MS 워드
- 가격 4,000원
소개글
"[방통대] 정보통계학 데이터과학의 입문 출석대체 과제 (30점)"에 대한 내용입니다.
문과생이었다가 컴퓨터공학으로 석사 진학을 앞두고 선수과목으로 수강하였습니다 :)
첫 학기 다녔는데 과제를 모두 30점 받았어요! 과제 점수를 잘 받는 꿀팁은 현실 내용을 추가하여 응용해서 작성하는 것 같습니다. 전체 학점도 4.2점으로 수료하였어요-
보시면 많이 도움 되실거에요:)
목차
1. 데이터 분석에서 기계학습과 같은 알고리즘 접근방법이 도입된 이유를 기술하시오, 이러한 기계학습과 같은 알고리즘 접근방법의 특징을 모수적 모형 접근방법과 비교하여 약술하시오
2. 빅데이터 시대의 주요 기술 중 하나로서 더그 커팅(Doug Cutting)이 공개한 하둡(Hadoop)을 꼽을 수 있다. 하둡의 개념을 조사하여 간략하게 기술하시오.
3. 추천 시스템에 활용되는 협업필터링은 무엇인지 설명하고 이의 종류로서 어떤 기술이 있는지 기술하시오.
4. 빅데이터 시대의 도래로 우리 사회는 많은 변화를 겪고 있다. 이러한 변화로부터 비롯될 수 있는 긍정적인 영향과 부정적인 영향에 대한 자신의 견해를 기술하시오. 또한, 이와 관련한 데이터 과학자의 역할을 논하시오.
본문내용
1. 데이터 분석에서 기계학습과 같은 알고리즘 접근방법이 도입된 이유를 기술하시오, 이러한 기계학습과 같은 알고리즘 접근방법의 특징을 모수적 모형 접근방법과 비교하여 약술하시오
수 많은 데이터가 지금도 끊임없이 생산되고 있으며, 기업이나 기관들은 이런 데이터를 연구함으로써 보다 나은 경영, 보다 나은 결과를 만들어내고자 하고 있다. 데이터를 분석하는 과정에서도 이러한 흐름에 따라 다양한 분석 방법이 연구되어 왔다. 크게, 과거에는 단순 회귀분석과 같이 과거 모든 데이터로부터 분석 값을 얻는 ‘모수적 모형 접근방법’이 주로 활용되었다면 시간이 지날수록 기계학습과 같은 ‘알고리즘적 접근방법’이 도입되어 왔다.
‘알고리즘적 접근방법’이 도입된 이유는 근본적으로 ‘데이터의 복잡성’ 때문이다. 인간이기 때문에 예측에 벗어나거나 통제불가능 한 행동을 보이게 되는데, 이에 따라 생산된 데이터는 매우 복잡한 양상을 띠며, 무수한 변수가 존재하게 된다. 기존의 ‘모수적 모형 접근방법’으로는 좋은 분석 결과를 기대하기 어려워 인공지능이나 패턴인식 등에서 연구되어 온 기계학습 이론을 데이터 분석에 적용하게 된 것이다.
‘모수적 모형 접근방법’은 ‘모수적 모델’이라고도 알려졌으며 확률분포를 바탕으로 모수(Parameter)를 추정해 나가는 모델을 포함한 것이다. 가장 대표적인 예로, 선형회귀모델이 있다. 선형회귀모델은 독립(예측)변수 X와 종속(반응)변수 Y와의 관계를 Y=a+bX와 같이 모수 a와 b를 과거 데이터로부터 적합하여 직선으로 표현하는 방식이다. X의 변화에 따라 Y가 어떻게 변하게 될 것인지를 예측하게 되는데, 해석이 대체로 용이하며 결과 자체가 복잡하지 않다. 그러나, ‘모수적 모델’에서는 두 변수 사이의 랜덤성이 존재하기 때문에 결과를 100% 예측하거나 설명하기 어렵다. 가정이나 설정한 식에 부합하지 않는 데이터의 경우 결과의 정확도를 낮추게 되는 것이다. 선형회귀모델 외에도 로지스틱 회귀모형, 1차/2차 판별모델 등이 ‘모수적 모형 접근방법’에 해당된다.
참고 자료
없음