경영학에서의 데이터 분석의 정의 및 흐름 요약(성적 A+)
- 최초 등록일
- 2021.12.02
- 최종 저작일
- 2020.06
- 7페이지/ 한컴오피스
- 가격 1,000원
목차
1. 데이터의 유형에 관해 아는 것을 모두 쓰시오
2. 정형데이터 분석에 대해 아는 것을 모두 쓰시오(전처리부터 순서도 쓰자)
3. 데이터 분석 모형의 평가에 대해 아는 것을 모두 쓰시오.
4. 데이터 분석의 사이클에 대해서 아는 것을 모두 쓰시오
5. 데이터 생명주기에 대해 아는 것을 모두 쓰시오.
6. 과적합에 대해 아는 것을 모두 설명하시오
7. 파이썬에 대해 아는 것을 모두 쓰시오
8. 프로그래밍의 6원칙에 대해 아는 것을 모두 쓰시오
9. 프로그래밍 언어의 세대에 대해 설명하시오.
10. 기계학습에 필요한 라이브러리와 이의 역할
11. 기계학습에 대해 아는 것을 모두 쓰시오
12. 분류모델의 분석 방법에서의 차이
13. 의사결정 나무에 대해 아는 것을 모두 쓰시오
14. 앙상블기법에 대해 아는 것을 모두 쓰시오
본문내용
데이터의 유형에 관해 아는 것을 모두 쓰시오
- 데이터는 정형데이터와 비정형데이터 그리고 반정형데이터로 나눌 수 있다. 비정형데이터는 체계화되지 않은 데이터로 음성, 텍스트, 이미지 등의 데이터를 의미한다. 이 데이터 자체만으로는 분석을 할 수 없어서 과거 기술이 부족할 때는 이 데이터들을 활용하지 못했는데 현재는 비정형데이터를 정형데이터화해서 분석을 진행하고 있다. 반정형데이터는 비정형데이터를 정형데이터화가 절반 정도 진행된 데이터를 의미한다. 정형데이터는 구조화되고 체계적인 데이터이다. 대표적인 데이터 형태로는 테이블이 있고 대체로 숫자로 이루어져있다.
정형데이터 분석에 대해 아는 것을 모두 쓰시오(전처리부터 순서도 쓰자)
-정형데이터는 지도학습과 비지도학습으로 나눌 수 있다. 우선 비지도학습은 종속변수(출력변수, 결과변수, 목표변수)가 존재하지 않아서 데이터의 형태와 분포를 보기 위해 진행하는 것이다. 그래서 무방향성 데이터 분석이라는 이름을 가지고 있기도 하다. 이는 일반적으로 지도학습을 돌리기 이전에 데이터의 특성을 파악하고 어떤 분석 모델을 돌릴지에 대해 결정하기 위해 많이 활용한다. 대표적인 기법으로는 군집분석과 장바구니 규칙으로 알려져 있는 연관성 분석이 있다.
비지도학습을 선행한 뒤에는 지도학습을 진행하는데 이는 비지도학습과는 달리 종속변수가 존재한다. 그래서 방향성 데이터 분석이라고 불리기도 한다. 지도학습은 크게 모형 생성 단계와 스코어링 단계로 구분할 수 있다.
모형 생성 단계는 과거의 데이터로부터 정형 데이터 분석 기법을 적용하여 모형을 생성하는 단계를 의미한다. 스코어링 단계는 생성된 모형을 사용해 새로운 사례에 대해 분류 또는 추정을 수행하는 것을 의미한다.
참고 자료
없음