[서평] 빅데이터의 이해 워크북
- 최초 등록일
- 2016.09.07
- 최종 저작일
- 2016.09
- 3페이지/ MS 워드
- 가격 1,000원
- 10,000원
- 100 page
- PDF 파일
- 상세 보기
소개글
빅데이터의 이해 워크북
이긍희 편저. 한국방송통신대학교출판문화 2014년 7월 25일 초판
서평입니다
목차
1. 용어
2. 흐름
3. 결론
본문내용
78쪽 용어해설이다.
<고차원 회귀분석은 회귀모형에서 설명변수의 수가 데이터의 수보다 큰 경우를 지칭>
변수가 데이터보다 많을 수가 있을까? 빅 데이터에서는 가능하다.
빅데이터는 레코드(행)이 늘어나는 것이 아니라 칼럼(횡)이 늘어난다.
행렬을 값으로 채우는 것이 아니라 없는 것은 없는 대로 둔다. 그러니 변수(칼럼)가 데이터(레코드)보다 많아 질 수 있는 것이다.
변수가 많으니 변수를 선택해야 한다. 선택하는 과정이 또 다른 변수로 작동하게되어 추정 결과가 불안정하고 회귀 모형의 예측력이 저하된다. 이를 해결하기 위한 것이 벌점화 방법이다. 벌점화는 분산을 크게 줄인다.
타겟군이 경영학, 통계학, 컴퓨터 과학 학생이다.
살짝 애매해졌다. 통계학을 기본으로 하는 학생은 어렵지 않게 이해할 수 있겠다. 하지만 다른 학과 학생은 통계학의 기초가 부족하여 이해가 힘들다.
평이하게 설명할 수 있었으면 더 나았겠다는 생각이 든다.
용어를 쉽게 이해시켰으면 한다. 티칭(teaching)과 연구(reserach)가 다른 포인트가 그것이라 생각한다.
연구는 동료를 대상으로 설득하는 것이고 티칭은 초심자를 대상으로 이야기를 거는 것이다.
참고 자료
없음