시계열 온라인 학습
- 최초 등록일
- 2022.05.14
- 최종 저작일
- 2022.05
- 7페이지/ MS 워드
- 가격 3,000원
소개글
"시계열 온라인 학습"에 대한 내용입니다.
목차
I. 서론
II. 본론
1. 온라인 학습
2. 오프라인 학습
3. 온라인 전문 학습 라이브러리 river
4. 드리프트
5. 드리프트 처리를 위한 알고리즘
6. 드리프트 감지 방법
7. 드리프트 감지 알고리즘
8. 적응형 학습 방법
III. 결론
IV. 참고문헌
본문내용
I. 서론
시계열 온라인 학습은 신규 데이터를 이용하여 모델을 지속적으로 업데이트 하는 방법을 말한다. 일반적으로 시계열 데이터는 스트리밍 형태로 끊임없이 수집되는 형태의 데이터이며, 이에 대응하기 위해 우리는 시계열 모형을 점진적으로 적합시키는 노력이 필요하다. 본 보고서에서는 시계열 온라인 학습에 대해서 알아보도록 하겠다.
II. 본론
1. 온라인 학습
1) 정의
- 끊임없이 들어오는 신규 데이터를 이용하여 모델을 지속적으로 업데이트 하는 방법을 말한다.
- 데이터가 유입(스트리밍)됨에 따라 모형을 점진적으로 적합시키는 방법이다.
2) 장점
- 스트리밍 데이터의 빠른 속도와 큰 규모의 특성에 대해 잘 대응할 수 있다.
- 신규로 배포된 데이터에 잘 대응할 수 있다.
3) 학습대상
- 빅데이터
- 시간제약조건
- 동적환경
4) 고려대상
- 학습대상이 시계열 데이터이다.
- 개념드리프트가 발생할 수 있다 -> 시간이 지남에 따라 기본 데이터 생성 프로세스가 변할 수 있다
- 개념드리프트에 대응하기 위해 새 데이터를 기반으로 매개변수가 지속적으로 변경되어야 한다.
5) 모델 평가방법
(1) 홀드아웃 방법
- 현재 모델을 독립적인 테스트셋에 적용하여 성능을 평가하는 방법이다.
- 배치학습뿐만 아니라 온라인 학습에서도 주로 사용하는 방법으로 불편성능 추정치를 제공한다.
(2) 프리퀀셜 평가 방법
- 시퀀스를 진행하면서 테스트한다.
- 신규로 고려되는 데이터는 테스트를 진행한 후, 훈련에 사용한다.
6) 사례
- 금융, 전자상거래, 경제, 헬스케어 분야(데이터가 동적인 분야)
7) 참고
- 강화학습과 능동학습은 모두 온라인 학습으로 분류할 수 있다.
2. 오프라인 학습
1) 정의
- 처음부터 주어진 정적 데이터셋이 있고 이를 이용하여 기계학습 알고리즘의 매개 변수를 한번에 조정하는 방법이다.
참고 자료
Auffarth(2021), Machine Learning for Time-Series with python, Packt