미래전망기술보고서 Deep Reinforcement Learning (심층강화학습)
- 최초 등록일
- 2018.04.11
- 최종 저작일
- 2018.03
- 15페이지/ MS 워드
- 가격 4,000원
목차
1. 서론
2. 심층강화학습
2.1 시작하기에 앞서
2.2 머신러닝
2.3 인공신경망의 원리
2.4 DQN(Deep-Q-Network)
3. 심층강화학습 활용사례
3.1 강화학습 예시 – NC soft 사의 GAME AI
3.2 딥러닝 예시 – 자율주행차
3.3 심층강화학습의 예시 – 구글 딥마인드의 알파고
4. 의의
4.1 딥 러닝의 장점
4.2 딥 러닝의 한계점
4.3 사회적효과
4.4 미래 직업의 변화
5. 참고한 사이트
본문내용
1. 서론
심층강화학습 기술은 분명 아직 우리에게 낯선 기술이다. 실제로 자료를 찾으려고 해도 그리 많지 않은 자료에 어려움을 겪기도 했다. 하지만, 세계적인 IT 자문기관인 ‘가트너(Gartner)’의 여러 자료들 중 주목 받고 있고, 교수님께서 올려주시기도 하신 ‘신기술 하이프 사이클 보고서’에서 심층강화학습 기술은 당당하게 소개되어있다. 이 보고서는 향후 5~10년간 높은 경쟁 우위를 제공할 것이 예상되는 일련의 기술들에 중점을 두고 있는데, 기술 업계의 다양한 관계자들에게 신기술 포트폴리오 구축 시 고려해야 할 기술과 동향에 대한 업계 전반적인 관점을 전달하고 있다. 보고서의 신기술 하이프 사이클에서 Deep reinforcement learning, 즉 심층강화학습 기술을 보면 Innovation trigger, 기술의 태동 시기, 상용화 제품이 없고 사업적 가치가 증명되지 않은 상태라고 한다. 하지만, ‘가트너’는 심층강화학습 기술을 AI를 활용하고자 하는 기업에게 권장하고 있으며, 5년에서 10년 사이에 안정기에 접어들 것으로 분석하고 있다. 이처럼 우리가 바라보는 시선과는 사뭇 다른 생각이 드러나있었다.
‘가트너’뿐만 아니라 ‘딥 마인드(Deep mind)’의 공동 창업자이자 CEO이며, 이미 사람들에게 잘 알려진 알파고의 핵심개발자이며, 인공지능 프로그래머인 ‘데미스 하사비스(Demis Hassabis)’ 또한 심층강화학습기술에 대해서 언급을 하였다. 작년 3월, ‘카이스트(KAIST)’에서 그는 ‘인공지능과 미래’를 주제로 강연을 하였는데, 그는 청중들에게 심층강화학습에 대해서 소개하였다. 먼저 심층강화학습의 접근 방법은 다양한 스케일의 문제에 강화학습알고리즘을 적용시킬 수 있게 해준다고 하며, 심층강화학습에서는 ‘딥러닝(Deep Learning)’과 ‘강화학습(Reinforcement Learning)’이 더해져서 딥러닝이 인지하는 절차를 밟고, 강화학습이 결정을 내려 실행에 옮긴다고 하였다. 그리고 그는 심층강화학습을 적용한 모습을 2가지의 게임영상으로 보여주었다.
참고 자료
http://www.itcle.com/2017/08/18/%EA%B0%80%ED%8A%B8%EB%84%88-%EC%8B%A0%ED%9D%A5%EA%B8%B0%EC%88%A0-%ED%95%98%EC%9D%B4%ED%94%84-%EC%82%AC%EC%9D%B4%ED%81%B4-2017%EB%85%84%EC%97%90-%EC%B5%9C%EC%B4%88%EB%A1%9C-5g%EC%99%80-%EB%94%A5/
https://youtu.be/enuDQJhrq8M (영상참조)
성상훈, 「구글 알파고, 이세돌에게 도전한 진짜 이유」, 『아이뉴스24』, 2016.03.08.(http://m.inews24.com/v/946246#imadnews)
https://www.youtube.com/watch?v=SuoouILpjDo&feature=youtu.be (영상참조)
https://www.youtube.com/watch?v=eG1Ed8PTJ18 (영상참조)
https://www.youtube.com/watch?v=4cBkGaj1S3Q (영상참조)
http://www.igloosec.co.kr
http://www.jipyeong.or.kr
http://www.bioin.or.kr
http://www.itworld.co.kr/news/103683