1. 강화학습 구성요소

통도사
개인인증판매자스토어
최초 등록일
2019.10.20
최종 저작일
2019.10
2페이지/한글파일 한컴오피스
가격 300원 할인쿠폰받기
다운로드
장바구니

* 본 문서(hwp)가 작성된 한글 프로그램 버전보다 이용하시는 한글프로그램 버전이 낮은 경우에는 문서가 올바르게 표시되지 않을 수 있습니다. 이 경우에는 한글 뷰어 프로그램 또는 상위버전 으로 확인하여 주시기 바랍니다.

목차

I. 강화학습 구성요소
II. 참고문헌

본문내용

I. 강화학습 구성요소
1. 상태(State)
- 현재 상황을 나타내는 정보
- 에이전트가 관찰할 수 있는 상태의 집합(시간에 따라 변함)
- 예) 에이전트가 탁구를 치려면 탁구공의 위치, 속도, 가속도와 같은 정보가 필요

2. Episode
- 에피소드 : 처음 상태부터 마지막 상태까지를 나열한 것
- 예) S(0), S(1), S(2), ..., S(t-1), S(t)

3. 행동(Action)
- 에이전트가 할 수 있는 활동의 집합
- 행동 a에 대해 모두 상태 s’로 가는 것은 아니다.
- 상태 변환확률에 따라 다음 상태가 결정된다.
- 행동에는 연속, 이산형 행동이 존재한다.
- 예) 시간 t에 취한 활동 : A(t)=a

참고 자료

이원웅(2018), 가깝고도 먼 DeepRL
통도사
판매자 유형Gold개인인증

주의사항

저작권 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

찾던 자료가 아닌가요?아래 자료들 중 찾던 자료가 있는지 확인해보세요

더보기
최근 본 자료더보기
  • 프레시홍 - 전복
  • 프레시홍-홍어
  •  '가슴이 떨리는 건 너 때문' 시사회 초대 이벤트
  • 릴레이이벤트
1. 강화학습 구성요소