가우시안 프로세스 모델 기반 강화 학습

저작시기 2019.08 |등록일 2019.08.14 파일확장자어도비 PDF (pdf) | 6페이지 | 가격 6,000원
다운로드
장바구니관심자료
상세신규 배너

* 본 문서는 배포용으로 복사 및 편집이 불가합니다.

서지정보

발행기관 : 제어로봇시스템학회 수록지정보 : 제어로봇시스템학회 논문지 / 25권 / 8호
저자명 : 유재현

목차

Abstract
I. 서론
II. 가우시안 프로세스 모델 기반 강화 학습
III. 이차 비용 함수와 선형 궤환 제어기
IV. 시뮬레이션
V. 결론
REFERENCES

영어 초록

Reinforcement learning (RL) has been a promising approach in robotics and control because data-driven learning methods can reduce system reliance on human engineering knowledge. A model-based RL autonomously learns observed dynamics based on a general flexible nonparametric approach. Probabilistic Inference for Learning COntrol (PILCO) is one of the most data-efficient model-based RL frameworks. Since PILCO sets up a Bayesian estimator problem with a Gaussian process regression, it derives a fully deterministic approximate inference for policy evaluation, which makes it computationally efficient. However, PILCO requires a task-specific scenario. If an agent is given a new goal that is different than the original training goal, PILCO should relearn its model from scratch. This paper extends PILCO to tune a linear feedback controller with a quadratic cost function, where the quadratic cost function commonly used in control systems can adjust the trade-off relationship between control input consumption and convergence rate. The suggested method is not only able to maintain the analytic and deterministic approximate inference for policy evaluation, but is also able to interpret the controller design. The suggested RL framework is applied to the control of a small quadrotor unmanned aerial vehicle (UAV) with no given dynamics. The simulation results show the convergence of the learning control performance as a function of the number of RL iterations.

참고 자료

없음
  • 구매평가(0)
  • 구매문의(0)
      최근 구매한 회원 학교정보 보기
      1. 최근 2주간 다운받은 회원수와 학교정보이며
         구매한 본인의 구매정보도 함께 표시됩니다.
      2. 매시 정각마다 업데이트 됩니다. (02:00 ~ 21:00)
      3. 구매자의 학교정보가 없는 경우 기타로 표시됩니다.
      4. 지식포인트 보유 시 지식포인트가 차감되며
         미보유 시 아이디당 1일 3회만 제공됩니다.
      상세하단 배너
      우수 콘텐츠 서비스 품질인증 획득
      최근 본 자료더보기
      상세우측 배너
      상세우측 배너
      상세우측 배너
      가우시안 프로세스 모델 기반 강화 학습
      페이지
      만족도 조사

      페이지 사용에 불편하신 점이 있으십니까?

      의견 보내기