BRONZE
BRONZE 등급의 판매자 자료

DQN과 A2C network를 활용한 CartPole 강화학습 훈련과정 및 code

DQN과 A2C network를 사용하여 Cartpole을 강화학습으로 훈련하는 과정과 코드가 담겨있는 레포트입니다.
16 페이지
어도비 PDF
최초등록일 2024.04.06 최종저작일 2021.05
16P 미리보기
DQN과 A2C network를 활용한 CartPole 강화학습 훈련과정 및 code
  • 미리보기

    소개

    DQN과 A2C network를 사용하여 Cartpole을 강화학습으로 훈련하는 과정과 코드가 담겨있는 레포트입니다.

    목차

    01 Cartpole environment
    02 DQN algorithm & code
    03 A2C algorithm & code

    본문내용

    OpenAI gym의 CartPole은 카트 위에 막대기가 고정되어 있고 막대기는 중력에 의해 바닥을 향해 자연적으로 기울게 되는 환경을 제공한다. CartPole의 목적은 카트를 좌, 우로 움직이며 막대기가 기울지 않고 서 있을 수 있도록 유지시켜 주는 것이 목적인데, 강화 학습 알고리즘을 이용하여 막대기를 세울 수 있는 방법을 소프트웨어 에이전트가 스스로 학습할 수 있도록 한다. 다음은 CartPole 환경에서 사용되는 observation, action, reward, episode의 시작과 종료에 대한 설명이다.
    Observation: cart의 현재 위치, cart의 속도, pole의 기울기, pole의 속도를 의미한다. Action: 오른쪽(1) 또는 왼쪽(0) reward: 매 타임스텝마다 +1씩 보상을 받는다. Episode Termination: 막대가 중심에서 2.4deg이상 기울어지거나, 멀리 떨어지면 종료된다.
    step function을 통해 랜덤한 움직임에 대한 action을 한번 수행하고, action이 실행된 이후의 상태(observation)와, 보상(reward), 막대가 쓰러졌는지의 여부(done) 등의 정보가 반환된다.
    Code:
    코드는 제가 직접 작성한 것이 아님을 밝힙니다. 산업정보시스템전공 딥러닝 수업을 듣고 프로젝트도 수행했던터라 딥러닝과 강화학습을 조합한 알고리즘에 자연스럽게 관심이 생겼습니다. 따라서 실제 구현된 DQN network와 A2C(Advantage Actor-Critic) network의 코드를 실행시키고 분석했습니다.

    참고자료

    · 없음
  • AI와 토픽 톺아보기

  • 자료후기

      Ai 리뷰
      OpenAI Gym의 CartPole-v0 환경에서 DQN 및 A2C 알고리즘을 구현하고 성능을 평가한 내용입니다. 강화 학습 알고리즘의 원리와 구현 과정, 실험 결과를 자세히 설명하고 있습니다.
    • 자주묻는질문의 답변을 확인해 주세요

      해피캠퍼스 FAQ 더보기

      꼭 알아주세요

      • 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
        자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
        저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
      • 해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.
        파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
        파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우
    문서 초안을 생성해주는 EasyAI
    안녕하세요. 해피캠퍼스의 방대한 자료 중에서 선별하여 당신만의 초안을 만들어주는 EasyAI 입니다.
    저는 아래와 같이 작업을 도와드립니다.
    - 주제만 입력하면 목차부터 본문내용까지 자동 생성해 드립니다.
    - 장문의 콘텐츠를 쉽고 빠르게 작성해 드립니다.
    - 스토어에서 무료 캐시를 계정별로 1회 발급 받을 수 있습니다. 지금 바로 체험해 보세요!
    이런 주제들을 입력해 보세요.
    - 유아에게 적합한 문학작품의 기준과 특성
    - 한국인의 가치관 중에서 정신적 가치관을 이루는 것들을 문화적 문법으로 정리하고, 현대한국사회에서 일어나는 사건과 사고를 비교하여 자신의 의견으로 기술하세요
    - 작별인사 독후감
    해캠 AI 챗봇과 대화하기
    챗봇으로 간편하게 상담해보세요.
    2025년 08월 05일 화요일
    AI 챗봇
    안녕하세요. 해피캠퍼스 AI 챗봇입니다. 무엇이 궁금하신가요?
    4:25 오전