총 2개
-
DQN과 A2C network를 활용한 CartPole 강화학습 훈련과정 및 code2025.01.131. CartPole environment OpenAI gym의 CartPole은 카트 위에 막대기가 고정되어 있고 막대기는 중력에 의해 바닥을 향해 자연적으로 기울게 되는 환경을 제공한다. CartPole의 목적은 카트를 좌, 우로 움직이며 막대기가 기울지 않고 서 있을 수 있도록 유지시켜 주는 것이 목적인데, 강화 학습 알고리즘을 이용하여 막대기를 세울 수 있는 방법을 소프트웨어 에이전트가 스스로 학습할 수 있도록 한다. 2. DQN algorithm Deep Q-Network는 state-action value Q값을 Deep...2025.01.13
-
화학공학을 위한 머신러닝과 딥러닝 기본이론2025.11.181. 지도학습 알고리즘 나이브 베이즈 분류, 선형판별분석, K-최근접 이웃, 서포트 벡터 머신, 랜덤 포레스트, 그레디언트 부스트, 신경망 등의 지도학습 알고리즘들을 다룬다. 이들은 정답이 있는 데이터를 활용하여 분류와 회귀 문제를 해결하는 기계학습 기법이다. 각 알고리즘은 서로 다른 수학적 원리와 최적화 방법을 기반으로 하며, 화학안전 분야에 적용하기 위해서는 선형대수학, 미분적분학 등의 기초 수학 이해가 필수적이다. 2. 비지도학습 및 군집화 K-평균 군집화, 계층적 군집화, 밀도 기반 클러스터링(DBSCAN) 등의 비지도학습 ...2025.11.18
