Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 |
Tags
- self driving car
- C
- Dubins Path
- autonomous vehicle
- Hybrid A star
- 강화학습
- Leetcode
- 정적라이브러리
- 경로생성
- OSQP
- 공유라이브러리
- Motion Planning
- Frenet Coordinate
- 동적라이브러리
- GNN
- C++
- MDP
- 선형대수
- CUDA
- 수치최적화
- solver
- PathPlanning
- 소프티어
- path planning
- Recursion
- DynamicProgramming
- Graph Neural Network
- 백준
- GIT
- CPP
Archives
- Today
- Total
목록강화학습 (5)
Swimmer
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/b05m7X/btrmjHrp2Du/KMREkuy1G1KkAVPb4ei2R0/img.png)
강화학습은 인공지능의 한 분야로 분류된다. 강화학습이라는 단어를 뜯어보면 강화 + 학습으로 나누어진다. 즉, 강화학습은 학습을 하는 주체가 있고, 학습을 하는 이유는 무엇인가를 강화하기 위함이라고 생각해볼 수 있다. 강화학습은 어떤 환경(Environment)에서 어떤 주체가(Agent) 최대의 보상(Reward)를 얻을 수 있도록 정책(Policy)을 학습하는 기법을 일컫는다. 여기서 환경과 주체는 현실에서 주어지는 문제이고, 보상은 개발자가 정의하는 것 그리고 정책은 주체가 보상을 받도록 하는 행동을 결정하는 기준을 말한다. 강화학습도 여타 다른 알고리즘과 같이 현실의 문제를 해결하기 위한 도구이다. 강화학습을 현실 문제를 풀 기위한 도구로 사용하는데 있어, 가장 기본 배경 개념은 Markov Dec..
개념공부/강화학습(Reinforcement Learning)
2021. 11. 27. 15:48