Finite vs Infinite
- Finite Markov decision process
: State / Action / Rewards 가 모두 유한하다.- ex : 5x5 미로 - 위치 state가 25개 / 4개(상하좌우)의 action / single reward
- Infinite Markov decision process
: State / Action / Rewards 중 하나라도 무한하다면 Infinite Markove decision process 이다.- 연속적 값의 경우 가능한 값이 무한하다.
- ex : 자동차 운전 - state : 자동차의 위치, 속력(infinite)
Episodic vs Continuing
-
Episodic Markov decision process: 특정 조건에서 종료되는 MDP이다.
- ex : 체크메이트를 하거나/당했을 경우 종료
- Continuing Markov decision process
: no certain conditions - keep going
'AI > RL' 카테고리의 다른 글
| [Dynamic Programming - 2] Value Iteration (0) | 2024.04.22 |
|---|---|
| [Dynamic Programming - 1] Intro (0) | 2024.04.22 |
| [Markov Decision Process - 4] Bellman Equation (0) | 2024.04.22 |
| [Markov Decision Process - 2] MDP에 대한 이해와 특성 (0) | 2024.04.22 |
| [Markov Decision Process - 1] 용어 정리 (0) | 2024.04.22 |