AI/RL

[Markov Decision Process - 3] MDP의 종류

pipes0512 2024. 4. 22. 19:11

Finite vs Infinite

Finite Markov decision process
: State / Action / Rewards 가 모두 유한하다.
- ex : 5x5 미로 - 위치 state가 25개 / 4개(상하좌우)의 action / single reward
Infinite Markov decision process
: State / Action / Rewards 중 하나라도 무한하다면 Infinite Markove decision process 이다.
- 연속적 값의 경우 가능한 값이 무한하다.
- ex : 자동차 운전 - state : 자동차의 위치, 속력(infinite)

Episodic vs Continuing

Episodic Markov decision process
: 특정 조건에서 종료되는 MDP이다.
- ex : 체크메이트를 하거나/당했을 경우 종료
Continuing Markov decision process
: no certain conditions - keep going

'AI > RL' 카테고리의 다른 글

[Dynamic Programming - 2] Value Iteration (0)	2024.04.22
[Dynamic Programming - 1] Intro (0)	2024.04.22
[Markov Decision Process - 4] Bellman Equation (0)	2024.04.22
[Markov Decision Process - 2] MDP에 대한 이해와 특성 (0)	2024.04.22
[Markov Decision Process - 1] 용어 정리 (0)	2024.04.22

현재글[Markov Decision Process - 3] MDP의 종류

Today :
Yesterday :

티스토리툴바