-
Notifications
You must be signed in to change notification settings - Fork 3
Deep Q learning
BIBI edited this page Nov 16, 2019
·
1 revision
- Q learning을 기초로 한 강화학습
- Q learning에서는 최적 행동 가치 함수로 최적인 행동을 정함
- 이러한 함수를 CNN으로 비슷하게 흉내 내어 사용하는 것이 DQN
- 비디오 게임을 자율 학습시켜 사람을 뛰어넘는 수준의 조작을 실현
- 그동안의 비디오 게임 학습에서는 게임의 상태를 미리 추출하는 것이 보통. 그러나 DQN에서는 입력 데이터는 비디오 게임의 영상 뿐.
- 게임마다 설정을 바꿀 필요 없이 단순히 DQN에 게임 영상을 보여주기만 하면 됨
- 팩맨, 아타리와 같은 게임에서 뛰어난 성적을 보임