Deep Q learning

Jump to bottom

BIBI edited this page Nov 16, 2019 · 1 revision

Deep Q-Network(DQN)

Q learning을 기초로 한 강화학습
Q learning에서는 최적 행동 가치 함수로 최적인 행동을 정함
이러한 함수를 CNN으로 비슷하게 흉내 내어 사용하는 것이 DQN

실제 사례

비디오 게임을 자율 학습시켜 사람을 뛰어넘는 수준의 조작을 실현
그동안의 비디오 게임 학습에서는 게임의 상태를 미리 추출하는 것이 보통. 그러나 DQN에서는 입력 데이터는 비디오 게임의 영상 뿐.
- 게임마다 설정을 바꿀 필요 없이 단순히 DQN에 게임 영상을 보여주기만 하면 됨
팩맨, 아타리와 같은 게임에서 뛰어난 성적을 보임