Skip to content

Commit 297153d

Browse files
committed
update errata
1 parent f6dacf2 commit 297153d

File tree

1 file changed

+3
-1
lines changed

1 file changed

+3
-1
lines changed

docs/errata.md

Lines changed: 3 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -13,8 +13,10 @@
1313
```bash
1414
pip install pygame
1515
```
16+
* 27页,第二段改为:Gym 库已注册的环境可以通过以下代码查看。
17+
* 27页,第三段和第四段改为:Gym 库中的每个环境都定义了观测空间和动作空间。观测空间和动作空间可以是离散的(取值为有限个离散的值),也可以是连续的(取值为连续的值)。
1618
* 28页,第一个代码框的第1行:观测空间 = Box(2,) → 观测空间 = Box([-1.2 -0.07], [0.6 0.07], (2,), float32)
17-
* 28页,第二段改为:观测是长度为 2 的数组,动作是整数,其取值范围为{0,1,2}。
19+
* 28页,第二段改为:在 Gym 库中,环境的观测空间用 env.observation\_space 表示,动作空间用 env.action\_space 表示。离散空间用 gym.spaces.Discrete 类表示,连续空间用 gym.spaces.Box 类表示。对于离散空间,Discrete (n) 表示可能取值的数量为 n;对于连续空间,Box类实例成员中的 low 和 high 表示每个浮点数的取值范围。MountainCar-v0 中的观测是长度为 2 的 numpy 数组,数组中值的类型为 float。MountainCar-v0 中的动作是整数,取值范围为 {0,1,2}。
1820
* 28页,第三段改为:接下来实现智能体来控制小车移动,对应代码如下。
1921
* 28页,第二个代码框第1行和倒数第1行:BespokeAgent → SimpleAgent
2022
* 28页,倒数第一段改为:SimpleAgent 类的 decide()方法用于决策,learn() 方法用于学习,该智能体不是强化学习智能体,不能学习,只能根据给定的数学表达式进行决策。

0 commit comments

Comments
 (0)