Skip to content

Commit e164cf2

Browse files
committed
update ch1.md
1 parent 5d248d6 commit e164cf2

File tree

1 file changed

+1
-1
lines changed

1 file changed

+1
-1
lines changed

docs/chapter1/chapter1.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -610,7 +610,7 @@ def play(env, agent, render=False, train=False):
610610

611611
上面代码中的 play 函数可以让智能体和环境交互一个回合,该函数有 4 个参数。env 是环境类。agent 是智能体类。render 是 bool 型变量,其用于判断是否需要图形化显示。如果 render 为 True,则在交互过程中会调用 env.render() 以显示图形界面,通过调用 env.close() 可关闭图形界面。train 是 bool 型变量,其用于判断是否训练智能体,在训练过程中设置为 True,让智能体学习;在测试过程中设置为 False,让智能体保持不变。该函数的返回值 episode\_reward 是 float 型的数值,其表示智能体与环境交互一个回合的回合总奖励。
612612

613-
接下来,我们使用下面的代码让智能体和环境交互一个回合,并且显示图像界面
613+
接下来,我们使用下面的代码让智能体和环境交互一个回合,并显示图形界面
614614

615615
```python
616616
env.seed(3) # 设置随机种子,让结果可复现

0 commit comments

Comments
 (0)