lvliguoren/MsPacman
Folders and files
| Name | Name | Last commit date | ||
|---|---|---|---|---|
Repository files navigation
使用Q学习进行MsPacman游戏的练习 1、游戏者使用ε-greedy策略进行游戏,生成了游戏状态-行为数据 2、观察者计算每种状态-行为的Q值(相当于打标签),并训练网络预测准确的Q值 3、把观察者训练得到的参数复制给游戏者 4、使用游戏者进行游戏
| Name | Name | Last commit date | ||
|---|---|---|---|---|
使用Q学习进行MsPacman游戏的练习 1、游戏者使用ε-greedy策略进行游戏,生成了游戏状态-行为数据 2、观察者计算每种状态-行为的Q值(相当于打标签),并训练网络预测准确的Q值 3、把观察者训练得到的参数复制给游戏者 4、使用游戏者进行游戏