Computational Benefits of Intermediate Rewards for Hierarchical Planning

We provide the code used to run the MiniGrid experiments provided in the paper.

Features

All our custom MiniGrid environments are available in gym-minigrid/gym_minigrid/envs/custom.py

For asynchronous Q-learning:

Script to train: scripts/qlearn.py
Script to evaluate: scripts/qlearn_evaluate.py

For Deep RL algorithms (A2C, PPO, DQN):

Script to train: scripts/train.py
Script to evaluate, scripts/evaluate.py

See experiments/ folder to run all experiments conducted in the paper. We provide a sample parser file Log_Parser.ipynb to gather results presented in paper (average steps, rewards, win rate) for all seeds.

Installation

Clone this repository.
Install gym-minigrid environments and torch-ac RL algorithms:

pip3 install -r requirements.txt
cd torch-ac
pip3 install -e .

Name		Name	Last commit message	Last commit date
Latest commit History 45 Commits
.ipynb_checkpoints		.ipynb_checkpoints
README-rsrc		README-rsrc
experiments		experiments
gym-minigrid		gym-minigrid
scripts		scripts
torch_ac		torch_ac
utils		utils
.DS_Store		.DS_Store
LICENSE		LICENSE
Log_Parser.ipynb		Log_Parser.ipynb
README.md		README.md
maze.gif		maze.gif
model.py		model.py
requirements.txt		requirements.txt
train.sh		train.sh
train_ppo.sh		train_ppo.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Computational Benefits of Intermediate Rewards for Hierarchical Planning

Features

Installation

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Computational Benefits of Intermediate Rewards for Hierarchical Planning

Features

Installation

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages