GraphDiffusionImitate/eval.py at development · caio-freitas/GraphDiffusionImitate · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
'''
Script to evaluate a specific policy
Usage: python eval.py
'''

import logging
import pathlib

import hydra
from omegaconf import DictConfig, OmegaConf

import wandb

from imitation.env.robomimic_lowdim_wrapper import RobomimicLowdimWrapper # fix segfault when loading runner

log = logging.getLogger(__name__)

OmegaConf.register_new_resolver("eval", eval, replace=True)

@hydra.main(
        version_base=None,
        config_path=str(pathlib.Path(__file__).parent.joinpath('imitation','config')),
        config_name="eval"
        )
def eval_main(cfg):
    print(OmegaConf.to_yaml(cfg))
    log.info("Running evaluation...")
    # instanciate environment runner from cfg file
    runner = hydra.utils.instantiate(cfg.env_runner)
    # instanciate policy from cfg file
    policy = hydra.utils.instantiate(cfg.policy)
    # instanciate agent from policy
    agent = hydra.utils.instantiate(cfg.agent, policy=policy, env=runner.env)
    try:
        if cfg.policy.ckpt_path is not None and cfg.load_ckpt:
            policy.load_nets(cfg.policy.ckpt_path)
    except Exception as e:
        log.error(f"Error loading checkpoint {cfg.policy.ckpt_path}: {e}")

    if __name__ == "__main__":
        wandb.init(
            project=policy.__class__.__name__,
            group=cfg.task.task_name,
            name=f"eval",
            # track hyperparameters and run metadata
            config={
                "policy": cfg.policy,
                "dataset_type": cfg.task.dataset_type,
                "episodes": cfg.num_episodes,
                "task": cfg.task.task_name,
            },
            # mode="disabled",
        )

    # run policy in environment
    success_count = 0
    for i in range(cfg.num_episodes):
        runner.reset()
        rewards, info = runner.run(agent, cfg.max_steps)
        assert "success" in info, "info['success'] not returned in info from runner"
        print(f"info: {info}")
        if info["success"]:
            success_count += 1
        log.info({"episode_reward": sum(rewards), "success": info["success"]})
        wandb.log({"episode_reward": sum(rewards), "success": 1 if info["success"] else 0})
        if i >= 1:
            runner.output_video = False
    log.info(f"Success rate: {success_count/cfg.num_episodes}")
    wandb.log({"success_rate": success_count/cfg.num_episodes})
    return success_count/cfg.num_episodes

if __name__ == "__main__":
    eval_main()