dice/sample.py at main · zju-pi/dice · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
import re
import os
import json
import argparse
import pickle
import tqdm
import random
import numpy as np
import torch
from pipelines.pipeline_stable_diffusion import StableDiffusionPipeline
from pipelines.pipeline_stable_diffusion_xl import StableDiffusionXLPipeline
from diffusers import DPMSolverMultistepScheduler, AutoencoderKL
from accelerate import Accelerator
from torch_utils.util import open_url

parser = argparse.ArgumentParser(description=globals()["__doc__"])
parser.add_argument('--outdir',         help='Where to save images', type=str, default='./samples')
parser.add_argument('--batch_gpu',      help='Batch size per gpu', type=int, default=4)
parser.add_argument('--seed',           help='Random seed', type=int, default=0)
parser.add_argument('--steps',          help='Sampling steps',  type=int, default=20)
parser.add_argument('--model_name',     help='Model name', type=str, default='sd15')
parser.add_argument('--cfg_scale',      help='Guidance scale, will be set to 1.0 if DICE sharpener is specified', type=float, default=5.0)
parser.add_argument('--model_path',     help='Path or expiemnt id of the trained model', type=str)
parser.add_argument('--model_id',       help='Id of the model, will be used as folder name to save images', type=str)
parser.add_argument('--alpha',          help='Strength for sharpener', type=float, default=1.0)
parser.add_argument('--gd_scale',       help='GD Guidance scale', type=float, default=5.0)
parser.add_argument('--method',         help='Method', type=str, default='dice')
args = parser.parse_args()

assert args.model_name in ['sd15', 'sdxl']
assert args.method in ['dice', 'gd', 'pnp']

def seed_everything(seed):
    torch.manual_seed(seed)
    torch.cuda.manual_seed(seed)
    random.seed(seed)
    np.random.seed(seed)

def parse_int_list(s):
    if isinstance(s, list): return s
    ranges = []
    range_re = re.compile(r'^(\d+)-(\d+)$')
    for p in s.split(','):
        m = range_re.match(p)
        if m:
            ranges.extend(range(int(m.group(1)), int(m.group(2))+1))
        else:
            ranges.append(int(p))
    return ranges


# Enable parallel computing
accelerator = Accelerator()
device = accelerator.device
accelerator.print('--------------settings--------------')
accelerator.print(args)
accelerator.print('------------------------------------')

# Basic hyperparameters
seed = args.seed
seeds = parse_int_list('0-4999')

# Load model
if args.model_name == 'sd15':
    # pipe = StableDiffusionPipeline.from_pretrained('stable-diffusion-v1-5/stable-diffusion-v1-5', torch_dtype=torch.float16)
    pipe = StableDiffusionPipeline.from_pretrained('Lykon/DreamShaper', torch_dtype=torch.float16)
elif args.model_name == 'sdxl':
    pipe = StableDiffusionXLPipeline.from_pretrained('stabilityai/stable-diffusion-xl-base-1.0', torch_dtype=torch.float16, use_safetensors=True, variant="fp16")
    pipe.vae = AutoencoderKL.from_pretrained('madebyollin/sdxl-vae-fp16-fix', torch_dtype=torch.float16)


# Pipe configuration
pipe.set_progress_bar_config(disable=True)
pipe.scheduler = DPMSolverMultistepScheduler.from_config(pipe.scheduler.config)
pipe.to(device)

# Load sampled COCO 2017 valiadation set - 5k prompts
prompt_path = "./assets/val2017_5k.json"
accelerator.print(f"Loading MS-COCO 2017 valiadation captions from {prompt_path}...")
sample_captions = list(json.load(open(prompt_path, 'r')).values())
accelerator.print('Finish, num of prompts:', len(sample_captions))

# Load DICE sharpener
if args.model_path is not None:
    model_path = args.model_path
    if not model_path.endswith('pkl'):      # load by experiment number
        # find the directory with distilled models
        predictor_path_str = '0' * (5 - len(model_path)) + model_path
        for file_name in os.listdir("./exps"):
            if file_name.split('-')[0] == predictor_path_str:
                if args.method == 'dice':
                    model_path = os.path.join('./exps', file_name, f'checkpoint-{file_name.split("-")[2]}/sharpener-snapshot.pkl')
                elif args.method == 'gd':
                    model_path = os.path.join('./exps', file_name, f'checkpoint-{file_name.split("-")[2]}/model-snapshot.pkl')
                elif args.method == 'pnp':
                    model_path = os.path.join('./exps', file_name, f'checkpoint-{file_name.split("-")[2]}/controlnet/')
                break

    accelerator.print(f'Loading model from "{model_path}"...')
    if args.method == 'dice':
        with open_url(model_path, verbose=(accelerator.process_index == 0)) as f:
            sharpener = pickle.load(f)['model'].to(device)
        sharpener.eval().to(device)
        pipe.sharpener = sharpener
        pipe.sharpener_alpha = args.alpha
    elif args.method == 'gd':
        with open_url(model_path, verbose=(accelerator.process_index == 0)) as f:
            unet = pickle.load(f)['model'].to(device)
        unet.eval().to(device)
        pipe.unet = unet
        pipe.gd_scale = args.gd_scale
    elif args.method == 'pnp':
        from diffusers import ControlNetModel
        controlnet = ControlNetModel.from_pretrained(model_path)
        controlnet.eval().to(device)
        pipe.controlnet = controlnet
        pipe.gd_scale = args.gd_scale

# Generate images
if args.model_path is not None:
    if args.method == 'dice':
        outdir_img = os.path.join(args.outdir, f"{args.model_name}_{args.method}_{args.model_id}_steps{args.steps}_cfg1.0_alpha{args.alpha}")
    else:
        outdir_img = os.path.join(args.outdir, f"{args.model_name}_{args.method}_{args.model_id}_steps{args.steps}_cfg${args.cfg_scale}_gdScale{args.gd_scale}")
else:
    outdir_img = os.path.join(args.outdir, f"{args.model_name}_base_steps{args.steps}_cfg{args.cfg_scale}")
seed_everything(seed+accelerator.process_index)
generator = torch.Generator().manual_seed(seed+accelerator.process_index)
num_batches = ((len(seeds) - 1) // (args.batch_gpu * accelerator.num_processes) + 1) * accelerator.num_processes
all_batches = torch.as_tensor(seeds).tensor_split(num_batches)
rank_batches = all_batches[accelerator.process_index :: accelerator.num_processes]
for batch_seeds in tqdm.tqdm(rank_batches, unit='batch', disable=(accelerator.process_index != 0)):
    accelerator.wait_for_everyone()
    prompts = sample_captions[batch_seeds[0]:batch_seeds[-1]+1]
    with torch.no_grad():
        with torch.autocast('cuda'):
            images = pipe(
                prompts,
                generator=generator,
                num_images_per_prompt=1,
                num_inference_steps=args.steps,
                guidance_scale=args.cfg_scale,
            ).images

    # Save images
    for seed, image in zip(batch_seeds, images):
        image_dir = os.path.join(outdir_img, f'{seed-seed%1000:06d}')
        os.makedirs(image_dir, exist_ok=True)
        image.save(os.path.join(image_dir, f'{seed:06d}.png'))