SSRNet_LL/main_retrain.py at master · lin-li16/SSRNet_LL · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
# 导入必要的库
import argparse
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import torch
import torch.nn as nn
import warnings
import time
import os
import sys
import scipy.io
import pickle
from tqdm import tqdm
from net_allsites import *
from solver import *
from eventDataset import *
from torchinfo import summary
from plot import plot_loss
warnings.filterwarnings("ignore")
sns.set_style('ticks')
sns.set_context("poster")
plt.rcParams['font.sans-serif'] = 'Arial'


class Logger(object):
    '''
    log文件记录对象，将所有print信息记录在log文件中
    '''
    def __init__(self, fileN="Default.log"):
        self.terminal = sys.stdout
        self.log = open(fileN, "w")

    def write(self, message):
        self.terminal.write(message)
        self.log.write(message)

    def flush(self):
        pass


def main():
    # 添加命令行输入参数
    parser = argparse.ArgumentParser(description='DNN Model for Time Series Forecasting in KiK-Net Downhole Array Dataset')
    parser.add_argument('--path', type=str, default='all_sites', help='Parent file path of the dataset and the results')
    parser.add_argument('--batch', type=int, default=1024, help='Batch size of training data')
    parser.add_argument('--validratio', type=float, default=0.1, help='Ratio of validation data in all data, 0-1.0')
    parser.add_argument('--testratio', type=float, default=0.2, help='Ratio of test data in all data, 0-1.0')
    parser.add_argument('--fixedorder', type=int, default=0, help='Whether to use the former data order')
    parser.add_argument('--epochs', type=int, default=100, help='Maximum training epochs')
    parser.add_argument('--printfreq', type=int, default=-1, help='Training message print frequency in each epoch')
    parser.add_argument('--lr', type=float, default=0.001, help='Learning rate')
    parser.add_argument('--model', type=str, default='Basic_3inp', help='Type of model used in this dataset')
    parser.add_argument('--resultspath', type=str, default='results', help='File path of results')
    parser.add_argument('--step', type=int, default=3, help='Number of layers in LSTM')
    parser.add_argument('--nums', type=int, default=256, help='Number of layers in LSTM')
    parser.add_argument('--ker1', type=int, default=5, help='Kernel size used in CNN layers')
    parser.add_argument('--ker2', type=int, default=11, help='Kernel size used in CNN layers')
    parser.add_argument('--normalize', type=str, default='minmax', help='Normalization of the dataset')
    parser.add_argument('--pretrain', type=str, default='no', help='Use the pre-trained model')
    parser.add_argument('--checkpoints', type=int, default=0, help='Output the models at all epochs')
    parser.add_argument('--plots', type=int, default=1, help='Plot the figures for each earthquake')
    parser.add_argument('--noisy', type=float, default=0, help='Noisy level added to the data')
    parser.add_argument('--bias', type=int, default=1, help='Bias in network')
    parser.add_argument('--datapre', type=str, default=None, help='Dataset file')
    parser.add_argument('--dropout', type=float, default=0.0, help='Dropout ratio')
    args = parser.parse_args()

    # 创建结果文件夹
    results_path = os.path.join(args.path, args.resultspath)
    if not os.path.exists(results_path):
        os.mkdir(results_path)
        # os.mkdir(os.path.join(results_path, 'figures'))
    sys.stdout = Logger(os.path.join(results_path, 'message.log'))      # 创建log文件对象
    print('The path of the results is %s' % results_path)

    # 加载数据集
    dataset = scipy.io.loadmat(os.path.join(results_path, args.datapre))
    train_dataset = eqkDataset(dataset['train_data'], dataset['train_label'])
    valid_dataset = eqkDataset(dataset['valid_data'], dataset['valid_label'])
    test_dataset = eqkDataset(dataset['test_data'], dataset['test_label'])
    train_data, train_label = dataset['train_data'], dataset['train_label']
    valid_data, valid_label = dataset['valid_data'], dataset['valid_label']
    test_data, test_label = dataset['test_data'], dataset['test_label']
    data_min, data_max = dataset['data_min'], dataset['data_max']
    label_min, label_max = dataset['label_min'], dataset['label_max']

    train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=args.batch)
    valid_loader = torch.utils.data.DataLoader(valid_dataset)
    test_loader = torch.utils.data.DataLoader(test_dataset)
    print('Batch size is %s' % args.batch)

    # 进行训练
    max_epoch = args.epochs
    disp_freq = args.printfreq
    learning_rate = args.lr
    print('%s model is applied' % args.model)
    print('Learning rate is %f' % learning_rate)

    Net = CNN_allsites(ker1=args.ker1, ker2=args.ker2, step=args.step, nums=args.nums)
    # 加载预训练模型
    if args.pretrain != 'no':
        print('Apply pretrain model!')
        model_pre = torch.load(os.path.join(args.path, args.pretrain, 'validbest.pt'))
        Net.load_state_dict(model_pre.state_dict())
        for name, param in Net.named_parameters():
            # if 'encoder_eq' in name or 'fc_eq_list' in name or 'decoder' in name:
            #     param.requires_grad = False
            # if '_st' in name or 'encoder_eq' in name:
            #     param.requires_grad = False
            # if 'encoder_eq' in name or 'decoder' in name or 'encoder_st' in name:
            #     param.requires_grad = False
            # if not 'decoder' in name:
            #     param.requires_grad = False
            if (not 'fc_' in name) and (not 'decoder' in name):
                param.requires_grad = False

    # Net = CNN_retrain()
    # model_dict = Net.state_dict()
    # if args.pretrain != 'no':
    #     print('Apply pretrain model!')
    #     model_pre = torch.load(os.path.join(args.path, args.pretrain, 'validbest.pt'))
    #     pretrain_dict = {k : v for k, v in model_pre.named_parameters() if k in model_dict}
    #     model_dict.update(pretrain_dict)
    #     Net.load_state_dict(model_dict)
    #     for name, param in Net.named_parameters():
    #         if not 'retrain' in name:
    #             param.requires_grad = False

    summary(Net)
    # GPU加速
    if torch.cuda.is_available():
        Net = Net.cuda()
    # optimizer = torch.optim.LBFGS(Net.parameters(), lr=learning_rate, max_iter=2)
    optimizer = torch.optim.Adam(Net.parameters(), lr=learning_rate)
    criterion = nn.MSELoss()
    slvr = Solver(Net, criterion, optimizer, train_loader, valid_loader)
    starttime = time.time()
    slvr.train(max_epoch, disp_freq, check_points=args.checkpoints)
    train_time = time.time()-starttime
    print('Training Time {:.4f}'.format(train_time))
    _, test_loss = test(slvr.valid_best_model, criterion, test_loader, batch=args.batch)
    print("Test Loss {:.4f}\n".format(test_loss))
    torch.cuda.empty_cache()

    # 绘制loss变化曲线
    plot_loss(slvr.avg_train_loss_set, slvr.avg_val_loss_set, yscale='log')
    plt.savefig(os.path.join(results_path, 'loss.svg'), bbox_inches='tight')
    print('Training best epoch: %d\tTraining minimum loss: %.3E' % (np.argmin(slvr.avg_train_loss_set) + 1, np.min(slvr.avg_train_loss_set)))
    print('Validate best epoch: %d\tValidate minimum loss: %.3E' % (np.argmin(slvr.avg_val_loss_set) + 1, np.min(slvr.avg_val_loss_set)))
    torch.save(slvr.train_best_model, os.path.join(results_path, 'trainbest.pt'))
    torch.save(slvr.valid_best_model, os.path.join(results_path, 'validbest.pt'))
    if args.checkpoints==0:
        torch.save(slvr.net, os.path.join(results_path, 'last.pt'))
    else:
        torch.save(slvr.all_models, os.path.join(results_path, 'allmodels.pt'))

    # 结果评价
    train_pred, _ = test(slvr.valid_best_model, criterion, torch.utils.data.DataLoader(train_dataset), batch=args.batch)
    valid_pred, _ = test(slvr.valid_best_model, criterion, valid_loader, batch=args.batch)
    test_pred, _ = test(slvr.valid_best_model, criterion, test_loader, batch=args.batch)

    train_pred = train_pred * (label_max - label_min) + label_min
    valid_pred = valid_pred * (label_max - label_min) + label_min
    test_pred = test_pred * (label_max - label_min) + label_min
    train_label = train_label * (label_max - label_min) + label_min
    valid_label = valid_label * (label_max - label_min) + label_min
    test_label = test_label * (label_max - label_min) + label_min

    scipy.io.savemat(os.path.join(results_path, 'results.mat'),
                     {'train_label': train_label, 'train_pred': train_pred,
                      'valid_label': valid_label, 'valid_pred': valid_pred,
                      'test_label': test_label, 'test_pred': test_pred,
                      'train_loss': slvr.avg_train_loss_set, 'valid_loss': slvr.avg_val_loss_set})

    with open(os.path.join(results_path, 'performance.out'), 'w') as out_file:
        out_file.write('训练最好次数：%d\n' % (np.argmin(slvr.avg_train_loss_set) + 1))
        out_file.write('验证最好次数：%d\n' % (np.argmin(slvr.avg_val_loss_set) + 1))
        out_file.write('%10s:%10.3E\n' % ('train-RMSE', np.sqrt(np.mean((train_pred - train_label) ** 2))))
        out_file.write('%10s:%10.3E\n' % ('train-MAE', np.mean(np.abs(train_pred - train_label))))
        out_file.write('%10s:%10.3f%%\n' % ('train-r', 100 * np.corrcoef(train_pred.ravel(), train_label.ravel())[0, 1]))
        out_file.write('%10s:%10.3E\n' % ('valid-RMSE', np.sqrt(np.mean((valid_pred - valid_label) ** 2))))
        out_file.write('%10s:%10.3E\n' % ('valid-MAE', np.mean(np.abs(valid_pred - valid_label))))
        out_file.write('%10s:%10.3f%%\n' % ('valid-r', 100 * np.corrcoef(valid_pred.ravel(), valid_label.ravel())[0, 1]))
        out_file.write('%10s:%10.3E\n' % ('test-RMSE', np.sqrt(np.mean((test_pred - test_label) ** 2))))
        out_file.write('%10s:%10.3E\n' % ('test-MAE', np.mean(np.abs(test_pred - test_label))))
        out_file.write('%10s:%10.3f%%\n' % ('test-r', 100 * np.corrcoef(test_pred.ravel(), test_label.ravel())[0, 1]))


if __name__ == "__main__":
    main()