RNN.py

__author__ = 'CP'
from network import LSTM
import argparse
import logging
import time
import datetime
import os
from utils import util
import torch
from torch.autograd import Variable
import numpy as np
import matplotlib.pyplot as plt

class RNNmodel(torch.nn.Module):
    def __init__(self,cell_class, num_layer, input_size, mid_dim, out_dim, batch_first = False):
    # def __init__(self,LSTMcell, num_layer, input_size, mid_dim, out_dim, batch_first = False):
        super(RNNmodel, self).__init__()
        # self.rnn = torch.nn.LSTM(inp_dim, mid_dim, mid_layers,batch_first=batch)  # api
        self.rnn = LSTM.LSTM(cell_class, num_layer, input_size, hidden_size).to(device)  # rnn
        # self.rnn = LSTM.LSTM(LSTMcell, num_layer, input_size, hidden_size).to(device)  # rnn
        self.reg = torch.nn.Sequential(
            torch.nn.Linear(mid_dim, mid_dim),
            torch.nn.Tanh(),
            torch.nn.Linear(mid_dim, out_dim),
        )  # regression
        
    def forward(self, x):
        # y = self.rnn(x)[0]  # y, (h, c) = self.rnn(x), unless attention interface not used
        y, _ = self.rnn(x)  # y, (h, c) = self.rnn(x), unless attention interface not used
        batch_size, seq_len, hid_dim = y.shape
        y = y.reshape(-1, hid_dim)
        y = self.reg(y)
        y = y.reshape(batch_size, seq_len, -1)
        return y



if __name__ == '__main__':
    parser = argparse.ArgumentParser(description = 'torch implement')
    parser.add_argument('--model_size', type=int, nargs = '+', default = [2,10])  # num_layer * hidden_size
    # parser.add_argument('--hidden_size', type=int, default = 10)
    # parser.add_argument('--num_layer', type=int, default = 2)
    parser.add_argument('--epochs', type=int, default = 100)
    parser.add_argument('--train_dir', type = str, default = './log/')
    FLAGS, unparsed = parser.parse_known_args()

    train_dir = FLAGS.train_dir + time.strftime('%Y%m%d_%H%M%S') + '_temp'
    if not os.path.exists(train_dir):
        # os.makedirs(train_dir)
        os.mkdir(train_dir)

    logging.basicConfig(level = logging.INFO, filename = train_dir + "/train_{}.log".format(time.strftime('%Y%m%d_%H%M%S', time.localtime(time.time()))), filemode = "w")
    logger = logging.getLogger(__name__)
    stream_handler = logging.StreamHandler()
    logger.addHandler(stream_handler)
    logger.info('>>>>>>>>>>>>>>>>>>>>>>>>  Running at %s', datetime.datetime.now())
    util.show_param(FLAGS, logger, stream_handler)

    input_size = 3
    batch_size = 32
    time_step = 4
    output_size = 1

    num_layer = FLAGS.model_size[0]
    hidden_size = FLAGS.model_size[1]
    epoch = FLAGS.epochs
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

    # net = LSTM.LSTM(LSTM.LSTMcell, num_layer, input_size, hidden_size).to(device)
    net = RNNmodel(LSTM.LSTMcell, num_layer, input_size, hidden_size, output_size).to(device)
    for param in net.state_dict():
        print("net.parameters()  ",param, net.state_dict()[param].shape)
        # print("net.parameters()  ",param)
    # net=RegLSTM(input_size,output_size,mid_dim,mid_layers,True).to(device)
    criterion=torch.nn.MSELoss()
    optimizer=torch.optim.Adam(net.parameters(),lr=1e-2)

    data = util.load_data()
    print("Simulink Database.shape:  ",data.shape)
    train_size = int(len(data) * 0.75)
    data_sample = np.zeros((train_size - time_step + 1, time_step, input_size))
    label_sample = np.zeros((train_size - time_step + 1, time_step, output_size))
    for i in range(train_size - time_step + 1):
        data_sample[i] = data[i:i + time_step, :]
        label_sample[i] = data[i + 1:i + 1 + time_step, 0:1:]

    for i in range(epoch):
        for j in range(int((train_size - time_step + 1) / batch_size)):
            train_X = data_sample[j * batch_size:(j + 1) * batch_size, :, :]
            train_Y = label_sample[j * batch_size:(j + 1) * batch_size, :, :]
            var_x = torch.tensor(train_X, dtype=torch.float32, device=device)
            var_y = torch.tensor(train_Y, dtype=torch.float32, device=device)
            out = net(var_x)
            # print("Epochs:  ", i,  ", Step  :  ",  j,    var_y.shape, len(out), out.shape)
            loss = criterion(out, var_y)
            # loss = criterion(out[:,-1,:], var_y[:,-1,:])
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
        train_X = data_sample[(j + 1) * batch_size:, :, :]
        train_Y = label_sample[(j + 1) * batch_size:, :, :]
        var_x = torch.tensor(train_X, dtype=torch.float32, device=device)
        var_y = torch.tensor(train_Y, dtype=torch.float32, device=device)
        out = net(var_x)
        loss = criterion(out, var_y)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        if i % 2 == 0:
            print('Epoch: {:4}, Loss: {:.5f}'.format(i, loss.item()))
            
    net=net.eval()
    test_X=data[train_size:,:]
    test_Y=data[train_size+time_step:,0:1:]
    test_y=list()

    for i in range(test_X.shape[0]-time_step):
        test_x=test_X[i:time_step+i,:].reshape(1,time_step,input_size)
        test_x=torch.tensor(test_x,dtype=torch.float32,device=device)
        tem=net(test_x).cpu().data.numpy()
        test_y.append(tem[0][-1])

    test_y=np.array(test_y).reshape((-1,1))
    diff=test_y-test_Y
    l1_loss=np.mean(np.abs(diff))
    l2_loss=np.mean(diff**2)
    print("Eval :  L1:{:.3f}    L2:{:.3f}".format(l1_loss,l2_loss))
    plt.plot(test_y, 'r', label='pred')
    plt.plot(test_Y, 'b', label='real', alpha=0.3)
    plt.legend()
    plt.title(" View of casual sequence comparison")
    plt.show()