MachineLearning/gradient_descent.py

import numpy as np
import matplotlib.pyplot as plt
import time

def load_data(fname):
    points = np.loadtxt(fname, delimiter=',') 
    y_ = points[:,1]
    x_ = np.ones([len(y_), 2])
    x_[:,0] = points[:,0]
    print('data loaded. x:{} y:{}'.format(x_.shape, y_.shape))
    return x_, y_

def evaluate_cost(x_, y_, params):
    tempcost = 0
    for i in range(len(y_)):
        tempcost += (y_[i] - ((params[0] * x_[i,0]) + params[1])) ** 2 
    return tempcost / float(10000)

def evaluate_gradient(x_, y_, params):
    m_gradient = 0
    b_gradient = 0
    N = float(len(y_))
    for i in range(len(y_)):
        m_gradient += -(2/N) * (x_[i,0] * (y_[i] - ((params[0] * x_[i,0]) + params[1]))
        b_gradient += -(2/N) * (y_[i] - ((params[0] * x_[i,0]) + params[1]))
    return [m_gradient, b_gradient]

def update_params(old_params, grad, alpha):
    new_m = old_params[0] - (alpha * grad[0])
    new_b = old_params[1] - (alpha * grad[1])
    return [new_m, new_b]

# initialize the optimizer
optimizer = {'init_params': np.array([4.5, 2.0]), 
             'max_iterations': 10000, 
             'alpha': 0.69908, 
             'eps': 0.0000001,
             'inf': 1e10}

# load data
x_, y_ = load_data("./data/1_points.csv")

# time stamp
start = time.time()

try:
    # gradient descent
    params = optimizer['init_params']
    old_cost = 1e10
    for iter_ in range(optimizer['max_iterations']):
        # evaluate cost and gradient
        cost = evaluate_cost(x_, y_, params)
        grad = evaluate_gradient(x_, y_, params)
        # display
        if iter_ % 10 == 0:
            print('iter: {} cost: {} params: {}'.format(iter_, cost, params))
        # check convergence
        if abs(old_cost - cost) < optimizer['eps']:
            break
        # update parameters
        params = update_params(params, grad, optimizer['alpha'])
        old_cost = cost
except:
    cost = optimizer['inf']

# final output
print('time elapsed: {}'.format(time.time() - start))
print('cost at convergence: {} (lower the better)'.format(cost))