Machine-Learning-Coding

第二版《统计学习方法》学习与实现

代码

https://github.com/Dod-o/Statistical-Learning-Method_Code

方法讲解

https://www.pkudodo.com/
原作者博客，包括从感知机到SVM的讲解，有很多作者自己的理解，推荐在读代码前阅读。

数据集

MNIST数据集是手写数字数据集，包含 60,000 个训练样本和 10,000 个测试样本，0-9共10种手写数字。
预处理后的.csv数据文件，每行的第一个元素是数据的label，之后的28*28个元素取值范围在[0, 255]，表示像素点的颜色。

生成式模型

生成式模型由数据学习联合概率分布P(X,Y)，然后求出条件概率分布P(Y|X)作为预测的模型，即：P(X|Y)=P(X,Y)/P(X)。
典型的生成式模型有：朴素贝叶斯、隐马尔可夫模型。

朴素贝叶斯法：是基于贝叶斯定理与特征条件独立假设的分类方法。
隐马尔可夫模型：是可用于标注问题的统计学习模型，描述由隐藏的马尔可夫链生成观测序列的过程，属于生成模型。

判别式模型

判别式模型由数据直接学习决策函数f(X)或者条件概率分布P(Y|X)作为预测的模型。
典型的判别式模型有：k近邻法、感知机、决策树、逻辑斯谛回归模型、最大熵模型、支持向量机、提升方法、条件随机场。

k近邻方法：是一种基本分类与回归方法。
感知机：是二类分类的线性分类模型。
决策树：是一种基本的分类与回归方法。
逻辑斯蒂回归：是统计学习中的经典分类方法。
最大熵：是概率模型学习的一个准则，将其推广到分类问题得到最大熵模型。
支持向量机：是一种二类分类模型。
提升方法：是一种常用的统计学习方法，在分类问题中，它通过改变训练样本的权重，学习多个分类器，并将这些分类器进行线性组合，提高分类的性能。
条件随机场：是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布，其特点是假设输出随机变量构成马尔科夫随机场。

其他

EM算法：是一种迭代算法，用于含有隐变量的概率模型参数的极大似然估计，或极大后验概率估计。

Name		Name	Last commit message	Last commit date
Latest commit History 46 Commits
Mnist		Mnist
ch02_Perceptron		ch02_Perceptron
ch03_KNN		ch03_KNN
ch04_NaiveBayes		ch04_NaiveBayes
ch05_DecisionTree		ch05_DecisionTree
ch06_LogisticRegression		ch06_LogisticRegression
ch06_MaxEntropy		ch06_MaxEntropy
ch07_SVM		ch07_SVM
ch08_AdaBoost		ch08_AdaBoost
ch09_EM		ch09_EM
ch10_HMM		ch10_HMM
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Machine-Learning-Coding

代码

方法讲解

数据集

生成式模型

判别式模型

其他

About

Releases

Packages

Languages

Lazysisphus/Machine-Learning-Coding

Folders and files

Latest commit

History

Repository files navigation

Machine-Learning-Coding

代码

方法讲解

数据集

生成式模型

判别式模型

其他

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages