德州扑克常见的机器学习算法

A+

德州扑克常见的机器学习算法

4月10日，为期 5 天的人工智能与顶尖德州扑克牌手对战暨“冷扑大师”对“龙之队”表演赛收官，人工智能“冷扑大师”最终以 792327 总记分牌的战绩完胜并赢得 200 万（货币单位）奖金。

“冷扑大师”相对于“阿尔法围棋”的不同在于，前者从零开始，基于扑克游戏规则对游戏中对手劣势进行自我学习，并通过博弈论来衡量和选取最优策略。

机器学习是人工智能的核心，本文为大家盘点十大常见的机器学习算法。

1661132235877748.

一、常见机器学习算法集锦

1．集成算法（Ensemble algorithms）

集成方法是由多个较弱的模型集成模型组，其中的模型可以单独进行训练，并且它们的预测能以某种方式结合起来做总体预测，这类算法又称元算法（meta-algorithm）。

算法实例：

Boosting
Bootstrapped Aggregation（Bagging）
AdaBoost
层叠泛化（Stacked Generalization , blending）
梯度推进机（Gradient Boosting Machines , GBM）
梯度提升回归树（Gradient Boosted Regression Trees , GBRT）
随机森林（Random Forest）
分类和回归树（Classification and Regression Tree , CART）
Iterative Dichotomiser 3（ID3）

2．回归（Regression）算法

回归是用于估计两种变量之间关系的统计过程。当用于分析因变量和一个多个自变量之间的关系时，该算法能提供很多建模和分析多个变量的技巧。回归分析可以帮助理解当任意一个自变量变化，另一个自变量不变时，因变量变化的典型值。

算法实例：

普通最小二乘回归（Ordinary Least Squares Regression , OLSR）
线性回归（Linear Regression）
逻辑回归（Logistic Regression）
逐步回归（Stepwise Regression）
多元自适应回归样条（Multivariate Adaptive Regression Splines , MARS）
本地散点平滑估计（Locally Estimated Scatterplot Smoothing , LOESS）

3．人工神经网络

人工神经网络（ANN）是受生物神经网络启发而构建的算法模型。它是一种模式匹配，常被用于回归和分类问题，提供了一种普遍而且实际的方法从样例中学习值为实数、离散值或向量函数。人工神经网络由一系列简单的单元相互连接构成，其中每个单元有一定数量的实值输入，并产生单一的实值输出。

算法实例：

感知器
反向传播
Hopfield 网络
径向基函数网络（Radial Basis Function Network , RBFN）

4．深度学习（Deep Learning）

深度学习是人工神经网络的最新分支，它受益于当代硬件的快速发展。众多研究者目前的方向主要集中于构建更大、更复杂的神经网络。

算法实例：

深玻耳兹曼机（Deep Boltzmann Machine , DBM）
Deep Belief Networks（DBN）
卷积神经网络（CNN）
Stacked Auto-Encoders

5．支持向量机（Support Vector Machines）

支持向量机是一种监督式学习的方法，主要用在统计分类问题和回归分析问题上。它属于一般化线性分类器，也可以被认为是提克洛夫规范化方法的一个特例。

这族分类器的特点是他们能够同时最小化经验误差与最大化几何边缘区，因此支持向量机也被称为最大边缘区分类器。

给定一组训练示例，其中每个事例都属于两个类别中的一个，支持向量机（SVM）训练算法可以在被输入新的事例后将其分类到两个类别中的一个，使自身成为非概率二进制线性分类器。

SVM 模型将训练事例表示为空间中的点，它们被映射到一幅图中，由一条明确的、尽可能宽的间隔分开以区分两个类别。

6．降维算法（Dimensionality Reduction Algorithms）

降维是指采用某种映射方法，将原高维空间中的数据点映射到低维度的空间中。它的本质是学习一个映射函数 f : x->y，其中 x 是原始数据点的表达，目前最多使用向量表达形式。 y 是数据点映射后的低维向量表达，通常 y 的维度小于 x 的维度（当然提高维度也是可以的）。f 可能是显式的或隐式的、线性的或非线性的。

这一算法可用于可视化高维数据或简化接下来可用于监督学习中的数据。许多这样的方法可针对分类和回归的使用进行调整。

算法实例：

主成分分析（Principal Component Analysis , PCA）
主成分回归（Principal Component Regression , PCR）
偏最小二乘回归（Partial Least Squares Regression , PLSR）
Sammon 映射（Sammon Mapping）
多维尺度变换（Multidimensional Scaling , MDS）
投影寻踪（Projection Pursuit）
线性判别分析（Linear Discriminant Analysis , LDA）
混合判别分析（Mixture Discriminant Analysis , MDA）
二次判别分析（Quadratic Discriminant Analysis , QDA）
灵活判别分析（Flexible Discriminant Analysis , FDA）

7．聚类算法（Clustering Algorithms）

聚类算法是指对一组目标进行分类，属于同一组（亦即一个类，cluster）的目标被划分在一组中，与其他组目标相比，同一组目标更加彼此相似。它的优点是让数据变得有意义，缺点是结果难以解读，针对不同的数据组，结果可能无用。

算法实例：

K-均值（K-Means）
k-Medians 算法
Expectation Maximi 封层 ation (EM)
最大期望算法（EM）
分层集群（Hierarchical Clstering）

8．贝叶斯算法（Bayesian Algorithms）

贝叶斯定理（Bayes' theorem）是概率论中的一个定理，它跟随机变量的条件概率以及边缘概率分布有关。在有些关于概率的解说中，贝叶斯定理能够告知我们如何利用新证据修改已有的看法。贝叶斯方法是指明确应用了贝叶斯定理来解决如分类和回归等问题的方法。

算法实例：

朴素贝叶斯（Naive Bayes）
高斯朴素贝叶斯（Gaussian Naive Bayes）
多项式朴素贝叶斯（Multinomial Naive Bayes）
平均一致依赖估计器（Averaged One-Dependence Estimators , AODE）
贝叶斯信念网络（Bayesian Belief Network , BBN）
贝叶斯网络（Bayesian Network , BN）

9．关联规则学习算法（Association Rule Learning Algorithms）

关联规则学习方法能够提取出对数据中的变量之间的关系的最佳解释。比如说一家超市的销售数据中存在规则 {洋葱，土豆} => {汉堡}，那说明当一位客户同时购买了洋葱和土豆的时候，他很有可能还会购买汉堡肉，类似于联想算法。

算法实例：

Apriori 算法（Apriori algorithm）
Eclat 算法（Eclat algorithm）
FP-growth

10．图模型（Graphical Models）

图模型（GraphicalModels）在概率论与图论之间建立起了联姻关系。它提供了一种自然工具来处理应用数学与工程中的两类问题——不确定性（Uncertainty）和复杂性（Complexity）问题，特别是在机器学习算法的分析与设计中扮演着重要角色。图模型的基本理念是模块化的思想，复杂系统是通过组合简单系统建构的。概率论提供了一种粘合剂使系统的各个部分组合在一起，确保系统作为整体的持续一致性，提供了多种数据接口模型方法。

图模型或概率图模型（PGM , Probabilistic Graphical Model）是一种概率模型，一个图（graph）可以通过其表示随机变量之间的条件依赖结构（Conditional Dependence Structure）。

算法实例：