#机器学习理论

深度学习开放数据集

转自DL4J [https://deeplearning4j.org/cn/opendata] ------------------------------------------------------------...

PCA主成分分析

维数灾难(Curse of Dimensionality,也可以直接翻译为“维度诅咒”)是一种在分析或组织高维(通常是几百维或者更高维度)数据时会遇到的现象。既然叫灾难或者诅咒,可见不是好现...

机器学习线性代数常用知识汇总

1. 向量 1.1 基本概念 【向量(vector)】:一个同时具有大小和方向的几何对象。 【行向量(row vector)】:一个1×n的矩阵,即矩阵由一个含有n个元素的行所组成: $x=\left [ x_1,x...

GMM高斯混合模型

前面我们讲的 KMeans 和谱聚类都是将特征空间中的一个个个体,依据它们相互之间的关系,归属到不同的簇中。 用个形象点的比喻,我们将特征空间想象成一个二维的...

最大期望算法EM

早在学习朴素贝叶斯模型的时候,我们就知道:当一个概率模型参数未知,但有一系列样本数据时,可以采用极大似然估计法来估计它的参数。...

谱聚类

无须事先指定簇数量的聚类 说到聚类,最常见的模型当然是 KMeans。不过如果使用 KMeans 的话,需要在算法运行前指定 $k$ 的值——也就是要在训练前指定最后的结果被分为几簇。 现实中有相当多的聚类问题,无法事...

有监督与无监督学习,KNN与KMeans

有监督学习和无监督学习,是机器学习两个大的类别。我们之前讲的都是有监督学习,毕竟有监督学习现阶段还是机器学习在实际应用中的主流。...

CRF条件随机场

概率无向图模型(Probabilistic Undirected Graphical Model)是一个可以用无向图表示的联合概率分布。它的整体结构是一张图(Graph),图中每一个节点表示一个或者一组变量,节点之间的边...