#机器学习理论

深度学习开放数据集

转自DL4J 本页为您整理汇总了各类可供机器学习研究使用的高质量数据集。欢迎您为本页列表推荐新的数据集!您还可以在维基百科等其他地方找到类似的数据集一览表。 最近添加 开源生物特征识别数据 谷歌A ...

PCA主成分分析

泛滥成灾的特征维度 维度灾难 维数灾难(Curse of Dimensionality,也可以直接翻译为“维度诅咒”)是一种在分析或组织高维(通常是几百维或者更高维度)数据时会遇到的现象。既然叫灾难或 ...

机器学习线性代数常用知识汇总

1. 向量 1.1 基本概念 【向量(vector)】:一个同时具有大小和方向的几何对象。 【行向量(row vector)】:一个1×n的矩阵,即矩阵由一个含有n个元素的行所组成: $x=\le ...

GMM高斯混合模型

个体 vs 集体 前面我们讲的 KMeans 和谱聚类都是将特征空间中的一个个个体,依据它们相互之间的关系,归属到不同的簇中。 用个形象点的比喻,我们将特征空间想象成一个二维的平面,样本数据则是“散 ...

最大期望算法EM

含有隐变量的概率模型 通过极大化对数似然函数求解概率模型参数 设有概率模型,${X}$ 表示其样本变量,$\Theta$ 表示其参数。 我们知道这个概率模型的形式,又有很多的样本数据($X$ 取值已 ...

谱聚类

无须事先指定簇数量的聚类 说到聚类,最常见的模型当然是 KMeans。不过如果使用 KMeans 的话,需要在算法运行前指定 $k$ 的值——也就是要在训练前指定最后的结果被分为几簇。 现实中有相当 ...

有监督与无监督学习,KNN与KMeans

从有监督学习到无监督学习 有监督学习和无监督学习,是机器学习两个大的类别。我们之前讲的都是有监督学习,毕竟有监督学习现阶段还是机器学习在实际应用中的主流。 有监督学习(Supervised Lear ...

CRF条件随机场

概率无向图 定义 概率无向图模型(Probabilistic Undirected Graphical Model)是一个可以用无向图表示的联合概率分布。 它的整体结构是一张图(Graph),图中每 ...