Gadzan

谱聚类

无须事先指定簇数量的聚类说到聚类，最常见的模型当然是 KMeans。不过如果使用 KMeans 的话，需要在算法运行前指定 $k$ 的值——也就是要在训练前指定最后的结果被分为几簇。现实中有相当多的聚类问题，无法事...

2019年1月1日下午1点22分大概12分钟读完机器学习理论

有监督学习和无监督学习，是机器学习两个大的类别。我们之前讲的都是有监督学习，毕竟有监督学习现阶段还是机器学习在实际应用中的主流。...

2018年12月31日下午4点17分大概21分钟读完机器学习理论

概率无向图模型（Probabilistic Undirected Graphical Model）是一个可以用无向图表示的联合概率分布。它的整体结构是一张图（Graph），图中每一个节点表示一个或者一组变量，节点之间的边...

2018年12月30日下午12点13分大概22分钟读完机器学习理论

所谓概率模型，顾名思义，就是将学习任务归结于计算变量的概率分布的模型。概率模型非常重要。在生活中，我们经常会根据一些已经观察到的现象来推测和估计未知的东西——这种需求，恰恰是概率模型的推断（Inference）行为所做...

2018年12月29日上午8点17分大概27分钟读完机器学习理论

线性可分 SVM import numpy as np import matplotlib.pyplot as plt from sklearn.svm import SVC # "Support vector clas...

2018年12月28日下午3点01分大概7分钟读完机器学习理论 SVM SVR Python

严格的线性回归线性回归是在向量空间里用线性函数去拟合样本。该模型以所有样本实际位置到该线性函数的综合距离为损失，通过最小化损失来求取线性函数的参数。参见下图：对于线性回归而言，一个样本只要不是正好落在最终作...

2018年12月28日下午2点29分大概8分钟读完机器学习理论 SVR

class binary_classification(object): def __init__(self, kernel, C=1.0, max_iter=1000, tol=0.001): ...

2018年12月27日下午3点00分大概2分钟读完机器学习理论 Python

线性可分 SVM 学习的训练数据本身就是线性可分的，可以很清晰地在特征向量空间里分成正集和负集。线性可分 SVM 正负样本之间的间隔叫做“硬间隔”，也就是说在这个“隔离带”里面，肯定不会出现任何训练样本。我们不难想到...

2018年12月27日下午2点31分大概22分钟读完机器学习理论 SVM