其他
机器学习储备(2):高斯分布
戳上面的蓝字关注我们!
作者:alg-flody
编辑:Emily
指随机过程中,任何时刻的取值都为随机变量,如果这些随机变量服从同一分布,并且互相独立,那么这些随机变量是独立同分布。
先说说独立这个概念。在预测德克萨斯州区域的房屋价值时,房屋样本x1和样本x2之间的预测是相互独立的,它们之间不存在任何关系,这也是接近实际的。
同分布是指预测的房屋都是来自于德克萨斯州这块区域的,你不能拿北京的某个小三居扔到这个模型中去做预测吧,如果非要这样,误差一定会很大。
高斯分布(Gaussian distribution), 又称为正态分布(Normal distribution),是一个非常重要在各个领域有广泛应用的概率分布。
正态曲线的特点是中间高,两头低,左右对称,人们经常称之为钟形曲线。
若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。
其概率密度函数为正态分布的,期望值μ决定了它的位置,标准差σ^2数据的偏离程度。
当μ = 0,σ = 1时的高斯分布又称为标准正态分布。
若随机变量服从如下的概率密度函数,则表明是一维正态分布。
当然,还有多维正态分布,在此不做详述。
主要推送关于算法的分析过程及应用的消息。培养思维能力,注重过程,挖掘背后的原理,刨根问底。本着严谨和准确的态度,目标是撰写实用和启发性的文章,欢迎您的关注。