其他
机器学习中距离和相似性度量方法
日期:2019年11月2日
正文共:4720字26图
预计阅读时间:12分钟
来源:daniel-D
2) d(x,y) >= 0 // 距离非负
3) d(x,y) = d(y,x) // 对称性: 如果 A 到 B 距离是 a,那么 B 到 A 的距离也应该是 a
4) d(x,k)+ d(k,y) >= d(x,y) // 三角形法则: (两边之和大于第三边)
1. 闵可夫斯基距
: 该维度上的均值 : 该维度上的标准差
2. 马氏距离
3. 向量内积
余弦相似度与向量的幅值无关,只与向量的方向相关,在文档相似度(TF-IDF)和图片相似性(histogram)计算上都有它的身影。需要注意一点的是,余弦相似度受到向量的平移影响,上式如果将 x 平移到 x+1, 余弦值就会改变。怎样才能实现平移不变性?这就是下面要说的皮尔逊相关系数(Pearson correlation),有时候也直接叫相关系数:
4. 分类数据点间的距离
5. 序列之间的距离
6. 概率分布之间的距离
— THE END —
☞现代数学确实在改变世界☞数学家们的故事☞经典 | 奇异值分解(SVD) 的 几何意义☞算法你都懂_如何一年赚它几百万☞他的科学生涯堪称加速器,30岁当博导,38岁当选中科院院士,40岁当选德国科学院院士。。。