摩杜云开发者社区-摩杜云

HarmonyOS

相似度标签描述

文章 | 聚类算法的性能度量

聚类算法的性能度量聚类算法就是根据数据中样本与样本之间的距离或相似度，将样本划分为若干组／类／簇，其划分的原则：簇内样本相似、簇间样本不相似，聚类的结果是产生一个簇的集合。其划分方式主要分为两种，嵌套类型非嵌套类型其中簇往往分为三种情况基于中心的簇：簇内的点和其“中心”较为相近（或相似），和其他簇的“中心”较远，这样的一组样本形成的簇基于邻接的簇：相比其他任何簇的点，每个点都至少和所属簇的某一个点更近基于密度的簇：簇是由高密度的区域形成的，簇之间是一些低密度的区域簇的相似性与距离度量若采用距离为度量闵可夫斯基距离：当时，为欧氏距离当时，为曼哈顿距离：这...

VW0ZAOA6bLNz 2023年12月22日 24 0 0 嵌套类型嵌套类型相似度机器学习相似度机器学习聚类算法聚类算法

文章 | t-SNE完整笔记 (附Python代码)

t-SNE(t-distributedstochasticneighborembedding)是用于降维的一种机器学习算法，是由LaurensvanderMaaten和GeoffreyHinton在08年提出来。此外，t-SNE是一种非线性降维算法，非常适用于高维数据降维到2维或者3维，进行可视化。 t-SNE是由SNE(StochasticNeighborEmbedding,SNE;HintonandRoweis,2002)发展而来。我们先介绍SNE的基本原理，之后再扩展到t-SNE。最后再看一下t-SNE的实现以及一些优化。 1.SNE 1.1基本原理 SNE是通过仿射(affiniti...

eCO46Rq6uUzg 2023年12月22日 19 0 0 开发语言开发语言相似度笔记概率分布相似度概率分布 python 笔记 Python