HarmonyOS
聚类算法 标签描述

聚类算法的性能度量 聚类算法就是根据数据中样本与样本之间的距离或相似度,将样本划分为若干组/类/簇,其划分的原则:簇内样本相似、簇间样本不相似,聚类的结果是产生一个簇的集合。 其划分方式主要分为两种, 嵌套类型 非嵌套类型 其中簇往往分为三种情况 基于中心的簇:簇内的点和其“中心”较为相近(或相似),和其他簇的“中心”较远,这样的一组样本形成的簇 基于邻接的簇:相比其他任何簇的点,每个点都至少和所属簇的某一个点更近 基于密度的簇:簇是由高密度的区域形成的,簇之间是一些低密度的区域 簇的相似性与距离度量 若采用距离为度量 闵可夫斯基距离:当时,为欧氏距离当时,为曼哈顿距离: 这...