最新!一号台风或将生成
1712 2025-05-14 09:33
样本数据i与局部密度高于i的样本数据之间的最小距离被称之为相对最小距离,用δi表示,其表达式为:
式中,假如样本数据i拥有最大局部密度值,则IiS≠ϕ,此时δi表示样本数据i与其他样本数据之间的最大距离,确保样本数据的最大局部密度值和相对最小距离值均维持最大。
通过计算数据集中每个样本数据,获取两个变量值后,采用下述步骤完成数据聚类:
1)类簇中心的确定需要找到密度高峰值点。
2)将剩余样本数据划分到类簇中,其为比剩余样本局部密度大且距离最小的样本数据所属的类簇。
3)针对使用决策图很难判断的情况,构建局部密度和相对最小距离结合参考量γ,γi=ρiδi,通过γi值的大小判断样本数据i是否为类簇中心,其值越大,样本数据i是类簇中心的可能性越大。因此,只要采用降序排列完成每个样本数据的γ值的处理后,选取相对较大γ值的样本数据为类簇中心。
类簇中心确定后,为完成实验室管理数据集聚类,需要将剩余数据划分至类簇中,该划分是根据局部密度逐渐降低的顺序实现;划分至类簇为密度比其高并且距离最小的样本数据所在的类簇。该算法具体流程为:
输入:数据集
其包含n个数据。
输出:k个簇。
1)样本数据i的局部密度值ρi通过式(1)计算得到。
2)样本数据xi的相对最小距离δi通过式(2)计算得到。
3)绘制决策图需要根据ρi和δi完成,它们分别是各样本数据的局部密度值以及相对最小距离值,类簇中心是决策图中最优样本数据,是决策图中显著的、局部密度高和相对最小距离大的样本数据。
4)向最优样本对象中分配剩余样本数据,实现实验室数据集聚类。
声明:本文所用图片、文字来源《现代电子技术》,版权归原作者所有。如涉及作品内容、版权等问题,请与本网联系删除。
相关链接:实验室,样本,评价