多语言展示
当前在线:142今日阅读:154今日分享:43

高维数据聚类方法

将物理或抽象对象的集合分组称为由类似的对象组成的多个类的过程被称为聚类。高维聚类分析与传统聚类分析的最主要差别就是高维度。高维数据聚类是聚类技术的难点和重点。那么高维数据聚类有哪些方法呢?下面就跟小编一起去看看吧
工具/原料

电脑

方法/步骤
1

一、降维聚类:降维就是通过把数据点映射到更低维的空间上寻求数据的紧凑的一种技术,这种低空间的紧凑表示有利于对数据的进一步处理。

2

3

二、基于超图的聚类: 超图是对常规图的扩展,图中的每条边可以连接多个顶点,成为超边。基于超图的聚类方法把高维数据的关系映射到一个超图上,图中的每一条变表达这些数据的关系,边上的权值则表示相应关系到密切程度。在此基础上,基于超图的聚类方法实际上就是寻找超图顶点的一个划分,并使得处于同一个划分中的数据尽可能地相关。

4

5

三、子空间聚类:子空间聚类又称特征选择,它把原始数据空间划分为不同的子空间,只在那些相关的子空间上考察聚类的存在。这些算法一般使用贪心策略等搜索方法搜索不同的特征子空间,然后使用一些标准来评价这些子空间,从而找到所需的簇。

6

典型的子空间聚类算法有CLIQUE、ENCLUS和MAFIA等。该类算法都使用Apriori策略来查找和合并某度量大于给定阈值的网格,产生候选子空间,并将这些候选子空间按其覆盖即子空间中点数量的大小排序;随后利用最小描述长度准则将规模较低的子空间剪枝

推荐信息