摘要: 大规模高维数据集的聚类算法已成为当前聚类研究的热点,由于高维的原因,聚类往往隐藏在数据空间的某些子空间中,传统的聚类算法无法获得有意义的聚类结果.此外,高维数据中含有的大量的随机噪声也会带来额外的效率问题.为了解决以上问题,该文在CLIQUE算法的基础上提出了一种基于最优区间分割和数据集划分的聚类算法—OpCluster,并使用仿真数据对该算法加以验证,实验结果表明,OpCluster对大规模高维数据集具有很好的聚类效果.
中图分类号:
周晓云, 孙志挥, 张柏礼. 一种大规模高维数据集的高效聚类算法[J]. 应用科学学报, 2006, 24(4): 396-400.
ZHOU Xiao-yun, SUN Zhi-hui, ZHANG Bai-li. An Efficient Clustering Algorithm of Large Scale and High Dimensional Data Set[J]. Journal of Applied Sciences, 2006, 24(4): 396-400.