摘要: 针对集成学习方法在处理大规模数据集时具有计算复杂度高、基分类器数目多、分类精度不理想的问题,提出一种基于频繁模式的选择性集成算法. 该算法利用频繁模式挖掘的原理,将未剪枝的集成分类器和样本空间映射为事务数据库,并利用布尔矩阵存储分类结果,然后从中挖掘频繁基分类器组成最终的集成分类器,达到选择性集成的目的. 实验结果表明,与集成分类算法Bagging、AdaBoost、WAVE 和RFW 相比,该算法减小了集成分类器的规模,提高了集成分类器的分类精度和分类效率.
中图分类号:
周红芳1, 王啸1, 赵雪涵1, 饶元2. 基于频繁模式的选择性集成[J]. 应用科学学报, 2013, 31(6): 628-632.
ZHOU Hong-fang1, WANG Xiao1, ZHAO Xue-han1, RAO Yuan2. Ensemble Pruning Based on Frequent Patterns[J]. Journal of Applied Sciences, 2013, 31(6): 628-632.