摘要: 首先将事务数据库压缩存储到一棵事务线索树(TT-tree)的结点上,并建立这些结点的索引表,然后寻找结点索引表的最后结点到根结点的全部路径,这些路径及路径的交集包含了用于挖掘关联规则的频繁集.该算法只需扫描事务数据库一次,由于采用了逆向搜索TT-tree的方法,搜索的时间开销非常少.该算法可以挖掘中短模式的海量数据,具有很好的伸缩性,同时该算法具有增量挖掘的功能.通过大量的实验数据进行比较,该算法的速度约是Apriori算法的10倍.
中图分类号:
业宁, 董逸生, 王厚立. 基于事务线索树的一次扫描关联规则增量挖掘算法[J]. 应用科学学报, 2004, 22(2): 200-204.
YE Ning, DONG Yisheng, WANG Houli. The One-Time Scanning Incremental Mining Algorithm of Association Rules Based on a Transaction Thread Tree[J]. Journal of Applied Sciences, 2004, 22(2): 200-204.