摘要: 给出了一种简单有效的算法,用于对图书馆大规模日志数据的快速聚类和借阅趋势分析.首先,根据读者基本的借阅规律,把日志数据聚成若干子类,然后,给出了对子类结果进行再次聚类的模糊算法.最后,为了预测读者的借阅趋势,对每一类进行了回归分析.该算法具有线性复杂度,对大规模数据集是可伸缩的,实验证明是可行的.
中图分类号:
宋爱波, 庄晓青, 何洁月, 业宁, 董逸生. 图书馆大规模日志数据的快速聚类[J]. 应用科学学报, 2003, 21(3): 284-288.
SONG Ai-bo, ZHUANG Xiao-qing, HE Jie-yue, YE Ning, DONG Yi-sheng. Quick Clustering of Large Log Data in Library[J]. Journal of Applied Sciences, 2003, 21(3): 284-288.