计算机与现代化 ›› 2013, Vol. 12 ›› Issue (12): 19-22.doi: 10.3969/j.issn.1006-2475.2013.12.005
卞艺杰,陈 超,马玲玲,陈远磊
BIAN Yi-jie, CHEN Chao, MA Ling-ling, CHEN Yuan-lei
摘要: 近年来很多基于协同过滤的推荐系统得到了成功应用,但随着系统中用户和项目数量的不断增加,相似度计算量剧增,使得协同过滤推荐系统的扩展性问题变得日益突出。本文提出改进的基于近似最近邻的LSH/MinHash算法,并运用到图书馆资源聚类中,以解决在合理时间复杂度下的高维大数据量聚类问题,降低相似度计算量,提高算法的可扩展性。实验表明此算法有较高的效率与精度。