首页 > 范文大全 > 正文

基于评分差异度和用户偏好的协同过滤算法

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于评分差异度和用户偏好的协同过滤算法范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:针对传统协同过滤推荐算法仅通过使用用户评分数据计算用户相似度以至于推荐精度不高的问题,提出一种改进的协同过滤推荐算法。首先,以用户评分的平均值作为分界点得出用户间的评分差异度,并将其作为权重因子计算基于评分的用户相似度;其次,依据用户项目评分和项目类别信息挖掘用户对项目类别的兴趣度以及用户项目偏好,并以此计算用户偏好相似度;然后,结合上述两种相似度加权产生用户综合相似度;最后,融合传统项目相似度和用户综合相似度进行评分预测及项目推荐。实验结果表明,相对于传统的基于用户评分的协同过滤推荐算法,所提算法在数据集下的平均绝对误差值平均降低了2.4%。该算法可在一定程度上提高推荐算法精度以及推荐质量。

关键词:协同过滤;评分差异度;类别兴趣度;用户相似度

中图分类号:TP301.6 文献标志码:A

0引言

协同过滤(Collaborative Filtering, CF)推荐算法是在推荐领域最受关注且研究应用最广泛的算法之一[1]。传统的协同过滤推荐算法主要包括基于用户的协同过滤(Userbased CF, UserCF)算法、基于产品的协同过滤(Itembased CF, ItemCF)算法和基于模型的协同过滤(Modelbased CF, ModelCF)算法[1-2]。其中:UserCF算法首先利用用户评价信息构建用户评分矩阵,采用余弦相似度、皮尔森相似度等相似度计算方法获得用户相似度矩阵;其次,以用户相似度矩阵作为数据源,结合TopN或者设定阈值方法[3-4],获取目标用户的邻居集;然后,通过与其相关联的用户评分信息,预测目标用户对未评分项目的评分,并进行最终的产品或服务推荐。

然而,随着互联网的飞速发展,在各大电子商务网站中,浏览各类信息的用户以及注册网站的用户数据量都以亿计,网站供需的产品数量规模也已经相当庞大,这些变化都给推荐系统的运行和实施带来了很大的负担;同时,也极大影响了推荐算法的复杂程度和推荐结果的质量。在协同过滤推荐算法中,数据稀疏以及相似度计算方式是影响推荐精度的重要原因[5]。为此,许多研究学者针对相似度计算方法提出了一系列的改进措施。一些学者提出项目评分预填充[6]、混合加权[7]等方式缓解数据稀疏,以改善相似度计算精度。也有一些学者,例如,高娜等[1]提出了改进的结合标签和评分的协同过滤(Unifying Tags and Ratings CF, UTRCF)推荐算法以及结合标签和评分的基于用户的协同过滤(Unifying Tags and Ratings based on user CF,UTRUserCF)推荐算法,有效缓解了数据稀疏性问题,并提升了推荐准确性;宋瑞平[8]提出了结合用户评分以及用户属性的综合相似度和改进最近邻的混合推荐算法――MSCF算法,改进了推荐算法的精确度;王晓军[9]提出了一种结合项目属性和偏好的协同过滤(CF using item Attribute and Preferences, CFAP)算法,首先利用项目基础特征和用户特征构建项目偏好,然后通过项目相似度融合提高相似度计算准确性。以上方法存在以下缺陷:在计算相似度时,未关注用户之间共同评分数对其计算精度的影响;忽略了用户评分的差异性,未考虑评分的高与低,默认所有评分的权重值相同;未充分利用项目类别信息,忽略了用户对单一项目类别的偏好程度对其评分的影响。

因此,本文综合考虑用户评分以及用户项目偏好两方面,结合用户共同评分权重、评分差异度和项目类别信息,提出一种基于评分差异度和用户偏好的协同过滤(CF based on Score Difference level and User Preference, SDUPCF)推荐算法,该算法从融合了用户共同评分权重以及评分差异度的用户评分信息和用户项目偏好信息两方面计算用户综合相似度,最终利用目标用户的相似用户对目标项目的评分以及目标项目的相似项目被用户评分结果,通过加权进行评分预测及生成推荐。

4结语

用户对项目的评价的高低可以体现用户对其的喜好程度,本文以此提出评分差异度权重因子,而用户对不同项目类别的喜好可以反映出用户对项目类别的感兴趣程度,结合用户评分可以更加准确地表示用户对项目的偏好。本文将评分差异度权重因子融入到用户评分相似度中,并利用用户项目类别兴趣度计算用户项目偏好,提出了一种新的用户相似度计算方法,并在最终预测评分阶段通过加权融合基于项目的评分值预测结果,进一步改善推荐结果。实验结果表明,本文算法在一定程度上提高了相似度计算的准确性以及推荐质量。此外,本文在算法设计以及实验过程中,发现在最近邻居选择时,忽略了与目标用户相似度很高但是未对预测项目评分的用户对最终预测结果的影响程度,今后将对此项不足进行深入研究。

参考文献:

[1]

高娜, 杨明.一种改进的结合标签和评分的协同过滤推荐算法[J].南京师大学报(自然科学版), 2015, 38(1):98-103.(GAO N, YANG M. An improved unifying tags and ratings collaborative filtering for recommendation system[J]. Journal of Nanjing Normal University (Natural Science Edition), 2015, 38(1):98-103.)

[2]

毕孝儒.项目子相似度融合的协同过滤推荐算法[J].计算机系统应用, 2015, 24(1):147-150.(BI X R. Collaboration filtering recommendation algorithm of subsimilarity integration between items[J]. Computer Systems & Applications, 2015, 24(1): 147-150.)

[3]

郝立燕, 王靖.基于项目流行度的协同过滤TopN推荐算法[J].计算机工程与设计, 2013, 34(10):3497-3501.(HAO L Y, WANG J. Collaborative filtering TopNrecommendation algorithm based on item popularity[J]. Computer Engineering and Design, 2013, 34(10):3497-3501.)

[4]

CASTROSCHEZ J, MIGUEL R. A highly adaptive recommender system based on fuzzy logic for B2C ecommerce portals[J]. Expret Systems with Applications, 2011, 38(3): 2441-2454.

[5]

王兴茂, 张兴明.基于贡献因子的协同过滤推荐算法[J].计算机应用研究, 2015, 32(12):3551-3554.(WANG X M, ZHANG X M. Collaborative recommendation algorithm based on contribution factor[J]. Application Research of Computers, 2015, 32(12):3551-3554.)

[6]

邓爱林, 朱扬勇, 施伯乐.基于项目评分预测的协同过滤推荐算法[J].软件学报, 2003, 14(9):1621-1628.(DENG A L, ZHU Y Y, SHI B L. A collaborative filtering recommendation algorithm based on item rating prediction[J]. Journal of Software, 2003, 14(9):1621-1628.)

[7]

高全力, 高岭, 杨建峰, 等.融合影响因子的加权协同过滤算法[J].计算机工程, 2014, 40(8):38-42.(GAO Q L, GAO L, YANG J F, et al. Weighted collaborative filtering algorithm with fused impact factor[J]. Computer Engineering, 2014, 40(8): 38-42.)

[8]

宋瑞平.混合推荐算法的研究[D].兰州:兰州大学, 2014:41-48.(SONG R P. Research of hybrid recommendation algorithm[D]. Lanzhou: Lanzhou University, 2014: 41-48.)

[9]

王晓军.利用项目属性和偏好改进协同过滤推荐[J].北京邮电大学学报, 2014, 37(6):68-71.(WANG X J. Employing item attribute and preference to enhance the collaborative filtering recommendation[J]. Journal of Beijing University of Posts and Telecommunications, 2015, 37(6): 68-71.)

[10]

丁少衡, 姬东鸿, 王路路.基于用户属性和评分的协同过滤推荐算法[J].计算机工程与设计, 2015, 36(2):487-491.(DING S H, JI D H, WANG L L. Collaborative filtering recommendation algorithm based on user attributes and scores[J]. Computer Engineering and Design, 2015, 36(2): 487-491.)

[11]

朱郁筱, 吕琳媛.推荐系统评价指标综述[J].电子科技大学学报, 2012, 41(2):163-175.(ZHU Y X, LYU L Y. Evaluation metrics for recommender systems[J]. Journal of University of Electronic Science and Technology of China, 2012, 41(2): 163-175.)

[12]

VOZALIS M, MARGARITIS K G. On the enhancement of collaborative filtering by demographic data[J]. Web Intelligence and Agent Systems, 2006, 4(2): 117-138.

Background

This work is partially supported by the National Natural Science Foundation of China (61462001), the NSFC Precultivation Project of Beifang University of Nationality (2012QZP02).

DANG Bo, born in 1989, M. S. candidate. His research interests include recommendation algorithm, information system, software engineering.

JIANG Jiulei, born in 1972, Ph. D., professor. His research interests include service computing, business process modeling, software engineering.