推荐算法的物以类聚人以群分( 二 )


依赖不同的协同算法,同样的数据集合可能会得到不同的结果 。下表中,展示了不同书籍的用户购买情况 。对于用户E而言,其购买了《推荐系统实践》和《大数据时代》两本书 。那下一步,我们应该给他推荐哪本书呢?
在基于物品的协同下,应该给他推荐《推荐系统》 。这是因为《推荐系统》与用户E已经购买的两本书的购买用户重叠度更高 。
在基于用户的协同下,应该给他推荐《集体智慧编程》 。这是因为用户E的消费历史跟用户A、B、D重叠更高、更相似,而A、B、D三位用户都购买了《集体智慧编程》 。

推荐算法的物以类聚人以群分

文章插图
 
基于用户的协同算法在1992年就已经被提出,而基于物品的协同算法直到2001年才被亚马逊提出 。大家一度认为基于物品的协同要优于基于用户的协同,这是因为大型电商网站的用户数量往往远大于商品数量,且商品的更新频率相对较低,基于物品的协同能够以离线运算的方式获得更好的推荐效果 。但对新闻推荐系统、社交性推荐系统等而言,其物品是海量和频繁更新的,故而基于用户的协同也有着相应的用武之地 。
协同类推荐的典型应用场景,如豆瓣在书籍介绍下展示的“喜欢读×××的人也喜欢……” 。基于模型的协同,是用用户的喜好信息来训练算法模型,实时预测用户可能的点击率 。比如,在Netflix的系统中就将受限玻尔兹曼机(Restricted Boltzmann machines,RBM)神经网络应用于协同过滤 。将深度学习应用于基于模型的协同,也成了业界广泛使用的方式 。
协同推荐是目前应用最为广泛的推荐机制,其基于用户行为的特点使我们不需要对物品或信息进行完整的标签化分析和建模,从而实现了领域无关,可以很好地发现用户的潜在兴趣偏好 。
作者:小武

【推荐算法的物以类聚人以群分】


推荐阅读