个性化互联网和推荐引擎
推荐引擎并不是一个新概念,大型的电子商务网站(例如,Amazon)很多年前就采用了推荐引擎技术,但是从2008年开始,陆续看到很多采用推荐引擎技术的网站开始盈利,推荐引擎就更受关注了,最近又有谷歌个性化搜索服务被诉侵权的报道,涉案专利是2000年申请的,而个性化是推荐引擎的核心,由此可见,推荐引擎的历史很久远。本文对其历史进行回溯,将一些关键资料进行汇集,方便产品和市场战略研究。
推荐引擎的价值
The Art, Science and Business of Recommendation Engines清晰地解释了推荐引擎的价值——是在线企业差异化竞争的利器。
原文指出用户上网行为分成两类:搜索和浏览。当消费者清楚地知道自己要找什么商品时,他的上网行为是搜索;如果用户并不清楚要找什么,只是逛一逛,此时他是在浏览,这是商家抓住消费者的有利时机,因为他并没有决定要买什么,他愿意听多种建议,推荐该粉墨登场了。
根据The Art, Science and Business of Recommendation Engines,推荐方式分成四类:
- 个性化推荐(Personalized recommendation),根据某个人过去的消费行为推荐商品
- 社会化推荐(Social recommendation),根据类似的消费者的过去的消费行为推荐商品。当前社交网络(SNS)正被热炒,提高用户注册量、增加用户活跃程度是 SNS发展的第一阶段,这个阶段也许即将结束了,下一个阶段是挖掘用户行为数据和社交关系图谱,用户在SNS系统中的活动数据是一个宝库,如果利用合适的 算法进行挖掘,社会化推荐就更有效了
- 物品推荐(Item recommendation),根据物品(商品)的特性进行推荐
- 上述三种方式的结合
The Art, Science and Business of Recommendation Engines以使用Amazon的体验为例详细讲解了上述四类推荐的案例。
推荐引擎需要面对的问题
The Art, Science and Business of Recommendation Engines将Amazon作为例子,Amazon有积累了10几年的用户消费行为数据,这就是它在推荐引擎方面的核心竞争力,即使Amazon拥有这么庞大的数据以供挖掘,它也需要面对很多难题需要解决。
5 Problems of Recommender Systems总结了5大需要解决的问题。
数据匮乏
也许Amazon没有这个问题,这是给推荐引擎产业的新进入者设置的最大的门槛
应对数据变化
因为核心算法是对历史数据的统计,所以偏爱老数据,而新的变化难于及时体现,所以难于跟上时尚潮流的变化(past behavior [of users] is not a good tool because the trends are always changing),同时原文指出:在变化很快的时尚领域物品推荐方式不太奏效,因为单个物品的特性太多而且随时间变化,所以,社会化推荐也许更有效。
应对用户喜好的变化
用户每次使用同一个系统(例如,Amazon)的目的不同,所以推荐算法也许会迷惑。但是,本人认为通过长时间的采集用户的行为数据,某个用户的消费倾向还是能够把握的,本人使用当当网购物时就体会到它的推荐还是比较贴合我的口味的。
个别物品的特性具有对立的多面性
有些物品,在同一个物品身上能够发现不相容的商品特性,主要在文化基因和个人喜好方面,这类物品很难推荐。
计算很复杂
要面对的问题有:原始数据量巨大、需计算的参数很多,因此计算很复杂。
个性化互联网
个性化是推荐引擎实现的基础,有了大量的个性化数据采集和挖掘,推荐引擎才得以实施,而推荐引擎只是个性化互联网的一种应用,在个性化基础上还会有很多应用涌现。
Top 5 Web Trends of 2009: Personalization对个性化和内容过滤进行了论述,个性化数据是关键,而这些数据一般都是结构化数据,原文罗列了多个结构化数据源和技术标准,并提及社交图谱的重要性。