怎么定义一个好的推荐系统,该本书通过回答以下三个问题对好的操作系统进行阐释。
第一个问题:什么是推荐系统
第二个问题:个性化推荐应用
第三个问题:推荐系统中‘好’的定义
什么是推荐系统
由于信息过载的问题,这是一个自动化的工具,能够分析用户的历史兴趣,找出符合用户兴趣的项目。推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,实现信息消费者与生产者的双赢(即解决信息过载的问题)。
推荐系统与搜索引擎的区别:搜索引擎也是一种解决信息过载的工具,能够帮助用户快速发现有用信息的工具。推荐系统与搜索引擎的区别在于推荐系统不需要用户提供明确的需求,而是通过分析用户的历史行为给用户兴趣建模,从而主动给用户推荐能够满足他们兴趣和需求的信息。两者形成一种互补关系(有明确目的查找以及没有明确目的查找)推荐算法的本质是通过一定的方式将用户和物品联系起来。个性化推荐应用
推荐系统应用是由前台的展示页面、后台的日志系统以及推荐算法系统3部分构成的。
使用推荐系统领域:电子商务、电影和视频、音乐、社交网络、阅读、基于位置的服务、个性化邮件和广告等。
推荐系统中‘好’的定义
预测准确度是推荐系统领域的重要指标。但是准确的预测并不代表好的推荐(本来就打算买的再给他推荐就没有意义了)。因此,一个好的推荐系统不仅仅能够预测用户的行为,而且能够扩展用户的视野,帮助用户发现那些他们可能感兴趣,但是不那么容易发现的东西。
推荐系统中,主要有3中评测推荐效果的实验方法:离线实验、用户调查、在线实验 离线实验:离线实验不需要有对实际系统的控制权以及用户参与实验,同时它速度快,可以测试大量算法,但是它无法计算商业关心的指标(点击率,转换率)用户调查可以获得很多离线时灭有办法评测的与用户主观感受有段的指标,但是它的成本高在线实验:AB测试(周期长,但是效果好) 评测指标:用户满意度(可以用点击率、用户停留实践和转化率等指标度量用户的满意度,或直接通过用户调查和用户反馈),预测准确度(评分预测中使用RMSE、MAE,TopN推荐中一般通过准确率( P = ∑ u i n U ∣ R ( u ) ⋃ T ( u ) ∣ ∑ u i n U ∣ R ( u ) ∣ P = \frac{\sum_{u in U}|R(u) \bigcup T(u)|}{\sum_{u in U}|R(u)|} P=∑uinU∣R(u)∣∑uinU∣R(u)⋃T(u)∣)或召回率( R = ∑ u i n U ∣ R ( u ) ⋃ T ( u ) ∣ ∑ u i n U ∣ T ( u ) ∣ R = \frac{\sum_{u in U}|R(u) \bigcup T(u)|}{\sum_{u in U}|T(u)|} R=∑uinU∣T(u)∣∑uinU∣R(u)⋃T(u)∣)度量(R(u)为预测的推荐列表,T(u)为用户再测试集上的行为列表)、覆盖率(信息熵与基尼系数)、多样性、新颖性、惊喜度(与用户历史兴趣不相似,但是用户觉得满意)、信任度(提高信任度的方法:增加推荐系统的透明度(主要方法是提供推荐解释),利用用户的好友信息给用户做推荐)、实时性、健壮性、商业目标在评测系统中还需要考虑评测维度(用户、物品、时间)。