推荐系统实战第七章 | 推荐系统实例

    技术2022-07-11  89

    1、外围架构 数据规模和是否需要实时存取,不同的行为数据将被存储在不同的媒介当中。 需要实时存取的数据存储在数据库和缓存中 大规模的非实时地存取数据存储在分布式文件系统(如HDFS)中。

    2、推荐系统架构 推荐系统的核心任务: 1)如何为给定用户生成特征 人口统计学特征、用户的行为特征、用户的话题特征 2)如何根据特征找到物品 最新推荐,商品推荐,推荐不同种类的物品,混合推荐,推荐不同新颖度的产品

    多引擎组合成推荐系统 推荐系统是由多个推荐引擎组成的,每个推荐引擎负责一类特征和一种任务,推荐系统的任务只是将推荐引擎的结果按照一定的权重或者优先级合并、排序然后返回。 多引擎组合成推荐系统的好处 1)方便的增加/删除引擎,控制不同引擎对搜索结果的影响。 2)可以实现推荐引擎级别的用户反馈。一个推荐引擎代表了一种推荐策略,不同的用户喜欢不同的推荐策略。每一种策略都设计成一个搜索引擎,根据用户反馈,对不同的用户给出不同的引擎组合权重。

    3、推荐引擎的架构 推荐引擎架构的3个部分 1)从数据库或者缓存中拿到用户行为数据,分析不同行为,生成用户的特征向量。 2)对用户的特征向量通过特征-物品相关矩阵转化为初始推荐物品列表 3)对初始推荐列表进行过滤、排名等处理,从而生成最终的推荐结果。 3.1 生成用户特征向量 利用用户行为计算特征向量时需要考虑一下因素 1)用户行为的种类。用户不同行为的权重。 2)用户行为产生的时间。近期重要,长远不重要 3)用户行为的次数。对单一物品的多次行为重要 4)物品的热门程度。用户对不热门的物品产生兴趣

    3.2 特征-物品相关推荐 利用特征-物品相关表,来对物品进行推荐。

    3.3 过滤模块 会过滤掉以下物品 1)用户已经产生过行为的物品。 对于已经产生过行为的产品,进行过滤,可以保证推荐结果的新颖性。 2)候选物品以外的物品。 满足产品需求和用户使用需求。 3)某些质量很差的物品。

    3.4 排名模块 1)新颖性 2)多样性 a. 在推荐结果按照某种物品的内容属性分成几类 b. 控制不同推荐结果的推荐理由出现的次数 3)时间多样性:在不同时间看到的推荐结果有差异性 4)用户反馈 分析用户之前和推荐结果的交互日志,预测用户会对什么样的推荐结果比较感兴趣

    Processed: 0.011, SQL: 10