推荐系统HandBook Chapter3 基于内容的推荐系统-前沿和趋势
物品推荐的问题已经有广泛的研究,现有两类主要方式。基于内容的推荐系统试图推荐给定用户过去喜欢的相似物品, 而协同过滤推荐方式的系统识别出拥有相同爱好的用户,并推荐他们喜欢过的物品。
基于内容的推荐系统的基础
一个基于内容的推荐系统的高层次结构下图所示。推荐的过程包含有三个阶段,每一个阶段都由独立的部件控制。
- 内容分析器
- 该部件的主要功能是将来自信息源的对象的内容表示成恰当的格式,以便于下一阶段的处理。
- 信息学习器
- 该部件收集用户偏好的数据特征,并试图通过机器学习技术泛化这些数据,从而构建用户特征信息。
- 过滤组件
- 该部件将用户与物品在表示空间中进行匹配,之后生成一个潜在感兴趣物品的排名清单。
基于内容的推荐系统的推荐流程
- 根据用户u对物品i的评分r,信息学习器通过监督学习算法,为该用户生成偏好特征;
- 用户偏好特征存储在信息资源库里,并被接下来的过滤组件使用;
- 比较用户偏好特征和新物品的特征,过滤组件预测用户对新物品的感兴趣程度;
- 过滤组件生成一个推荐列表给用户。
- 用户偏好会不断变化,上述步骤不断迭代。
基于内容过滤的优缺点
基于内容的推荐与基于协同过滤的推荐相比有一下优点:
- 用户独立性
- 只使用当前用户提供的评分构建个人信息
- 协同过滤使用近邻用户,只有用户近邻喜欢的物品才有可能被推荐
- 透明度
- 通过显式列出推荐列表中的物品特征,可以对推荐进行解释
- 协同过滤是黑盒子,解释仅来自相似的未知用户
- 新物品
- 新物品没有用户评分也能被推荐
- 协同过滤只有被一系列用户评分后,才有可能被推荐
缺点:
- 可分析的内容有限
- 受特征数量、类型以及领域知识的限制
- 过度特化
- 无法获得出人意料的推荐。(不能发现用户的潜在兴趣)
- 新用户
- 必须收集到足够的用户评分后,才能理解用户偏好并给予推荐
基于内容的推荐系统的现状
基于关键词系统概述
- Web推荐系统领域
- 新闻过滤领域
- 音乐领域
- 融合协同过滤和基于内容的方法的混合推荐系统
基于本体的语义分析
- SiteIF
- 多语言新闻网站的个性化工具
- 第一个采用基于感知的文档表示来对用户兴趣建模
- 词领域消歧
- ITR, Item Recommender
- 词感知消歧
- SEWeP
- 利用日志和Web站点内容的语义实现个性化
- Quickstep
- 在线学术研究论文的推荐系统
- informed Recommender
- 使用消费者产品评价给出推荐建议
- 系统通过作为知识表示和共享的翻译本体,把用户观点转换成一个结构化形式
- News@hand
- 采用基于本体表示物品特征和用户偏好来推荐新闻的系统
趋势和未来研究
略