推荐系统——零散概念

25-26年毕业论文开始:推荐系统的一些零散概念

相关概念

LLM4REC

LLM推荐系统

数据集

  1. 用户/物品的独有信息:比如用户的id、年龄、性别、兴趣、职业;物品的id、价格/描述(商品)、封面/标题(视频或书籍)等。
  2. 用户与物品之间的交互信息:比如用户对物品的评论、点赞、分享等行为

而推荐系统的核心任务,就是在充分利用这些信息的基础上,从固定的物品集合中选出当前用户最有可能感兴趣的物品,用数学形式化语言来讲,就是对于一个用户$u$和他的历史行为$U = {I_1, I_2, I_3, ……, I_n}$,预测下一步的交互行为$ I_{n+1} \in \mathcal{I} $,其中 代表所有物品(item)的集合。下面将具体介绍一些推荐系统任务中常用到的数据集。

冷启动

cold-start 冷启动就比如在抖音中新注册的账号,没有用户历史数据,所以会不知道该初始化推荐些啥。

大模型优势:“主要得益于其在预训练过程中学习到的丰富世界知识(world knowledge)。这些知识能够帮助推荐系统构建更精准、语义信息更丰富的表征,从而有效缓解传统推荐系统中长期存在的冷启动(cold-start)问题。”

长尾效应

因为items数据的分布不是均匀的,会有类似正态的分布结构,这就会有“火爆、热点”视频更容易被推荐、但一些边边角角的冷视频不容易被推荐。