推荐系统——零散概念
25-26年毕业论文开始:推荐系统的一些零散概念
相关概念
LLM4REC
LLM推荐系统
数据集
- 用户/物品的独有信息:比如用户的id、年龄、性别、兴趣、职业;物品的id、价格/描述(商品)、封面/标题(视频或书籍)等。
- 用户与物品之间的交互信息:比如用户对物品的评论、点赞、分享等行为
而推荐系统的核心任务,就是在充分利用这些信息的基础上,从固定的物品集合中选出当前用户最有可能感兴趣的物品,用数学形式化语言来讲,就是对于一个用户$u$和他的历史行为$U = {I_1, I_2, I_3, ……, I_n}$,预测下一步的交互行为$ I_{n+1} \in \mathcal{I} $,其中 代表所有物品(item)的集合。下面将具体介绍一些推荐系统任务中常用到的数据集。
冷启动
cold-start 冷启动就比如在抖音中新注册的账号,没有用户历史数据,所以会不知道该初始化推荐些啥。
大模型优势:“主要得益于其在预训练过程中学习到的丰富世界知识(world knowledge)。这些知识能够帮助推荐系统构建更精准、语义信息更丰富的表征,从而有效缓解传统推荐系统中长期存在的冷启动(cold-start)问题。”
长尾效应
因为items数据的分布不是均匀的,会有类似正态的分布结构,这就会有“火爆、热点”视频更容易被推荐、但一些边边角角的冷视频不容易被推荐。