为什么写作本书
我从2010 年开始研究、实践推荐系统,属于国内最早从事推荐系统工作的一批人。过去15 年,我有过至少4 次从零开始成功构建推荐系统的经历,曾经负责构建的推荐系统最高有超过千万日活跃用户数量(Daily Active User,DAU)。我出版过两本推荐系统相关图书,分别是《构建企业级推荐系统:算法、工程实现与案例分析》(2021.09)和《推荐系统:算法、案例与大模型》(2024.04)。过去十几年的经历让我见证了推荐系统技术的完整发展过程,我也一直跟随推荐系统的发展大势进行学习、实践。
2022 年11 月底ChatGPT 发布后,全世界掀起了新一轮的人工智能浪潮,以ChatGPT 为代表的大模型技术逐步渗透到各个应用场景和领域,当然也包括推荐系统。将大模型应用在推荐系统上的相关学术研究非常多,截至2024 年5 月,已有上百篇相关的研究论文发表。大模型在产业上的应用也逐步开始:阿里巴巴在淘宝上内测了淘宝问问—— 一个对话式推荐引擎;Meta在尝试利用大模型技术实现万亿级参数的新一代推荐系统;百度正在利用大模型重构底层的核心搜索、推荐模块……
ChatGPT 和大模型带来的影响是空前的,过去没有哪一项AI 技术对全球的冲击像ChatGPT和大模型这么大。我预见到ChatGPT 和大模型会革新推荐行业,因此在过去的一年多时间里,我阅读了上百篇大模型、大模型推荐系统相关的论文,并且跟行业专家进行了密切的交流。
另外,我从2023 年4 月开始创业,公司业务为B 端的数智化转型,主要方向是精细化运营、大模型搜索推荐、大模型智能知识顾问等。过去一年,我针对将大模型应用于推荐、搜索等话题与相关的企业进行交流并付诸实践。
结合过往的学习、交流、实践,我准备将自己掌握的大模型推荐系统的知识框架进行系统梳理,整理成一本系统介绍大模型推荐系统的图书,希望为推荐行业提供一套完整的、基于大模型的方法论和实践指南。
希望我的经验和经历可以帮助想学习大模型在推荐系统上应用的读者体系化了解并快速掌握大模型推荐系统。
读者对象
本书主要讲解大模型在推荐系统中的应用,既有算法原理,又有代码实现,聚焦于如何利用最新的大模型技术赋能、革新、重构现有的推荐系统。本书需要读者有一定的推荐系统基础知识,了解大模型的一些基本原理,本书适合以下读者。
1. 推荐系统开发人员及推荐算法研究人员。
2. 期望从事推荐系统相关工作的学生。
3. 在高校从事推荐算法研究,希望对大模型在推荐系统中的应用有全面了解的科研人员。
4. 对大模型在推荐、搜索中的应用感兴趣的产品和运营人员。
5. 期望将大模型引入推荐、搜索产品的公司管理层人员。
如何阅读本书
本书分为9 章,包含大模型基本原理介绍、将大模型应用于推荐系统的思路和方法、在电商推荐场景中使用大模型等。下面分别对各个章节进行简单介绍。
第1~3 章是准备部分。第1 章介绍大模型的基础知识,包括大模型的发展历史、数据资源、数据预处理、大模型预训练、大模型微调、大模型推理、大模型部署、相关软件和框架等,这一章是后续章节的理论基础,是为没有大模型基础的读者准备的。如果你已经非常熟悉大模型,那么可以略过这一章。第2 章对后续章节用到的数据和开发环境进行介绍,本书的代码实现基于微软的MIND 数据集和Amazon 电商数据集,开发环境包括Python 沙盒、CUDA 和MacBook。第3 章将大模型在推荐系统中的应用抽象为4 种范式——生成范式、预训练范式、微调范式、直接推荐范式。
第4~7 章展开说明第3 章介绍的4 种范式,每章既包含算法原理,又包含相关的案例说明,同时会基于MIND 数据集给出对应的代码实现。
第8 章是一个完整的实战案例,基于Amazon 商品评论数据,利用大模型解决电商推荐问题。本章讲解如何利用大模型来解决生成用户兴趣画像、生成个性化商品描述信息、猜你喜欢推荐、关联推荐、冷启动、推荐解释、对话式推荐7 类问题,针对每类问题都提供完整的步骤及对应的代码实现。其中,前6 类问题是大模型对传统推荐算法解决方案的有效补充和突破,有了大模型的支持,传统推荐算法有更新颖、更好的解决方案;而对话式推荐是基于传统推荐系统的一种新的推荐形态,借助大模型的自然语言对话能力,我们可以采用对话的方式为用户进行个性化推荐,在提升用户体验的同时,带来更高的商业价值。
第9 章为将大模型推荐系统更好地应用于工业界提供了一些思路和方法,包含大模型的高效预训练、高效推理,以及真实业务场景中的一些问题和建议。
本书是专门为方便读者快速上手大模型推荐系统而准备的。本书主要有三个特点:一是将大模型应用于推荐系统抽象为4 种范式,在这个统一的框架下,你可以体系化地学习大模型推荐系统;二是包含电商场景的最佳实践,针对每种问题,提供完整的利用大模型解决推荐问题的思路、步骤和方法;三是包含代码实战内容,第2~8 章都有完整的代码实现。本书所有的代码都可以从GitHub 的代码仓库中获取,读者也可以根据封底处提示,加入本书读者群,获取本书代码、链接及参考文献。
希望本书能够成为有志于利用大模型技术更好地赋能传统推荐、搜索系统的爱好者和从业者的方法论和落地实战指南!