前言
笔者原来是一名理论数学家、大学讲师,后来成为人工智能爱好者,再后来成为成功的创业公司创始人、人工智能教科书作者、风险投资顾问。今天,笔者还可以作为导游,带读者参观
LLM工程和应用这个巨大的知识博物馆。本书的编写有两个目的: 一是揭开LLM领域的神秘面纱,二是为读者提供实用的知识,使读者能够开始实验、编码和构建LLM。
与在课堂上大多数教授的讲解不同,本书并不是要用复杂的术语向读者灌输,相反,本书的目的是使复杂的概念易于理解、容易与常识关联起来,更重要的是具有实用性。
坦率地说,于笔者而言,本书内容已经相当充分。笔者想给读者一些关于如何阅读本书的提示,
多次阅读本书,确保自己从本书中获得自己所需的知识。
读者人群和预备知识
本书是为谁准备的?答案很简单: 任何对LLM充满好奇心的人,有意愿的程序员,不懈的学习者。无论你在机器学习领域已有见解,还是正准备开始学习相关知识,本书都是你的指南,是为你导航LLM领域的地图。
为了最大限度地利用这段旅程,拥有一些机器学习和Python方面的经验将是非常有益的。这并不是说没有它们你将无法
继续,而是没有这些工具,
阅读的过程可能有点波折。如果你准备边读边学习,那也很好。我们将探索的一些概念
并不一定全部需要大量的编码,但大多数是需要的。
在本书中,笔者试图在深入的理论理解和实际的实践技能之间找到平衡。书中每章都充满了类比,将复杂的事物变得简单,并配以代码片段,使概念更加生动。本质上,笔者是将这本书作为LLM讲师+助教,旨在简化和揭开
LLM引人入胜的神秘面纱,而不是向读者灌输学术术语。笔者希望读者在结束每一章时能更清楚地理解主题,并了解如何将其应用于真实世界中的场景。
如何阅读本书
如前所述,如果读者有一些机器学习的经验,会发现这个旅程比没有经验的人稍微容易一些。尽管如此,这条路对任何可以用Python编码并准备学习的人都是开放的。本书可以满足不同阅读层次的读者需求,取决于每个人的背景、目标和可用的时间。依据个人喜好,读者可以深入实践部分,尝试代码并调整模型,或者可以参与理论部分,在没有编写一行代码的情况下深入理解LLM如何工作。
需要注意的是,本书每一章都建立在
之前的章节上。读者在前面部分中获得的知识和技能将成为后续部分的基础。面临的挑战是学习过程的一部分
,读者可能会困惑、沮丧,有时甚至陷入困境。当笔者为本书开发可视化问答(VQA)系统时,
曾遇到了多次失败。模型会输出无意义的内容,一遍又一遍地重复相同的短语。但是,经过无数次迭代之后,它开始生成有意义的输出。胜利的那一刻,取得突破的喜悦,让之前每一次失败的尝试
都有价值。本书将为读者提供类似的挑战,
使读者体验类似的胜利喜悦。
本书总览
本书分为以下四部分。
第1部分: 大模型介绍
第1章:
本章对LLM的领域进行概述。包括基本知识: 它们是什么、如何工作、为何重要,读完本章,读者会有一个坚实的基础来理解本书的其余部分。
第2章:
在第1章的基础上,深入讲解LLM如何用于其最具影响力的应用之一——语义搜索。本章将致力于创建一个能够理解查询含义的搜索系统,而不仅仅是匹配关键字。
第3章:
科学且具有艺术性的提示指令对充分使用大模型的能力十分重要。第3章提供提示工程的实用介绍,以及充分利用LLM的指导方针和技术。
第2部分: 充分挖掘大模型的潜力
第4章:
在LLM中的既有模型并不适合所有情景,本章介绍如何使用自己的数据集对LLM进行微调,并提供实践示例和练习,让读者可以快速自定义模型。
第5章:
深入讲解提示工程的世界,对高级策略技术的讲解可以帮助读者从LLM中获得更多的高级策略和技术,例如,输出验证和语义小样本学习。
第6章: 通过微调基于OpenAI的推荐引擎,
介绍如何修改模型体系结构和嵌入,以更好地适应用户的特定用例和需求,调整LLM架构以满足用户的需求。
第3部分: 大模型的高级应用
第7章:
讲解下一代模型和体系结构,它们正在突破LLM的极限。本章将组合多个LLM,并使用PyTorch建立一个框架来构建自定义的LLM架构。本章还介绍从反馈中进行强化学习,以使LLM符合用户的需求。
第8章:
提供微调高级开源LLM的实践指南和示例,重点是实现。本章不仅使用通用语言建模,还使用增强等高级方法来微调LLM,并从反馈中学习,创建自己的LLMSAWYER。
第9章:
讲解在生产环境中部署LLM的实际注意事项,如何扩展模型,处理实时请求,并确保模型稳健可靠。
第4部分: 附录
3个附录包括常见问题列表、术语表和LLM应用的参考。
附录A:
作为一名顾问、工程师和教师,笔者每天都会收到很多关于LLM的问题,
此处整理了一些较有影响力的问题。
附录B:
术语表提供本书中一些主要术语的参考。
附录C:
本书使用LLM构建了许多应用程序,附录C旨在为那些想要构建自己的应用程序的读者提供一个起点。对于LLM的一些常见应用,本附录将建议关注哪种LLM,以及可能需要的数据,还有可能会遇到的常见陷阱以及如何处理。
本书特色
读者也许会问: “是什么让本书与众不同”?首先,笔者在这项工作中汇集了各种各样的经验: 从笔者的理论数学背景,笔者进入创业世界的经历,笔者作为前大学讲师的经历,到笔者目前作为企业家、机器学习工程师和风险投资顾问的经历。每一次经历都加深了笔者对LLM的理解,笔者把所有这些知识都倾注在本书中。
读者会在本书中发现一个独一无二的特色,那就是概念在现实世界中的应用。当笔者说“现实世界”时,笔者是认真的: 本书充满了实践和实践经验,可以帮助读者理解LLM在现实中的应用。
此外,本书不仅仅是关于理解当下所涉及的领域。正如笔者经常说的,LLM的世界是随时间变化的,即便如此,一些基本原理仍然是不变的,笔者在本书中强调了这些。这样读者不仅为现在做好了准备,也为未来做好了准备。
从本质上讲,本书不仅反映了笔者的知识,还反映了笔者对人工智能和LLM构建的热情。
本书是笔者的经历、见解以及笔者使用LLM
对广大读者的启迪。这是笔者向你发出一起探索这个迷人、快速发展的领域发出的邀请。
总结
这里或许是我们共同旅程的开始,这取决于你如何看待它。你已经了解了笔者是谁,以及这本书为什么存在,期待什么,以及如何充分利用它。
现在,剩下的由你决定。笔者邀请你加入进来,让自己沉浸在LLM的世界里。无论你是经验丰富的数据科学家,还是好奇的爱好者,这里都有适合你的东西。笔者鼓励你积极参与本书——运行代码,调整它,分析它,然后把它重新组合起来。探索、实验、犯错、学习。
致谢
致我的家庭: 谢谢你,妈妈,你一直是我教学力量和影响的化身。是你对教育的热情让我意识到分享知识的
价值,我现在努力在工作中做到这一点。爸爸,你对新技术
的敏锐及其潜力的兴趣一直激励着我突破自己的领域。妹妹,你不断提醒我要考虑我的工作对人类的影响,让我脚踏实地。你们的见解使我更加意识到工作影响着人们的生活。
致我的妻子: 对于我的生活伴侣伊丽莎白来说,当我沉浸在无数个写作和编码的夜晚时,你的耐心和理解是无价的。谢谢你忍受我的胡言乱语,帮助我理解复杂的想法。当道路看起来很模糊时,你一直是一根支柱、一个传声筒和一盏明灯。你在这段旅程中的坚定一直是我的灵感来源,否则这部作品不会是现在的样子。
图书出版流程: 衷心感谢Debra Williams Cauley为我提供了为AI和LLM社区做贡献的机会。在这个过程中,我作为一名教育工作者和作家,所经历的成长是不可估量的。
因为迷失于大模型的复杂的微调过程,耽误了本书的出版时间,对此深表歉意
。我还要感谢Jon Krohn的推荐,感谢他一直以来的支持。