☆☆ 编写背景
☆ 一个宏大的叙事
我们正处在一个充满变革与机遇的时代,见证着技术的进步和应用的百花齐放。大语言模型的迅猛发展,让我们看到了通用人工智能(AGI)的曙光和充满无限可能的未来图景。
2022年11月,ChatGPT横空出世,我第一时间就开始使用并为之着迷,而后全身心地投入对大模型的研究与应用中。2023年春节假期,我写了一篇文章《NLP奋发五载,AGI初现曙光》,全面梳理了大语言模型自2018年以来取得的令人瞩目的成就,并展望可能到来的AGI时代的壮丽蓝图。
从2023年开始,AGI被广泛讨论,逐渐成为全球的热点。我深刻感受并深度参与了大模型与AGI的“热浪”——从训练和微调模型、大模型的应用开发,到研读论文、撰写文章,再到讨论、直播和演讲。在深度探索、广泛实践和理性分析的过程中,我逐渐认识到:大模型带来的改变无疑是革命性的,但大模型并不是万能的,而是存在一定的局限性。
☆ 仰望星空与脚踏实地
回顾人工智能的历史,人类对智能机器的追求从未止步。人类一直试图赋予机器只有人类具备的能力——理解、学习、推理,甚至觉察自身。大模型代表着人工智能的巨大进步,我也坚定地全身心投入其中,并憧憬着未来的无限可能。我坚信人工智能的未来发展必将远超我们的想象,我也坚信人工智能的未来建立在更深入、更广泛的应用之上。这需要我们脚踏实地,从实际出发,理性探索人工智能的能力边界。大模型的能力强大,其在生产工具、生活应用中的深度与广度将被进一步扩展,然而,我们也要深刻认识到大模型的“能”与“不能”,夯实基础。
☆ 大模型应用的“阿喀琉斯之踵”
当将大模型的应用落地到相应的行业领域时,大模型的“阿喀琉斯之踵”出现了——幻觉和知识陈旧。幻觉,即大模型“凭空捏造”,生成与事实不符的内容。知识陈旧,是指大模型无法及时更新知识,导致生成的内容与现实情况脱节。如果不能解决这两个问题,基于大模型构建的智能系统就无法做到可靠和可信,就难以成为真正的生产力工具。试想:如果大模型生成的分析报告引用了虚假的市场数据,那么其不仅毫无价值,还可能造成严重的经济损失;如果医疗诊断大模型基于幻觉或陈旧的知识对疾病进行诊断,那么其后果可能会危及患者的生命。
然而,这两个问题难以依靠大模型自身来解决。根本原因在于,现在的大模型本质上是静态的,其生成能力依赖于训练时储备的知识,而非实时动态更新的知识。若要解决这两个问题,就不得不借助另外两种技术——检索增强生成与知识图谱。检索增强生成通过实时检索外部信息,弥补了大模型在知识广度与时效性上的不足。知识图谱则提供了一种不可或缺的逻辑支撑——不仅为大模型生成的内容提供新鲜的知识和结构化的语义框架,而且让生成结果具备更好的一致性和准确性。在图模互补应用范式中,知识图谱为大模型生成的内容赋予了逻辑脉络,使大模型不仅能“说得出来”,还能“说得对”。
☆ 《知识增强大模型》应运而生
技术不是空中楼阁,必须扎根于真实的需求之中。唯有如此,大模型才能广泛并深入地渗透到生产和生活的方方面面,AGI的宏伟愿景才能从理想照进现实。我相信,未来十年,基于大模型的智能系统将嵌入日常工作和生活中所用的每一个软件,如空气般无所不在。我将自己自2022年年底至今在大模型领域的思考、探索与实践总结成书,《知识增强大模型》这本书就是在这样的背景下诞生的。
本书聚焦于通过外部知识增强的方法实现可靠、可信的大模型应用。需要强调的是,知识增强并非对大模型能力的否定,而是与大模型相辅相成,共同解决实际需求的有效途径,也是推进并最终实现AGI的关键一环。
我希望本书能够为渴望理解与拥抱AGI的读者提供启发,帮助大家穿越技术的迷雾,迎接大模型纪元;也希望本书能够成为迈向AGI新时代旅途中的一座补给站,为人类构建更加美好的未来贡献一份力量。我真诚期待与每一位读者携手踏上这段充满希望与创造力的征程!
☆☆ 本书内容
全书共分10章,全面介绍知识增强大模型涉及的各类技术,并通过丰富的实例解析如何用好相关技术。
第1章概述大模型、大模型幻觉与知识陈旧的固有特性、知识增强大模型等概念,并对大模型纪元做简要的展望。
第2章详细介绍大模型的相关技术及使用方法。
第3章和第4章围绕文档类知识增强展开。
第3章详细介绍向量表示及向量的相似性度量、向量数据库和基于向量的语义检索等内容,并介绍Milvus向量数据库的实战指南,以及其他主流的开源向量数据库。
第4章介绍检索增强生成的概念、技术,以及基于开源框架Dify构建RAG系统。在向量检索方面,探讨文本分块相关的内容,并介绍基于搜索引擎Elasticsearch的文本检索方法,将其与向量检索进行比较和配合。
第5章至第9章围绕知识图谱增强展开。
第5章全面讲解知识图谱技术体系,并详细论述如何将大模型和“六韬法”相结合设计知识图谱模式。大模型和六韬法的组合既是设计专业领域的知识图谱的利器,也是知识图谱增强生成实现产业应用的基础。
第6章全面论述知识图谱的映射式构建技术和抽取式构建技术,深入探讨如何利用大模型来抽取实体、关系、属性和事件,进而构建知识图谱。
第7章详细介绍JanusGraph分布式图数据库和基于数据库的图计算方法,并介绍如何在Python环境中使用Gremlin操作JanusGraph图数据库和实现图计算。
第8章系统阐述图模互补应用范式的相关内容,涵盖知识图谱增强大模型和大模型增强知识图谱等。
第9章深入介绍知识图谱增强生成的原理、通用框架和方法,并以GraphRAG为基础,介绍知识图谱增强生成的应用。
第10章从应用框架、知识来源、知识运营、应用指南等角度,全面介绍知识增强大模型的应用方法,给出一个知识增强应用的案例——文档助手,并结合教育、智慧金融、智慧医疗和智能制造领域的应用场景给出具体案例。
☆☆ 本书特色
本书内容丰富、体系完整、布局有序、案例翔实,理论与实践兼顾,深度与广度并重,既适合初学者,也适合进阶学习者。书中包含大量精心绘制的插图、丰富的实践案例和深入浅出的技术解析,帮助读者快速掌握知识增强大模型的理论,引导读者从零开始构建知识增强大模型应用,从实践层面了解应用价值,提升自身技能。值得一提的是,第2章到第10章配有思考题,帮助读者拓展思维,深化理解,激发创新意识,思考人工智能理论和应用的未来发展。
本书主要面向以下三类读者。
1. 人工智能技术工作者:本书涵盖大模型、向量数据库、图数据库、知识图谱、RAG、GraphRAG等被广泛应用的技术,并辅以丰富的实例,既可作为技术工作者学习知识增强大模型应用开发的入门图书和进阶指南,也可作为指导实际工作的参考工具书。
2. 企业或机构的管理者:本书有助于管理者全面了解大模型的潜力,客观评估大模型的能力,避免因对大模型能力的高估或低估而产生误判或错误决策,并可协助管理者在企业或机构中精准定位和有效落地大模型。
3. 高校师生:本书可作为人工智能、计算机等相关专业高年级本科生或研究生的教材和参考用书。第2章到第10章的思考题可作为学习内容的拓展,激发学生思考,培养创新思维。第10章的“文档助手”部分可作为课程实践项目。