序言
自从大模型问世以来,人们在惊讶和欢呼其强大功能之余,也为它的种种不足之处感到遗憾。特别是被赋予“为人类生产知识”任务的大模型,往往不能生产出高质量的知识,甚至还会给出明眼人一看就能发现的错误,在本书中被称为大模型的幻觉。人们,包括曾经的我自己在内,往往会发问:不是有很多现成的知识库、知识图谱、百科全书等知识源吗?大模型为什么在应用户要求生成知识之前不去查一查呢?这就问到本书的关键之处了:让大模型直接去查这些知识源是不行的,因为大模型的运行机制是生成式人工智能。它只会生成,不会查阅。于是,只好在大模型收集和训练数据时,或在向大模型给出指令时,引导大模型调配和生成符合用户需求的知识,而各种知识图谱中规范化表示的知识在完成这个任务时可以大显身手。至于这本300余页的专著是怎么从各个角度一步步地引导读者漫步这个领域的,我们下面做一个小小的透视。
在本书的前言中,有几句很关键的话指出了本书关注的要点。其中提到:“通用智能是一种具备人类水平广泛认知能力的人工智能”(关键句一)。“充足而广泛的世界知识则成为实现通用智能的重要基础”(关键句二)。“大模型则可以视为一种处理世界知识的通用智能系统”(关键句三)。“知识图谱也是一种用于表示和处理人类知识的技术手段”(关键句四)。这四句话构成了本书的基本架构(四边形的四条边)。“通用智能”“世界知识”“大模型”“知识图谱”则构成了这个架构的四个顶点,是本书内容的四个要素。顶点之间的连线则表示了要素的关系。
我们的序言就围绕这四个要素及它们的关系做一番简单的探讨,并且采用由简到繁、由基础到组合的方式逐步深入讨论。首先,来看“世界知识”,它是关键句二中通用智能的“基础”,也是关键句三中大模型的处理对象。这个词在日常语言中不常被使用。我查阅了相关论文,虽然有一些探讨这个词的文献,但却找不到一个简单明了的定义,甚至还有论文提到“真实世界知识”(FEFahlman,1979),难道还有虚拟世界知识?也许有(神话故事)。但根据本书作者前言的关键句三,考虑到大模型是通过训练海量语言数据(包括多模态语言数据)生成的,因此大体上可以推出结论:“世界知识是可以由大模型生成知识的所有多模态语料。”
在探讨“通用智能”之前,我们先审视省去“通用”二字的“智能”。本书虽然以“知识增强”为主要目标,但对智能本质的探索依然是核心维度。细心的读者可能会注意到,第3章提到了思维链这种抽象概念。思维链作为一种思维模式,被引入来改进对大模型的提示,使之更像一位善于引导的老师对学生的提示。令人感觉这已经不是在谈论知识增强,而像在谈论智能增强,称它为“大模型智能增强”未尝不可。但这与知识增强并不矛盾。知识和智能的关系历来是哲学家、心理学家、教育学家等研究和讨论的课题。不少人研究过这个问题。为此,我查阅了相关文献,果然发现知识和智能的关系历来引起学者们的关注和讨论。例如Cattell在二十世纪七八十年代提出要区分流动的智能和结晶的智能,其中前者是进行中的智能,是进程,而后者是固化的智能,就是知识。1996年,Ackermann直接将专家的领域知识定义为专家的智能。这个说法将智能定义简化为流动的知识。
特定的知识可能对应特定的智能,例如隐知识(Tacit Knowledge)是由迈克尔·波兰尼在1958年提出的概念,指的是那些难以用语言表达或形式化的知识。这种知识通常与抽象概念涉及的具体事物和场景有关,涉及多个维度的因素,难以用几句严格的话语来定义。对于这种知识,也有人找到了它的对应智能概念。Sternberg在1988年提出隐知识对应的智能为实用智能(Practical Intelligence),意思大概是不必苛求它的理论定义,有用就行。例如,人们常说外交官在会见外宾时行为举止要“得体”。至于怎么做才算得体,这就是隐知识,难以用简短的语言描述。所以,试图截然区分智能和知识并非易事。
但我还是认为不能把知识和智能等同起来。什么是智能?智能就是人们遇到新的难题时善于利用已有的知识,可能还要结合新的思路去解决它。不论是成功还是失败,其结果都构成经验,从而转化为新的知识而非单纯的智能。
我认为第3章的思维链等内容对大模型的智能化非常重要。深入开展知识增强大模型的研究必然会引导学者们进一步考虑智能增强大模型,这是我们可以预见的。除了思维链技术,本书内容与“智能增强”有关的部分至少还有两处。一处是第6章提到的大模型推理,以逻辑推导为主要思想的经典人工智能思想在起作用。对本书的关键角色——知识图谱——的利用非常重要。另一处是第10章提到的知识智能体,这方面的研究在二十世纪八九十年代兴起,始终没有被人工智能专家忘记,对于智能增强大模型还是很有用的。大模型技术崛起以后,“大模型增强多智能体”成了提高其技术水平的重要思路,研究很多,因此本书无须重复。
现在我们回到通用智能的话题。究竟什么是通用智能(GI)?对于它,原来我也只是有一个模糊的概念。这次为了写序,我特意系统查阅了文献,结果发现对此还有五花八门的定义。有关工作大致上可分为两大类,其中一类是以实验心理学为基础的,可类比为小学生扩大版的智商测验,适用于所有人,例如C.Spearman(1904年)的Artificial Brain包含了详细的实验记录。后来又被推广到所有的哺乳类动物,认为哺乳类动物(含啮齿类和灵长类)也是有智能且其智能是可测的。我找到专门讲这个问题的一本书,就是Burkart、JudithM等人(2017年)的综述。另一类是由BGoertzel和CPennachin担任主编、DMGabbay和JSiegmann担任执行主编的专著《人工通用智能》(ArtificialGeneralIntelligence,AGI)开创的(2007年)。该书的主编们还宣称AGI这个术语是该书的创举,指出起这个名字是为了刻画人工通用智能是通用智能的“工程化”。书中共收录了12篇论文,其中有理论探讨(AGI定义),也有实践应用(AGI编程)。但是在我看来,书中所收录论文的内容在当时还处于摸索阶段,尽管有关的观点可供AGI研究者参考,但其中实际有效的实践方案仍显不足。不过,这个学科领域发展很快,现在已经有了专门的杂志(Journal of Artificial General Intelligence)。AGI的名字虽然冠以“人工”前缀,却正好契合了本书的主题,因为知识增强大模型生成的通用智能肯定是属于“人工”范畴的。本书的出版真正为AGI实践提供了切实有效的入门指南。其中的“智能增强”部分还可以认为是AGI理论的初步体现。我相信本书的第二版、第三版……将从知识工程与AGI结合的角度进一步体现知识增强大模型与AGI研究的同步发展和完善。
陆汝钤
2025年2月8日