目 录
第 1 章 大模型原理及MCP开发基础 1
1.1 大模型概述 1
1.1.1 从统计语言模型到Transformer架构 1
1.1.2 GPT系列大模型简介 2
1.1.3 DeepSeek系列大模型简介 5
1.1.4 其他主流大模型简介 8
1.2 Transformer模型架构详解 10
1.2.1 自注意力机制 10
1.2.2 多头注意力与残差连接 11
1.2.3 位置编码与序列建模 14
1.2.4 编码器-解码器结构 16
1.3 LLM的输入输出机制与上下文表示 19
1.3.1 Tokenization与BPE 19
1.3.2 Prompt与上下文缓存 21
1.3.3 上下文窗口限制与扩展 22
1.3.4 KV Cache技术 23
1.4 LLM在应用中的典型接口模式 25
1.4.1 Completion与Chat模型API接口 25
1.4.2 流式响应协议 26
1.4.3 函数调用 27
1.5 DeepSeek开发基础 28
1.5.1 DeepSeek API调用规范 28
1.5.2 API基础开发模式 29
1.6 本章小结 33
第 2 章 MCP的基本原理 34
2.1 MCP概述 34
2.1.1 MCP定义 34
2.1.2 MCP与传统Prompt工程的区别 38
2.1.3 MCP的上下文模型 40
2.1.4 MCP对多轮任务与状态保持的支持 43
2.2 MCP上下文结构与层级划分 44
2.2.1 上下文对象数据结构定义 45
2.2.2 Prompt单元与上下文边界管理 47
2.2.3 动态上下文链 49
2.2.4 多模型之间的上下文共享机制 51
2.3 MCP的状态管理与中间态控制 53
2.3.1 状态快照与恢复机制 53
2.3.2 执行中断与延迟执行 58
2.3.3 状态变更通知与订阅模式 61
2.3.4 内部状态同步与外部事件绑定 64
2.4 MCP与语义执行模型 65
2.4.1 MCP语义单元映射 65
2.4.2 插件式语义节点扩展设计 66
2.5 本章小结 68
第 3 章 MCP协议标准与规范体系 69
3.1 协议消息结构设计 69
3.1.1 请求结构字段说明 69
3.1.2 响应结构与异常处理 72
3.1.3 系统元信息与上下文元数据定义 75
3.1.4 JSON数据标准 78
3.2 交互协议与状态码体系 80
3.2.1 请求生命周期 81
3.2.2 成功与失败的错误码表设计 82
3.2.3 多步对话状态标识 84
3.2.4 流控制字段 85
3.3 上下文管理策略与限制规则 88
3.3.1 上下文最大长度限制与自动裁剪机制 88
3.3.2 上下文缓存设计 89
3.4 安全性与权限控制 91
3.4.1 上下文隔离权限边界模型 91
3.4.2 Token与身份认证机制 92
3.4.3 加密传输与数据隐私规范 94
3.5 本章小结 96
第 4 章 MCP与大模型的互联机制 97
4.1 上下文注入机制与Prompt协商策略 97
4.1.1 MCP上下文注入流程 97
4.1.2 Prompt Merge与顺序策略 103
4.1.3 Prompt插槽式语义填充设计 108
4.2 多模态上下文注入 113
4.2.1 图像上下文的封装与映射 113
4.2.2 表格结构信息的Prompt合成方式 117
4.2.3 文档嵌入的预处理与载入 122
4.3 响应解码与上下文返回 127
4.3.1 Token流的中间态解码策略 127
4.3.2 响应结构中的上下文提示注入 130
4.4 与模型推理引擎的接口对接 134
4.4.1 DeepSeek推理服务接口协议 134
4.4.2 KV Cache与MCP上下文对齐策略 139
4.5 本章小结 143
第 5 章 MCP开发环境与工具链 144
5.1 开发接口与SDK概览 144
5.1.1 MCP官方SDK使用指南 144
5.1.2 HTTP API与WebSocket接口封装 147
5.1.3 Python客户端基础封装 149
5.1.4 客户端与服务端协同开发 152
5.2 本地调试与Mock函数测试 154
5.2.1 本地模拟器部署方式 154
5.2.2 调试时的日志抓取与分析 156
5.2.3 Mock函数与Prompt响应测试 159
5.3 本章小结 161
第 6 章 MCP应用开发进阶 162
6.1 面向任务的上下文组织结构 162
6.1.1 子任务嵌套与嵌套上下文定义 162
6.1.2 上下文转移中的语义保持机制 164
6.1.3 面向任务的动态上下文调度 170
6.2 模块化上下文组件设计 175
6.2.1 Prompt模板与上下文模板的分离 175
6.2.2 可复用的任务模块与参数注入 177
6.2.3 上下文组件的注册与组合 183
6.2.4 Prompt Block的条件拼接 184
6.3 状态驱动的MCP控制流程 186
6.3.1 基于状态机的上下文控制流建模 187
6.3.2 多状态响应协同调度模式 189
6.3.3 并发任务中的状态隔离 189
6.4 本章小结 191
第 7 章 小试牛刀:构建基于MCP的智能邮件处理系统 192
7.1 系统架构设计 192
7.1.1 智能邮件处理系统结构划分 192
7.1.2 MCP应用开发流程 194
7.1.3 系统开发任务划分(按文件) 196
7.2 主要模块开发 197
7.2.1 系统入口与主控制器 197
7.2.2 上下文对象与Prompt模板定义 200
7.2.3 工具注册模块(MCP Tool) 202
7.2.4 客户端与服务端配置 205
7.2.5 任务状态管理与流程控制 207
7.2.6 日志与调试支持 209
7.2.7 系统配置与环境定义 212
7.3 系统集成 214
7.4 用户交互与MCP接口集成 215
7.4.1 前端与MCP接口的通信规范 215
7.4.2 流式交互反馈机制 219
7.5 本章小结 223
第 8 章 MCP与多模态大模型集成 224
8.1 图像输入与视觉上下文注入 224
8.1.1 图像编码与MCP封装接口 224
8.1.2 视觉描述生成 226
8.1.3 图像推理结果 229
8.1.4 图像片段与多轮问答上下文保持 231
8.2 音频与语音输入处理 234
8.2.1 自动语言识别模型与文本上下文对齐 234
8.2.2 音频片段的语义编码方式 236
8.3 表格型数据与文档结构的上下文封装 239
8.3.1 表格信息的结构化Prompt插入 239
8.3.2 文档段落抽取与摘要上下文生成 242
8.4 本章小结 244
第 9 章 开发进阶:复合智能体开发实战 245
9.1 项目一:人格共创AI剧本工坊 245
9.1.1 多角色协同/剧情状态控制与驱动方式/剧情决策/情绪驱动生成 245
9.1.2 项目架构拆解(由模块到文件) 247
9.1.3 模块实现 249
9.1.4 项目总结 264
9.2 项目二:自演化智能议程会议系统 264
9.2.1 多Agent观点建模/动态语义议题演化/协议主持调度 265
9.2.2 项目架构拆解(由模块到文件) 266
9.2.3 模块实现 267
9.2.4 项目总结 276
9.3 项目三:深梦编导器——连续梦境脚本生成器 277
9.3.1 多轮感官输入/隐喻引导Prompt构造/意象链式结构生成 277
9.3.2 项目架构拆解(由模块到文件) 278
9.3.3 模块实现 280
9.3.4 项目总结 290
9.4 本章小结 290