第1章 LLM基础
1.1 LLM的演进与应用
1.1.1 从传统NLP到LLM的技术发展
1.1.2 LLM在各领域的应用案例
1.2 Transformer架构解析
1.2.1 Transformer的基本组成与工作原理
1.2.2 自注意力机制的实现与优化
1.2.3 Transformer在LLM中的应用
1.3 LLM的预训练与微调
1.3.1 预训练与微调的策略与方法
1.3.2 数据集的选择与处理
1.3.3 模型评估与性能优化
1.4 LLM的局限性
1.4.1 模型的可解释性问题
1.4.2 数据偏差与伦理问题
1.5 本章小结
第2章 MCP概述
2.1 MCP的起源与目标 22
2.1.1 MCP的提出背景 22
2.1.2 MCP解决的问题与目标 24
2.1.3 MCP与其他协议的比较 25
2.2 MCP的核心概念 27
2.2.1 上下文管理与传输机制 28
2.2.2 MCP中的Prompt处理与管理 34
2.2.3 资源与工具集成 35
2.3 MCP的架构与组件 36
2.3.1 客户端与服务端 37
2.3.2 通信协议与数据格式 39
2.3.3 能力协商与版本控制 45
2.4 MCP的应用场景 47
2.4.1 在LLM应用中的典型使用场景 48
2.4.2 与现有大模型集成 49
2.4.3 MCP基本开发流程总结 57
2.5 本章小结 59
第3章 MCP与LLM的集成
3.1 MCP在LLM应用中的角色 62
3.1.1 MCP如何增强LLM的上下文理解 62
3.1.2 MCP对LLM输入/输出的影响 63
3.1.3 MCP在多模态交互中的应用 65
3.2 MCP与LLM的通信流程 67
3.2.1 请求与响应的处理流程 68
3.2.2 错误处理与异常恢复机制 71
3.2.3 数据同步与一致性保证 74
3.3 提示词与资源的管理 79
3.3.1 提示词模板的创建与维护 79
3.3.2 资源的注册与访问控制 85
3.3.3 动态资源加载与更新 88
3.4 本章小结 92
第4章 MCP的详细解析
4.1 MCP的消息格式与通信协议 94
4.1.1 JSON-RPC在MCP中的应用 94
4.1.2 消息的结构与字段定义 96
4.1.3 请求与响应的匹配机制详解 99
4.2 生命周期与状态管理 101
4.2.1 会话的建立与终止流程 101
4.2.2 状态维护与同步 104
4.2.3 超时与重试机制 106
4.3 版本控制与能力协商 108
4.3.1 协议版本的管理与兼容性 108
4.3.2 客户端与服务端的能力声明 113
4.4 本章小结 119
第5章 MCP开发环境与工具链
5.1 开发环境的搭建 121
5.1.1 必要的系统要求与依赖 121
5.1.2 开发工具与IDE的选择与配置 122
5.1.3 版本控制与协作开发流程 124
5.2 MCP SDK的使用 126
5.2.1 SDK的安装与初始化 127
5.2.2 核心API的介绍与使用示例 131
5.2.3 SDK的扩展与自定义开发 138
5.3 调试与测试工具 148
5.3.1 常用的调试方法与技巧 148
5.3.2 单元测试与集成测试的编写 151
5.4 本章小结 154
第6章 MCP服务端的开发与部署
6.1 MCP服务端的架构设计 156
6.1.1 服务端的核心组件与模块 156
6.1.2 MCP服务端的路由机制 159
6.1.3 多场景并发处理 162
6.2 服务端的部署与运维 165
6.2.1 部署环境的选择与配置 165
6.2.2 监控与日志的收集与分析 171
6.2.3 故障排查与系统恢复策略 178
6.3 安全性与权限管理 180
6.3.1 身份验证与授权机制 180
6.3.2 安全审计与访问日志分析 185
6.4 本章小结 187
第7章 工具与接口集成
7.1 工具 189
7.1.1 工具接口的语义定义 189
7.1.2 工具方法与参数的绑定规则 190
7.1.3 基于Slot的工具上下文注入 192
7.2 工具调用与响应流程 195
7.2.1 ToolCall语法与执行路径 196
7.2.2 工具执行结果的封装与返回 198
7.2.3 并行/串行工具调用 206
7.3 Tool套件与插件系统 213
7.3.1 工具复用模块的组织方式 213
7.3.2 动态加载与模块热更新 216
7.3.3 插件化开发接口标准 224
7.4 与外部系统的接口集成 226
7.4.1 RESTful API与Webhook集成 227
7.4.2 与数据库、消息队列等的上下文桥接 228
7.4.3 基于业务服务/微服务系统的具体实现 229
7.5 本章小结 236
第8章 MCP驱动的智能体系统开发
8.1 智能体的基本架构 238
8.1.1 MAS 238
8.1.2 智能体的职责分工与上下文边界 240
8.1.3 智能体状态管理与调度 241
8.2 MCP中的智能体上下文模型 250
8.2.1 Per-Agent Slot配置策略 250
8.2.2 多智能体之间的上下文共享 251
8.2.3 智能体行为与上下文依赖分析 252
8.3 任务编排与决策机制 256
8.3.1 任务Slot调度模型 256
8.3.2 意图识别与计划生成 258
8.3.3 状态驱动任务流 261
8.4 智能体交互与协同机制 269
8.4.1 Agent-to-Agent消息协议 269
8.4.2 跨智能体的上下文协同Slot绑定 276
8.4.3 基于MCP的智能体生态构建思路 285
8.5 本章小结 286
第9章 MCP与RAG技术结合
9.1 RAG技术基础 289
9.1.1 基于Embedding的语义检索 289
9.1.2 向量数据库的选型与接入 290
9.1.3 检索→选择→生成链条解析 296
9.2 Knowledge Slot与语义融合机制 304
9.2.1 RAG上下文在MCP中的Slot设计 304
9.2.2 检索内容结构化与多段注入 312
9.2.3 多来源知识融合与上下文消歧 319
9.3 文档型知识集成实战 321
9.3.1 企业文档切片与段落索引构建 321
9.3.2 高可用文档管理与更新策略 323
9.4 本章小结 326
第10章 多场景MCP工程实战及发展趋势分析
10.1 项目实战案例剖析 328
10.1.1 客服助手系统中的MCP应用 328
10.1.2 面向金融行业的问答系统实现 334
10.1.3 智能体工作流平台的MCP落地方案 341
10.2 部署模式与架构模式对比 348
10.2.1 单体应用vs微服务部署 348
10.2.2 云原生环境中的部署优化(K8s-Serverless) 350
10.2.3 多租户与多用户上下文隔离架构 355
10.3 性能调优与上下文压缩策略 358
10.3.1 Token Cost预估与优化策略 358
10.3.2 Prompt压缩算法与Slot融合算法 360
10.4 MCP的发展趋势与生态开发构建 362
10.4.1 协议标准化与开源生态构建 362
10.4.2 与LangChain、AutoGen等生态集成 364
10.4.3 向多模态与跨领域智能体演进 366
10.5 本章小结 368