MCP 的正确心智模型

来源：一次关于 MCP 协议理解纠正的讨论整理。
核心问题：MCP 到底是“上下文注入协议”，还是更通用的工具协议？

一句话理解

MCP 不是简单的 RAG，也不是“让模型知道所有 API 怎么调”。

更准确地说：

MCP 是一种让 AI 应用标准化发现、理解和调用外部上下文与工具的协议。

它把外部系统封装成模型可发现、可调用的能力。

1. MCP 不只是注入知识

MCP 全称是 Model Context Protocol。

它连接的外部能力主要包括：

Tools：可调用动作，例如查数据库、读文件、创建 GitHub issue、调用内部 API。
Resources：可读取上下文，例如文件、文档、数据库记录、知识库条目。
Prompts：服务端预定义的提示模板或工作流入口。
Sampling：部分 MCP server 可以反过来请求模型完成子任务。

所以，动态获取上下文只是 MCP 的一个应用场景。

MCP 更大的价值是：

让外部能力以统一协议暴露给模型应用。

2. 外部能力不一定来自互联网 API

MCP server 背后可以连接很多东西：

本地文件系统
本地 SQLite / Postgres 数据库
企业内网服务
GitHub、Slack、Notion、Linear 等 SaaS
本地 CLI 工具
浏览器自动化
私有知识库
代码仓库
本机进程或设备

也就是说：

大模型 ←→ MCP Client ←→ MCP Server ←→ 任意后端能力

这个后端能力可以是 HTTP API，也可以是本地命令、数据库、文件系统、RPC、SDK 或硬件设备。

3. MCP Server 负责封装底层接口

调用外部系统时，接口定义、鉴权、错误处理、返回格式仍然需要有人实现。

MCP 的价值是：

这些适配逻辑集中封装在 MCP Server 中，而不是散落在每个 Agent / 每个应用里。

例如 GitHub MCP server 可以把 GitHub API 封装成：

list_issues
create_issue
get_pull_request
comment_on_pr

模型不需要知道 GitHub REST API 的 URL、headers、分页、返回 JSON 细节。

MCP Server 负责：

鉴权
API 调用
参数校验
返回结果整理
错误处理
暴露工具 schema

模型看到的是更高层的工具定义。

4. 模型感知的是 MCP 暴露出来的 schema

比较准确的流程是：

MCP Client 连接 MCP Server
  ↓
Client 调用 list_tools() 等方法发现能力
  ↓
Server 返回工具列表、描述、参数 schema
  ↓
Agent / Client 把这些工具注册给模型
  ↓
模型根据任务决定是否调用工具

所以，不是模型直接扫描互联网接口，也不是模型自己理解所有 REST API。

而是：

MCP Server 把后端能力包装成标准工具描述；
MCP Client 再把这些工具暴露给模型。

5. MCP 常配合 tool-calling loop 使用

典型流程是：

用户问题
  ↓
Agent 把用户问题 + 可用 tools schema 发给模型
  ↓
模型决定调用某个 tool，并生成参数
  ↓
Agent / MCP Client 执行 tool call
  ↓
MCP Server 调用真实后端能力
  ↓
返回 tool result
  ↓
Agent 把 tool result 再发给模型
  ↓
模型基于结果继续推理或生成最终回答

这个过程不一定只有两轮。复杂任务可能是：

模型 → tool A → 结果 → 模型 → tool B → 结果 → 模型 → tool C → 最终回答

所以更准确地说，它是多轮 tool-calling loop。

6. MCP 的核心价值是工具生态标准化

没有 MCP 时，不同框架各自定义工具协议：

LangChain tool 格式
OpenAI function calling 格式
Claude tool use 格式
自研 Agent tool 格式
某个 SaaS SDK 格式

每接一个外部系统，都可能要为不同框架写一遍适配层。

MCP 试图标准化中间层：

外部系统 ←→ MCP Server ←→ MCP Client / Agent / IDE / 模型应用

这样一个 MCP Server 可以被多个客户端使用：

Claude Desktop
Cursor
VS Code 插件
Hermes Agent
自研 Agent
企业内部 AI 助手

类比一下：

MCP 对 Agent 工具生态的作用，有点像 LSP 对编辑器生态的作用。

LSP 让不同编辑器用统一协议接语言服务；MCP 让不同 AI 应用用统一协议接外部工具和上下文。

7. 常见误区

误区一：MCP 等于 RAG

不对。MCP 可以用于上下文获取，但也可以用于执行动作、操作外部系统、读取资源、调用工作流。

误区二：MCP 后面一定是互联网 API

不对。MCP server 可以封装本地文件、本地数据库、CLI、内网服务、浏览器，甚至硬件设备。

误区三：模型直接学会所有 API

不对。模型看到的是 MCP server 暴露的工具 schema，而不是底层 API 的全部实现细节。

定稿版理解

MCP 是一种标准协议，用来让 AI 应用发现和调用外部工具、资源和上下文。外部系统的 API、数据库、本地文件或业务逻辑由 MCP Server 封装成标准化的 tools/resources，并暴露出名称、描述和参数 schema。MCP Client 连接这些 server 后，将可用工具注入到模型上下文中。模型根据用户任务决定是否调用某个工具，Agent 执行工具调用并把结果返回给模型，模型再基于结果继续推理或生成最终答案。