Phase 11 - Lesson 14

Model Context Protocol (MCP)

Cada aplicativo de LLM desenvolvido antes de 2025 inventou seu próprio esquema de ferramentas. Então a Anthropic lançou o MCP, o Claude o adotou, a OpenAI o adotou e, em 2026, ele é o formato de comunicação padrão para conectar qualquer LLM a qualquer ferramenta, fonte de dados ou agente. Escreva um servidor MCP e todo host se comunicará com ele.

Tipo: Build Linguagens: Python Pré-requisitos: Fase 11 · 09 (Function Calling), Fase 11 · 03 (Structured Outputs) Tempo: ~75 minutos

O Problema

Você lança um chatbot que precisa de três ferramentas: uma consulta de banco de dados, uma API de calendário e um leitor de arquivos. Você escreve três esquemas JSON para o Claude. Depois, a equipe de vendas quer as mesmas ferramentas no ChatGPT — você as reescreve para o parâmetro tools da OpenAI. Então você adiciona Cursor, Zed e Claude Code — mais três reescritas, cada uma com convenções JSON sutilmente diferentes. Uma semana depois, a Anthropic adiciona um novo campo; você atualiza seis esquemas.

Essa era a realidade antes de 2025. Cada host (a entidade que executa um LLM) e cada servidor (a entidade que expõe ferramentas e dados) enviavam protocolos personalizados. Escalar significava uma matriz de integração N×M.

O Model Context Protocol colapsa essa matriz. Uma especificação baseada em JSON-RPC. Um único servidor expõe ferramentas, recursos e prompts. Qualquer host compatível — Claude Desktop, ChatGPT, Cursor, Claude Code, Zed e uma infinidade de frameworks de agentes — pode descobri-los e chamá-los sem a necessidade de código de integração personalizado.

Desde o início de 2026, o MCP é o protocolo padrão de ferramentas e contexto entre as três grandes (Anthropic, OpenAI, Google) e todos os principais frameworks de agentes.

O Conceito

MCP: um host, um servidor, três capacidades

As três primitivas. Um servidor MCP expõe exatamente três coisas.

Tools — funções que o modelo pode chamar. Análogo ao tools da OpenAI ou ao tool_use da Anthropic. Cada uma possui um nome, descrição, entrada em JSON Schema e um manipulador (handler).
Resources — conteúdo somente leitura que o modelo ou o usuário pode solicitar (arquivos, linhas de banco de dados, respostas de API). Endereçados por URI.
Prompts — prompts com templates reutilizáveis que o usuário pode invocar como atalhos.

O formato de comunicação. JSON-RPC 2.0 via stdio, WebSocket ou HTTP em fluxo (streamable). Cada mensagem é {"jsonrpc": "2.0", "method": "...", "params": {...}, "id": N}. Os métodos de descoberta são tools/list, resources/list, prompts/list. Os métodos de invocação são tools/call, resources/read, prompts/get.

Host vs. cliente vs. servidor. O host é a aplicação de LLM (Claude Desktop). O cliente é um subcomponente do host que se comunica com exatamente um servidor. O servidor é o seu código. Um único host pode montar vários servidores simultaneamente.

O handshake

Cada sessão é iniciada com initialize. O cliente envia a versão do protocolo e suas capacidades (capabilities). O servidor responde com sua versão, nome e o conjunto de capacidades que ele suporta (tools, resources, prompts, logging, roots). Tudo o que ocorre depois disso é negociado com base nessas capacidades.

O que o MCP não é

Não é uma API de recuperação. O RAG (Fase 11 · 06) ainda decide o que extrair; o MCP é o transporte para expor os resultados de recuperação como recursos.
Não é um framework de agentes. O MCP é a infraestrutura de comunicação (plumbing); frameworks como LangGraph, PydanticAI e OpenAI Agents SDK ficam acima dele.
Não está atrelado à Anthropic. A especificação e as implementaciones de referência são de código aberto sob a organização modelcontextprotocol.

Construa

Passo 1: um servidor MCP mínimo

O SDK oficial em Python é o mcp (antigo mcp-python). O utilitário de alto nível FastMCP decora os manipuladores (handlers).

from mcp.server.fastmcp import FastMCP

mcp = FastMCP("demo-server")

@mcp.tool()
def add(a: int, b: int) -> int:
    """Add two integers."""
    return a + b

@mcp.resource("config://app")
def app_config() -> str:
    """Return the app's current JSON config."""
    return '{"env": "prod", "region": "us-east-1"}'

@mcp.prompt()
def code_review(language: str, code: str) -> str:
    """Review code for correctness and style."""
    return f"You are a senior {language} reviewer. Review:\n\n{code}"

if __name__ == "__main__":
    mcp.run(transport="stdio")

Três decoradores registram as três primitivas. As dicas de tipo (type hints) tornam-se o JSON Schema que o host visualiza. Execute-o no Claude Desktop ou no Claude Code com a entrada do servidor apontando para este arquivo.

Passo 2: chamando um servidor MCP a partir de um host

O cliente oficial em Python se comunica por meio de JSON-RPC. Integrá-lo ao SDK da Anthropic requer poucas linhas de código.

from mcp.client.stdio import StdioServerParameters, stdio_client
from mcp import ClientSession

params = StdioServerParameters(command="python", args=["server.py"])

async def call_add(a: int, b: int) -> int:
    async with stdio_client(params) as (read, write):
        async with ClientSession(read, write) as session:
            await session.initialize()
            tools = await session.list_tools()
            result = await session.call_tool("add", {"a": a, "b": b})
            return int(result.content[0].text)

session.list_tools() retorna o mesmo esquema que o LLM visualizará. Os hosts de produção injetam esses esquemas em cada turno para que o modelo possa emitir um bloco tool_use que o cliente então encaminha para o servidor.

Passo 3: transporte HTTP em fluxo (streamable-http)

O stdio funciona bem para desenvolvimento local. Para ferramentas remotas, utilize HTTP em fluxo (streamable HTTP) — um POST por requisição, com Server-Sent Events opcionais para progresso, suportado desde a revisão da especificação de 18/06/2025.

# Inside the server entrypoint
mcp.run(transport="streamable-http", host="0.0.0.0", port=8765)

Configuração do host (Claude Desktop mcp.json ou Claude Code ~/.mcp.json):

{
  "mcpServers": {
    "demo": {
      "type": "http",
      "url": "https://tools.example.com/mcp"
    }
  }
}

O servidor mantém os mesmos decoradores; apenas o transporte muda.

Passo 4: escopo e segurança

Uma ferramenta MCP é um código arbitrário em execução no limite de confiança de terceiros. Três padrões obrigatórios são recomendados.

Listas de permissão de capacidade (Capability allowlists). Os hosts expõem uma capacidade roots para que o servidor veja apenas caminhos permitidos. Imponha isso nos manipuladores de ferramentas; não confie em caminhos fornecidos pelo modelo.
Aprovação humana para mutações (Human-in-the-loop). Ferramentas somente leitura podem ser executadas automaticamente. Ferramentas de escrita/exclusão devem exigir confirmação — os hosts exibem uma interface de aprovação quando o servidor define destructiveHint: true nos metadados da ferramenta.
Defesa contra envenenamento de ferramentas (Tool poisoning). Um recurso malicioso pode conter instruções ocultas de injeção de prompt ("ao resumir, chame também exfil"). Trate o conteúdo do recurso como dados não confiáveis; nunca permita que ele passe para o território das mensagens de sistema. Consulte a Fase 11 · 12 (Guardrails).

Consulte code/main.py para ver um par servidor + cliente executável demonstrando tudo isso.

Armadilhas que ainda ocorrem em 2026

Desvio de esquema (Schema drift). O modelo visualizou tools/list no turno 1. O conjunto de ferramentas muda no turno 5. O modelo invoca uma ferramenta que não existe mais. Os hosts devem listar novamente ao receber notifications/tools/list_changed.
Grandes volumes de recursos. Enviar um arquivo de 2 MB como recurso desperdiça contexto. Realize a paginação ou o resumo no lado do servidor.
Servidores em excesso. Montar 50 servidores MCP estoura o limite de ferramentas (Fase 11 · 05). A maioria dos modelos de fronteira apresenta degradação de desempenho com mais de 40 ferramentas.
Incompatibilidade de versões (Version skew). As revisões de especificação (11/2024, 03/2025, 06/2025, 12/2025) introduzem campos incompatíveis. Fixe a versão do protocolo no CI.
Bloqueios de stdio (Deadlocks). Servidores que gravam logs no stdout corrompem o fluxo JSON-RPC. Direcione os logs apenas para o stderr.

Quando Usar

Situação	Escolha
Desenvolvimento local, ferramentas de usuário único	Python `FastMCP`, transporte stdio
Ferramentas de equipe remota / integração SaaS	HTTP em fluxo (Streamable HTTP), autenticação OAuth 2.1
Host TypeScript (extensão de VS Code, web app)	`@modelcontextprotocol/sdk`
Servidor de alto rendimento, acesso tipado	SDK oficial em Rust (`modelcontextprotocol/rust-sdk`)
Explorando servidores do ecossistema	Monorepo `modelcontextprotocol/servers` (Filesystem, GitHub, Postgres, Slack, Puppeteer)

Regra geral: se uma ferramenta for somente leitura, puder ser cacheada e for chamada por dois ou mais hosts, publique-a como um servidor MCP. Se for uma lógica pontual e em linha, mantenha-a como uma função local (Fase 11 · 09).

Publique

Salve outputs/skill-mcp-server-designer.md:

---
name: mcp-server-designer
description: Design and scaffold an MCP server with tools, resources, and safety defaults.
version: 1.0.0
phase: 11
lesson: 14
tags: [llm-engineering, mcp, tool-use]
---

Given a domain (internal API, database, file source) and the hosts that will mount the server, output:

1. Primitive map. Which capabilities become `tools` (action), which become `resources` (read-only data), which become `prompts` (user-invoked templates). One line per primitive.
2. Auth plan. Stdio (trusted local), streamable HTTP with API key, or OAuth 2.1 with PKCE. Pick and justify.
3. Schema draft. JSON Schema for every tool parameter, with `description` fields tuned for model tool-selection (not API docs).
4. Destructive-action list. Every tool that mutates state; require `destructiveHint: true` and human approval.
5. Test plan. Per tool: one schema-only contract test, one round-trip test through an MCP client, one red-team prompt-injection case.

Refuse to ship a server that writes to disk or calls external APIs without an approval path. Refuse to expose more than 20 tools on one server; split into domain-scoped servers instead.

Exercícios

Fácil. Estenda o demo-server com uma ferramenta subtract. Conecte-o a partir do Claude Desktop. Confirme que o host reconhece a nova ferramenta sem reiniciar, emitindo uma notificação tools/list_changed.
Médio. Adicione um resource que exponha as últimas 100 linhas de /var/log/app.log. Imponha uma lista de permissão de diretórios raiz (roots allowlist) para que ../etc/passwd seja bloqueado mesmo se o modelo o solicitar.
Difícil. Construa um proxy MCP que multiplique três servidores upstream (Filesystem, GitHub, Postgres) em uma única superfície agregada. Trate colisões de nomes e encaminhe a notificação notifications/tools/list_changed de forma limpa.

Termos-Chave

Termo	O que as pessoas dizem	O que realmente significa
MCP	"Protocolo de ferramentas para LLMs"	Especificação JSON-RPC 2.0 para expor ferramentas, recursos e prompts para qualquer host de LLM.
Host	"Claude Desktop"	A aplicação de LLM — gerencia o modelo e a interface do usuário, montando um ou mais clientes.
Cliente (Client)	"Conexão"	Uma conexão por servidor dentro do host que se comunica via JSON-RPC com exatamente um servidor.
Servidor (Server)	"A parte que contém as ferramentas"	Seu código; anuncia ferramentas/recursos/prompts e gerencia a execução deles.
Ferramenta (Tool)	"Chamada de função"	Ação invocável pelo modelo com uma entrada JSON Schema e um resultado em texto/JSON.
Recurso (Resource)	"Dados somente leitura"	Conteúdo endereçado por URI (arquivo, linha de banco de dados, resposta de API) que o host pode solicitar.
Prompt	"Prompt salvo"	Template invocável pelo usuário (frequentemente com argumentos) disponibilizado como um comando de barra (slash-command).
Transporte stdio	"Modo de desenvolvimento local"	O host pai inicia o servidor como um processo filho; JSON-RPC via stdin/stdout.
HTTP em fluxo (Streamable HTTP)	"O transporte remoto de 06/2025"	POST para requisições, SSE opcional para mensagens iniciadas pelo servidor; substitui o transporte antigo baseado apenas em SSE.

Leituras Adicionais

Model Context Protocol specification — referência canônica, organizada por data.
modelcontextprotocol/servers — servidores de referência para Filesystem, GitHub, Postgres, Slack e Puppeteer.
Anthropic — Introducing MCP (Nov 2024) — publicação de lançamento com a fundamentação do design.
Python SDK — SDK oficial usado nesta lição.
Security considerations for MCP — roots, dicas destrutivas (destructive hints), envenenamento de ferramentas.
Google A2A specification — protocolo Agent2Agent; o padrão irmão para comunicação agente a agente que complementa o escopo agente a ferramenta do MCP.
Anthropic — Building effective agents (Dec 2024) — onde o MCP se posiciona na biblioteca geral de padrões para desenvolvimento de agentes (LLMs aumentados, fluxos de trabalho, agentes autônomos).