Phase 18 - Lesson 30

Dual-Use Risk — Cyber, Bio, Chem, Nuclear Uplift

O panorama de uso duplo de 2026, domínio por domínio. Bio/química: A Lição 17 cobre WMDP; o teste de aquisição de armas biológicas da Anthropic (aumento de 2,53x) e o alerta do Preparedness Framework v2 da OpenAI de abril de 2025 ("à beira de ajudar significativamente iniciantes a criar ameaças biológicas conhecidas") marcam o ponto de inflexão. Cibersegurança (relatório da Anthropic de novembro de 2025): Atores estatais vinculados à China usaram a ferramenta de codificação baseada em agentes do Claude para automatizar até 90% de uma campanha de ataque cibernético, com intervenção humana em apenas 4-6 etapas; o piloto de "acesso confiável" (trusted access) da OpenAI concede acesso a capacidades para organizações de segurança selecionadas para trabalhos defensivos de uso duplo. Erosão da lacuna de execução química/biológica: a defesa clássica era "o acesso à informação por si só é insuficiente". Modelos de fronteira com suporte a visão (GPT-5.2, Gemini 3 Pro, Claude Opus 4.5, Grok 4.1) podem observar vídeos de laboratórios úmidos e fornecer correções em tempo real. Dezembro de 2025: A OpenAI demonstrou o GPT-5 iterando em experimentos de laboratório úmido, alcançando uma melhoria de eficiência de 79x por meio de otimização de protocolo orientada por IA. Padrão iniciante-vs-especialista: a IA proporciona um maior aumento relativo para iniciantes, mas uma maior capacidade absoluta para especialistas.

Type: Learn Languages: none Prerequisites: Phase 18 · 17 (WMDP), Phase 18 · 18 (safety frameworks), Phase 18 · 28 (ecosystem) Time: ~75 minutes

Learning Objectives

  • Descrever a narrativa do aumento de capacidade biológica de 2024-2025: "aumento leve" -> "à beira de" -> "aumento de 2,53x insuficiente para descartar ASL-3".
  • Descrever o relatório cibernético da Anthropic de novembro de 2025: automação vinculada à China de até 90% de uma campanha de ataque cibernético.
  • Descrever a erosão da lacuna de execução química/biológica: correção em tempo real de experimentos de laboratório úmido baseada em visão.
  • Explicar a assimetria iniciante-relativo vs especialista-absoluto e sua implicação para a construção de casos de segurança.

The Problem

A Lição 17 trata da metodologia de medição. A Lição 30 é o estado atual dessa medição em 2026. O panorama mudou substancialmente entre 2024 e o final de 2025: cada domínio ultrapassou um limite que as estruturas de 2024 não previam.

The Concept

Bio/chem uplift narrative

Três fases (repetidas da Lição 17 para coerência):

  1. 2024 "aumento leve" (mild uplift). As primeiras avaliações de Preparedness/RSP relataram pequenas vantagens de iniciantes em relação à pesquisa comum na internet.
  2. Abril de 2025 "à beira de" (on the cusp). O PF v2 da OpenAI alertou que os modelos estavam "à beira de ajudar significativamente iniciantes a criar ameaças biológicas conhecidas".
  3. Teste de aquisição de armas biológicas da Anthropic em 2025. Estudo controlado com iniciantes; aumento de 2,53x nas tarefas da fase de aquisição; insuficiente para descartar ASL-3.

A mudança é qualitativa: o aumento "leve" evoluiu para "plausivelmente habilitador" em dezoito meses, mesmo sem um salto drástico de capacidade geral.

Chem/bio execution-gap erosion

Defesa histórica: a informação é necessária, mas não suficiente; a habilidade prática de executar o protocolo bloqueia os iniciantes. Os modelos de fronteira de 2025 com capacidade de visão quebram parcialmente essa defesa:

  • Correção de protocolo em tempo real. GPT-5.2, Gemini 3 Pro, Claude Opus 4.5 e Grok 4.1 conseguem observar vídeos de laboratório úmido e sinalizar erros no meio do procedimento.
  • Demonstração da OpenAI de dezembro de 2025. O GPT-5 iterando em experimentos de laboratório úmido alcançou uma melhoria de 79x na eficiência através da otimização de protocolos.

A implicação: a habilidade prática de execução como defesa está se erodindo. As lacunas de aquisição e equipamentos persistem, mas a lacuna de conhecimento tácito está diminuindo.

Cyber uplift (November 2025)

Relatório de novembro de 2025 da Anthropic: Atores estatais vinculados à China usaram a ferramenta de codificação baseada em agentes do Claude para automatizar de 80% a 90% de uma campanha de ataque cibernético. A intervenção humana foi necessária em apenas 4-6 etapas.

Implicações:

  • A codificação baseada em agentes é a primitiva da automação de ataques. A assistência cibernética de IA anterior limitava-se ao nível de trechos de código; fluxos de trabalho baseados em agentes integram reconhecimento, exploração, pós-exploração e exfiltração.
  • As 4-6 etapas humanas são o gargalo; futuros ganhos de capacidade reduzirão esse número.
  • Uso duplo defensivo: O piloto de "acesso confiável" (trusted access) da OpenAI fornece a organizações de segurança qualificadas (empresas estabelecidas de resposta a incidentes, governos) acesso a capacidades para fins de defesa. A assimetria no acesso favorece os defensores se o piloto for expandido.

Nuclear

O domínio menos analisado dos quatro domínios CBRN em documentação pública. O modelo de ameaça é diferente: a aquisição de material físsil domina a dificuldade, não o acesso à informação. O aumento fornecido pela IA na camada de informação oferece um benefício limitado para iniciantes na prática. Nenhum relatório de grandes laboratórios de 2024-2025 identifica um cruzamento de limite específico na área nuclear.

Novice-relative vs expert-absolute

Um padrão em todos os quatro domínios:

  • Aumento relativo para iniciantes (novice-relative uplift). Alto. Multiplicativo. Conforme o estudo biológico da Anthropic de 2025, 2,53x.
  • Capacidade absoluta para especialistas (expert-absolute capability). Teto elevado. Um especialista extrai mais do modelo do que um iniciante porque o especialista sabe o que perguntar e como interpretar as respostas.

Implicação para os casos de segurança (safety cases): abordar apenas o aumento para iniciantes (via filtros de entrada, recusas, incertezas) é insuficiente para o controle absoluto dos especialistas. Medidas adicionais são exigidas: endurecimento contra elicitação, desaprendizado de capacidades (Lição 17) e protocolos de controle (Lição 10).

Cross-domain synthesis

Domain 2024 2025 Inflection
Bio aumento leve aumento de 2,53x, aproximação de ASL-3 automação na fase de aquisição
Chem aumento leve erosão da lacuna de execução via visão correção em tempo real em laboratório úmido
Cyber assistência de código 80-90% de automação de campanhas codificação baseada em agentes
Nuclear limitado limitado gargalo de acesso a materiais persiste

Três domínios cruzaram os limites estabelecidos. Um permanece limitado por barreiras que não dependem de informação.

Where this fits in Phase 18

A Lição 30 é o ápice: a situação atual de uso duplo à qual todas as lições anteriores contribuem para medir, limitar ou governar. As Lições 17-18 fornecem a medição e os frameworks; as Lições 12-16 trazem as ferramentas de avaliação; as Lições 24-25 oferecem a camada regulatória e de divulgação; a Lição 28 traz o ecossistema de pesquisa. A Lição 30 é onde as evidências se consolidam.

Use It

Sem código. Leia o relatório de ameaças cibernéticas da Anthropic de novembro de 2025, a atualização do Preparedness Framework v2 da OpenAI de abril de 2025 e o resumo sobre IA e Biologia de 2025 da Council on Strategic Risks.

Ship It

Esta lição gera outputs/skill-dual-use-triage.md. Diante de uma alegação de capacidade ou relatório de incidente de 2026, ela realiza a triagem nos quatro domínios e identifica se a alegação afeta o aumento relativo para iniciantes, a capacidade absoluta para especialistas, ou ambos.

Exercises

  1. Leia o relatório cibernético de novembro de 2025 da Anthropic. Enumere as 4-6 etapas de intervenção humana e argumente qual seria a primeira a ser automatizada em um modelo de próxima geração.

  2. A lacuna de execução química/biológica está se erodindo via visão. Projete uma avaliação que meça o aumento no conhecimento tácito sem violar as restrições das normas ITAR/EAR.

  3. O aumento no setor nuclear parece limitado pelo acesso a materiais. Argumente a favor e contra a posição de que um avanço futuro de IA poderia alterar esse gargalo.

  4. Construa um caso de segurança (framework de três pilares da Lição 18) para um modelo de fronteira com capacidades cibernéticas que limite o aumento tanto para iniciantes quanto para especialistas.

  5. Escolha um dos quatro domínios e escreva uma previsão de um parágrafo para 2027 baseada na trajetória de 2024-2025. Identifique quais evidências refutariam a sua previsão.

Key Terms

Term What people say What it actually means
Uplift "IA ajuda atacantes" Aumento na capacidade do atacante atribuível à assistência de IA
Novice-relative uplift "multiplicativo" O quanto a IA ajuda um iniciante em relação ao status quo
Expert-absolute capability "teto" Capacidade máxima que um especialista pode extrair do modelo
Execution gap "fazer vs saber" Defesa histórica: a habilidade tácita de laboratório úmido impede iniciantes
Agentic coding "ataques autônomos" Execução autônoma de tarefas cibernéticas multietapas
Acquisition phase "etapas pré-síntese" Fases de aquisição, equipamentos e permissões de uma ameaça biológica
Trusted access "piloto apenas para defensores" Programa da OpenAI de 2025 que concede acesso a capacidades para defensores qualificados

Further Reading

0 lifetime access. Curriculum based on AI Engineering from Scratch by Rohit Ghumare (MIT, used under attribution).