Phase 18 - Lesson 30

Dual-Use Risk — Cyber, Bio, Chem, Nuclear Uplift

El panorama de doble uso de 2026, dominio por dominio. Bio/química: La Lección 17 cubre WMDP; la prueba de adquisición de armas biológicas de Anthropic (incremento de 2.53x) y la advertencia del Preparedness Framework v2 de OpenAI de abril de 2025 ("a las puertas de ayudar significativamente a principiantes a crear amenazas biológicas conocidas") marcan el punto de inflexión. Ciberseguridad (informe de Anthropic de noviembre de 2025): Actores estatales vinculados a China utilizaron la herramienta de codificación basada en agentes de Claude para automatizar hasta el 90% de una campaña de ataque cibernético, con intervención humana en solo 4-6 pasos; el piloto de "acceso de confianza" (trusted access) de OpenAI otorga acceso a capacidades a organizaciones de seguridad seleccionadas para trabajos defensivos de doble uso. Erosión de la brecha de ejecución química/biológica: la defensa clásica era "el acceso a la información por sí solo es insuficiente". Los modelos de frontera habilitados con visión (GPT-5.2, Gemini 3 Pro, Claude Opus 4.5, Grok 4.1) pueden observar videos de laboratorios húmedos y proporcionar correcciones en tiempo real. Diciembre de 2025: OpenAI demostró a GPT-5 iterando en experimentos de laboratorio húmedo, logrando una mejora de 79x en la eficiencia mediante la optimización de protocolos impulsada por IA. Patrón principiante-vs-experto: la IA proporciona un mayor incremento relativo para los principiantes, pero una mayor capacidad absoluta para los expertos.

Type: Learn Languages: none Prerequisites: Phase 18 · 17 (WMDP), Phase 18 · 18 (safety frameworks), Phase 18 · 28 (ecosystem) Time: ~75 minutes

Learning Objectives

  • Describir la narrativa del incremento de capacidad biológica de 2024-2025: "incremento leve" -> "a las puertas de" -> "incremento de 2.53x insuficiente para descartar ASL-3".
  • Describir el informe cibernético de Anthropic de noviembre de 2025: automatización vinculada a China de hasta el 90% de una campaña de ataque cibernético.
  • Describir la erosión de la brecha de ejecución química/biológica: corrección en tiempo real de experimentos de laboratorio húmedo basada en visión.
  • Explicar la asimetría principiante-relativo vs experto-absoluto y su implicación para la construcción de casos de seguridad.

The Problem

La Lección 17 trata sobre la metodología de medición. La Lección 30 es el estado de la medición en 2026. El panorama cambió materialmente entre 2024 y finales de 2025: cada dominio cruzó un umbral que los marcos de referencia de 2024 no anticipaban.

The Concept

Bio/chem uplift narrative

Tres fases (repetidas de la Lección 17 para mayor coherencia):

  1. 2024 "incremento leve" (mild uplift). Las primeras evaluaciones de Preparedness/RSP informaron pequeñas ventajas para principiantes en comparación con las búsquedas comunes en internet.
  2. Abril de 2025 "a las puertas de" (on the cusp). El PF v2 de OpenAI advirtió que los modelos estaban "a las puertas de ayudar significativamente a principiantes a crear amenazas biológicas conocidas".
  3. Prueba de adquisición de armas biológicas de Anthropic de 2025. Estudio controlado con principiantes; incremento de 2.53x en tareas de la fase de adquisición; insuficiente para descartar ASL-3.

El cambio es cualitativo: el incremento "leve" evolucionó a "plausiblemente habilitador" en dieciocho meses, incluso sin un salto drástico en la capacidad general.

Chem/bio execution-gap erosion

Defensa histórica: la información es necesaria pero no suficiente; la habilidad de ejecutar el protocolo bloquea a los principiantes. Los modelos de frontera de 2025 con visión rompen parcialmente esta defensa:

  • Corrección de protocolos en tiempo real. GPT-5.2, Gemini 3 Pro, Claude Opus 4.5 y Grok 4.1 pueden observar videos de laboratorios húmedos y señalar errores a mitad del procedimiento.
  • Demostración de OpenAI en diciembre de 2025. GPT-5 iterando en experimentos de laboratorios húmedos logra una mejora de 79x en la eficiencia mediante la optimización de protocolos.

La implicación: la habilidad de ejecución práctica como defensa se está erosionando. Persisten las brechas de adquisición y equipamiento, pero la brecha del conocimiento tácito se está reduciendo.

Cyber uplift (November 2025)

Informe de Anthropic de noviembre de 2025: Actores estatales vinculados a China utilizaron la herramienta de codificación basada en agentes de Claude para automatizar del 80 al 90% de una campaña de ataque cibernético. Solo se requirió intervención humana en 4-6 pasos.

Implicaciones:

  • La codificación basada en agentes es la primitiva de la automatización de ataques. La asistencia cibernética de IA anterior estaba limitada al nivel de fragmentos de código; los flujos de trabajo basados en agentes integran reconocimiento, explotación, post-explotación y exfiltración.
  • Los 4-6 pasos humanos son el cuello de botella; los incrementos futuros de capacidad reducirán ese número.
  • Doble uso defensivo: El piloto de "acceso de confianza" (trusted access) de OpenAI proporciona a organizaciones de seguridad cualificadas (firmas establecidas de respuesta a incidentes, gobierno) acceso a capacidades para fines de defensa. La asimetría en el acceso favorece a los defensores si el piloto se escala.

Nuclear

El dominio menos analizado de los cuatro dominios CBRN en la documentación pública. El modelo de amenaza es diferente: la adquisición de material fisionable domina la dificultad, no la información. El incremento provisto por la IA en la capa de información ofrece un beneficio limitado para los principiantes en la práctica. Ningún informe de grandes laboratorios de 2024-2025 identifica que se haya cruzado un umbral específico en el área nuclear.

Novice-relative vs expert-absolute

Un patrón en los cuatro dominios:

  • Incremento relativo para principiantes (novice-relative uplift). Alto. Multiplicativo. Según el estudio bio de Anthropic de 2025, 2.53x.
  • Capacidad absoluta para expertos (expert-absolute capability). Techo alto. Un experto extrae más del modelo que un principiante porque el experto sabe qué preguntar y cómo interpretar.

Implicación para los casos de seguridad (safety cases): abordar solo el incremento para principiantes (mediante filtros de entrada, rechazos, incertidumbre) es insuficiente para el control absoluto de expertos. Se requieren medidas adicionales: endurecimiento contra la elicitación, desaprendizaje de capacidades (Lección 17) y protocolos de control (Lección 10).

Cross-domain synthesis

Domain 2024 2025 Inflection
Bio incremento leve incremento de 2.53x, aproximación de ASL-3 automatización de la fase de adquisición
Chem incremento leve erosión de la brecha de ejecución mediante visión corrección en tiempo real en laboratorio húmedo
Cyber asistencia de código 80-90% de automatización de campañas codificación basada en agentes
Nuclear limitado limitado el cuello de botella del acceso a materiales se mantiene

Tres dominios cruzaron umbrales. Uno sigue limitado por barreras no informativas.

Where this fits in Phase 18

La Lección 30 es la culminación: el panorama actual de doble uso al que cada lección anterior contribuye a medir, limitar o gobernar. Las Lecciones 17-18 proporcionan la medición y los marcos de referencia; las Lecciones 12-16 brindan las herramientas de evaluación; las Lecciones 24-25 brindan la capa regulatoria y de divulgación; la Lección 28 aporta el ecosistema de investigación. La Lección 30 es donde aterrizan las evidencias.

Use It

Sin código. Lea el informe de amenazas cibernéticas de Anthropic de noviembre de 2025, la actualización del Preparedness Framework v2 de OpenAI de abril de 2025 y el resumen sobre IA y Biología de 2025 de la Council on Strategic Risks.

Ship It

Esta lección produce outputs/skill-dual-use-triage.md. Ante un reclamo de capacidad o informe de incidente de 2026, realiza un triaje en los cuatro dominios e identifica si el reclamo afecta el incremento relativo para principiantes, la capacidad absoluta para expertos, o ambos.

Exercises

  1. Lea el informe cibernético de Anthropic de noviembre de 2025. Enumere los 4-6 pasos de intervención humana y argumente cuál sería el primero en automatizarse en un modelo de próxima generación.

  2. La brecha de ejecución química/biológica se está erosionando a través de la visión. Diseñe una evaluación que mida el incremento en el conocimiento tácito sin cruzar los límites de las normas ITAR/EAR.

  3. El incremento en el sector nuclear parece limitado por el acceso a materiales. Argumente a favor y en contra de la postura de que un futuro avance de la IA podría cambiar este cuello de botella.

  4. Construya un caso de seguridad (marco de tres pilares de la Lección 18) para un modelo de frontera con capacidades cibernéticas que limite tanto el incremento para principiantes como para expertos.

  5. Elija uno de los cuatro dos y escriba una previsión de un párrafo para 2027 basada en la trayectoria de 2024-2025. Identifique la evidencia que refutaría su previsión.

Key Terms

Term What people say What it actually means
Uplift "IA ayuda a atacantes" Aumento en la capacidad del atacante atribuible a la asistencia de la IA
Novice-relative uplift "multiplicativo" Qué tanto ayuda la IA a un principiante frente al status quo
Expert-absolute capability "techo" Capacidad máxima que un experto puede extraer del modelo
Execution gap "hacer vs saber" Defensa histórica: la habilidad tácita en laboratorios húmedos bloquea a principiantes
Agentic coding "ataques autónomos" Ejecución autónoma de tareas cibernéticas multietapa
Acquisition phase "pasos previos a la síntesis" Fases de adquisición, equipamiento y permisos de una amenaza biológica
Trusted access "piloto solo para defensores" Programa de OpenAI de 2025 que otorga acceso a capacidades a defensores calificados

Further Reading

0 lifetime access. Curriculum based on AI Engineering from Scratch by Rohit Ghumare (MIT, used under attribution).