Phase 18 - Lesson 30
Dual-Use Risk — Cyber, Bio, Chem, Nuclear Uplift
El panorama de doble uso de 2026, dominio por dominio. Bio/química: La Lección 17 cubre WMDP; la prueba de adquisición de armas biológicas de Anthropic (incremento de 2.53x) y la advertencia del Preparedness Framework v2 de OpenAI de abril de 2025 ("a las puertas de ayudar significativamente a principiantes a crear amenazas biológicas conocidas") marcan el punto de inflexión. Ciberseguridad (informe de Anthropic de noviembre de 2025): Actores estatales vinculados a China utilizaron la herramienta de codificación basada en agentes de Claude para automatizar hasta el 90% de una campaña de ataque cibernético, con intervención humana en solo 4-6 pasos; el piloto de "acceso de confianza" (trusted access) de OpenAI otorga acceso a capacidades a organizaciones de seguridad seleccionadas para trabajos defensivos de doble uso. Erosión de la brecha de ejecución química/biológica: la defensa clásica era "el acceso a la información por sí solo es insuficiente". Los modelos de frontera habilitados con visión (GPT-5.2, Gemini 3 Pro, Claude Opus 4.5, Grok 4.1) pueden observar videos de laboratorios húmedos y proporcionar correcciones en tiempo real. Diciembre de 2025: OpenAI demostró a GPT-5 iterando en experimentos de laboratorio húmedo, logrando una mejora de 79x en la eficiencia mediante la optimización de protocolos impulsada por IA. Patrón principiante-vs-experto: la IA proporciona un mayor incremento relativo para los principiantes, pero una mayor capacidad absoluta para los expertos.
Type: Learn Languages: none Prerequisites: Phase 18 · 17 (WMDP), Phase 18 · 18 (safety frameworks), Phase 18 · 28 (ecosystem) Time: ~75 minutes
Learning Objectives
- Describir la narrativa del incremento de capacidad biológica de 2024-2025: "incremento leve" -> "a las puertas de" -> "incremento de 2.53x insuficiente para descartar ASL-3".
- Describir el informe cibernético de Anthropic de noviembre de 2025: automatización vinculada a China de hasta el 90% de una campaña de ataque cibernético.
- Describir la erosión de la brecha de ejecución química/biológica: corrección en tiempo real de experimentos de laboratorio húmedo basada en visión.
- Explicar la asimetría principiante-relativo vs experto-absoluto y su implicación para la construcción de casos de seguridad.
The Problem
La Lección 17 trata sobre la metodología de medición. La Lección 30 es el estado de la medición en 2026. El panorama cambió materialmente entre 2024 y finales de 2025: cada dominio cruzó un umbral que los marcos de referencia de 2024 no anticipaban.
The Concept
Bio/chem uplift narrative
Tres fases (repetidas de la Lección 17 para mayor coherencia):
- 2024 "incremento leve" (mild uplift). Las primeras evaluaciones de Preparedness/RSP informaron pequeñas ventajas para principiantes en comparación con las búsquedas comunes en internet.
- Abril de 2025 "a las puertas de" (on the cusp). El PF v2 de OpenAI advirtió que los modelos estaban "a las puertas de ayudar significativamente a principiantes a crear amenazas biológicas conocidas".
- Prueba de adquisición de armas biológicas de Anthropic de 2025. Estudio controlado con principiantes; incremento de 2.53x en tareas de la fase de adquisición; insuficiente para descartar ASL-3.
El cambio es cualitativo: el incremento "leve" evolucionó a "plausiblemente habilitador" en dieciocho meses, incluso sin un salto drástico en la capacidad general.
Chem/bio execution-gap erosion
Defensa histórica: la información es necesaria pero no suficiente; la habilidad de ejecutar el protocolo bloquea a los principiantes. Los modelos de frontera de 2025 con visión rompen parcialmente esta defensa:
- Corrección de protocolos en tiempo real. GPT-5.2, Gemini 3 Pro, Claude Opus 4.5 y Grok 4.1 pueden observar videos de laboratorios húmedos y señalar errores a mitad del procedimiento.
- Demostración de OpenAI en diciembre de 2025. GPT-5 iterando en experimentos de laboratorios húmedos logra una mejora de 79x en la eficiencia mediante la optimización de protocolos.
La implicación: la habilidad de ejecución práctica como defensa se está erosionando. Persisten las brechas de adquisición y equipamiento, pero la brecha del conocimiento tácito se está reduciendo.
Cyber uplift (November 2025)
Informe de Anthropic de noviembre de 2025: Actores estatales vinculados a China utilizaron la herramienta de codificación basada en agentes de Claude para automatizar del 80 al 90% de una campaña de ataque cibernético. Solo se requirió intervención humana en 4-6 pasos.
Implicaciones:
- La codificación basada en agentes es la primitiva de la automatización de ataques. La asistencia cibernética de IA anterior estaba limitada al nivel de fragmentos de código; los flujos de trabajo basados en agentes integran reconocimiento, explotación, post-explotación y exfiltración.
- Los 4-6 pasos humanos son el cuello de botella; los incrementos futuros de capacidad reducirán ese número.
- Doble uso defensivo: El piloto de "acceso de confianza" (trusted access) de OpenAI proporciona a organizaciones de seguridad cualificadas (firmas establecidas de respuesta a incidentes, gobierno) acceso a capacidades para fines de defensa. La asimetría en el acceso favorece a los defensores si el piloto se escala.
Nuclear
El dominio menos analizado de los cuatro dominios CBRN en la documentación pública. El modelo de amenaza es diferente: la adquisición de material fisionable domina la dificultad, no la información. El incremento provisto por la IA en la capa de información ofrece un beneficio limitado para los principiantes en la práctica. Ningún informe de grandes laboratorios de 2024-2025 identifica que se haya cruzado un umbral específico en el área nuclear.
Novice-relative vs expert-absolute
Un patrón en los cuatro dominios:
- Incremento relativo para principiantes (novice-relative uplift). Alto. Multiplicativo. Según el estudio bio de Anthropic de 2025, 2.53x.
- Capacidad absoluta para expertos (expert-absolute capability). Techo alto. Un experto extrae más del modelo que un principiante porque el experto sabe qué preguntar y cómo interpretar.
Implicación para los casos de seguridad (safety cases): abordar solo el incremento para principiantes (mediante filtros de entrada, rechazos, incertidumbre) es insuficiente para el control absoluto de expertos. Se requieren medidas adicionales: endurecimiento contra la elicitación, desaprendizaje de capacidades (Lección 17) y protocolos de control (Lección 10).
Cross-domain synthesis
| Domain | 2024 | 2025 | Inflection |
|---|---|---|---|
| Bio | incremento leve | incremento de 2.53x, aproximación de ASL-3 | automatización de la fase de adquisición |
| Chem | incremento leve | erosión de la brecha de ejecución mediante visión | corrección en tiempo real en laboratorio húmedo |
| Cyber | asistencia de código | 80-90% de automatización de campañas | codificación basada en agentes |
| Nuclear | limitado | limitado | el cuello de botella del acceso a materiales se mantiene |
Tres dominios cruzaron umbrales. Uno sigue limitado por barreras no informativas.
Where this fits in Phase 18
La Lección 30 es la culminación: el panorama actual de doble uso al que cada lección anterior contribuye a medir, limitar o gobernar. Las Lecciones 17-18 proporcionan la medición y los marcos de referencia; las Lecciones 12-16 brindan las herramientas de evaluación; las Lecciones 24-25 brindan la capa regulatoria y de divulgación; la Lección 28 aporta el ecosistema de investigación. La Lección 30 es donde aterrizan las evidencias.
Use It
Sin código. Lea el informe de amenazas cibernéticas de Anthropic de noviembre de 2025, la actualización del Preparedness Framework v2 de OpenAI de abril de 2025 y el resumen sobre IA y Biología de 2025 de la Council on Strategic Risks.
Ship It
Esta lección produce outputs/skill-dual-use-triage.md. Ante un reclamo de capacidad o informe de incidente de 2026, realiza un triaje en los cuatro dominios e identifica si el reclamo afecta el incremento relativo para principiantes, la capacidad absoluta para expertos, o ambos.
Exercises
Lea el informe cibernético de Anthropic de noviembre de 2025. Enumere los 4-6 pasos de intervención humana y argumente cuál sería el primero en automatizarse en un modelo de próxima generación.
La brecha de ejecución química/biológica se está erosionando a través de la visión. Diseñe una evaluación que mida el incremento en el conocimiento tácito sin cruzar los límites de las normas ITAR/EAR.
El incremento en el sector nuclear parece limitado por el acceso a materiales. Argumente a favor y en contra de la postura de que un futuro avance de la IA podría cambiar este cuello de botella.
Construya un caso de seguridad (marco de tres pilares de la Lección 18) para un modelo de frontera con capacidades cibernéticas que limite tanto el incremento para principiantes como para expertos.
Elija uno de los cuatro dos y escriba una previsión de un párrafo para 2027 basada en la trayectoria de 2024-2025. Identifique la evidencia que refutaría su previsión.
Key Terms
| Term | What people say | What it actually means |
|---|---|---|
| Uplift | "IA ayuda a atacantes" | Aumento en la capacidad del atacante atribuible a la asistencia de la IA |
| Novice-relative uplift | "multiplicativo" | Qué tanto ayuda la IA a un principiante frente al status quo |
| Expert-absolute capability | "techo" | Capacidad máxima que un experto puede extraer del modelo |
| Execution gap | "hacer vs saber" | Defensa histórica: la habilidad tácita en laboratorios húmedos bloquea a principiantes |
| Agentic coding | "ataques autónomos" | Ejecución autónoma de tareas cibernéticas multietapa |
| Acquisition phase | "pasos previos a la síntesis" | Fases de adquisición, equipamiento y permisos de una amenaza biológica |
| Trusted access | "piloto solo para defensores" | Programa de OpenAI de 2025 que otorga acceso a capacidades a defensores calificados |
Further Reading
- Anthropic — November 2025 cyber threat report — automatización de campañas vinculadas a China
- OpenAI — Preparedness Framework v2 (April 15, 2025) — bio "a las puertas de"
- Anthropic — RSP v3.0 (February 2026) — umbrales bio de ASL-3
- Council on Strategic Risks — 2025 AI x Bio wrapup — síntesis de fin de ano