Phase 16 - Lesson 17

Agentes Generativos y Simulación Emergente

Park et al. 2023 (UIST '23, arXiv:2304.03442) poblaron Smallville, un sandbox de 25 agentes, con una arquitectura de tres partes: flujo de memoria (registro en lenguaje natural), reflexión (síntesis de nivel superior que el agente genera sobre su propio flujo) y plan (comportamiento a nivel diario, luego subplanes). El resultado histórico fue la emergencia de la fiesta de San Valentín: un agente sembrado con "quiere organizar una fiesta de San Valentín", sin secuencias de comandos adicionales, produjo invitaciones que se difundieron entre la población, coordinó fechas y la fiesta ocurrió, a partir de 24 agentes que comenzaron sin conocimiento de ella. Las ablaciones muestran que los tres componentes son necesarios para la credibilidad. Los fallos documentados son errores de normas espaciales (entrar en tiendas cerradas, compartir baños individuales). Esta es la arquitectura de referencia para simulaciones de agentes y evaluación social multiagente en 2026.

Tipo: Learn + Build Lenguajes: Python (stdlib) Prerrequisitos: Fase 16 · 04 (Primitive Model), Fase 16 · 13 (Shared Memory) Tiempo: ~75 minutos

El Problema

La mayoría de los sistemas multiagente son equipos rígidamente programados: el planificador planifica, el codificador codifica, el revisor revisa. Eso funciona para tareas bien definidas. Pero no captura el comportamiento emergente y no programado que surge cuando los agentes tienen memoria, prioridades y un mundo abierto. Las investigaciones, la simulación de la sociedad y, cada vez más, la IA de los juegos necesitan este segundo tipo.

La arquitectura Smallville es el punto de referencia para esto. Hasta Park 2023, las mejores simulaciones de agentes eran seguidoras de scripts poco profundos; después de ella, este patrón se convirtió en el predeterminado para agentes generativos en mundos abiertos. Si creas una simulación de agentes en 2026, estarás utilizando los tres componentes de Smallville o justificando explícitamente por qué no lo haces.

Concepto

Los tres componentes

Flujo de memoria. Un registro append-only de observaciones, acciones, reflexiones y planes. Cada entrada tiene una marca de tiempo, un tipo, una descripción (en lenguaje natural) y metadados derivados: recencia, importancia (autocalificada de 1 a 10 por el agente) y relevancia (similitud de coseno con la consulta actual).

[2026-02-14 09:12:03] observation: Isabella Rodriguez asked me if I like jazz
[2026-02-14 09:14:22] reflection:   I enjoy long conversations about music
[2026-02-14 10:05:00] plan:         Attend Isabella's Valentine's Day party tonight

La recuperación de memoria combina las tres puntuaciones: score = w_recency * e^(-decay * age) + w_importance * importance + w_relevance * cos_sim. Las top-k entradas ingresan al prompt actual.

Reflexión. Periódicamente (cada N memorias o ante eventos importantes), el agente genera síntesis de orden superior a partir de las memorias recientes. Las entradas de reflexión vuelven al flujo y son recuperables como cualquier otra memoria. Así es como los agentes construyen "entendimientos", el equivalente de la arquitectura para las creencias a largo plazo.

Plan. Descomposición top-down. Primero, un plan a nivel de día en términos generales ("ir a trabajar, cenar con Klaus"). Luego, planes a nivel de hora. Después, planes a nivel de acción. Los planes son revisables: cuando una observación contradice un plan, el agente replanifica únicamente el segmento afectado.

Por qué los tres importan (ablación)

Park et al. realizaron ablaciones eliminando cada uno de los componentes: observación, reflexión y plan. Cada ablación afecta la credibilidad:

  • Sin observación, el agente carece de contexto y actúa con base en creencias obsoletas.
  • Sin reflexión, el agente no puede formar creencias de orden superior; las interacciones siguen siendo superficiales.
  • Sin plan, el comportamiento se convierte en ruido reactivo; los objetivos se disipan.

Las puntuaciones de credibilidad de evaluadores humanos son más altas cuando se usan los tres; eliminar cualquiera de ellos produce una regresión cuantificable.

La emergencia de la fiesta de San Valentín

Un agente, Isabella Rodriguez, es sembrado con el objetivo "quiere organizar una fiesta de San Valentín en Hobbs Cafe el 14 de febrero a las 5pm". Los otros 24 agentes no reciben tal semilla. A lo largo de los días simulados:

  1. El plan de Isabella incluye invitar personas.
  2. Cada invitación se convierte en una observación en el flujo de memoria de un vecino.
  3. La reflexión de ese vecino genera creencias: "Isabella organizará una fiesta".
  4. El plan del vecino incorpora "asistir a la fiesta el 14 de febrero".
  5. Los vecinos se lo cuentan a otros vecinos. La invitación se difunde sin coordinación central.
  6. A las 5pm del 14 de febrero, varios agentes convergen en Hobbs Cafe.

Esto es emergencia en el sentido técnico: un comportamiento a nivel de sistema (una fiesta) surgió de interacciones locales (invitaciones bilaterales + planificación individual) sin un orquestador central.

Los modos de fallo documentados

Park et al. documentan explícitamente:

  • Errores de normas espaciales. Los agentes entran a tiendas cerradas. Los agentes intentan usar el mismo baño individual. Los agentes comen en habitaciones que no están destinadas a ello. El modelo no infiere normas físico-sociales solo a partir del entorno.
  • Desbordamiento de memoria. Las simulaciones profundas hacen que el costo de recuperación de memoria crezca. Solución práctica: compactación periódica de la memoria (resumir y podar) y decaimiento en las entradas de baja importancia.
  • Alucinación en la reflexión. Las reflexiones pueden inventar relaciones que no existen en el flujo de memoria. Mitigación: incluir los IDs de las memorias de origen en los prompts de reflexión y verificar en el momento de la recuperación.

Estos son modos de fallo relevantes en entornos de producción: cualquier simulación de agentes en 2026 los hereda.

Reglas de implementación de tres componentes

  1. La memoria es append-only. Nunca modifiques una entrada de memoria. Las correcciones son nuevas entradas.
  2. Las puntuaciones de importancia son baratas. Llama al LLM para calificar la importancia de 1 a 10 al momento de escribir. Almacena la puntuación en caché.
  3. La recuperación es clasificada, no filtrada. Top-k por puntuación combinada; no utilices filtros rígidos (que hacen perder contexto).
  4. La reflexión se ejecuta periódicamente. Se activa cuando la suma de la importancia de las memorias no procesadas supera un umbral (por ejemplo, 150).
  5. Los planes son revisables. Cuando una nueva observación contradice un plan, regenera únicamente el segmento afectado, no todo el plan.

Agentes generativos más allá de Smallville

La literatura de seguimiento de 2024-2026 amplía la arquitectura:

  • Simulación social multiagente para investigación de políticas y mercado. Las poblaciones tipo Smallville simulan el comportamiento de los usuarios en respuesta a nuevas características. Más rápido que las pruebas A/B; la precisión es debatida.
  • IA de NPCs para videojuegos. Los RPGs con agentes de Smallville producen historias emergentes en lugar de misiones programadas de antemano.
  • Benchmarks de evaluación de agentes generativos. En lugar de la precisión de las tareas, la métrica pasa a ser la credibilidad y la coherencia del comportamiento a lo largo de ejecuciones prolongadas.

La arquitectura es la referencia. Las extensiones reemplazan componentes (base de datos vectorial para la memoria, reflexión aumentada por recuperación, plan neurosimbólico), pero mantienen la estructura de tres partes.

Por qué esto importa para la ingeniería multiagente

Smallville es la prueba de concepto de que la emergencia multiagente es barata cuando os componentes son los correctos. Esta arquitectura ha sido replicada en modelos de código abierto (los LLMs más pequeños reducen su credibilidad de forma gradual, no abrupta). Cualquier sistema en producción que requiera comportamiento social emergente utiliza este esquema. Cualquier sistema que requiera ejecución estricta de tareas utiliza los patrones de supervisor / roles / primitivas de fases anteriores.

Build It

code/main.py implementa los tres componentes en Python nativo (stdlib) con políticas de agentes preprogramadas (sin un LLM real). La demostración reproduce la emergencia de la fiesta de San Valentín en miniatura:

  • MemoryStream — registro append-only con recuperación por recencia/importancia/relevancia.
  • reflect(stream) — reflexión programada sobre memorias recientes de alta importancia.
  • plan(agent_state) — planes a nivel diario y por horas basados en las creencias actuales.
  • Escenario: 5 agentes. El agente 1 comienza con "organizar fiesta a las 5pm". A lo largo de los ciclos simulados, la invitación se difunde y los agentes convergen.

Ejecución:

python3 code/main.py

Salida esperada: traza ciclo a ciclo. En el último ciclo, al menos 3 de los 5 agentes muestran la fiesta en sus planes y convergen en el lugar de la fiesta. La semente única produjo la llegada coordinada sin ningún orquestador.

Use It

outputs/skill-simulation-designer.md diseña una simulación de agentes generativos: número de agentes, esquema de memoria, cadencia de reflexión, horizonte del plan y métrica de evaluación.

Ship It

Reglas para simulaciones en producción:

  • La memoria es la base de datos. Elige una base de dados real (DB vectorial, Postgres) a escala. La stdlib en memoria es solo para prototipos.
  • Registra el historial de recuperación. Para cada acción, registra las top-k memorias que la impulsaron. Esta es tu herramienta de depuración.
  • Presupuesta los tokens por agente. El proceso de recuperar + reflexionar + planificar por ciclo para cada agente equivale a llamadas de LLM O(k). N agentes × T ciclos × llamadas por ciclo pueden agotar rápidamente tu presupuesto.
  • Compacta la memoria periódicamente. Resume y poda las entradas de baja importancia. La política de retención es una decisión de diseño, no un detalle.
  • Detecta las violaciones de normas espaciales / sociales de forma explícita. La arquitectura no las aprende sola.

Ejercicios

  1. Ejecuta code/main.py. Confirma que 3+ agentes convergen en la fiesta. Aumenta los agentes a 10; ¿sigue ocurriendo la emergencia?
  2. Elimina el paso de reflexión. ¿Cómo se ve afectado el comportamiento? Conéctalo con los hallazgos de ablación en Park 2023.
  3. Introduce un objetivo sembrado en competencia ("Klaus quiere dar una charla de investigación a las 5pm"). ¿Se dividen los agentes o domina un objetivo? ¿Qué lo determina?
  4. Añade restricciones espaciales: Hobbs Cafe tiene una capacidad máxima de 4 agentes. ¿Lida la simulación de forma elegante con el desbordamiento o cae en el patrón de fallo de "baño individual"?
  5. Lee Park et al. (arXiv:2304.03442) Sección 6 (experimentos de comportamiento emergente). Identifica un comportamiento que no sea reproducible en tu simulación miniatura. ¿Qué componente de la arquitectura necesitarías mejorar?

Términos Clave

Término Lo que la gente dice Lo que realmente significa
Flujo de memoria "El diario del agente" Registro append-only de observaciones, acciones, reflexiones y planes.
Recencia "Qué tan nueva es la memoria" Puntuación de decaimiento exponencial basada en la antigüedad.
Importancia "Qué tanto le importa al agente" Autocalificación de 1 a 10 en el momento de la escritura. Almacenada en caché.
Relevancia "Qué tan relacionado está con la consulta actual" Similitud de coseno (basada en embeddings).
Reflexión "Creencia de orden superior" Síntesis generada a partir de recuerdos recientes, reintroducida como una nueva memoria.
Plan "Decomposición en día/hora/acción" Árbol de planes top-down. Revisable cuando las observaciones son contradictorias.
Smallville "El sandbox de Park 2023" Simulación de 25 agentes que produjo la emergencia de San Valentín.
Credibilidad "La métrica de calidad" Puntuación dada por evaluadores humanos sobre si el comportamiento parece el de un agente plausible.

Lecturas Adicionales

0 lifetime access. Curriculum based on AI Engineering from Scratch by Rohit Ghumare (MIT, used under attribution).