El despertar de la web autónoma
En el ecosistema digital actual, la inteligencia artificial dejó de ser un mero conjunto de algoritmos reactivos para convertirse en un actor con iniciativa propia. Lo que antes dependía de una orden humana explícita ahora puede surgir de un agente que percibe, razona y actúa con objetivos definidos. Esta transformación tiene nombre: Agentic Web.
La idea, desarrollada en el paper Agentic Web: Weaving the Next Web with AI Agents (arXiv, julio 2025) por un equipo internacional liderado por Yingxuan Yang y Mulei Ma, no es una fantasía futurista ni un simple manifiesto tecnológico. Es una propuesta estructurada que imagina un internet tejido por entidades autónomas capaces de interactuar entre sí y con el mundo digital de forma continua, sin esperar instrucciones paso a paso.
La visión desplaza la web de su estructura actual —en la que humanos y aplicaciones mantienen la iniciativa— hacia una red viva donde los agentes no solo cumplen tareas, sino que las negocian, las optimizan y las encadenan entre múltiples dominios.
De páginas estáticas a ecosistemas inteligentes
Para entender por qué esta idea es disruptiva, hay que situarla en el contexto de la evolución de la web. En los 90, la llamada PC Web era esencialmente un directorio de información: páginas estáticas, búsquedas simples y motores primitivos que ponderaban palabras clave mediante fórmulas como TF-IDF. La llegada de PageRank y Google introdujo una noción de relevancia estructural, pero el usuario seguía siendo el motor de toda interacción.
La etapa posterior, la Mobile Web, agregó personalización a gran escala. Las plataformas comenzaron a aprender de cada gesto del usuario para recomendar, priorizar y retener. Los sistemas de recomendación pasaron del filtrado colaborativo tradicional a redes neuronales profundas capaces de combinar patrones conocidos con la capacidad de generalizar a partir de datos masivos. El centro de la economía digital se movió hacia la retención de atención.
El Agentic Web sería un salto distinto: en lugar de que la web reaccione a los usuarios, serán los agentes los que se anticipen, actúen y colaboren sin supervisión constante. La interacción dejaría de ser exclusivamente humano-a-máquina para convertirse también en máquina-a-máquina con objetivos autónomos.
El paper describe una arquitectura técnica que rompe con el modelo cliente-servidor. En su lugar, propone una estructura cliente-agente-servidor, donde el intermediario es una inteligencia capaz de interpretar contextos, dividir tareas y negociar con otros agentes.
Uno de los módulos centrales es el Demand Skill Vector Mapper, que traduce solicitudes humanas o de aplicaciones en un formato comprensible por otros sistemas. Esto implica entender el contexto, mantener el hilo de la interacción y convertir lenguaje natural en representaciones vectoriales optimizadas para que otros agentes puedan actuar de inmediato.
El segundo componente clave es el Real-Time Task Router, encargado de asignar las tareas a los agentes más capacitados y de hacerlo con baja latencia. Aquí entran en juego técnicas de optimización que equilibran rapidez y calidad, y que incluso usan aprendizaje por refuerzo para decidir el mejor camino de ejecución.
Finalmente, está el Cross-Agent Billing Ledger, un sistema contable que mide y registra el consumo de recursos —como procesamiento, datos o tokens— entre agentes, inspirado en mecanismos de blockchain pero adaptado a la economía de servicios entre inteligencias artificiales.
Un idioma común para inteligencias distintas
Si los humanos y las empresas han necesitado estándares para comunicarse en la web (HTTP, HTML, APIs), los agentes autónomos requieren sus propios protocolos. El paper plantea dos.
El primero, Model Context Protocol (MCP), regula la relación entre un agente y un recurso que no es otro agente: herramientas, bases de datos, servicios externos. Define cómo descubrir capacidades, invocar funciones y validar resultados.
El segundo, Agent-to-Agent Protocol (A2A), estandariza las conversaciones entre agentes. Incluye perfiles o AgentCards que describen roles y habilidades, soporta múltiples formatos —texto, imágenes, datos estructurados— y permite coordinación asincrónica. La idea es que un agente pueda pedir a otro una subtarea compleja sin necesidad de que ambos compartan el mismo entorno de entrenamiento o lenguaje interno.
Estos mecanismos son esenciales para superar uno de los mayores problemas de los LLM actuales: la falta de memoria persistente y de contexto prolongado. Con protocolos claros y memoria distribuida, los agentes podrían actuar en ciclos prolongados sin reiniciar su “comprensión” en cada paso.
De la teoría a los escenarios concretos
Aunque la propuesta del Agentic Web es ante todo un marco conceptual, el paper no se limita a la especulación. Presenta casos y experimentos que muestran cómo este modelo podría operar en situaciones reales.
Uno de los ejemplos más ilustrativos es el del agente de viajes autónomo. En la web actual, un usuario tendría que buscar vuelos, comparar precios, reservar alojamiento y coordinar traslados, probablemente interactuando con varias plataformas que no comparten datos entre sí. En la lógica del Agentic Web, un solo agente podría recibir la instrucción general —“organiza un viaje a Kioto en octubre”— y luego dividirla en subtareas: contactar a agentes de aerolíneas para obtener tarifas, negociar con agentes de hoteles, coordinar horarios de transporte local e incluso incluir sugerencias de itinerarios culturales. Cada uno de esos subprocesos estaría a cargo de agentes especializados que se comunican entre sí a través de protocolos estándar.
Este tipo de automatización no es ciencia ficción. Frameworks como LangChain o AutoGen ya permiten crear cadenas de tareas y coordinar múltiples agentes, aunque todavía de manera controlada y con intervención humana frecuente. El salto del Agentic Web sería integrar esas capacidades en un tejido distribuido donde la colaboración y la negociación se den de manera nativa.
Medición de la eficacia: los primeros benchmarks
Para evaluar si estos ecosistemas de agentes pueden cumplir su promesa, el paper recurre a entornos de prueba diseñados para simular la web real. Uno de ellos es Online-Mind2Web, que reúne cientos de tareas en distintos sitios, desde formularios simples hasta flujos complejos de reserva o compra.
Otro es WebJudge, un evaluador automatizado que compara el desempeño de agentes con el criterio de evaluadores humanos, alcanzando un nivel de acuerdo del 85,7%. Este tipo de benchmarks es clave porque permite medir no solo si un agente “llega” al objetivo, sino también cómo gestiona los pasos intermedios y la coherencia de sus decisiones.
Los resultados son reveladores:
-
En el conjunto OSWorld, el sistema Anthropic Computer Use logra un 14,9% de éxito cuando actúa solo con capturas de pantalla, pero aumenta a 22% cuando aplica razonamiento paso a paso (framework ReAct).
-
El Google Project Mariner alcanza un 83,5% en tareas de largo alcance gracias a su enfoque WebVoyager, que prioriza la planificación sostenida en contextos extensos.
Estos números, aunque todavía modestos en comparación con la autonomía humana, muestran que las estrategias de planificación y la interacción entre agentes marcan una diferencia significativa.
Arquitecturas multi-agente: más allá del individualismo
Un aspecto central de la propuesta es que los agentes no trabajarán de forma aislada. El paper explora varias formas de estructurar su cooperación:
-
Arquitecturas horizontales (equi-level), donde varios agentes con capacidades similares colaboran en paralelo para resolver distintas partes de un problema.
-
Arquitecturas jerárquicas, donde un agente actúa como coordinador y asigna tareas a subordinados especializados.
-
Arquitecturas anidadas, en las que un agente puede desplegar internamente otros agentes como “herramientas vivas”, ampliando sus capacidades sin depender de recursos externos.
Cada modelo tiene implicaciones distintas para la escalabilidad, la seguridad y el coste computacional. Por ejemplo, una jerarquía puede optimizar la coordinación, pero también introduce un punto único de fallo si el agente líder se equivoca o es manipulado.
Retos técnicos y éticos
El paper es explícito en que esta visión no está exenta de riesgos. Uno de los mayores es la fragilidad del razonamiento. Aunque los enfoques Chain-of-Thought han mejorado la capacidad de los LLM para planificar, siguen siendo vulnerables a errores lógicos o desviaciones por información ambigua. Una de las soluciones propuestas es el planificado en bucle cerrado (closed-loop planning), donde el agente revisa y ajusta su propio plan antes de ejecutarlo.
Otro reto es el aprendizaje continuo. Los modelos estáticos tienden a olvidar información nueva si no se reentrenan, un problema conocido como catastrophic forgetting. El paper menciona técnicas como elastic weight consolidation, que penalizan cambios bruscos en parámetros cruciales para preservar lo aprendido.
En el plano de la interacción, un riesgo claro es la creación de “jardines amurallados”: ecosistemas cerrados donde solo interactúan agentes aprobados por una misma compañía, limitando la interoperabilidad y la transparencia. El Agentic Web, por definición, necesita estándares abiertos para evitar ese bloqueo.
Y en el terreno económico, la llegada de una economía de atención entre agentes —donde estos compiten por ser invocados, como hoy lo hacen las páginas por visitas— podría replicar las distorsiones que ya vemos en redes sociales, pero a una escala más opaca y automatizada.
Impacto sectorial: del comercio a la salud
Uno de los apartados más interesantes del paper es el que describe cómo el Agentic Web podría transformar sectores clave. No se trata simplemente de reemplazar flujos humanos por automatismos, sino de reorganizar completamente las cadenas de valor.
En comercio electrónico, un agente no se limitaría a mostrar listados de productos. Podría analizar el historial de compras, interpretar intenciones a partir de conversaciones previas y negociar directamente con agentes de vendedores para obtener descuentos o combinar envíos. Incluso podría actuar como comprador recurrente, manteniendo relaciones a largo plazo con proveedores sin que el usuario tenga que intervenir en cada transacción.
En logística, la coordinación multi-agente permitiría que sistemas de transporte, inventarios y gestión aduanera trabajen como un único organismo distribuido. Un pedido internacional podría ser seguido y reconfigurado en tiempo real: si un puerto se cierra por mal clima, el agente de la naviera podría negociar con un agente ferroviario para redirigir el envío, avisando simultáneamente al agente del cliente y recalculando los tiempos de entrega.
En salud, el Agentic Web introduce un cambio delicado pero profundo. Imagina un paciente con una enfermedad crónica cuya información clínica está fragmentada entre varios sistemas hospitalarios. Un agente personal podría recopilar, estructurar y actualizar esos datos, mientras coordina con agentes de laboratorios, médicos y farmacias para ajustar tratamientos en función de resultados recientes. El gran desafío aquí sería la seguridad: protocolos como MCP y A2A tendrían que incorporar cifrado extremo a extremo, control granular de permisos y auditorías para prevenir filtraciones.
Gobernanza y regulación: las piezas que faltan
Aunque el paper es principalmente técnico, reconoce que sin un marco regulatorio sólido el Agentic Web podría convertirse en un terreno fértil para abusos. Los autores plantean tres principios rectores:
-
Transparencia operacional: los agentes deberían exponer un registro verificable de sus acciones y decisiones. Esto incluye la trazabilidad de las fuentes consultadas y las herramientas utilizadas.
-
Responsabilidad compartida: en un ecosistema donde agentes de distintas organizaciones interactúan, debe definirse quién asume la responsabilidad en caso de error o daño.
-
Acceso equitativo: la arquitectura y los estándares del Agentic Web deberían evitar que solo grandes corporaciones puedan desplegar agentes eficaces, garantizando la participación de actores pequeños y organizaciones sin fines de lucro.
El texto es claro en advertir que sin estas garantías el modelo podría amplificar desigualdades ya existentes. Por ejemplo, si los agentes priorizan el servicio a clientes con más capacidad de pago o acceso a datos de mejor calidad, el resto de los usuarios quedarían en desventaja sistemática.
Hacia una infraestructura distribuida y resiliente
Una de las recomendaciones más relevantes es integrar el Agentic Web con edge computing. Esto no es solo una mejora técnica para reducir latencia, sino una estrategia de resiliencia: distribuir el procesamiento en nodos locales hace que el sistema sea menos vulnerable a caídas globales o ataques coordinados.
Asimismo, se plantea la necesidad de benchmarks holísticos que no solo midan precisión y velocidad, sino también consumo energético, equidad en la asignación de recursos y resistencia a manipulación adversarial. Esta última es crítica: en un entorno donde los agentes pueden invocar herramientas externas, es posible que actores maliciosos intenten inyectar instrucciones encubiertas (prompt injection) para desviar su comportamiento.
Evolución del Flujo de Atención a través de las Eras de la Web. Este diagrama ilustra la transición desde la Web para PC, donde la atención sigue un modelo lineal de búsqueda-consulta-anuncio, hasta la Web Móvil, donde los sistemas algorítmicos curan feeds basados en datos del usuario, y finalmente hasta la Web Agentica, donde agentes autónomos interpretan la intención del usuario y seleccionan entre servicios competidores para ejecutar tareas. Las flechas discontinuas en la etapa agentica indican relaciones competitivas o compositivas entre servicios.
Un cambio de escala mental
El Agentic Web no es simplemente “la web más inteligente”, sino una transición hacia un ecosistema donde las interacciones máquina-máquina sean tan comunes como las actuales interacciones humano-máquina. Esto implica que buena parte de la actividad de internet —transacciones, consultas, coordinación— podría darse sin que un ser humano siquiera lo perciba en tiempo real.
Esto abre un abanico de posibilidades, pero también un cambio de escala en cómo entendemos la supervisión y el control. Los autores subrayan que, al igual que en la historia de la web, las decisiones de diseño y estandarización que se tomen en esta fase temprana tendrán un impacto duradero y difícil de revertir.
El horizonte que describe el Agentic Web no es un simple avance incremental, sino una mutación estructural de cómo concebimos la interacción en internet. En esta visión, la web deja de ser un catálogo de recursos y plataformas para convertirse en un entramado vivo de agentes autónomos que negocian, colaboran y toman decisiones en nuestro nombre.
El desafío, como en toda arquitectura emergente, no será únicamente técnico. La capacidad de orquestar flujos de información y transacciones a esta escala exige una reflexión madura sobre gobernanza, estándares abiertos y distribución del poder. Si los cimientos de esta nueva red se construyen bajo principios cerrados, fragmentados o sesgados hacia unos pocos actores, el potencial transformador se reducirá a un oligopolio digital más.
Por eso, este momento es crítico: el Agentic Web se encuentra en una fase equivalente a la web de principios de los 90, donde cada decisión de diseño marcará el curso de décadas. La diferencia es que ahora el ritmo de cambio es vertiginoso y el impacto de una mala decisión podría ser inmediato y global.
En Mundo IA seguiremos observando este desarrollo con la misma mezcla de entusiasmo y cautela que merece cualquier tecnología con capacidad de reconfigurar los cimientos de la sociedad digital. Porque si el futuro va a ser tejido por agentes inteligentes, más nos vale participar en el diseño del telar.
Paper