La infraestructura centralizada en la nube que actualmente procesa la mayoría de las consultas a modelos de lenguaje enfrenta una presión sin precedentes. El crecimiento exponencial de la demanda amenaza con saturar los centros de datos, mientras los proveedores luchan por…