Más allá del big data: cuando los algoritmos cambian los libros por la experiencia vital Expertos de Scale AI señalan el fin de la era dominada exclusivamente por el volumen de datos y revelan cómo los «entornos de aprendizaje por refuerzo» están transformando modelos predictivos pasivos en agentes autónomos capaces de razonar, fallar y adaptarse…
CUDA-L2: Inteligencia Artificial que supera a los ingenieros humanos
En las profundidades invisibles de los centros de datos, donde el silicio procesa las interrogantes de la humanidad, ocurre una danza matemática incesante y frenética. Cada vez que un usuario interactúa con un modelo de lenguaje, o cuando un sistema de visión artificial reconoce un rostro en una multitud, no estamos presenciando magia, sino una…
MiniRL: La receta de Alibaba para enseñar a los modelos gigantes sin que colapsen
Cómo Qwen quiere domar el RL con LLMs: convertir una pared vertical en una colina entrenable Un equipo de Alibaba propone una forma sencilla pero potente de entender cuándo el entrenamiento por refuerzo en modelos de lenguaje gigantes es estable y cuándo está condenado al colapso. La clave está en tratar el objetivo real de…
Evolución hacia el razonamiento digital directo
En poco menos de diez años hemos construido una relación con la inteligencia artificial generativa basada fundamentalmente en la verborrea. Desde los primeros modelos de lenguaje hasta los gigantescos sistemas actuales como GPT-4 o Llama, la premisa operativa ha sido siempre…
Seer: La arquitectura logística que adivina el futuro del cómputo masivo
Moonshot AI en colaboración con un equipo de investigadores de la Universidad de Tsinghua revelan «Seer», una arquitectura revolucionaria que erradica los tiempos muertos en el entrenamiento de la inteligencia artificial, demostrando que la eficiencia computacional ya no depende de…
Agent0: desarrollo exponencial de agentes
El framework Agent0 introduce una arquitectura de inteligencia artificial totalmente autónoma, capaz de evolucionar y generar agentes de alto rendimiento sin depender de nuevos datos externos o de la supervisión humana directa. Mediante un proceso de co-evolución de múltiples pasos, este…
Un cerebro para todas las máquinas: la apuesta multimillonaria por el software que lo controla todo
Una constelación de exinvestigadores de Google DeepMind y académicos de élite de Stanford y Berkeley han asegurado una financiación de $600 millones de dólares para Physical Intelligence, con una valoración de $5.6 mil millones. Su misión es audaz: construir un único…
Lenguaje y política económica en sistemas multiagente
Las decisiones económicas del mundo real no ocurren en el vacío de hojas de cálculo y ecuaciones diferenciales. Cuando una familia evalúa si comprar una vivienda, no solo considera precios e ingresos en forma de números fríos. Lee noticias sobre…
P1: La arquitectura de tres mentes que reescribe las leyes de la física
La física ya no es solo humana: P1 y la nueva era del razonamiento científico Hay un silencio particular en las salas donde se celebra la Olimpiada Internacional de Física (IPhO). Es el sonido de decenas de las mentes jóvenes más…
El método DRIVE: IA más inteligente, no solo más grande
La revolución del aprendizaje por refuerzo aplicado a tareas de razonamiento complejo ha encontrado en la programación competitiva uno de sus campos de batalla más exigentes. Mientras modelos como OpenAI o1 y DeepSeek R1 acaparan titulares por sus capacidades matemáticas, existe…










