Un solo modelo para ver, pensar y comprender Investigadores de Hong Kong y Beijing presentan OneThinker, una arquitectura que unifica diez tareas de comprensión visual bajo un único sistema capaz de razonar explícitamente sobre imágenes y videos, desde resolver ecuaciones geométricas hasta seguir objetos en movimiento fotograma a fotograma Por el equipo editorial | 4…
CUDA-L2: Inteligencia Artificial que supera a los ingenieros humanos
En las profundidades invisibles de los centros de datos, donde el silicio procesa las interrogantes de la humanidad, ocurre una danza matemática incesante y frenética. Cada vez que un usuario interactúa con un modelo de lenguaje, o cuando un sistema de visión artificial reconoce un rostro en una multitud, no estamos presenciando magia, sino una…
MiniRL: La receta de Alibaba para enseñar a los modelos gigantes sin que colapsen
Cómo Qwen quiere domar el RL con LLMs: convertir una pared vertical en una colina entrenable Un equipo de Alibaba propone una forma sencilla pero potente de entender cuándo el entrenamiento por refuerzo en modelos de lenguaje gigantes es estable y cuándo está condenado al colapso. La clave está en tratar el objetivo real de…
Quedan 900 días: el fundador de Stability AI advierte sobre el colapso de la economía humana
Quedan 900 días: el fundador de Stability AI advierte sobre el colapso de la economía humana Emad Mostaque, el matemático británico-bangladesí que creó Stable Diffusion y democratizó la generación de imágenes, sostiene que el valor económico del trabajo cognitivo humano caerá a cero, o incluso a territorio negativo, antes de que termine 2028. En una…
Entrena tu propio modelo frontera con Nova Forge de Amazon
Amazon abre las puertas de la fábrica: ahora las empresas pueden entrenar sus propios modelos frontera La compañía presenta Nova 2, una familia de cuatro modelos que procesan texto, imagen, video y voz, junto con Nova Forge, un servicio revolucionario que permite a las organizaciones crear versiones personalizadas inyectando sus datos propietarios desde las etapas…
InnoGym: La prueba de fuego para la creatividad artificial
Vivimos tiempos de una aceleración tecnológica que desafía nuestra capacidad de asombro. Durante los últimos años, hemos sido testigos de cómo los grandes modelos de lenguaje y los agentes autónomos conquistaban bastiones que creíamos exclusivamente humanos. Los hemos visto aprobar exámenes de abogacía con notas sobresalientes, diagnosticar enfermedades complejas con una precisión quirúrgica y escribir…
TUNA: Un cerebro digital único para video, foto y texto
La singularidad visual: una arquitectura unificada pone fin a la esquizofrenia en la inteligencia artificial Un equipo ensamblado de investigación de Meta y la Universidad de Hong Kong presentan una arquitectura revolucionaria que derriba la histórica barrera entre la comprensión semántica y la generación de imágenes, proponiendo un modelo nativo capaz de ‘ver’, ‘entender’ y…
Mistral Large 3: analizamos la nueva versión del modelo de código abierto mas potente del momento
Mistral 3: La arquitectura MoE y el código abierto redefinen la soberanía de la IA Con el lanzamiento de Mistral Large 3 bajo licencia Apache 2.0 y la familia Ministral para el borde, la firma francesa desafía el oligopolio de los modelos cerrados entregando rendimiento de frontera, eficiencia de inferencia y control total al desarrollador….










