Suscríbete a MUNDO IA

multimodal

Generated Image November 25, 2025 - 6_47PM

Mixture of States: El fin de la disociación en el pensamiento digital

Asistimos a una era de asombro digital casi cotidiano. Pedimos a una máquina que imagine «un astronauta montando a caballo en Marte, al estilo de Rembrandt» y, en segundos, una imagen fotorrealista que jamás ha existido aparece en nuestra pantalla. Solicitamos…

Leer Más
Generated Image November 14, 2025 - 8_12PM

Menos parámetros, más poder: la arquitectura experta de ERNIE

  El gigante tecnológico chino lanza ERNIE, una arquitectura multimodal que activa solo 3.000 millones de parámetros pero iguala o vence a GPT-5 y Gemini en tareas críticas empresariales. Su estrategia dual de código abierto y modelos propietarios redefine las reglas…

Leer Más
Google_AI_Studio_2025-10-21T03_26_04.682Z

El laboratorio de la superinteligencia: Meta reorganiza su investigación para alcanzar la IA más avanzada

Mientras los observadores debatían si el impulso en inteligencia artificial había comenzado a desacelerarse, Meta acaba de ejecutar la reorganización más ambiciosa de su división científica en años. La creación de Meta Superintelligence Labs (MSL) no es un simple cambio de…

Leer Más
Google_AI_Studio_2025-10-16T04_32_31.593Z

OmniVideoBench y el futuro de la comprensión multimodal

La inteligencia artificial ha experimentado una transformación radical en los últimos años, pasando de procesar información de un solo tipo a integrar y comprender simultáneamente múltiples flujos de datos. Este salto cualitativo, conocido como inteligencia multimodal, permite a las máquinas analizar…

Leer Más
ChatGPT Image 26 ago 2025, 20_17_15

InternVL 3.5: ve mejor, piensa mejor, gasta menos

Por Javier Ruiz, Periodista Especializado en Inteligencia Artificial y Tecnología Emergente, para Mundo IA   Menos tokens, más cabeza en InternVL 3.5 El equipo de Shanghai AI Lab presentó InternVL 3.5: una familia de modelos multimodales abiertos que mejora el razonamiento…

Leer Más
image_202504Su213206.png

OpenAI estrena O3 y O4‑mini: la nueva generación que lleva la visión multimodal a ChatGPT gratis

La Revolución Multimodal Llega Gratis a ChatGPT con Visión Avanzada OpenAI, la reconocida organización detrás de ChatGPT, ha dado un paso significativo en la evolución de la inteligencia artificial con el anuncio de dos nuevos modelos de lenguaje avanzados: O3 (Omni…

Leer Más
image_202503We152524.png

Gemini 2.5 Pro está aquí con números más grandes y excelentes vibraciones

Llega Gemini 2.5 Pro: Más Potencia y Mejores Capacidades para la IA de Google El panorama de la inteligencia artificial está en constante ebullición, y Google acaba de añadir más leña al fuego con el anuncio de su nuevo modelo insignia:…

Leer Más

Para estar informado, Ingresá o Creá tu cuenta en MundoIA...

Entrar

Recordá revisar la carpeta de "no deseados", el correo puede llegar allí