DeepSeek V4 llega con 1,6 billones de parámetros y precios que rompen el mercado

El regreso del laboratorio que sacudió al mundo

Un año después del terremoto financiero que provocó la caída bursátil más costosa de la historia de Nvidia, DeepSeek lanza V4: dos modelos de código abierto que combinan el mayor número de parámetros del ecosistema abierto con precios que dejan sin argumento a sus competidores occidentales. La pregunta ya no es si China puede competir en inteligencia artificial, sino a qué velocidad está redefiniendo sus reglas.

Por el equipo editorial | 24 de abril, 2026

Hay fechas que dividen una industria en un antes y un después. Para el sector tecnológico global, el 20 de enero de 2025 fue una de esas bisagras. Esa noche, mientras los mercados estadounidenses cerraban, el laboratorio chino DeepSeek publicó R1, un modelo de razonamiento que no solo igualaba a sus contrapartes de OpenAI y Anthropic en múltiples benchmarks, sino que lo hacía a una fracción del costo de entrenamiento declarado. La respuesta de Wall Street fue fulminante: en una sola jornada, Nvidia perdió cerca de 600.000 millones de dólares de capitalización bursátil. El pánico no era irracional. Si un actor chino podía construir modelos de frontera con chips menos potentes y un presupuesto radicalmente menor, la narrativa entera sobre la ventaja competitiva estadounidense en inteligencia artificial necesitaba ser reescrita.

Doce meses después, DeepSeek volvió. Esta vez con V4, una serie compuesta por dos modelos en versión preliminar: V4-Pro y V4-Flash. Ambos fueron publicados bajo licencia MIT, con pesos disponibles de manera abierta, y ambos operan con una arquitectura de Mixture of Experts sobre una ventana de contexto de un millón de tokens. El detalle más inmediato, el que circuló más rápido por las comunidades de desarrolladores, no fue el rendimiento sino las dimensiones. Con 1,6 billones de parámetros totales y 49.000 millones activos por inferencia, V4-Pro se convirtió en el modelo de código abierto más grande conocido hasta la fecha, superando al Kimi K2.6 de Moonshot AI (1,1 billones) y al GLM-5.1 de Zhipu (754.000 millones), y más que duplicando el tamaño de la versión anterior de la propia empresa, el V3.2 lanzado en diciembre pasado.

La versión más compacta, V4-Flash, tiene 284.000 millones de parámetros totales con 13.000 millones activos. Su tamaño en disco, 160 gigabytes, lo vuelve teóricamente ejecutable en hardware de consumo de gama alta, una posibilidad que ya está despertando expectativas entre quienes trabajan con los modelos cuantizados del equipo Unsloth. El Pro, en cambio, ocupa 865 gigabytes en Hugging Face, lo que lo convierte en un sistema pensado para infraestructura seria, aunque su arquitectura de expertos dispersos lo hace considerablemente más eficiente de lo que ese número sugiere a primera vista.

La aritmética que incomoda a Silicon Valley

El rendimiento de V4 es competitivo, pero no imbatible. Los propios autores del paper técnico reconocen que V4-Pro-Max, la variante con mayor presupuesto de razonamiento, supera a GPT-5.2 y a Gemini-3.0-Pro en los benchmarks estándar de razonamiento, aunque queda ligeramente por debajo de GPT-5.4 y Gemini-3.1-Pro. El laboratorio lo formula con honestidad inusual para el sector: su trayectoria de desarrollo se ubica entre tres y seis meses por detrás de los modelos de frontera más avanzados. En una industria acostumbrada a los superlativos, esa admisión tiene algo de refrescante, y también de estratégico: quien define las expectativas controla la narrativa de la sorpresa.

Pero donde la discusión se vuelve verdaderamente incómoda para los grandes laboratorios occidentales no es en los benchmarks, sino en los precios. DeepSeek fijó V4-Flash en 0,14 dólares por millón de tokens de entrada y 0,28 por millón de salida. V4-Pro cotiza a 1,74 y 3,48, respectivamente. Para tener una referencia concreta: Claude Sonnet 4.6 de Anthropic cuesta 3 dólares por millón de tokens de entrada y 15 de salida; GPT-5.4 de OpenAI, 2,50 y 15. DeepSeek-V4-Flash no solo es el modelo pequeño más barato del mercado, superando al propio GPT-5.4 Nano de OpenAI (0,20 y 1,25), sino que V4-Pro es el más económico de los modelos grandes de frontera, con un costo de salida que es menos de una cuarta parte del de sus competidores directos.

Comparación de precios por millón de tokens de salida entre DeepSeek V4 y los principales modelos de frontera. Datos publicados por los propios laboratorios al 24 de abril de 2026.

La eficiencia computacional detrás de ese precio no es accidental. El paper técnico del modelo describe con precisión el mecanismo: en un escenario de contexto de un millón de tokens, V4-Pro consume solo el 27% de los FLOPs de punto flotante necesarios para V3.2 y apenas el 10% del tamaño de la caché KV. Flash va más lejos todavía, llegando al 10% de FLOPs y al 7% de caché en el mismo escenario. El laboratorio no solo redujo costos de entrenamiento como lo hizo con R1: ahora también optimizó la inferencia, el gasto que en los sistemas de producción a gran escala representa el verdadero peso económico del negocio.

Especificaciones técnicas de DeepSeek V4 (preview)

V4-Pro: 1,6 billones de parámetros totales, 49.000 millones activos por inferencia.

V4-Flash: 284.000 millones de parámetros totales, 13.000 millones activos por inferencia.

Arquitectura: Mixture of Experts (MoE) en ambos modelos.

Contexto: 1 millón de tokens.

Licencia: MIT, pesos disponibles en Hugging Face.

Hardware de referencia: optimizado para chips Huawei Ascend; no se otorgó acceso previo a Nvidia ni AMD para optimización.

Chips Huawei y la reconfiguración del mapa del hardware

Uno de los datos más significativos de este lanzamiento no está en los benchmarks sino en el silicio. Reuters informó en febrero que DeepSeek no dio acceso anticipado a Nvidia ni a AMD para que optimizaran sus modelos, mientras que Huawei sí lo recibió. Esa decisión no es solo una señal de preferencia técnica; es una declaración de autonomía dentro de un ecosistema diseñado durante décadas para depender del hardware estadounidense. Durante los meses previos al lanzamiento, el laboratorio trabajó junto a Huawei y Cambricon para reescribir partes del stack del modelo y ejecutar pruebas sobre los chips Ascend de la firma china. El resultado es un sistema que, al menos en su trayectoria interna, no necesita de Nvidia para funcionar.

Esta dimensión del lanzamiento tiene consecuencias que van mucho más allá de la empresa. Las restricciones de exportación que Washington impuso a los chips de alta gama hacia China, y que se endurecieron en las administraciones sucesivas, partían de una premisa: sin acceso a las GPU más avanzadas de Nvidia, la capacidad de China para entrenar modelos de frontera quedaría limitada. DeepSeek ha cuestionado esa premisa dos veces en catorce meses. Con R1 demostró que era posible competir con presupuestos menores. Con V4 demuestra que es posible operar al margen del ecosistema CUDA, el entorno de programación de Nvidia que durante años funcionó como una barrera de entrada casi invisible pero enormemente efectiva para cualquier actor que no tuviera acceso al hardware que lo soporta.

"DeepSeek-V4-Pro es actualmente el modelo de código abierto más grande conocido. Su relación entre costo y rendimiento no tiene precedentes entre los modelos disponibles públicamente." Simon Willison, investigador independiente y desarrollador de LLM-Utils, 24 de abril de 2026

La pregunta que circula entre los analistas más serios del sector es si DeepSeek puede mantener ese ritmo. Entre el lanzamiento de R1 en enero de 2025 y V4 en abril de 2026, el laboratorio publicó V3.2-Exp en septiembre y V3.2 Speciale en diciembre, manteniendo una cadencia de actualizaciones que pocos competidores igualaron. Cada iteración incorporó mejoras en eficiencia, y cada una fue acompañada de documentación técnica detallada que permitió a la comunidad global replicar, adaptar y construir sobre sus fundamentos. Esa apertura, que contrasta con la opacidad de OpenAI o con las limitaciones de acceso de Anthropic, ha convertido a DeepSeek en una referencia casi obligatoria para los equipos de investigación de todo el mundo.

El modelo abierto como instrumento geopolítico

Sería un error leer el ascenso de DeepSeek como un fenómeno puramente técnico. Hay una dimensión estratégica en la decisión de publicar modelos bajo licencia MIT con pesos abiertos que trasciende la generosidad hacia la comunidad de desarrolladores. Cada modelo de código abierto que DeepSeek publica se convierte en infraestructura global. Universidades en América Latina, laboratorios en África, startups en Europa y equipos gubernamentales en Asia pueden descargar, ejecutar y adaptar estos sistemas sin pagar royalties, sin negociar acceso y sin depender de los servidores de una empresa americana. En un contexto de creciente tensión geopolítica sobre el control de las tecnologías digitales, esa distribución de capacidad tiene un valor que no aparece en ningún benchmark.

El timing del lanzamiento también comunica algo. DeepSeek eligió publicar V4 exactamente cuando el debate sobre el control de las exportaciones de chips estaba alcanzando una nueva intensidad en Washington, y cuando varios legisladores estadounidenses discutían medidas adicionales para limitar el acceso chino a semiconductores avanzados. La respuesta implícita del laboratorio fue operativa: lanzar el modelo de código abierto más grande del mundo, entrenado y optimizado sobre hardware chino, con precios que hacen irrelevante la pregunta de quién tiene las GPU más rápidas si el código base mismo ya es de acceso libre.

Desde Buenos Aires hasta Berlín, los equipos que trabajan con modelos de lenguaje de gran escala observan este movimiento con atención. La competencia en inteligencia artificial no se dirime ya únicamente entre laboratorios que acumulan más cómputo; también involucra a quienes logran hacer que su tecnología se vuelva insustituible por razones de precio, accesibilidad y apertura. En ese juego, DeepSeek lleva doce meses ganando terreno con una consistencia que ya no admite ser tratada como casualidad o como un golpe de suerte atribuido a ingeniería creativa. Es una estrategia, y está funcionando.

Lo que V4 todavía no resuelve

Brecha de frontera: según el propio laboratorio, V4-Pro se ubica entre tres y seis meses por detrás de GPT-5.4 y Gemini-3.1-Pro en los benchmarks de razonamiento más exigentes.

Versión preliminar: tanto V4-Pro como V4-Flash fueron publicados como previews, sin garantía de paridad con una eventual versión de producción.

Dependencia de hardware doméstico: la optimización sobre chips Huawei abre preguntas sobre el rendimiento en infraestructura internacional no adaptada.

Capacidades multimodales: V4 se presenta como un sistema de texto; las capacidades de visión y audio, si existen, no forman parte del anuncio inicial.

El sector, en todo caso, ya no debate si DeepSeek es un actor serio. La discusión ha migrado hacia una pregunta más incómoda para las empresas que han construido negocios sobre el supuesto de que los modelos más capaces también son los más caros: ¿cuánto tiempo puede sostenerse ese modelo de negocio cuando un competidor ofrece prestaciones comparables a una décima parte del precio? La respuesta, por ahora, la está escribiendo un laboratorio de Hangzhou con una cadencia de lanzamientos que hace difícil mirar hacia otro lado.

Referencias

Reuters, "DeepSeek previews new AI model adapted to run on Huawei chips", Eduardo Baptista, Ethan Wang y Che Pan, 23-24 de abril de 2026. https://www.reuters.com/technology/chinas-deepseek-returns-with-new-model-year-after-viral-rise-2026-04-24/

Simon Willison, "DeepSeek V4: almost on the frontier, a fraction of the price", 24 de abril de 2026. https://simonwillison.net/2026/apr/24/deepseek-v4/

CNN, "China's AI upstart DeepSeek drops new model. Will it make waves again?", 24 de abril de 2026. https://www.cnn.com/2026/04/24/tech/chinas-ai-deepseek-v4-intl-hnk

Bloomberg, "China's DeepSeek Unveils New Model a Year After Shock Launch", 24 de abril de 2026. https://www.bloomberg.com/news/newsletters/2026-04-24/china-s-deepseek-unveils-new-model-a-year-after-shock-launch

US News, "China's DeepSeek Rolls Out a Long-Anticipated Update of Its AI Model", 24 de abril de 2026. https://www.usnews.com/news/business/articles/2026-04-24/chinas-deepseek-rolls-out-a-long-anticipated-update-of-its-ai-model

EvoLink AI, "DeepSeek V4 Release Date (April 2026 Update)", 5 de abril de 2026. https://evolink.ai/blog/deepseek-v4-release-window-prep

Reuters, "DeepSeek rushes to launch new AI model as China goes all in", 25 de febrero de 2025. https://www.reuters.com/technology/artificial-intelligence/deepseek-rushes-launch-new-ai-model-china-goes-all-2025-02-25/

Reuters, "China's DeepSeek releases 'intermediate' AI model on route to next generation", 29 de septiembre de 2025. https://www.reuters.com/technology/deepseek-releases-model-it-calls-intermediate-step-towards-next-generation-2025-09-29/

DeepSeek V4 llega con 1,6 billones de parámetros y precios que rompen el mercado