Claude deja de olvidar documentos largos

El millón que deja de ser lujo

Anthropic convirtió una capacidad que hasta hace poco funcionaba como vitrina técnica en una herramienta comercial mucho más utilizable. Claude Opus 4.6 y Sonnet 4.6 ya trabajan con un millón de tokens sin recargo, con más material visual por solicitud y menos fricción para integrarse en flujos de desarrollo, revisión documental y trabajo corporativo a gran escala.

Por el equipo editorial | 14 de marzo de 2026

La industria de los modelos fundacionales lleva meses compitiendo con cifras cada vez más aparatosas. Más parámetros, más velocidad, más agentes, más automatización. Sin embargo, pocas variables impactan tanto el trabajo cotidiano como la memoria operativa. No la memoria entendida como una metáfora publicitaria, sino como el espacio efectivo que un sistema puede conservar, recorrer y usar sin perder el hilo. El anuncio de Anthropic del 13 de marzo no entra en la categoría de adorno técnico. Claude Opus 4.6 y Claude Sonnet 4.6 pasan a ofrecer una ventana de contexto de un millón de tokens en disponibilidad general, con precios estándar, sin cabeceras beta y con un salto fuerte en el volumen de imágenes o páginas PDF que pueden entrar en una sola solicitud.

La novedad parece abstracta hasta que se traduce a operaciones concretas. Un estudio jurídico deja de partir un expediente en fragmentos artificiales. Un equipo de ingeniería puede cargar un repositorio entero, pruebas incluidas, sin diseñar una coreografía de resúmenes intermedios. Un analista financiero puede mantener en una misma sesión contratos, hojas de cálculo, anexos, correos y versiones sucesivas de negociación. En otras palabras, la empresa no acaba de vender solo más memoria. Está vendiendo menos pérdida de contexto, menos trabajo de preparación y menos costo oculto en capas de infraestructura creadas solo para compensar olvidos de la máquina.

Eso es lo que vuelve relevante este movimiento. El tamaño por sí solo sirve de poco si el modelo se degrada cuando el material crece. La propia documentación de Claude admite ese problema y lo nombra con crudeza: a mayor longitud, la recuperación y la precisión se erosionan. En ese terreno, Anthropic sostiene que Opus 4.6 alcanza 78,3 por ciento en MRCR v2 a la longitud completa de un millón de tokens, mientras Sonnet 4.6 llega a 68,4 por ciento en GraphWalks BFS al mismo tamaño. Son pruebas diferentes, con objetivos distintos, pero apuntan al corazón del asunto: recordar detalles enterrados y conectar hechos dispersos cuando el contexto deja de ser un puñado de páginas y se convierte en un archivo entero.

Ventana de contexto 1M tokens

Límite multimedia 600 páginas o imágenes

Opus 4.6 US$ 5 / 25

Sonnet 4.6 US$ 3 / 15

Qué cambia cuando deja de doler el precio

La parte más importante del anuncio no es el millón. Es la factura. Durante la etapa beta, trabajar con contexto largo implicaba penalidades económicas y técnicas. En Sonnet 4 y Sonnet 4.5, superar los 200.000 tokens activaba una tarifa premium. La entrada saltaba de 3 a 6 dólares por millón de tokens y la salida de 15 a 22,50. Para Opus 4.6, la documentación también había situado el contexto de un millón en beta y sujeto a condiciones especiales. Ese régimen convertía el uso de gran escala en una decisión reservada para laboratorios, equipos con presupuestos generosos o compañías dispuestas a absorber la fricción. Con la disponibilidad general, Anthropic elimina ese peaje: una solicitud de 900.000 tokens se cobra al mismo valor por token que una de 9.000.

Ese detalle modifica el tablero competitivo más que cualquier eslogan. En el mercado de modelos, el costo real rara vez es solo el precio por token. También cuentan la necesidad de trocear documentos, los sistemas de recuperación auxiliares, la lógica de compresión, los resúmenes parciales, el control de versiones y la pérdida de tiempo humano cuando una sesión olvida la página uno justo cuando llega a la página cuatrocientos. La eliminación del recargo reduce una doble barrera: la financiera y la operativa. El beneficio no se limita a abaratar. Simplifica.

        Dato central: la empresa confirmó que las solicitudes por encima de 200.000 tokens funcionan automáticamente en Opus 4.6 y Sonnet 4.6, sin activar cabeceras beta. El cambio también extiende los límites estándar de tasa a toda la ventana de contexto, un punto clave para equipos que trabajan con volumen y no solo con demostraciones aisladas.
    

También hay una mejora menos vistosa, pero decisiva para quienes usan documentos, presentaciones, capturas y reportes escaneados. El límite sube de 100 a 600 imágenes o páginas PDF por pedido. Es una ampliación de seis veces. En la práctica, eso desplaza la conversación desde la demo espectacular hacia el trabajo serio: auditorías extensas, due diligence, discovery legal, análisis de incidentes complejos, evaluación de código con múltiples archivos, investigación científica y sesiones de agentes que pasan horas encadenando herramientas. Anthropic, además, aseguró que la capacidad ya está disponible no solo en su plataforma nativa, sino también en Microsoft Azure Foundry y Google Cloud Vertex AI. Para quienes compran infraestructura corporativa, esa frase pesa casi tanto como el benchmark.

El movimiento tiene otra derivación. Claude Code incorpora el millón de tokens de forma automática para usuarios Max, Team y Enterprise con Opus 4.6. Eso significa menos compactación de contexto y más continuidad en sesiones prolongadas. La compañía venía trabajando justamente en ese frente: compaction API, gestión de contexto y la llamada context awareness, una función que permite al modelo saber cuánto espacio le queda y ajustar su conducta en consecuencia. El salto de marzo no aparece en el vacío. Es la monetización de una arquitectura que llevaba meses afinándose para que el modelo no solo soporte volumen, sino que no se desordene cuando el volumen crece.

Dónde se nota de verdad

La promesa de un millón de tokens seduce porque permite imaginar una máquina capaz de leerlo todo. Lo verdaderamente útil, sin embargo, no está en la fantasía de totalidad, sino en la reducción de recortes artificiales. Una revisión de código ya no necesita dividir un cambio grande en trozos ciegos entre sí. Un abogado puede comparar varias rondas de un acuerdo extenso dentro de una sola sesión. Un analista de ciberseguridad puede mantener alertas, señales, hipótesis y registros técnicos en la misma conversación mientras busca la causa de un incidente. En su nota de lanzamiento, Anthropic reunió testimonios de clientes que describen exactamente ese punto de dolor: la compactación temprana hacía desaparecer detalles críticos y obligaba a recomenzar análisis que ya habían sido hechos.

La empresa incluso cita un descenso de 15 por ciento en eventos de compactación en uno de esos entornos. El número, aislado, no define una revolución. Pero revela algo más importante: el contexto largo empieza a medirse no solo por lo que cabe, sino por cuántas veces interrumpe menos el trabajo. En el mundo corporativo, esa diferencia vale dinero. Cada resumen manual o automático implica riesgo de omisión, pérdida de matiz y sobrecarga para los equipos que deberían estar resolviendo el problema original, no administrando la memoria del sistema.

La carrera por el contexto empieza a salir de la fase teatral. Cuando el material entra completo, la pregunta deja de ser cuánto cabe y pasa a ser cuánto recuerda el sistema sin deformarlo.

Ese matiz ayuda a entender por qué Anthropic eligió enfatizar MRCR y GraphWalks. MRCR evalúa recuperación de detalles específicos en conversaciones largas y con información escondida. GraphWalks mide la capacidad de seguir relaciones distribuidas a lo largo de contextos extensos. Son exámenes menos vistosos que una prueba de generación de código instantánea, pero mucho más honestos para juzgar memoria útil. Un millón de tokens sin recuerdo fiable sería una bodega repleta con un bibliotecario desorientado. La empresa necesita demostrar que no solo alquila una nave más grande, sino que conserva un sistema de archivo razonablemente preciso.

Conviene, de todos modos, no confundir longitud con omnisciencia. La documentación oficial recuerda que más contexto no significa automáticamente mejor resultado. El material mal elegido, redundante o ruidoso también deteriora el rendimiento. Dicho de forma menos académica, meter todo en la licuadora no garantiza un buen informe. El nuevo margen amplía la ambición de los casos de uso, pero no reemplaza la disciplina de selección, jerarquización y diseño de prompts. La diferencia es que ahora esa disciplina se vuelve un factor de calidad, no una solución de emergencia para esquivar límites absurdamente bajos.

Rendimiento informado por Anthropic a longitud completa de un millón de tokens. Los porcentajes corresponden a dos pruebas oficiales de contexto largo distintas: MRCR v2 para Opus 4.6 y GraphWalks BFS para Sonnet 4.6.

La nueva batalla del contexto

La disponibilidad general de esta ventana de trabajo también dice algo sobre la etapa que atraviesa el sector. En 2024 y 2025, la discusión pública giró demasiado alrededor del modelo más brillante en rankings generales. En 2026, la conversación se está desplazando hacia otro eje: qué sistema puede sostener tareas largas, con herramientas, documentos y revisiones sucesivas, sin obligar a reconstruir el estado a cada rato. Anthropic parece haber decidido que allí hay una oportunidad comercial clara. No busca vender únicamente el modelo más inteligente, sino un entorno que reduzca el costo invisible de operar agentes y flujos complejos durante horas.

Eso explica por qué el anuncio toca varios frentes a la vez. Precio plano para el millón, más material visual, límites de tasa estándar a cualquier longitud, compatibilidad sin cabeceras experimentales, integración con Claude Code y soporte en nubes empresariales. Ninguna de esas piezas, por separado, resultaría suficiente para reordenar el mercado. Juntas, forman una oferta que intenta volver cotidiano lo que hasta ayer era una función premium, delicada o marginal. En tecnología, la diferencia entre una rareza llamativa y una infraestructura adoptable suele definirse en ese tipo de detalles, no en la portada.

También asoma una lectura competitiva. Cuando un proveedor baja la fricción de una capacidad costosa, obliga al resto a justificar por qué sus límites siguen siendo más estrechos, más caros o más enredados de activar. El golpe no está dirigido solo a usuarios de laboratorio. Apunta a equipos de producto, estudios jurídicos, fintechs, consultoras, redacciones, áreas de compliance y compañías que ya no preguntan si usarán estos sistemas, sino cuánto presupuesto y cuánto esfuerzo demandará hacerlo a escala. En ese segmento, cobrar menos por recordar más puede resultar una ventaja más tangible que prometer una inteligencia abstracta ligeramente superior.

Por eso el anuncio de Anthropic importa. No porque convierta de repente a Claude en una máquina infalible, ni porque el millón sea una cifra mágica, sino porque desplaza el contexto largo desde la categoría de lujo técnico hacia la de insumo operativo. El paso decisivo no fue inflar la memoria, sino normalizarla. Cuando una capacidad deja de exigir peajes especiales y empieza a comportarse como parte del servicio estándar, el mercado entiende algo simple: ya no se trata de un experimento. Se trata de una expectativa.

Lo que queda después del anuncio

La ventana de un millón ya no funciona como argumento de demostración, sino como oferta comercial con precios normales, límites ampliados y despliegue en entornos corporativos concretos. Para quienes procesan repositorios completos, contratos extensos, series largas de mensajes, planillas densas o expedientes visuales, el cambio no promete magia. Promete algo más valioso: menos olvido, menos costura manual y menos fricción para trabajar con material grande sin romperlo en pedazos.

Qué no dice el anuncio

La disponibilidad general no elimina los problemas clásicos del contexto largo. Los documentos mal curados siguen introduciendo ruido, los errores de recuperación no desaparecen y la amplitud del material no sustituye la verificación humana en tareas delicadas. El avance es real, pero su valor dependerá de cómo cada equipo diseñe flujos, controles y criterios de selección de información.

Referencias

Claude Blog. "1M context is now generally available for Opus 4.6 and Sonnet 4.6". Publicado el 13 de marzo de 2026. https://claude.com/blog/1m-context-ga

Claude Developer Platform. Release notes, entrada del 13 de marzo de 2026 sobre la disponibilidad general del contexto de 1M tokens, eliminación de límites dedicados y ampliación a 600 imágenes o páginas PDF. https://platform.claude.com/docs/en/release-notes/overview

Claude API Docs. Models overview, especificaciones comparadas de Claude Opus 4.6 y Claude Sonnet 4.6, incluyendo precios base, ventana de contexto y salida máxima. https://platform.claude.com/docs/en/about-claude/models/overview

Claude API Docs. Pricing, con detalle de precios estándar de Opus 4.6 y Sonnet 4.6 y del esquema premium anterior para contexto largo en Sonnet 4 y Sonnet 4.5. https://platform.claude.com/docs/en/about-claude/pricing

Claude API Docs. Context windows, explicación técnica del contexto, la degradación por longitud, las pruebas MRCR y GraphWalks, la gestión de compaction y la capacidad de context awareness. https://platform.claude.com/docs/en/build-with-claude/context-windows

Anthropic. "Introducing Claude Opus 4.6". Publicado el 5 de febrero de 2026, con referencia a la beta inicial del contexto largo para Opus 4.6. https://www.anthropic.com/news/claude-opus-4-6

Anthropic. "Introducing Claude Sonnet 4.6". Publicado el 17 de febrero de 2026, con detalles de mejoras de Sonnet 4.6 y contexto largo en beta. https://www.anthropic.com/news/claude-sonnet-4-6

Anthropic. Claude Sonnet 4.6 System Card, febrero de 2026, con tablas de evaluación que incluyen GraphWalks BFS. https://anthropic.com/claude-sonnet-4-6-system-card

Claude deja de olvidar documentos largos