Britannica demanda a OpenAI por copiar 100.000 artículos sin permiso ni pago

La enciclopedia que desafía al algoritmo: Britannica lleva a juicio al modelo más poderoso del mundo

Encyclopedia Britannica y Merriam-Webster demandan a OpenAI por el uso no autorizado de casi 100.000 artículos para entrenar sus modelos de lenguaje. La causa, radicada en Manhattan, expone una grieta estructural en la economía del conocimiento: quién tiene derecho a aprender de lo que otros construyeron durante siglos, y si ese aprendizaje masivo y gratuito puede seguir llamándose innovación

Por el equipo editorial | 20 de marzo de 2026

Hay una ironía densa, casi poética, en que la enciclopedia más antigua del mundo en idioma inglés tenga que recurrir a los tribunales para reclamar lo que construyó durante 258 años. Encyclopedia Britannica, fundada en Edimburgo en 1768 y transformada en referencia digital desde 2012, presentó el 13 de marzo de 2026 una demanda federal en Manhattan contra OpenAI, la empresa creadora de ChatGPT. La acusación es concreta: el sistema habría consumido cerca de 100.000 artículos de la enciclopedia y de su subsidiaria Merriam-Webster para entrenar la familia de modelos GPT, sin permiso y sin compensación. El conocimiento curado durante generaciones por miles de expertos se convirtió, según la denuncia, en combustible gratuito para una de las corporaciones más valuadas del planeta.

El caso llega cargado de contexto. Se inscribe en una corriente jurídica que lleva más de dos años acumulando precedentes, acuerdos y sentencias con consecuencias que todavía no terminan de calibrarse. Desde que The New York Times presentó su propia demanda en diciembre de 2023, la industria editorial, académica y periodística comenzó a trazar una frontera cada vez más definida: el entrenamiento masivo de sistemas de lenguaje con contenido protegido no es una práctica neutral, es una apropiación que tiene consecuencias económicas reales para quienes produjeron ese contenido. Britannica llega tarde a esa batalla, pero no llega sola ni llega débil.

El robo silencioso: cien mil artículos y un modelo que no paga

La demanda presentada por Britannica y Merriam-Webster describe un mecanismo que se ha vuelto familiar pero que no por eso resulta menos inquietante. OpenAI habría rastreado y descargado sistemáticamente el catálogo digital de ambas publicaciones para alimentar sus modelos de lenguaje, los mismos que hoy responden consultas de cientos de millones de usuarios. El resultado, documentado en la denuncia con capturas de pantalla comparativas, es que ChatGPT puede reproducir fragmentos casi textuales de las entradas de la enciclopedia cuando se le formulan las preguntas adecuadas.

La frase que usa la denuncia es técnica pero reveladora: GPT-4 "memorizó" porciones significativas del archivo de Britannica y puede recitar esos pasajes si se lo estimula correctamente. Esa capacidad de reproducción no es un accidente del sistema sino, precisamente, la evidencia de que el contenido fue absorbido durante el entrenamiento. La enciclopedia sostiene que esas reproducciones no autorizadas constituyen una violación directa de la ley de derechos de autor estadounidense, y aporta ejemplos visuales para respaldarlo.

"ChatGPT priva a los editores de la web de ingresos al generar respuestas a las consultas de los usuarios que sustituyen directamente el contenido de publicaciones como Britannica, compitiendo con ellas de forma desigual." Demanda de Encyclopedia Britannica y Merriam-Webster contra OpenAI, caso 1:2026cv02097, Tribunal Federal del Distrito Sur de Nueva York, 13 de marzo de 2026

Pero la acusación no se detiene en el derecho de autor. La demanda incorpora también un reclamo bajo la Ley Lanham, el estatuto federal de marcas comerciales de Estados Unidos. El argumento es que ChatGPT, cuando genera respuestas incorrectas, a veces las atribuye a Britannica, creando la falsa impresión de que la enciclopedia avala ese contenido. Las alucinaciones del sistema, en otras palabras, no son solo errores técnicos: pueden convertirse en difamación comercial cuando se asocian a una institución con dos siglos y medio de reputación construida sobre la verificación rigurosa. Este doble frente legal amplía considerablemente el alcance potencial del litigio.

        Las cifras del caso: La demanda fue radicada el 13 de marzo de 2026 bajo el expediente 1:2026cv02097 en el Distrito Sur de Nueva York. Casi 100.000 artículos del catálogo digital de ambas publicaciones habrían sido utilizados sin autorización. Britannica busca daños económicos, restitución de ganancias obtenidas por OpenAI con ese material, y una orden judicial que prohíba continuar con las prácticas denunciadas. La empresa ya había presentado una demanda separada contra Perplexity AI por cargos similares el año anterior.
    

OpenAI respondió con el argumento que ha utilizado en casi todos los litigios similares: sus modelos se entrenan con datos de acceso público y esa práctica está amparada por el principio de uso justo, el llamado fair use del derecho estadounidense, que permite el empleo limitado de material protegido bajo determinadas condiciones. "Nuestros modelos fomentan la innovación y se entrenan con datos de acceso público, operando dentro de los límites del fair use", declaró un portavoz de la empresa poco después de conocerse la demanda. Es la misma respuesta, casi palabra por palabra, que la compañía ha ofrecido en todos los casos anteriores.

La guerra de los editores: cuando las demandas se multiplican

Lo que Britannica enfrenta hoy no es una experiencia aislada. El mapa de los litigios contra las principales empresas de modelos de lenguaje creció de forma sostenida desde 2023. Raw Story, Alternet y The Intercept se sumaron a la disputa en febrero de 2024. En abril de 2025, Ziff Davis, empresa propietaria de publicaciones como PCMag y CNET, radicó su propia demanda en Delaware alegando el uso no autorizado de su catálogo editorial. Ese mismo mes, un panel judicial decidió consolidar en Manhattan las causas presentadas por autores individuales y medios de comunicación, formando un bloque procesal que podría acelerar los plazos. En julio de 2025 llegó una nueva oleada: un grupo de escritores de no ficción demandó a OpenAI y Microsoft argumentando que sus obras fueron tomadas de repositorios digitales que circulan contenido sin licencia, los llamados "bibliotecas en la sombra".

Evolución estimada de las demandas por derechos de autor contra empresas de modelos de lenguaje a nivel global entre 2022 y 2026. Fuentes: Reuters, Bloomberg Law, Columbia Journalism Review, Debevoise & Plimpton (2025). Cifras aproximadas basadas en casos documentados públicamente.

El caso más resolutivo hasta el momento no involucra a OpenAI sino a Anthropic, creadora del chatbot Claude. Un tribunal federal determinó que el uso de textos para entrenar modelos puede considerarse "transformativo" bajo el criterio del fair use, pero estableció también que el empleo de copias pirateadas es ilegal con independencia del propósito. Anthropic acordó finalmente pagar 1.500 millones de dólares a los autores afectados en un acuerdo extrajudicial. Esa cifra no es solo un número: es la primera señal concreta de que el costo de la capacitación masiva de sistemas con contenido ajeno puede cuantificarse en términos que las empresas tecnológicas no pueden ignorar.

Paralelamente, OpenAI eligió la negociación con algunos actores del ecosistema editorial. La empresa firmó acuerdos de licencia con Associated Press, Financial Times, The Guardian, Le Monde, Vox Media y Time, entre otros. El contrato con News Corp se reveló como el más voluminoso: un pacto quinquenal valorado en más de 250 millones de dólares que cubre publicaciones como The Wall Street Journal y The Times de Londres. Estos acuerdos no resuelven las demandas pendientes, pero demuestran que existe una tarifa de mercado para el contenido editorial; lo que, de manera paradójica, refuerza el argumento de quienes sostienen que el material usado sin licencia tenía un valor que debió haberse compensado.

⚠️ Argumentos centrales de la demanda contra OpenAI

Reproducción casi literal: La denuncia aporta capturas de pantalla que muestran cómo ChatGPT reproduce fragmentos de artículos de Britannica y definiciones de Merriam-Webster con escasas variaciones respecto al original, evidenciando que el contenido fue "memorizado" durante el entrenamiento.

Daño económico directo: La generación de respuestas que sustituyen la consulta directa al sitio de Britannica reduce el tráfico web y, por consiguiente, los ingresos publicitarios y de suscripción de una publicación que sobrevivió dos siglos y medio gracias a su autoridad informativa.

Violación de marcas comerciales: ChatGPT atribuye en ocasiones contenido inventado o incorrecto a Britannica, dañando la reputación de una institución cuya marca es precisamente sinónimo de verificación y rigor. La Ley Lanham provee la base legal para ese reclamo adicional.

Escala del perjuicio: El alcance global de ChatGPT, con cientos de millones de usuarios activos, amplifica exponencialmente el impacto de cada respuesta que sustituye una visita a la enciclopedia, haciendo el daño difícil de acotar.

Entre el fair use y la factura pendiente

El corazón jurídico del conflicto es la doctrina del fair use, y su aplicación al entrenamiento de modelos de lenguaje constituye uno de los debates legales más relevantes del momento. La teoría de OpenAI sostiene que el proceso de aprendizaje computacional es transformador: el modelo no reproduce el contenido sino que extrae patrones estadísticos para generar respuestas nuevas. Expertos de Harvard Law y de Columbia University han señalado, sin embargo, que esa defensa se debilita cuando el sistema puede reproducir fragmentos extensos casi sin variación, que es precisamente lo que Britannica y The New York Times documentaron con evidencia concreta.

En enero de 2025, el Tribunal del Distrito Sur de Nueva York celebró audiencias orales sobre las mociones de desestimación presentadas por OpenAI en el caso del diario neoyorquino. La resolución de ese litigio de alto perfil fijará precedente para el resto de los casos acumulados en Manhattan, incluido el de Britannica. Un fallo favorable a los demandantes podría transformar de manera radical el modelo operativo de las empresas que desarrollan grandes sistemas de lenguaje, obligándolas a licenciar retroactivamente el contenido utilizado o a reconstruir sus conjuntos de entrenamiento.

Un desarrollo jurídico relevante llegó de un caso aparentemente menor. En el litigio Advance Local contra Cohere, una empresa de modelos lingüísticos de uso comercial, la jueza a cargo sostuvo que las alucinaciones atribuidas falsamente a medios de comunicación constituyen una forma de responsabilidad bajo la Ley Lanham. La sentencia rechazó el argumento de que las salidas incorrectas son accidentes técnicos sin consecuencias comerciales. Si ese razonamiento se consolida en la jurisprudencia, el reclamo de Britannica sobre la reputación dañada por alucinaciones atribuidas a su nombre adquiere una fuerza que va más allá del derecho de autor y abre un segundo frente legalmente sólido.

✅ Lo que los editores están reclamando al sistema

Compensación por uso histórico: Que las empresas reconozcan que el contenido con el que entrenaron sus sistemas tenía valor comercial, y que ese valor debió acordarse antes de la captura masiva, no después de que el daño económico se consumó.

Transparencia en los datos de entrenamiento: Mayor claridad sobre qué fuentes se usaron, en qué volumen y con qué metodología, algo que las empresas han resistido sistemáticamente invocando secreto industrial y dificultad técnica.

Modelos de licencia sostenibles: Que los acuerdos firmados voluntariamente con algunos medios se conviertan en el estándar del sector, no en la excepción que favorece a quienes tienen poder de negociación o capacidad legal para litigar.

Atribución de fuentes: Que las respuestas generadas citen las fuentes en las que se basan, en lugar de presentar el conocimiento acumulado por generaciones como si fuera producido de la nada por el propio sistema.

Lo que está en disputa va mucho más allá de los 100.000 artículos que Britannica pone sobre la mesa. Es la pregunta estructural sobre quién paga por el conocimiento que alimenta a los sistemas que hoy responden consultas en nombre de la humanidad. Durante décadas, la enciclopedia fue el lugar al que acudían quienes querían una respuesta verificada por expertos. Ese modelo de negocio, construido sobre la autoridad editorial y el rigor académico, tardó generaciones en consolidarse. Que sea replicado y vaciado de tráfico por un sistema estadístico que nunca pidió permiso no es solo un problema de derecho de autor: es una pregunta sobre qué tipo de economía del conocimiento la sociedad está dispuesta a sostener.

La demanda llegará a resolución en un contexto en que la industria ya no puede actuar como si el problema no existiera. Los acuerdos de licencia acumulados demuestran que hay una tarifa posible. Los fallos en marcha apuntan a que el fair use tiene límites que los tribunales aún no han trazado con precisión. Y la multiplicación de litigios indica que el modelo de captura masiva de datos sin compensación es insostenible: no solo desde un punto de vista moral, sino, con creciente probabilidad, también frente a los jueces que ahora tienen sobre su escritorio los archivos de 258 años de conocimiento verificado que alguien usó gratis.

Referencias

Reuters. "Encyclopedia Britannica sues OpenAI over AI training." 16 de marzo de 2026. reuters.com

The Verge. "Encyclopedia Britannica is suing OpenAI for allegedly memorizing its content." 16 de marzo de 2026. theverge.com

Futurism. "Encyclopedia Britannica Hits OpenAI With Scary Lawsuit." 19 de marzo de 2026. futurism.com

PCMag. "Encyclopedia Britannica Sues OpenAI Over Alleged Copyright Infringement." 17 de marzo de 2026. pcmag.com

CNET. "Encyclopedia Britannica and Merriam-Webster Sue OpenAI." 17 de marzo de 2026. cnet.com

Gizmodo. "Encyclopedia Britannica Sues OpenAI Over AI Training Data." 15 de marzo de 2026. gizmodo.com

TNW (The Next Web). "Encyclopedia Britannica and Merriam-Webster sue OpenAI." 15 de marzo de 2026. thenextweb.com

CADE Project. "Encyclopaedia Britannica sues OpenAI over alleged use of its content to train AI models." 16 de marzo de 2026. cadeproject.org

The New York Times. "The Times Sues OpenAI and Microsoft Over A.I. Use of Copyrighted Work." 27 de diciembre de 2023. nytimes.com

Bloomberg Law. "OpenAI Sued by New Set of Authors Over Training Data Copyrights." 2 de julio de 2025. bloomberglaw.com

Reuters. "OpenAI copyright lawsuits from authors, New York Times consolidated in Manhattan." 3 de abril de 2025. reuters.com

Thompson Coburn. "Cited and Indicted: Trademark Trouble in the Age of AI Hallucinations" (análisis sobre Advance Local v. Cohere). Noviembre de 2025. thompsoncoburn.com

Debevoise & Plimpton. "AI Intellectual Property Disputes: The Year in Review." Diciembre de 2025. debevoise.com

Columbia University Law Review. "Stolen Stories or Fair Use? The New York Times v. OpenAI and the Future of AI Copyright." Junio de 2025. culawreview.org

Harvard Law School. "Does ChatGPT violate New York Times' copyrights?" Marzo de 2024. hls.harvard.edu

A Media Operator. "Key questions around OpenAI's licensing deals with publishers." Mayo de 2024. amediaoperator.com

AI Watch.dog. "Content Licensing Deals." Actualización de febrero de 2026. aiwatch.dog

Columbia Journalism Review. "Lawsuit or License?" Diciembre de 2025. cjr.org

Britannica demanda a OpenAI por copiar 100.000 artículos sin permiso ni pago