Una célula cancerosa es una maestra del disfraz. Evoluciona constantemente, desarrolla estrategias sofisticadas para evadir el sistema inmunológico y permanece invisible mientras prolifera sin control. Durante décadas, oncólogos e inmunólogos han luchado contra este fenómeno conocido como «tumores fríos», masas celulares que el cuerpo simplemente no reconoce como enemigas y que, por tanto, no activa ninguna respuesta defensiva. Ahora, en un laboratorio donde convergen científicos de Google DeepMind y la Universidad de Yale, un sistema computacional acaba de proponer una solución que nadie había considerado antes. Y lo más sorprendente es que funcionó cuando se probó en células humanas vivas.
El 15 de octubre de 2025, ambas instituciones anunciaron C2S-Scale 27B, un modelo fundacional con 27.000 millones de parámetros diseñado para comprender el «lenguaje» de células individuales. Este sistema no solo procesa información biológica, sino que razona a través de contextos extraordinariamente complejos que modelos más pequeños no pueden manejar. Su misión específica consistía en identificar medicamentos capaces de amplificar la presentación de antígenos, el mecanismo mediante el cual las células exhiben fragmentos de proteínas en su superficie para alertar al sistema inmunológico de su presencia. Pero existía una condición crucial: el fármaco debía funcionar únicamente bajo circunstancias biológicas muy particulares, en entornos donde ya existiera una señalización inmune débil pero insuficiente para activar una respuesta completa.
Para cumplir esta tarea, el algoritmo ejecutó lo que los investigadores denominan una «pantalla virtual de contexto dual». Simuló más de 4.000 candidatos farmacológicos en dos escenarios paralelos: uno donde existía un contexto inmunopositivo con bajos niveles de interferón, y otro donde las células estaban aisladas sin ningún entorno inmune. El objetivo era encontrar compuestos que potenciaran selectivamente la activación inmunológica solo en el primer caso, ignorando las células en el segundo. Este nivel de razonamiento condicional representa un salto cualitativo respecto a generaciones anteriores de modelos computacionales.
La hipótesis improbable que se convirtió en validación experimental
Los resultados sorprendieron incluso a quienes diseñaron el experimento. Entre los candidatos identificados, algunos eran fármacos ya conocidos por la comunidad médica, pero entre el 10 y el 30 por ciento eran compuestos completamente novedosos, sustancias sin conexión previa documentada con la inmunoterapia oncológica o la modulación inmune. El hallazgo más llamativo fue el inhibidor de la quinasa CK2 conocido como silmitasertib, identificado comercialmente como CX-4945. El modelo predijo que esta molécula incrementaría drásticamente la presentación de antígenos únicamente cuando se utilizara en un ambiente inmunopositivo donde hubiera niveles bajos de interferón preexistentes.
La predicción era particularmente notable porque, aunque la quinasa CK2 ha sido implicada en múltiples funciones celulares e incluso como modulador del sistema inmune, inhibir esta enzima mediante silmitasertib nunca había sido reportado en la literatura científica como un mecanismo para aumentar la expresión de moléculas MHC-I, las estructuras proteicas responsables de presentar antígenos a los linfocitos T citotóxicos. Se trataba de una hipótesis genuinamente nueva, generada por el sistema sin influencia de conocimientos previos. Era el equivalente computacional de una teoría científica original.
Los investigadores de Yale sometieron esta predicción a pruebas rigurosas utilizando modelos celulares humanos neuroendocrinos, ninguno de los cuales había formado parte de los datos de entrenamiento del modelo. La validación experimental confirmó la hipótesis algorítmica con precisión sorprendente. Tratar células exclusivamente con silmitasertib no produjo cambio alguno. Administrar únicamente interferón a baja dosis generó un efecto modesto. Sin embargo, combinar ambos elementos resultó en un incremento del 50 por ciento en la presentación de antígenos, activando efectivamente el reconocimiento inmunológico donde antes no existía. Las células tumorales, previamente invisibles para el sistema defensivo, se volvieron luminosas, identificables, atacables.
Este descubrimiento toca el núcleo de uno de los desafíos más persistentes en oncología moderna. Los tumores fríos representan aproximadamente la mitad de todos los cánceres diagnosticados y son notoriamente resistentes a las inmunoterapias convencionales, incluyendo los inhibidores de puntos de control inmunitario que han revolucionado el tratamiento de melanomas y ciertos carcinomas pulmonares. Estas masas celulares permanecen frías porque utilizan estrategias múltiples para evitar la detección: reducen la expresión de antígenos tumorales, suprimen la presentación de MHC-I mediante autofagia selectiva, silencian genes relacionados con señalización inmune y crean microambientes inmunosupresores donde las células dendríticas no pueden madurar adecuadamente ni las células T citotóxicas infiltrarse.
La presentación de antígenos mediante moléculas MHC-I es el paso fundamental en la respuesta antitumoral efectiva. Estas moléculas exhiben fragmentos de proteínas intracelulares en la superficie celular, permitiendo que los linfocitos T citotóxicos reconozcan células anormales. Cuando este mecanismo falla, ya sea por mutaciones genéticas, regulación epigenética aberrante o degradación inducida por autofagia, los tumores se vuelven esencialmente invisibles. Convertir un tumor frío en caliente, transformándolo de invisible a detectable, ha sido el santo grial de la inmunoterapia durante años. Estrategias previas incluyeron inhibidores epigenéticos, radioterapia localizada, vacunas terapéuticas y terapias combinadas de múltiples puntos de control, pero ninguna ha demostrado consistencia universal.
Lo revolucionario del hallazgo de C2S-Scale reside en que identificó un amplificador condicional, un compuesto que funciona únicamente en presencia de señalización inmune preexistente aunque débil. Esta condicionalidad es biológicamente elegante: el fármaco no fuerza una respuesta inmune artificial en tejidos sanos, sino que amplifica selectivamente señales inmunes endógenas en contextos relevantes desde la perspectiva clínica. El interferón a baja dosis actúa como modulador contextual, preparando el terreno celular, mientras que silmitasertib ejecuta la amplificación de la presentación antigénica. La sinergia entre ambos componentes demuestra que el tratamiento del cáncer puede beneficiarse de enfoques combinatorios donde la efectividad emerge de interacciones contextuales específicas.
El trabajo de C2S-Scale 27B demuestra que la escala algorítmica en sistemas biológicos no solo mejora tareas existentes, sino que puede generar capacidades completamente nuevas. Específicamente, desarrolla la habilidad de razonar condicionalmente sobre contextos biológicos complejos, algo que modelos más pequeños simplemente no logran. El éxito experimental de la predicción sobre silmitasertib e interferón proporciona evidencia concreta de que grandes modelos computacionales pueden funcionar como laboratorios virtuales, ejecutando miles de experimentos simulados para revelar relaciones desconocidas entre fármacos, células y señales inmunes.
Sundar Pichai, director ejecutivo de Google, describió el hallazgo como un hito para la ciencia computacional aplicada a la biomedicina. Con pruebas preclínicas y clínicas adicionales, este descubrimiento podría revelar una ruta terapéutica prometedora para desarrollar tratamientos contra el cáncer. Los equipos de Yale continúan explorando el mecanismo subyacente que el algoritmo descubrió y están probando predicciones adicionales generadas por el sistema en otros contextos inmunológicos.
Lo que resulta particularmente fascinante es la inversión del flujo tradicional de descubrimiento científico. Durante siglos, los investigadores humanos han formulado hipótesis basadas en observaciones experimentales, probándolas después en el laboratorio. Ahora, sistemas computacionales generan teorías biológicas fundamentadas en patrones que detectan en vastos conjuntos de datos, y los científicos humanos validan esas predicciones en células vivas. Esta nueva metodología no reemplaza la experimentación tradicional, sino que la complementa y acelera, permitiendo explorar espacios de posibilidades farmacológicas que serían prohibitivamente costosos o lentos de investigar mediante ensayo y error convencional.
El hallazgo también ilustra un principio fundamental sobre cómo funcionan los sistemas biológicos: son profundamente contextuales. El mismo compuesto químico puede tener efectos radicalmente distintos dependiendo del microambiente celular en que actúa. Silmitasertib no amplifica la presentación de antígenos de manera universal, sino únicamente cuando existe un contexto inmunológico específico con niveles bajos de interferón. Esta condicionalidad hace que el descubrimiento sea tanto más difícil de realizar mediante métodos tradicionales como más relevante clínicamente. Las terapias condicionales que responden a contextos biológicos específicos representan el futuro de la medicina de precisión, donde los tratamientos se adaptan no solo al tipo de cáncer, sino al estado inmunológico particular del tumor de cada paciente.
El proyecto C2S-Scale es también un experimento sobre ciencia abierta. Al liberar el modelo completo, el código fuente y los datos experimentales en plataformas de acceso público, Google DeepMind y Yale invitan al escrutinio global y a la colaboración internacional. Otros laboratorios pueden ahora replicar los hallazgos, explorar hipótesis adicionales generadas por el modelo y potencialmente descubrir nuevas terapias combinatorias para diferentes tipos de cáncer. Esta transparencia es crucial para la validación científica, permite que la comunidad médica construya sobre el trabajo inicial y acelera el camino desde el descubrimiento computacional hasta la aplicación clínica.
Décadas de investigación en oncología han demostrado que el cáncer no es una única enfermedad, sino cientos de entidades moleculares distintas con comportamientos heterogéneos. Los tumores fríos representan un subconjunto particularmente desafiante, pero también uno de los más prevalentes. Si el enfoque de silmitasertib e interferón demuestra eficacia en estudios clínicos, podría extender los beneficios de la inmunoterapia a poblaciones de pacientes que actualmente carecen de opciones efectivas. Más allá del hallazgo específico, el proyecto establece un modelo operacional para cómo los sistemas computacionales de gran escala pueden contribuir al descubrimiento biomédico: no como meras herramientas de análisis de datos, sino como motores generadores de conocimiento capaces de proponer teorías científicas originales y biológicamente fundamentadas que orientan el trabajo experimental humano.
Especificaciones técnicas y benchmarks relevantes
Arquitectura del modelo C2S-Scale 27B
Fundamentos arquitectónicos
- Familia de modelos: Gemma de Google (arquitectura decoder-only transformer)
- Parámetros totales: 27.000 millones
- Parámetros de embeddings: 25.600 millones dedicados a representación semántica
- Parámetros no-embeddings: 1.400 millones para procesamiento central (mecanismos de atención, redes feedforward)
- Arquitectura base: Transformer decoder con Grouped-Query Attention (GQA)
- Ventana de contexto: 128.000 tokens
- Mecanismo de atención: Combinación 5:1 de atención local (ventana de 1.024 tokens) y atención global
- Función de activación: GeGLU en lugar de ReLU estándar
- Codificador de posición: Rotary Positional Embeddings (RoPE)
- Vocabulario: 262.000 entradas usando SentencePiece encoding
Especificidades técnicas del entrenamiento
- Dataset de preentrenamiento: Documentos web en inglés, artículos científicos, código, contenido matemático y datos multilingües
- Soporte de idiomas: Más de 140 lenguas con datos monolingües y paralelos
- Fine-tuning: Supervised fine-tuning + Reinforcement Learning from Human Feedback (RLHF)
- Plataforma de entrenamiento: Google Cloud TPU v5 y NVIDIA H100 GPUs
- Optimización: Entrenamiento mediante destilación de conocimiento desde modelos mayores
Capacidades computacionales
- Inferencia en hardware: Ejecutable en un solo TPU host o un solo NVIDIA H100 GPU
- Costo computacional: Aproximadamente la mitad del requerido por modelos de 70.000 millones de parámetros con rendimiento comparable
- Velocidad de inferencia: Optimizada para generación rápida mediante atención local predominante
- Huella de carbono del preentrenamiento: 1.497,13 tCO2eq (mitigada por centros de datos carbono-neutral de Google)
Metodología experimental del descubrimiento
Diseño del screening virtual de contexto dual
- Compuestos evaluados: Más de 4.000 candidatos farmacológicos
- Contexto inmunopositivo simulado: Muestras de tumores de pacientes donde células tumorales e inmunes interactúan con niveles bajos de interferón
- Contexto inmuno-neutral simulado: Líneas celulares aisladas sin microambiente inmune
- Objetivo primario: Identificar compuestos que amplificaran presentación de antígenos exclusivamente en el primer contexto
- Hipótesis novedosas generadas: 10-30% de los candidatos identificados carecían de documentación previa en literatura científica
Validación experimental in vitro
- Modelo celular: Células neuroendocrinas humanas (no incluidas en datos de entrenamiento del modelo)
- Fármaco evaluado: Silmitasertib (CX-4945), inhibidor de quinasa CK2
- Condiciones experimentales:
- Silmitasertib solo: Sin cambio en presentación de antígenos
- Interferón a baja dosis solo: Efecto modesto en presentación de antígenos
- Combinación sinérgica: Incremento del 50% en presentación de antígenos
- Métrica evaluada: Expresión de moléculas MHC-I en superficie celular
- Reproducibilidad: Resultados confirmados en múltiples réplicas experimentales
Benchmarks de rendimiento del modelo Gemma 27B
Evaluaciones en tareas de lenguaje natural
- MMLU (Massive Multitask Language Understanding): 76,9% de precisión
- GSM8K (matemática de primaria): Rendimiento excepcional
- HumanEval (generación de código): 87,8% de tasa de éxito
- MATH benchmark (razonamiento matemático): 89% de precisión
- Winogrande (razonamiento de sentido común): Desempeño competitivo con modelos 2x mayores
Evaluaciones multimodales
- MMMU-Pro (comprensión multimodal universitaria): Competitivo con Mistral
- MathVista (razonamiento visual matemático): Dentro de 1 punto del líder
- MMMU (comprensión multimodal masiva): 64,9% (posición de liderazgo)
Posicionamiento en rankings públicos
- LMArena Chatbot Arena: Modelo abierto mejor rankeado en su clase de parámetros
- Elo score estimado: Superior a Llama 3 70B en evaluaciones humanas lado a lado
- Competitividad: Desempeño comparable a modelos de 70.000 millones de parámetros con menos de la mitad del tamaño
Contexto biomédico: tumores fríos vs calientes
Definiciones clínicas
- Tumores fríos: Masas celulares con escasa o nula infiltración de linfocitos T, microambiente inmunosupresor, baja expresión de MHC-I, resistencia a inhibidores de puntos de control inmunitario
- Tumores calientes: Abundante infiltración de células inmunes efectoras, alta expresión de antígenos y MHC-I, microambiente proinflamatorio, receptivos a inmunoterapias
Mecanismos de evasión inmune en tumores fríos
- Pérdida de heterocigosidad en genes HLA-I: Aproximadamente 17% de análisis pancancerosos
- Represión epigenética mediante complejo PRC2: Metilación de H3K27 suprimiendo transcripción de MHC-I
- Autofagia selectiva: Degradación lisosomal de moléculas MHC-I mediante receptores como NBR1
- Silenciamiento de quimiocinas: Reducción de CXCL9, CXCL10, CCL5 impidiendo reclutamiento de células T
- Déficit de células dendríticas cDC1: Ausencia de cross-presentation de antígenos exógenos vía MHC-I
Estrategias terapéuticas convencionales para calentar tumores
- Inhibidores epigenéticos: DNMTi, inhibidores de EZH2 restaurando expresión de antígenos y MHC-I
- Inhibidores de autofagia: Bloqueando degradación selectiva de MHC-I
- Radioterapia: Modulando repertorio de péptidos y aumentando expresión de MHC-I
- Inhibidores de vías MAPK/MEK/BRAF: Restaurando expresión de MHC-I/II suprimida
- Citoquinas recombinantes: Interferón-gamma sistémico incrementando infiltración de células T
- Terapias combinadas: Inhibidores de múltiples puntos de control inmunitario simultáneos
Limitaciones de enfoques actuales
- Tasa de respuesta baja: Mayoría de tumores fríos permanecen resistentes a inmunoterapias estándar
- Toxicidad sistémica: Activación inmune no selectiva causando efectos adversos
- Falta de biomarcadores predictivos: Dificultad identificando qué pacientes se beneficiarán
- Resistencia adquirida: Tumores desarrollando nuevos mecanismos de evasión post-tratamiento
Implicaciones del hallazgo de silmitasertib + interferón
Ventajas del enfoque condicional
- Selectividad contextual: Amplificación únicamente en microambientes inmunopositivos relevantes
- Minimización de toxicidad: Sin activación inmune sistémica indiscriminada
- Sinergia farmacológica: Efecto combinatorio superior a suma de efectos individuales
- Reutilización de fármacos: Silmitasertib ya investigado en ensayos clínicos previos para otras indicaciones
- Mecanismo novedoso: Primera descripción de inhibición de CK2 aumentando presentación antigénica vía MHC-I
Próximos pasos en investigación
- Estudios mecanísticos: Equipos de Yale investigando vía molecular exacta mediante la cual silmitasertib + interferón amplifican MHC-I
- Predicciones adicionales: Validación de otras hipótesis generadas por C2S-Scale en contextos inmunes diversos
- Estudios preclínicos: Evaluación en modelos murinos de cáncer con tumores fríos establecidos
- Ensayos clínicos potenciales: Pruebas de concepto en pacientes con tumores neuroendocrinos resistentes a inmunoterapia
- Extensión a otros tipos tumorales: Evaluando aplicabilidad en carcinomas pancreáticos, ovarios, próstata con fenotipos fríos
Disponibilidad y recursos para la comunidad científica
Acceso abierto al modelo y herramientas
- Modelo completo: Disponible en Hugging Face Model Hub
- Código fuente: Repositorio público en GitHub con documentación completa
- Paper científico: Preprint publicado en bioRxiv con metodología detallada
- Plataformas de experimentación: Google AI Studio para pruebas sin requisitos de hardware local
- Notebooks educativos: Ejemplos en Kaggle y Google Colab para reproducibilidad
Ecosistema de desarrollo y fine-tuning
- Frameworks compatibles: Hugging Face Transformers, JAX, PyTorch, TensorFlow vía Keras 3.0
- Optimizaciones específicas: NVIDIA TensorRT-LLM, vLLM para inferencia acelerada
- Opciones de cuantización: Checkpoints con Quantization-Aware Training para reducción de precisión preservando calidad
- Fine-tuning eficiente: Recetas para ajuste mediante técnicas PEFT (Parameter-Efficient Fine-Tuning)
- Deployment en cloud: Integración con Google Cloud Vertex AI y NVIDIA NIM microservices
Referencias y enlaces
Google DeepMind – Anuncio oficial del descubrimiento: https://blog.google/technology/ai/google-gemma-ai-cancer-therapy-discovery/
Interesting Engineering – Artículo de análisis del hallazgo: https://interestingengineering.com/health/google-deepmind-new-ai-cancer-treatment
Declaración de Sundar Pichai en X: https://x.com/sundarpichai/status/1978507110477332582
Decrypt – Análisis técnico del descubrimiento: https://decrypt.co/344454/google-ai-cracks-new-cancer-code
eWeek – Detalles sobre el modelo Gemma y su aplicación: https://www.eweek.com/news/google-gemma-model-cancer-therapy/WinBuzzer – Explicación del breakthrough científico: https://winbuzzer.com/2025/10/16/googles-gemma-c2s-scale-27b-ai-model-discovers-novel-cancer-therapy-pathway-in-lab-breakthrough-xcxwbn/
Nature – Artículo de revisión sobre tumores fríos y calientes: https://www.nature.com/articles/s41392-024-01979-xFrontiers in Immunology – Desafíos terapéuticos de tumores fríos: https://www.frontiersin.org/journals/immunology/articles/10.3389/fimmu.2019.00168/full
PMC – Estrategias para remodelar tumores inmunológicamente fríos: https://pmc.ncbi.nlm.nih.gov/articles/PMC8809427/
Google Developers Blog – Arquitectura de modelos Gemma: https://developers.googleblog.com/en/gemma-explained-overview-gemma-model-family-architectures/
Google DeepMind – Página oficial de modelos Gemma: https://deepmind.google/models/gemma/
Hugging Face – Acceso al modelo C2S-Scale 27B: (Disponible en Hugging Face Model Hub)
GitHub – Código fuente y recursos: (Repositorio público de Google DeepMind)
bioRxiv – Preprint científico completo: (Paper técnico con metodología detallada)