Tu genoma tiene tres mil millones de letras. Solo 60 millones codifican instrucciones directas para fabricar proteínas. El resto, durante décadas despreciado como basura genética, en realidad controla cuándo, dónde y con qué fuerza se activan esos genes. Un interruptor mal programado puede desatar cáncer, autismo, o enfermedades raras sin nombre. Pero esos interruptores son invisibles para las pruebas genéticas convencionales, que solo examinan el dos por ciento del genoma que fabrica proteínas directamente.
Google DeepMind acaba de publicar AlphaGenome en Nature. Puede tragar un millón de pares de bases de ADN y escupir predicciones de alta resolución para miles de señales biológicas. Detecta cambios de nucleótido único, esos errores de tipeo molecular de una sola letra, incluso cuando están sepultados en regiones que herramientas anteriores consideraban ruido. En 25 de 26 evaluaciones comparativas contra los mejores modelos especializados disponibles, AlphaGenome ganó o empató.
La aplicación inmediata es diagnóstico. Un paciente llega con síntomas neurológicos extraños. La secuenciación de exoma completo no encuentra nada. Los padres gastan años consultando especialistas, acumulando facturas médicas, sin respuestas. AlphaGenome escanea el genoma entero, identifica una mutación en un potenciador que desregula un gen del desarrollo cerebral. Esa mutación está a dos millones de pares de bases del gen que afecta. Ningún médico la habría encontrado manualmente.
Tres mutaciones diferentes, mismo cáncer
El equipo de DeepMind demostró el poder del sistema con leucemia TAL1-positiva. El gen TAL1, cuando se expresa en el momento equivocado durante el desarrollo de células sanguíneas, causa leucemia linfoblástica aguda de células T. Pero en muchos pacientes, el gen TAL1 no tiene mutaciones. Está perfectamente intacto. El problema está en los interruptores que lo controlan.
Tres laboratorios independientes, trabajando con pacientes no relacionados, encontraron tres clases completamente distintas de mutaciones. Una crea un potenciador ectópico corriente arriba del gen. Otra es una variante intrónica única enterrada en medio del gen. La tercera establece un neo-potenciador corriente abajo. Ubicaciones diferentes, secuencias diferentes, mismo resultado: TAL1 se activa cuando debería estar apagado. Leucemia.
AlphaGenome, sin entrenamiento específico en estos casos, recapituló la biología. Las predicciones mostraron que las tres clases de mutaciones incrementan la accesibilidad de la región del ADN cerca de TAL1 (es decir, el ADN se desenrolla y se vuelve legible para la maquinaria celular), fortalecen la unión de proteínas que activan genes, y elevan los niveles de ARN mensajero de TAL1. Todo esto ocurre específicamente en células del timo y progenitores de sangre, no en hígado o músculo. El modelo aprendió especificidad de tejido sin que nadie le dijera explícitamente qué tejidos importan.
| Qué predice | Para qué sirve |
|---|---|
| Niveles de expresión en 222 tipos de células | Saber si una mutación desregula un gen en neuronas, células cardíacas, o células inmunes sin hacer experimentos en cada tejido |
| Cómo se corta y empalma el ARN | Diagnosticar enfermedades raras causadas por errores de procesamiento de ARN que no aparecen en secuenciación de exoma |
| Qué regiones del ADN están abiertas o cerradas | Entender cómo mutaciones cambian la arquitectura tridimensional del genoma dentro del núcleo celular |
| Dónde se pegan las proteínas reguladoras | Mapear las redes de control molecular que deciden si una célula se convierte en neurona, célula sanguínea, o músculo |
| Qué regiones distantes del genoma se tocan físicamente | Explicar cómo un potenciador a cinco millones de pares de bases de distancia puede regular un gen |
Para splicing, el mecanismo por el cual las células cortan y empalman ARN, AlphaGenome predijo efectos en cascada. Una mutación patogénica en el gen NF1 causa omisión de exón, un error de edición molecular donde la célula salta una sección entera del gen. El modelo predijo: reducción en uso del sitio de corte del exón afectado, pérdida de uniones que conectan los bordes del exón, emergencia de una unión nueva que bypasea el exón, disminución fuerte en la cantidad de ARN que cubre ese exón. Todo desde secuencia de ADN. Cada predicción coincide con lo que se observa experimentalmente.
Cribar cinco millones de variantes antes del desayuno
Los estudios de asociación de genoma completo encontraron miles de regiones vinculadas con diabetes, esquizofrenia, Alzheimer, artritis. La mayoría están en zonas no codificantes. Saber que una región cromosómica se asocia con una enfermedad no explica nada. ¿Qué gen está desregulado? ¿En qué tejido? ¿Por qué mecanismo?
Responder esas preguntas con experimentos tradicionales toma años y cientos de miles de dólares por variante. AlphaGenome convierte el problema en búsqueda computacional rápida. El investigador introduce coordenadas genómicas, el sistema devuelve predicciones para todas las variantes en esa región, las puntuaciones se ordenan por impacto funcional. Las variantes con mayor puntuación van al laboratorio para validación. El resto se descarta. Proceso completo: minutos.
Un equipo aplicó AlphaGenome para analizar variantes que afectan el gen RHD, que determina si tu sangre es Rh positivo o negativo. Usaron las predicciones para priorizar candidatos, luego editaron células con CRISPR para validar. Las puntuaciones del modelo correlacionaban fuertemente con los efectos reales medidos en laboratorio. El flujo híbrido (computación primero, experimentos después) fue diez veces más rápido que probar todo experimentalmente.
🧬 Dónde se usa esto ahora
Enfermedades raras sin diagnóstico: Pacientes con fenotipos claros pero secuenciación de exoma negativa. AlphaGenome encuentra mutaciones en intrones profundos o desiertos génicos que las pruebas convencionales ignoran.
Cáncer hereditario: Variantes en potenciadores o silenciadores que predisponen a tumores. Complementa paneles genéticos enfocados en BRCA y TP53.
Dosis de medicamentos personalizada: Mutaciones en regiones regulatorias de genes que metabolizan fármacos. Una variante puede hacer que proceses un medicamento tres veces más rápido o tres veces más lento que el promedio.
Autismo y epilepsia: Muchos casos resultan de desregulación sutil de genes del desarrollo cerebral. Las mutaciones causales a menudo están fuera de genes codificantes.
Riesgo cardíaco: Variantes que afectan expresión de genes cardíacos bajo estrés. Predicción de arritmias o miocardiopatías antes de que aparezcan síntomas.
✅ Por qué esto cambia el diagnóstico médico
Velocidad extrema: Evaluar efectos de una variante en cientos de contextos celulares mediante experimentos tomaría años. AlphaGenome lo hace en minutos.
Cobertura total de tejidos: Obtener muestras de cerebro, corazón, o páncreas humanos para experimentos es complicado. AlphaGenome predice efectos en 222 tipos celulares sin necesidad de tejidos físicos.
Análisis de mutaciones nunca vistas: Los investigadores pueden probar virtualmente mutaciones hipotéticas para diseñar terapias génicas o entender mecanismos de enfermedades antes de hacer experimentos costosos.
Costo reducido drásticamente: Caracterizar una variante con CRISPR cuesta miles de dólares. AlphaGenome permite priorización computacional económica antes de gastar en laboratorio.
Interpretación completa: En lugar de medir un efecto por vez (expresión o splicing o accesibilidad), AlphaGenome predice todo simultáneamente, revelando cascadas regulatorias completas.
DeepMind liberó el código y los pesos del modelo en GitHub bajo licencia no comercial. También ofrece una API hospedada para que hospitales y laboratorios académicos ejecuten predicciones sin necesidad de comprar supercomputadoras. Esta estrategia replica AlphaFold, cuya liberación pública generó miles de aplicaciones que DeepMind nunca habría imaginado.
⚠️ Límites y advertencias importantes
No es un test diagnóstico aprobado: AlphaGenome es herramienta de investigación. No podés usar las predicciones para decisiones médicas sin que un genetista clínico las valide. La FDA y agencias europeas todavía están desarrollando reglas para aprobar modelos de aprendizaje profundo en genómica clínica.
Predicciones probabilísticas: Una puntuación alta de impacto patogénico no garantiza que esa variante cause enfermedad en un paciente particular. El fenotipo clínico emerge de interacciones complejas entre múltiples genes, ambiente, dieta, historia médica.
Solo humanos y ratones: El modelo fue entrenado en genomas humanos y de ratón. No sabemos cómo funciona en otras especies.
No captura todo: Modificaciones epigenéticas como metilación de ADN, interacciones ARN-ARN, efectos de estructura tridimensional de ARN, y proteínas reguladoras que no se unen al ADN directamente no están modelados.
El modelo tiene límites claros. Fue entrenado en genomas humanos y de ratón; no sabemos cómo funciona en otras especies. Las predicciones son probabilísticas, no certezas. Una puntuación alta de impacto patogénico no garantiza que esa variante cause enfermedad en un paciente particular. El fenotipo clínico (lo que realmente ves en la persona) emerge de interacciones entre múltiples genes, ambiente, dieta, historia médica. AlphaGenome predice efectos moleculares: cambios en ARN, accesibilidad de cromatina. No predice si tendrás convulsiones o problemas cardíacos directamente.
Además, esto es una herramienta de investigación, no un test diagnóstico aprobado. No podés usar las predicciones para tomar decisiones médicas sin que un genetista clínico las valide. La FDA y las agencias regulatorias europeas todavía están desarrollando reglas para aprobar modelos de aprendizaje profundo aplicados a diagnóstico genómico. Eso llevará años.
AlphaGenome no captura todo. Las modificaciones epigenéticas, marcas químicas que se adhieren al ADN sin cambiar la secuencia y pueden afectar expresión génica, no están modeladas explícitamente. Tampoco interacciones entre moléculas de ARN, ni proteínas que regulan genes sin unirse al ADN directamente, ni efectos de la estructura tridimensional que adopta el ARN después de ser transcrito. El modelo lee el código regulatorio inscrito en la secuencia de ADN. La regulación génica real involucra capas adicionales que AlphaGenome todavía no toca.
Combinarlo con secuenciación de genoma completo de larga lectura, que detecta variantes estructurales grandes y regiones repetitivas invisibles para métodos convencionales, podría resolver casos que llevan décadas sin diagnóstico. Secuenciación de célula única, que revela diferencias entre células individuales dentro de un tejido, puede validar las predicciones en resolución extrema. Pero todo esto requiere que instituciones médicas adopten flujos de trabajo completamente nuevos, entrenen personal, y paguen por tecnologías costosas.
Los tres mil millones de letras que cada humano porta ya no son texto ilegible. Son código. Y finalmente estamos aprendiendo a descifrarlo.
Referencias
Avsec, Ž., et al. (2026). Advancing regulatory variant effect prediction with AlphaGenome. Nature, 637, 569-578.
Google DeepMind. (2025). AlphaGenome: AI for better understanding the genome. DeepMind Blog.
Herper, M. (2025). Google's AI company DeepMind launches genetics prediction tool. STAT News.
Wade, L. (2026). Google DeepMind unleashes new AI to investigate DNA's dark matter. Scientific American.
Service, R. F. (2025). DeepMind's latest AI tool makes sense of changes in the human genome. Science.
Agencia SINC. (2026). AlphaGenome predice cómo las variantes del ADN regulan los genes.
Science Media Centre España. (2026). AlphaGenome predice el impacto de las variaciones en el ADN.
Google DeepMind. (2024). AlphaGenome Research Code and Model Weights. GitHub Repository.



