Más de dos décadas después de que se completara el primer borrador del genoma humano, gran parte de su secuencia aún es un territorio inexplorado.
Aunque el mapa de los 3100 millones de letras del ADN humano fue publicado en 2003, comprender el funcionamiento real de ese código genético ha resultado mucho más complejo.
Ahora, un nuevo avance en inteligencia artificial promete cambiar ese panorama: se trata de AlphaGenome, el modelo desarrollado por Google DeepMind que busca traducir el lenguaje genético en información funcional y práctica para la biología y la medicina.
A diferencia de la parte del genoma que codifica proteínas, que representa solo el 2 %, la vasta región no codificante ha sido durante años una fuente de incertidumbre. En ese sector —la llamada “materia oscura” del genoma— se encuentran muchos de los elementos que regulan cuándo y cómo se activan los genes.
AlphaGenome fue diseñado justamente para abordar este terreno incierto. Mediante técnicas de aprendizaje automático y una arquitectura basada en transformadores, esta IA puede analizar hasta un millón de letras de ADN en una sola entrada y predecir miles de propiedades biológicas asociadas a esa secuencia.
Lo notable es que estas predicciones no se limitan a regiones codificantes. AlphaGenome puede detectar patrones en zonas lejanas de la secuencia que actúan como interruptores genéticos.
Y no solo identifica funciones, sino que evalúa cómo mutaciones puntuales en el ADN podrían alterar esos procesos.
Según los investigadores de DeepMind, el sistema predijo con éxito casos en los que una mutación activa anormalmente el gen TAL1, un evento que contribuye al desarrollo de leucemia linfoblástica aguda de células T. Este tipo de resultados entusiasma a la comunidad científica por el potencial que ofrece para entender el impacto de las variaciones genéticas en múltiples enfermedades.
“Por primera vez, hemos creado un modelo único que unifica muchos desafíos diferentes que vienen con la comprensión del genoma”, afirmó Pushmeet Kohli, vicepresidente de investigación de DeepMind.
Desde su presentación oficial, ayer 25 de junio, AlphaGenome fue puesto a disposición de universidades, laboratorios públicos y centros de salud que deseen explorar sus aplicaciones.
La llegada de AlphaGenome ocurre en un contexto donde la inteligencia artificial ya mostró avances disruptivos en ciencias de la vida. En 2020, Google presentó AlphaFold, un sistema que resolvió uno de los problemas más antiguos de la biología: predecir cómo una cadena de aminoácidos se pliega en una estructura tridimensional para formar una proteína.
Ese desarrollo derivó en la creación de Isomorphic Labs, una empresa dedicada al descubrimiento de fármacos, y en la obtención del Premio Nobel de Química en 2024 otorgado a los creadores de AlphaFold, John Jumper y Demis Hassabis, junto con David Baker.
Los galardonados explicaron en ese entonces que AlphaFold es un sistema de inteligencia artificial que predice cómo se pliegan las proteínas a partir de su secuencia de aminoácidos, resolviendo un problema que perduró durante décadas en la biología molecular. Jumper y Hassabis trabajan en Google DeepMind, donde lideraron el desarrollo de esta herramienta, mientras que Baker, bioquímico de la Universidad de Washington, fue premiado por sus contribuciones en el diseño computacional de proteínas. La Academia resaltó que estos aportes abren una nueva etapa en la medicina, la biotecnología y el medio ambiente.
Ahora, con AlphaGenome, la ambición es ampliar ese impacto desde las proteínas hacia el genoma completo.
Mientras que AlphaFold ofrecía una única respuesta estructural a partir de una secuencia proteica, AlphaGenome enfrenta una complejidad mayor.
Las secuencias de ADN no cumplen una sola función, sino que participan de múltiples procesos superpuestos. Un mismo fragmento puede atraer proteínas que regulan la transcripción, modificar la forma tridimensional del cromosoma o definir si un gen se activará o quedará en silencio. Captar esa diversidad de funciones en un solo modelo representa un salto en la interpretación genómica.
Anshul Kundaje, especialista en genómica computacional de la Universidad de Stanford, fue uno de los investigadores que accedió de forma anticipada al sistema. “Creo que es un gran avance. Es una auténtica mejora en prácticamente todos los modelos de secuenciación a función de vanguardia actuales”, aseguró.
La arquitectura del modelo se inspira en los mismos principios que sustentan los grandes modelos de lenguaje como GPT-4, aunque en este caso aplicados al “idioma” del ADN. Para entrenarlo, DeepMind utilizó datos de consorcios científicos como ENCODE, GTEx, 4D Nucleome y FANTOM5, que abarcan información genética y epigenética de cientos de tipos celulares humanos y de ratón.
Esa diversidad de datos permitió que AlphaGenome reconociera patrones funcionales más allá del contexto genético inmediato.
En términos prácticos, el modelo puede predecir dónde empiezan y terminan los genes en distintas células, cómo se empalman los fragmentos de ARN, dónde se unen las proteínas reguladoras o cuánto ARN se producirá. Además, su capacidad para comparar secuencias normales con mutadas ofrece una herramienta clave para evaluar el impacto de una variante genética antes de llevarla al laboratorio. Según DeepMind, AlphaGenome puede estimar en cuestión de segundos el efecto de una mutación sobre múltiples procesos moleculares.
Esa rapidez resulta particularmente útil en escenarios clínicos donde se analizan grandes volúmenes de datos genéticos. “Tenemos estos 3 mil millones de letras de ADN que conforman el genoma humano, pero cada persona es ligeramente diferente y no comprendemos del todo el efecto de esas diferencias. Esta es la herramienta más potente hasta la fecha para modelar esto”, explicó Caleb Lareau, biólogo computacional del Centro Oncológico Memorial Sloan Kettering.
Los biólogos suelen enfrentarse a conjuntos de datos que incluyen miles de variantes genéticas asociadas a una enfermedad. Determinar cuál de ellas tiene un efecto real sobre la salud requiere una enorme inversión en tiempo y recursos de laboratorio. Con AlphaGenome, muchas de esas pruebas podrían realizarse de forma virtual. Lareau señala que el modelo permitirá reducir las hipótesis que deben evaluarse en experimentos reales: “Recibirás una lista de variantes genéticas, pero luego quiero entender cuáles de ellas realmente tienen algún efecto y dónde puedo intervenir”.
Aunque AlphaGenome no fue diseñado para predecir rasgos individuales ni ascendencias personales, como los servicios comerciales de genómica, sí ofrece una aproximación detallada al funcionamiento de las variantes genéticas en términos moleculares. “No hemos diseñado ni validado AlphaGenome para la predicción del genoma personal, un desafío conocido para los modelos de IA”, aclaró Google en un comunicado.
Para casos clínicos complejos, como los cánceres raros con mutaciones poco documentadas, esta IA podría ofrecer pistas sobre qué cambios genéticos están detrás de la enfermedad. Julien Gagneur, profesor de medicina computacional en la Universidad Técnica de Múnich, señaló: “Una característica distintiva del cáncer es que mutaciones específicas en el ADN hacen que los genes incorrectos se expresen en el contexto equivocado. Este tipo de herramienta es fundamental para identificar cuáles alteran la expresión génica adecuada”.
Gagneur también considera que AlphaGenome podría ser útil para pacientes con enfermedades genéticas raras, cuyo diagnóstico muchas veces no se alcanza incluso después de decodificar su genoma. “Podemos obtener sus genomas, pero desconocemos qué alteraciones genéticas causan la enfermedad”, indicó. Para estos casos, el modelo podría aportar una nueva vía de investigación diagnóstica.
Además del ámbito clínico, algunos investigadores proyectan aplicaciones más ambiciosas. Desde diseñar genomas artificiales hasta desarrollar un laboratorio completamente virtual para ensayos farmacológicos, el potencial de estos modelos de IA todavía no conoce límites definidos.
“Mi sueño sería simular una célula virtual. Puede que AlphaGenome no modele la célula completa, pero está empezando a arrojar luz sobre la semántica más amplia del ADN”, dijo Demis Hassabis, director ejecutivo de Google DeepMind. Kohli coincide en que AlphaGenome representa un paso en ese camino.
(Imagen Ilustrativa Infobae)
Por el momento, la API de AlphaGenome estará disponible para instituciones académicas, laboratorios públicos y organismos de salud. DeepMind planea abrir el modelo a colaboraciones con gobiernos e industrias, aunque la versión para uso comercial todavía no está lista. La compañía también aseguró que compartirá detalles técnicos del modelo para facilitar su validación e integración en nuevas investigaciones.
Mientras tanto, los primeros resultados permiten anticipar un cambio de paradigma en la forma en que la ciencia aborda el genoma humano.
No se trata solo de observar letras, sino de empezar a comprender su significado en contexto. AlphaGenome propone justamente eso: un intento de leer el ADN con un nuevo tipo de inteligencia.
Fuente: Inboae.com