La predisposición a padecer determinadas enfermedades depende en gran medida de las innumerables variantes que existen en nuestro genoma. Sin embargo, hasta ahora ha sido difícil determinar su influencia en la aparición de determinados rasgos patológicos, sobre todo en el caso de variantes genéticas que sólo se dan en raras ocasiones en la población.
Investigadores del Centro Alemán de Investigación del Cáncer (DKFZ), del Laboratorio Europeo de Biología Molecular (EMBL) y de la Universidad Técnica de Múnich han presentado un algoritmo basado en aprendizaje profundo que puede predecir los efectos de variantes genéticas raras.
El artículo, «La integración de anotaciones de variantes mediante redes de conjuntos profundos impulsa las pruebas de variantes raras», ha sido publicado en Medicina natural .
El método permite distinguir con mayor precisión a las personas con alto riesgo de padecer enfermedades y facilita la identificación de genes implicados en el desarrollo de enfermedades.
El genoma de cada persona difiere del de sus congéneres en millones de elementos individuales. Estas diferencias en el genoma se conocen como variantes. Muchas de estas variantes están asociadas con características biológicas y enfermedades particulares. Estas correlaciones se determinan generalmente mediante los llamados estudios de asociación del genoma completo.
Pero en los estudios de asociación a menudo se pasa por alto estadísticamente la influencia de variantes raras, que se presentan con una frecuencia de sólo el 0,1% o menos en la población.
«Las variantes raras, en particular, suelen tener una influencia significativamente mayor en la presentación de un rasgo biológico o de una enfermedad», afirma Brian Clarke, uno de los primeros autores del presente estudio.
«Por tanto, pueden ayudar a identificar los genes que desempeñan un papel en el desarrollo de una enfermedad y que luego pueden orientarnos hacia nuevos enfoques terapéuticos», añade la coautora principal Eva Holtkamp.
Para predecir mejor los efectos de las variantes raras, los equipos dirigidos por Oliver Stegle y Brian Clarke en el DKFZ y EMBL y Julien Gagneur en la Universidad Técnica de Múnich han desarrollado una herramienta de evaluación de riesgos basada en el aprendizaje automático. «DeepRVAT» (prueba de asociación de variantes raras), como han denominado los investigadores al método, es el primero en utilizar la inteligencia artificial (IA) en estudios de asociación genómica para descifrar variantes genéticas raras.
El modelo se entrenó inicialmente con los datos de secuencias (secuencias del exoma) de 161.000 individuos del Biobanco del Reino Unido. Además, los investigadores introdujeron información sobre los rasgos biológicos de los individuos influidos genéticamente, así como sobre los genes implicados en los rasgos.
Las secuencias utilizadas para el entrenamiento comprendían alrededor de 13 millones de variantes. Para cada una de ellas se dispone de «anotaciones» detalladas que proporcionan información cuantitativa sobre los posibles efectos que la variante respectiva puede tener en los procesos celulares o en la estructura de las proteínas. Estas anotaciones también fueron un componente central del entrenamiento.
Tras el entrenamiento, DeepRVAT es capaz de predecir para cada individuo qué genes están afectados por variantes raras en su función. Para ello, el algoritmo utiliza variantes individuales y sus anotaciones para calcular un valor numérico que describe el grado de afectación de un gen y su posible impacto en la salud.
Los investigadores validaron DeepRVAT con datos genómicos del Biobanco del Reino Unido. Para 34 rasgos analizados, es decir, resultados de análisis de sangre relevantes para la enfermedad, el método de prueba encontró 352 asociaciones con genes involucrados, superando con creces todos los modelos existentes anteriormente. Los resultados obtenidos con DeepRVAT demostraron ser muy robustos y más reproducibles en datos independientes que los resultados de enfoques alternativos.
Otra aplicación importante de DeepRVAT es la evaluación de la predisposición genética a ciertas enfermedades. Los investigadores combinaron DeepRVAT con una puntuación de riesgo poligénico basada en variantes genéticas más comunes. Esto mejoró significativamente la precisión de las predicciones, especialmente para las variantes de alto riesgo.
Además, resultó que DeepRVAT reconoció correlaciones genéticas para numerosas enfermedades, incluidas diversas enfermedades cardiovasculares, tipos de cáncer, enfermedades metabólicas y neurológicas, que no se habían encontrado con las pruebas existentes.
«DeepRVAT tiene el potencial de hacer avanzar significativamente la medicina personalizada. Nuestro método funciona independientemente del tipo de rasgo y se puede combinar de forma flexible con otros métodos de prueba», afirma el físico y científico de datos Oliver Stegle. Su equipo ahora quiere seguir probando la herramienta de evaluación de riesgos en ensayos a gran escala lo antes posible y ponerla en práctica.
Los científicos ya están en contacto, por ejemplo, con los organizadores de INFORM. El objetivo de este estudio es utilizar datos genómicos para identificar tratamientos personalizados para niños con cáncer que sufren una recaída. DeepRVAT podría ayudar a descubrir la base genética de ciertos cánceres infantiles.
«Me parece apasionante el posible impacto de DeepRVAT en las aplicaciones para enfermedades raras. Uno de los principales desafíos en la investigación de enfermedades raras es la falta de datos sistemáticos a gran escala. Aprovechando el poder de la IA y el medio millón de exomas del Biobanco del Reino Unido, hemos identificado objetivamente qué variantes genéticas afectan de manera más significativa a la función de los genes», afirma Julien Gagneur de la Universidad Técnica de Múnich.
El siguiente paso es integrar DeepRVAT en la infraestructura del Archivo Alemán de Fenomas del Genoma Humano (GHG) con el fin de facilitar aplicaciones en el diagnóstico y la investigación básica.
Otra ventaja de DeepRVAT es que el método requiere una potencia de cálculo considerablemente menor que otros modelos comparables. DeepRVAT está disponible como un paquete de software fácil de usar que puede utilizarse con los modelos de evaluación de riesgos previamente entrenados o con los conjuntos de datos propios de los investigadores para fines especializados.
Más información:
La integración de anotaciones de variantes mediante redes de conjuntos profundos mejora las pruebas de variantes raras, Medicina natural (2024). DOI: 10.1038/s41588-024-01919-z. www.nature.com/articles/s41588-024-01919-z
Citación:¿Cómo afectan las variantes genéticas raras a la salud? La IA proporciona predicciones más precisas (25 de septiembre de 2024) recuperado el 25 de septiembre de 2024 de https://medicalxpress.com/news/2024-09-rare-genetic-variants-affect-health.html
Este documento está sujeto a derechos de autor. Salvo que se haga un uso legítimo con fines de estudio o investigación privados, no se podrá reproducir ninguna parte del mismo sin autorización por escrito. El contenido se ofrece únicamente con fines informativos.