Misión cumplida, o lo suficientemente cerca, de todos modos.
Ese fue el mensaje que los científicos enviaron al mundo en 2003 cuando anunciaron que el genoma humano había sido secuenciado, ensamblado y esencialmente completo, con algunas lagunas aparentemente menores.
En realidad, el esfuerzo por cuantificar e identificar el código genético que nos hace a todos humanos, que le costó al gobierno de los EE. UU. miles de millones de dólares, quedó en un borrador y al menos le faltaba un 8 por ciento para terminar.
Algunas de las piezas más grandes, repetitivas y complejas del rompecabezas del ADN permanecieron en la oscuridad, hasta ahora.
Impulsado por una nueva y poderosa tecnología de secuenciación, una colaboración flexible de unos 100 científicos anunció el jueves que habían llenado los vacíos, completando un solo genoma humano de un extremo al otro y abriendo nuevas y prometedoras líneas de investigación en áreas en las que los científicos han estado vagando. alrededor en la oscuridad.
La secuenciación del genoma se compartió públicamente por primera vez hace más de un año, pero los resultados de una contabilidad completa, ahora examinada y en uso por investigadores de todo el mundo, se publicaron por primera vez el jueves en una revista revisada por pares. Seis nuevos artículos describen el esfuerzo de secuenciación completo y el análisis adicional de sus impactos en la revista Science..
“Está hecho, es correcto y ha pasado por todos esos niveles de investigación”, dijo Adam Phillippy, biólogo computacional del Instituto Nacional de Investigación del Genoma Humano y líder del esfuerzo reciente. «Somos optimistas de que podría haber claves para la evolución humana y lo que nos hace únicamente humanos».
Este trabajo preliminar algún día podría ayudar a los investigadores a identificar las causas genéticas de los trastornos, desentrañar los misterios de lo que impulsa a algunas células a volverse cancerosas y ayudar a explicar cómo diferentes grupos de personas desarrollaron diferentes rasgos con el tiempo, como la capacidad de prosperar a gran altura.
“Es un hito”, dijo Steve Henikoff, biólogo molecular y profesor del Centro de Investigación del Cáncer Fred Hutchinson y de la Universidad de Washington, que no participó en el proyecto.
De líneas a páginas
Ensamblar un genoma es similar a «tomar un libro, romperlo en pedazos pequeños y unirlos nuevamente», dijo Megan Dennis, profesora asistente que estudia genética y genómica humana en UC Davis Health, quien contribuyó al esfuerzo de secuenciación.
Primero, los investigadores deben cortar el ADN en fragmentos cortos. Luego, se procesa y se lee poco a poco.
Cortado en pedazos, es difícil saber de dónde vino cada hebra, por lo que los científicos deben «unir ese ADN de forma computacional», dijo Dennis.
Durante la década de 2000, la tecnología de secuenciación de ADN solo podía producir fragmentos cortos de código genético, alrededor de 500 pares de bases, o letras, a la vez.
Pero algunas regiones del genoma humano son extremadamente repetitivas, casi como una página de libro con palabras repetidas muchas veces.
“Los elementos repetitivos existen en muchos lugares diferentes. Es difícil saber a dónde pertenecen”, dijo Dennis. Durante años, los científicos simplemente tuvieron que dejar esas páginas, y su comprensión del genoma, en blanco.
En los últimos años, la nueva tecnología que crea lecturas más largas de ADN ha cambiado el juego por completo. Las nuevas máquinas pueden producir cientos de miles de pares de bases en un solo trozo.
Los avances han permitido a los investigadores completar las piezas faltantes del genoma.
“Hubiera sido impensable hace 20 años tener esta tecnología”, dijo Phillippy. De repente, los investigadores pudieron ordenar y poner en contexto esas partes repetitivas del genoma.
«Esas secuencias tienen genes… hay funciones muy importantes contenidas dentro de esas regiones».
Un proyecto pandémico
La idea de terminar el genoma creció orgánicamente.
Un perfeccionista de corazón, siempre le había molestado a Phillippy que el genoma humano permaneciera incompleto.
Hace unos cinco años, se asoció con Karen Miga, profesora asistente en el departamento de ingeniería biomolecular de la Universidad de California, Santa Cruz, para terminar el trabajo.
Cuando se atascaron, buscaron ayuda. El proyecto comenzó a crecer como una bola de nieve, acumulando unos pocos cientos de colaboradores científicos y creciendo hasta convertirse en lo que ahora se llama el proyecto Telomere-to-Telomere, usando un término que describe las tapas de los extremos de los cromosomas.
Cuando llegó la pandemia, el ritmo de la investigación solo se aceleró, con los investigadores comunicándose desde sótanos lúgubres en la plataforma de comunicación Slack y a través de llamadas de Zoom.
“2020 fue un año loco por muchas razones. Nos dio algo en lo que concentrarnos”, dijo Phillippy.
En última instancia, los investigadores juntaron todo el código genético para una sola versión de un genoma. Ese genoma, que se derivó hace décadas del tejido celular que contiene la información genética de un solo espermatozoide, no representa a ningún humano que haya vivido porque solo contiene un conjunto de cromosomas paternos.
El código completo ahora formará la columna vertebral de la nueva investigación genómica y se convierte en una referencia nueva y terminada para la comparación.
Teoría y práctica
El genoma completo abre nuevas vías para la investigación.
Durante décadas, los científicos han estudiado detenidamente el 92 por ciento del genoma disponible, probándolo para encontrar variaciones genéticas que podrían estar causando enfermedades.
“Tenemos una buena comprensión de cómo se ve la variación en esas regiones, pero no tenemos idea sobre el otro 8 por ciento”, dijo Phillippy.
Ahora, los investigadores están volviendo a analizar sus datos antiguos contra el nuevo genoma de referencia, tratando de descubrir nuevas pistas de lo que faltaba.
“Identificamos muchas más, decenas de miles, si no cientos de miles, de nuevas variantes”, dijo Dennis. “Algunos de ellos caen dentro de los genes que codifican proteínas y algunos de esos genes son médicamente importantes, clínicamente importantes y contribuyen a las enfermedades”.
La nueva referencia del genoma también permite seguir estudiando cómo funcionan los centrómeros.
Los centrómeros son estructuras en el medio de los cromosomas que están llenos de secuencias repetitivas de código y son parte integral del proceso de división celular. Históricamente, se encuentran entre las partes menos entendidas del genoma porque contienen mucha codificación tediosa y densa.
“No entendemos el mecanismo subyacente de la evolución de los centrómeros”, dijo Henikoff. «De repente, en el último año, a medida que salían los datos, aprendimos mucho más sobre los centrómeros».
Usando el nuevo genoma, los investigadores pueden estudiar mejor cómo se ensamblan las proteínas del centrómero y qué sucede cuando cambian o pierden su función.
“La disfunción del centrómero puede ser un factor importante en el cáncer”, dijo Henikoff. Hasta ahora, “nos hemos visto obstaculizados porque no hemos tenido una secuencia de referencia”.
El estudio adicional de porciones recién secuenciadas del genoma también podría ayudar a los científicos a comprender mejor cómo los humanos evolucionaron rasgos particulares, como los cerebros más grandes que los enviaron por un camino genéticamente distinto al de sus antepasados los grandes simios.
“Las cosas que hacen que nuestra corteza frontal sea más grande provienen de los genes que se mapean en estas regiones repetitivas”, dijo Evan Eichler, profesor del departamento de ciencias del genoma en la Facultad de Medicina de la Universidad de Washington y también parte de la colaboración de investigación.
Los avances en la tecnología de secuenciación genómica podrían impulsar un renacimiento de los avances médicos, dicen los investigadores.
“Estoy más entusiasmado con lo que no sabemos y las oportunidades de descubrimiento”, dijo Miga.
Phillippy dijo que su próximo objetivo es optimizar el proceso de secuenciación para hacerlo más económico, más eficiente y ampliamente disponible. También planea secuenciar el código genético con los cromosomas paternos y maternos. La secuenciación amplia entre personas de muchos orígenes ayudará a describir la diversidad genética del mundo y a identificar variaciones genéticas importantes, dijo.
Él imagina un mundo en el que todos tengan acceso a sus datos genéticos, lo que podría ayudar a proporcionar información individualizada sobre qué enfermedades deben vigilar los médicos o qué medicamentos recetar.
“Dentro de 10 años, obtener un genoma humano completo y perfectamente preciso será una parte rutinaria del cuidado de la salud y será lo suficientemente barato como para que no se piense dos veces: una prueba de laboratorio de menos de $ 1,000”, dijo Phillippy. “Tendrás el genoma completo en tu bolsillo”.