Desafíos del proyecto genoma humano a 20 años

Jueves 9 de diciembre de 2021

El 15 de febrero del año 2001 es un día histórico para la ciencia. En dicha fecha, la revista Nature publicaba por primera vez la secuenciación definitiva del genoma humano elaborada por el proyecto del mismo nombre. Sin embargo, y contrario a lo que podría pensarse, en el momento de su anuncio el logro estaba aún inconcluso, pues aún quedaba cerca de un 15% del genoma por secuenciar. El desafío de descifrar las partes faltantes ha sido tal, que a pesar de los numerosos desarrollos tecnológicos y de los constantes esfuerzos de parte de la comunidad científica, para el 2013 aún quedaba un 8% del genoma por dilucidar.

Felizmente, la ambiciosa meta fue alcanzada este año. La institución detrás del logro es el consorcio T2T (Telomere-to-Telomere) que aúna el esfuerzo de más de 30 instituciones alrededor del mundo. El anuncio fue realizado en una prepublicación del 27 de mayo, titulada “La secuencia completa del genoma humano”, en la cual el equipo presidido por Adam Phillippy y Karol Miga reportaron haber secuenciado las partes faltantes, descubriendo en el proceso 115 nuevos genes codificadores de proteínas (en total se conocen 19969 genes codificantes).

¿Cómo es que se han logrado descifrar las partes faltantes?

La esencia de todos los métodos de secuenciación de ADN es similar: consiste en leer el genoma por segmentos, para después hacerlos calzar entre ellos, de manera afín a como se articulan las piezas de un rompecabezas para formar una imagen.

Aunque el genoma humano consista únicamente en una secuencia de 4 bases nitrogenadas agrupadas en 46 cromosomas, no todas las secciones son igualmente fáciles de descifrar, del mismo modo que un rompecabezas suele tener partes más difíciles de armar. Resulta especialmente complicado articular las secciones que constan de muchas secuencias repetidas, al punto que llegan a ser casi idénticas. Estas secciones serían afines a la parte del “cielo” del rompecabezas, en donde las piezas son tan parecidas que son difíciles de ubicar del modo correcto.  

Al respecto, la copresidenta del proyecto, Karol Miga, afirma que habría sido imposible resolver este problema si no fuera por una nueva tecnología de secuenciación que utiliza láser para escanear segmentos extensos de ADN, del orden de 20.000 pares de base en una lectura. Esto es un gran avance considerando que los métodos tradicionales de secuenciación de ADN leían segmentos mucho más pequeños, de sólo unos cientos de pares de bases por vez. Para comprender por qué esto es tan conveniente, resulta útil volver a la analogía del rompecabezas, en donde mientras más grandes sean las piezas, menos piezas hay que encajar. De esta manera, el impacto de dicho aumento del tamaño de los segmentos de genoma es equivalente a pasar de armar un puzle de cien mil piezas, a armar uno de sólo mil.

Esta no es la única innovación que han aplicado los investigadores del consorcio T2T. En vez de tomar el ADN de una persona viva, que era lo más convencional, se utilizó una línea celular derivada de una “mola hidatídica”, un tipo de tejido que se forma cuando un espermatozoide insemina a un óvulo sin núcleo. Como las células resultantes contienen sólo cromosomas del padre, sólo es necesario distinguir un grupo de cromosomas en vez de dos.

Limitaciones y nuevos desafíos.

A pesar de que el genoma presentado por el equipo T2T no tiene partes faltantes, se estimó que el 0,3% del genoma puede contener errores. Esto porque es más difícil revisar la calidad de la secuenciación en las zonas más desafiantes. Además, el espermatozoide que formó la “mola hidatídica” cuyo genoma se secuenció, poseía el cromosoma sexual X, por lo que aún no se ha secuenciado el cromosoma Y; es por esto que dicha labor ha sido declarada como uno de los próximos objetivos del consorcio T2T.

Otra limitación que han tenido los estudios de secuenciación en humanos, es que la mayoría de estos se han utilizado genomas de personas de origen europeo, lo que podría inducir a realizar generalizaciones erróneas sobre la especie humana a partir de un grupo en particular. Cabe destacar también que el consorcio T2T sólo ha secuenciado el genoma completo de sólo una persona; es por esto que, en cooperación con el Consorcio de Referencia de Pangenoma Humano (HPRC por sus siglas en inglés) se ha fijado el objetivo de secuenciar, en los próximos 3 años, un total de 300 genomas de personas provenientes de todo el mundo, lo que contribuiría a comprender qué partes del genoma difieren entre individuos, y cómo esto determina las diferencias fenotípicas en nuestra especie. Además, una base de datos de genoma más extensa permitiría asociar con mayor exactitud ciertos genes con el desarrollo de enfermedades hereditarias, entre las que se encuentran diversas enfermedades neurodegenerativas tales como el Alzheimer o el Parkinson, facilitando así su prevención y tratamiento.

Las siguientes palabras de la doctora Miga son ilustrativas de la amplia perspectiva que implica este tema: “Debemos alcanzar un nuevo estándar en genética, donde estos procedimientos dejen de ser especiales y pasen a considerarse algo rutinario” Así, tal vez llegue el día en que la habituación a estas tecnologías vuelva difícil comprender la dimensión de estos avances, de modo parecido a como los teléfonos celulares, ubicuos en nuestro día a día, nos vuelven sorprendente el hecho de que un computador de menor capacidad fuera capaz de llevar al ser humano a la luna, en 1969.

Fuentes:

Reardon, Sara (Junio 2021). A complete human genome sequence is close: how scientists filled in the gaps.
https://www.nature.com/articles/d41586-021-01506-w.

National Human Genome Research Institute (Diciembre 2020). The Human Genome Project. https://www.genome.gov/human-genome-project.

T2Tconsortium. The Telomere-to-Telomere (T2T) consortium is an open, community-based effort to generate the first complete assembly of a human genome. https://sites.google.com/ucsc.edu/t2tworkinggroup.

Glosario:

Genoma: Conjunto completo de material genético en un organismo

Gen: Unidad básica de información en el ADN. Un gen es un sector de ADN que posee la información necesaria para producir una de las proteínas que forman el organismo.

Base nitrogenada: Las bases nitrogenadas que componen el ADN son Adenina (A), Timina (T),. Guanina (G), Citosina (C). Estas bases son lo único que puede variar en la estructura del ADN, y por eso la secuencia en la que se organizan contiene la información hereditaria de un organismo.

Fenotipo: Características observables en un organismo. El fenotipo está influenciado por el genoma, pero también por factores externos o ambientales.

 Photo by National Cancer Institute on Unsplash  

Red de Neurociencia del aprendizaje

Plataforma de educación, investigación, innovación, y extensión en Neurociencia y Aprendizaje.