El genoma humano, ese inmenso manual de instrucciones que define nuestra biología, ha sido durante mucho tiempo un rompecabezas incompleto. Si bien la ciencia ha logrado leer la secuencia de "letras" (nucleótidos) que lo componen, gran parte de la información más compleja y enigmática permanecía oculta. Un reciente estudio publicado en la prestigiosa revista Nature marca un antes y un después en esta misión, al duplicar el conocimiento sobre la variación genética estructural, abriendo una ventana sin precedentes a la diversidad humana y a las bases genéticas de las enfermedades.
Tradicionalmente, la genética humana se ha centrado en las variantes de un solo nucleótido (SNVs), que son cambios de una sola letra en la secuencia de ADN. Este enfoque ha sido crucial, pero es como intentar comprender una biblioteca completa leyendo solo un puñado de palabras mal escritas en cada libro. El verdadero tesoro, el que explica gran parte de nuestra diversidad y susceptibilidad a las enfermedades, reside en las variantes estructurales (SVs). Estas son alteraciones a gran escala, como fragmentos de ADN que se duplican, se eliminan, se invierten o se insertan en nuevos lugares.
El problema era que la tecnología de secuenciación de lectura corta, que ha dominado la genética durante décadas, no podía identificar estas variaciones masivas con precisión. Era como tratar de ensamblar un puzle gigante con piezas diminutas y repetitivas, haciendo casi imposible ver la imagen completa de las variaciones estructurales.
Para superar esta barrera, un consorcio internacional de científicos liderado por instituciones como el Laboratorio Europeo de Biología Molecular (EMBL) y el Instituto de Investigación de Patología Molecular (IMP), recurrió a una tecnología de vanguardia: la secuenciación de lectura larga (LRS). A diferencia de las tecnologías anteriores, la LRS puede leer miles de bases de ADN de una sola vez, proporcionando fragmentos de información mucho más grandes y coherentes.
El equipo aplicó esta tecnología a los genomas de 1,019 individuos de 26 poblaciones diversas de los cinco continentes, extraídos del famoso Proyecto 1000 Genomas. La elección de una muestra tan variada fue crucial para asegurar que el nuevo mapa genético fuera representativo de la variación humana a nivel global. El uso de avanzados análisis basados en genomas gráficos y lineales permitió identificar y cartografiar estas variantes con una resolución sin precedentes.
Los resultados de este monumental esfuerzo son, en palabras de los propios autores, "extraordinarios". El estudio ha logrado identificar más de 167,000 nuevas variantes estructurales, un hallazgo que duplica el catálogo conocido de este tipo de variación en el pangenoma humano. Esto no solo demuestra la inmensa cantidad de variación genética que permanecía invisible, sino que también recalibra nuestra comprensión de lo que nos hace únicos. Se descubrió que cada persona en el estudio lleva, en promedio, 7.5 millones de bases adicionales de ADN en forma de SVs, un dato que resalta la magnitud de estas variaciones.
Además, la investigación arrojó luz sobre los mecanismos biológicos detrás de estas variantes. Los científicos descubrieron que estas SVs se forman a través de un espectro de procesos y no de uno solo. Identificaron mecanismos por los cuales los transposones, conocidos popularmente como "genes saltarines", pueden mover fragmentos de ADN a nuevos lugares, creando una rica fuente de diversidad genética.
Este nuevo atlas de la variación estructural tiene implicaciones profundas para la medicina y la investigación. Los datos generados, que serán de acceso abierto para la comunidad científica, servirán como un nuevo mapa de referencia para el genoma humano. Este mapa es vital para mejorar el diagnóstico genético de enfermedades, ya que la precisión en la identificación de variantes patógenas, como las asociadas al cáncer y a trastornos del neurodesarrollo, se incrementará significativamente.
El estudio es una "hoja de ruta" para el desarrollo del pangenoma humano, un genoma de referencia más completo que refleje la diversidad de nuestra especie. Esta nueva herramienta permitirá a los científicos entender de manera más precisa las bases genéticas de diversas enfermedades, lo que a su vez facilitará el diseño de terapias más personalizadas y efectivas. La investigación también subraya la necesidad de que los proyectos de salud pública, tanto a nivel nacional como global, consideren la secuenciación de lectura larga como un estándar para desentrañar por completo el código genético humano.
La medicina del futuro, precisa y personalizada, se construye sobre los cimientos de la genética. Y este nuevo estudio ha ampliado enormemente esos cimientos. Es un llamado a la acción para que la comunidad científica siga explorando lo que aún queda por descubrir en nuestro ADN.
Temas relacionados
SaludReferencia: Schloissnig, S., Pani, S., Korbel, J. O., et al. (2025). Structural variation in 1,019 diverse humans based on long-read sequencing. Nature, 631(7901), 22-29. https://doi.org/10.1038/s41586-025-09290-7