El genoma
humano

Alberto Bermudez Polo
Para situar el estudio sobre el genoma humano hay que remontarse a los primeros estudios sobre la
genética y la herencia.
La historia de la genética se considera que comienza con el trabajo del monje agustino Gregor
Mendel. Su investigación sobre hibridación en guisantes, publicada en 1866, describe lo que más
tarde se conocería como las leyes de Mendel.
En experimentos de cruza realizados entre 1856 y 1863, Gregor Mendel trazó por primera vez los
patrones hereditarios de ciertos rasgos en plantas de guisante y mostró que obedecían a reglas
estadísticas sencillas. A pesar de que no todas las características muestran los patrones de la
herencia mendeliana, su trabajo sirvió como prueba de que la aplicación de estadística a la herencia
podía ser sumamente útil. A partir de esa época muchas formas más complejas de herencia han sido
demostradas.
A partir de su análisis estadístico, Mendel definió un concepto al que llamó alelo, al cual concibió
como la unidad fundamental de la herencia. Esta utilización del término alelo es casi un sinónimo
del contemporáneo término gen. Sin embargo, en la actualidad alelo indica a una variante específica
de un gen en particular.
El trabajo de Mendel se publicó en 1866 bajo el título Experimentos sobre hibridación de plantas
(en alemán: "Versuche über Pflanzenhybriden") en las Actas de la Sociedad de Historia Natural de
Brno (en alemán: Verhandlungen des Naturforschenden zu Brünn), después de haberlo dado a
conocer en dos conferencias de la misma sociedad a principios de 1865.
El trabajo de Mendel fue publicado en una revista académica relativamente desconocida, y no se le
dio ninguna atención en la comunidad científica. En cambio, las discusiones sobre modalidades de
la herencia fueron galvanizadas por la teoría de Charles Darwin de la evolución por selección
natural, en la cual parecían requerirse mecanismos no lamarquianos de la herencia. La propia teoría
de la herencia de Darwin, pangénesis, no encontró mucho nivel de aceptación. Una versión más
matemática de la pangénesis, la cual descartaba mucho de los remanentes lamarquistas de Darwin,
fue desarrollada como la escuela de la herencia "biométrica" por el primo de Darwin, Francis
Galton. Bajo Galton, y su sucesor Karl Pearson, la escuela biométrica intentó construir modelos
estadísticos para la herencia y la evolución, con éxito limitado pero auténtico, aunque los métodos
exactos de la herencia eran desconocidos y se cuestionaban ampliamente.
El año 1900 marcó el «redescubrimiento de Mendel» por parte de Hugo de Vries, Carl Correns y
Erich von Tschermak, y para 1915 los principios básicos de la genética mendeliana habían sido
aplicados a una amplia variedad de organismos, donde destaca notablemente el caso de la mosca de
la fruta (Drosophila melanogaster). Bajo el liderazgo de Thomas Hunt Morgan y sus compañeros
«drosofilistas», los especialistas en genética desarrollaron la teoría mendeliana-cromosómica de la
herencia, la cual fue ampliamente aceptada para 1925. Paralelamente al trabajo experimental, los
matemáticos desarrollaron el marco estadístico de la genética de poblaciones, y llevaron la
interpretación genética al estudio de la evolución.
Con los patrones básicos de la herencia genética establecidos, muchos biólogos se volvieron hacia
investigaciones sobre la naturaleza física de los genes. En los años cuarenta y a principios de los
cincuenta, los experimentos señalaron al ADN como la parte de los cromosomas (y quizás otras
nucleproteínas) que contenía genes.
El enfoque sobre nuevos organismos modelo tales como virus y bacterias, junto con el
descubrimiento en 1953 de la estructura en doble hélice del ADN, marcaron la transición a la era de
la genética molecular. En los años siguientes, algunos químicos desarrollaron técnicas para
secuenciar tanto a ácidos nucleicos como a proteínas, mientras otros solventaban la relación entre
estos dos tipos de biomoléculas: el código genético. La regulación de la expresión génica se volvió
un tema central en los años sesenta, y para los años setenta dicha expresión génica podía ser
controlada y manipulada utilizando ingeniería genética. Durante lás últimas décadas del siglo XX
muchos biólogos se enfocaron a proyectos genéticos a gran escala, secuenciando genomas enteros.
A continuación se nombran algunos de los acontecimientos más destacables en el campo de la
genética:
1865: Publicación del artículo de Gregor Mendel Experimentos sobre hibridación de plantas
1869: Friedrich Miescher descubre lo que hoy se conoce como ADN.
1880-1890: Walther Flemming, Eduard Strasburger, y Edouard Van Beneden describen la
distribución cromosómica durante la división celular.
1903: Walter Sutton establece la hipótesis según la cual los cromosomas, segregados de modo
mendeliano, son unidades hereditarias.1
1905: William Bateson acuña el término «genética» en una carta dirigida a Adam Sedgwick.2
1906: William Bateson propone el término «genética».3
1908: Ley de Hardy-Weinberg
1910: Thomas Hunt Morgan demuestra que los genes residen en los cromosomas.
1913: Alfred Sturtevant realiza el primer mapa genético de un cromosoma.
1913: Los mapas genéticos muestran cromosomas con genes organizados linealmente.
1918: Ronald Fisher publica "The Correlation Between Relatives on the Supposition of
Mendelian Inheritance" (en español "La correlación entre parientes con base en la suposición
de la herencia mendeliana"). Comienza la llamada síntesis evolutiva moderna.
1928: Frederick Griffith descubre que el material hereditario de bacterias muertas puede ser
incorporado en bacterias vivas.
1931: El entrecruzamiento cromosómico se identifica como la causa de la recombinación
genética.
1933: Jean Brachet demuestra que el ADN se encuentra en los cromosomas y que el ARN está
presente en el citoplasma de todas las células.
1941: Edward Lawrie Tatum y George Wells Beadle muestran que los genes codifican las
proteínas.
1944: Oswald Theodore Avery, Colin MacLeod y Maclyn McCarty aíslan ADN como
material genético4
1950: Erwin Chargaff muestra que los cuatro nucleótidos no están presentes en los ácidos
nucleicos en proporciones estables, pero que parecen existir algunas leyes generales. La
cantidad de adenina (A), por ejemplo, tiende a ser igual a la de timina (T).
Barbara McClintock descubre los transposones en el maíz.
1952: El experimento Hershey-Chase prueba que la información genética de los fagos (y de
todos los organismos) es ADN.
Rosalind Franklin obtiene la llamada Fotografía 51, la primera imagen del ADN
realizada mediante difracción de rayos X.
1953: James D. Watson y Francis Crick demuestran la estructura de doble hélice del ADN5
1956: Joe Hin Tjio y Albert Levan determinan que es 46 el número de cromosomas en los
seres humanos.
1958: El experimento Meselson-Stahl demuestra que el ADN se replica de modo
semiconservador.
1961: El código genético se ordena en tripletes.
1964: Howard Temin muestra, utilizando virus de ARN, que la dirección de transcripción
ADN-ARN puede revertirse.
1970: Se descubren las enzimas de restricción, lo que permite a los científicos cortar y pegar
fragmentos de ADN.
1972: Walter Fiers y su equipo, en el Laboratorio de biología molecular de la Universidad de
Gante (Gante, Bélgica), fueron los primeros en determinar la secuencia de un gen: el gen para
la proteína del pelo del bacteriófago MS2.6
1976: Walter Fiers y su equipo determinan la secuencia completa del ARN del bacteriófago
MS27
1977: Primera secuenciación del ADN por Fred Sanger, Walter Gilbert y Allan Maxam.8
1983: Kary Banks Mullis descubre la reacción en cadena de la polimerasa.
1989: Francis Collins y Lap-Chee Tsui secuencian el gen humano codificador de la proteína
CFTR.
1995: Se secuencia por primera vez el genoma de un organismo vivo (Haemophilus
influenzae).
1996: Primera secuenciación de un genoma eucariota: Saccharomyces cerevisiae.
1998: Primera secuenciación del genoma de un eucariota multicelular:Caenorhabditis
elegans.
2001: Primeras secuencias del genoma humano por parte del Proyecto Genoma Humano y
Celera Genomics
2003: El Proyecto Genoma Humano publica la primera secuenciación completa del genoma
humano con un 99.99% de fidelidad.
De todos estos proyectos el más actual e importante es el proyecto del genoma humano:
El Proyecto Genoma Humano (PGH) fue un proyecto de investigación científica con el objetivo
fundamental de determinar la secuencia de pares de bases químicas que componen el ADN e
identificar y cartografiar los aproximadamente 20.000-25.000 genes del genoma humano desde un
punto de vista físico y funcional.
El proyecto, dotado con 3000 millones de dólares, fue fundado en 1990 en el Departamento de
Energía y los Institutos Nacionales de la Salud de los Estados Unidos, bajo la dirección del doctor
Francis Collins, quien lideraba el grupo de investigación público , conformado por múltiples
científicos de diferentes países, con un plazo de realización de 15 años. Debido a la amplia
colaboración internacional, a los avances en el campo de la genómica, así como los avances en la
tecnología computacional, un borrador inicial del genoma fue terminado en el año 2000 (anunciado
conjuntamente por el expresidente Bill Clinton y el ex-primer ministro británico Tony Blair el 26 de
junio de 2000), finalmente el genoma completo fue presentado en abril del 2003, dos años antes de
lo esperado. Un proyecto paralelo se realizó fuera del gobierno por parte de la Corporación Celera.
La mayoría de la secuenciación se realizó en las universidades y centros de investigación de los
Estados Unidos, Canadá, Nueva Zelanda, Gran Bretaña y España.
El genoma humano es la secuencia de ADN de un ser humano. Está dividido en fragmentos que
conforman los 23 pares de cromosomas distintos de la especie humana (22 pares de autosomas y 1
par de cromosomas sexuales). El genoma humano está compuesto por aproximadamente entre
22500 y 25000 genes distintos. Cada uno de estos genes contiene codificada la información
necesaria para la síntesis de una o varias proteínas (o ARN funcionales, en el caso de los genes
ARN). El "genoma" de cualquier persona (a excepción de los gemelos idénticos y los organismos
clonados) es único.
La secuencia de ADN que conforma el genoma humano contiene codificada la información
necesaria para la expresión, altamente coordinada y adaptable al ambiente, del proteoma humano, es
decir, del conjunto de las proteínas del ser humano. Las proteínas, y no el ADN, son las principales
biomoléculas efectoras; poseen funciones estructurales, enzimáticas, metabólicas, reguladoras,
señalizadoras..., organizándose en enormes redes funcionales de interacciones. En definitiva, el
proteoma fundamenta la particular morfología y funcionalidad de cada célula. Asimismo, la
organización estructural y funcional de las distintas células conforma cada tejido y cada órgano, y,
finalmente, el organismo vivo en su conjunto. Así, el genoma humano contiene la información
básica necesaria para el desarrollo físico de un ser humano completo.
Conocer la secuencia completa del genoma humano puede tener mucha relevancia cuanto a los
estudios de biomedicina y genética clínica, desarrollando el conocimiento de enfermedades poco
estudiadas, nuevas medicinas y diagnósticos más fiables y rápidos. Sin embargo descubrir toda la
secuencia génica de un organismo no nos permite conocer su fenotipo. Como consecuencia, la
ciencia de la genómica no podría hacerse cargo en la actualidad de todos los problemas éticos y
sociales que ya están empezando a ser debatidos. Por eso el PGH necesita una regulación legislativa
relativa al uso del conocimiento de la secuencia genómica, pero no tendría por qué ser un
impedimento en su desarrollo, ya que el saber en sí, es inofensivo.
Antes de los ochenta ya se conocía la secuencia de genes sueltos de algunos organismos, como
también se conocían los genomas de entidades subcelulares, tales como virus y plásmidos. Así pues,
no fue hasta 1986 cuando el Ministerio de Energía (DOE), concretó institucionalmente el Proyecto
Genoma Humano (PGH) durante un congreso en Santa Fe. El PGH contaba con una buena suma
económica y sería utilizado para estudiar los posibles efectos de las radiaciones sobre el ADN. Al
siguiente año, en el congreso de biólogos en el Laboratorio de Cold Spring Harbor, el Instituto
Nacional de la Salud (NIH) quiso participar del proyecto al ser otro organismo público con mucha
más experiencia biológica, si bien no tanta en la organización de proyectos de esta magnitud.
El debate público que suscitó la idea captó la atención de los responsables políticos, no solo porque
el Proyecto Genoma Humano era un gran reto tecnocientífico, sino por las tecnologías de
vanguardia que surgirían, así como porque el conocimiento obtenido aseguraría la superioridad
tecnológica y comercial del país. Antes de dar luz verde a la iniciativa del PGH se necesitó por un
lado el informe de 1988 de la Oficina de Evaluación Tecnológica del Congreso (OTA) y el del
Consejo Nacional de Investigación (NRC). Ese año se inauguró HUGO (Organización del Genoma
Humano) y James D. Watson fue nombrado alto cargo del proyecto. Sería reemplazado por Francis
Collins en abril de 1993, en gran parte por su enemistad con Bernadine Healy que era su jefe por
aquel entonces. Tras esto el nombre del Centro cambió a Instituto Nacional de Investigaciones del
Genoma Humano (NHGRI).
En 1990 se inauguró definitivamente el Proyecto Genoma Humano calculándose quince años de
trabajo. Sus objetivos principales en una primera etapa eran la elaboración de mapas genéticos y
físicos de gran resolución, mientras se ponían a punto nuevas técnicas de secuenciación, para poder
abordar todo el genoma. Se calculó que el PGH americano necesitaría unos 3000 millones de
dólares y terminaría en 2005. En 1993 los fondos públicos aportaron 170 millones de dólares,
mientras que la industria gastó aproximadamente 80 millones. Con el paso de los años, la inversión
privada cobró relevancia y amenazó con adelantar a las financiaciones públicas.
En 1984 comenzaron las actividades propias del PGH, coincidiendo con la idea de fundar un
instituto para la secuenciación del genoma humano por parte de Robert Sanshheimerm, en ese
momento Rector de la Universidad de California. De forma independiente el Departamento de
Energía de Estados Unidos (DOE) se interesó por el proyecto, al haber estudiado los efectos que las
actividades de sus programas nucleares producían en la genética y en las mutaciones. Entonces se
conocía como "Proyecto HUGO".
En su comienzo, el Proyecto Genoma Humano, enfrentó a dos clases de científicos: de un lado, los
biólogos moleculares universitarios y del otro, biólogos de institutos de investigación del Instituto
Nacional de Salud, organismo estatal que percibía grandes sumas económicas federales destinadas a
la investigación. Si bien el enfrentamiento se basó en la preocupación de ambos científicos por la
magnitud y los costos de la empresa a llevar a cabo, existían sobre todo discrepancias para definir
las vías más adecuadas a la hora de lograr los objetivos fijados. Solo debemos observar los 28.2
millones de dólares destinados al periodo 88-89 para ubicarnos “materialmente”. Por su parte, los
Estados Unidos se comprometieron a destinar parte de los fondos económicos del proyecto al
estudio de los aspectos éticos y sociales del PGH.
James Watson asumió en 1988 la dirección ejecutiva de la Investigación del Genoma Humano en el
NIH (Instituto Nacional de Salud). Al asumir el cargo, firmó un acuerdo de cooperación con el DOE
mediante el cual ambas instituciones se ayudarían mutuamente. De esta forma el PGH comenzó con
el liderazgo del NIH en lugar del DOE. El interés internacional por el proyecto creció de forma
notable, motivado fundamentalmente por no quedar por detrás de Estados Unidos en un tema de
tanta importancia. Para evitar repeticiones y solapamientos en los logros, se creó HUGO
(Organización del Genoma Humano) para coordinar los trabajos de investigación.
En 1994 Craig Venter funda, con un financiamiento mixto, el Instituto para la Investigación
Genética (TIGR) que se dio a conocer públicamente en 1995 con el descubrimiento de la secuencia
nucleotídica del primer organismo completo publicado, la bacteria Haemophilus influenzae con
cerca de 1740 genes (1.8 Mb). En mayo de 1998 surgió la primera empresa relacionada con el PGH
llamada Celera Genomics. La investigación del proyecto se convirtió en una carrera frenética en
todos los laboratorios relacionados con el tema, ya que se intentaba secuenciar trozos de
cromosomas para rápidamente incorporar sus secuencias a las bases de datos y atribuirse la
prioridad de patentarlas.
El 6 de abril de 2000 se anunció públicamente la terminación del primer borrador del genoma
humano secuenciado que localizaba a los genes dentro de los cromosomas. Los días 15 y 16 de
febrero de 2001, las dos prestigiosas publicaciones científicas americanas, Nature y Science,
publicaron la secuenciación definitiva del Genoma Humano, con un 99.9% de fiabilidad y con un
año de antelación a la fecha presupuesta. Sucesivas secuenciaciones condujeron finalmente al
anuncio del genoma esencialmente completo en abril de 2003, dos años antes de lo previsto.1 En
mayo de 2006 se alcanzó otro hito en la culminación del proyecto al publicarse la secuencia del
último cromosoma humano en la revista Nature.

Objetivos
Desde el principio de la investigación, se propuso desarrollar el PGH a través de dos vías
independientes, pero relacionadas y ambas esenciales:
• Secuenciación: se trataba de averiguar la posición de todos los nucleótidos del genoma
(cada una de las cuatro posibles bases nitrogenadas típicas del ADN).
• Cartografía o mapeo genético: consistía en localizar los genes en cada uno de los 23 pares
de cromosomas del ser humano.
-Identificación de los genes en el genoma humano:El Genoma humano está compuesto por
aproximadamente 30.000 genes, cifra bastante próxima a la mencionada en el borrador del
proyecto, publicado en el año 2000, ocasión en la que las genes oscilaban entre 26.000 y 38.000.
Otra peculiaridad del PGH es que la cifra de genes humanos es solo dos o tres veces mayor que la
encontrada en el genoma de Drosophila, y cualitativamente hablando, existen genes comunes a los
de bacterias y que no han sido hallados en nuestros ancestros.
-Determinación de la secuencia de las bases nitrogenadas que forman el ADN humano:Los
humanos poseen poco más de 3 mil millones de bases nitrogenadas, similar al tamaño de genomas
de otros vertebrados.
-Mantenimiento a resguardo de la información anterior creando bases de datos de acceso
público:En estos momentos son una realidad las bases de datos donde se almacena toda la
información surgida del Proyecto Genoma Humano. Si accedemos a Internet podremos conocer
libremente aspectos de alto interés en la comparación entre genomas de distintas especies de
animales y plantas. Gracias al uso libre de este conocimiento es posible determinar la función de los
genes, así como averiguar cómo las mutaciones influyen en la síntesis de proteínas.
-Aprovisionamiento de herramientas multimedia para el análisis de datos:Se ha inducido un
gran desarrollo tecnológico a partir de la creación de herramientas de análisis de datos generadas en
el Proyecto Genoma Humano. Este desarrollo facilitará y hará posible definir los temas de estudio
futuros con vistas a las tareas pendientes. Entre las tecnologías beneficiadas gracias al PGH figuran
las de manejo computacional de datos, las que permiten la generación de las anteriores, técnicas de
biología molecular relacionadas con la secuenciación de trozos de ADN automáticamente y aquellas
que permiten ampliar la cantidad de material genético disponible como la PCR.
-Transferencia de tecnología relacionada con el tema al sector privado:Se ha producido una
importante corriente de liberación de derechos que anteriormente estaban en manos del Estado, en
relación a la transferencia de tecnologías al sector privado. Esta medida ha suscitado aplausos y
críticas. Por un lado se amplía el acceso libre a los datos del Proyecto con lo que muchas más
personas pueden seguir estudiando este campo, pero por otro esto puede suponer el incremento de
poder de ciertos sectores que a su vez, aumentaran su influencia en la sociedad.
-Supervisión de los temas éticos, legales y sociales derivados del Proyecto:Para terminar, se
puede afirmar que el objetivo relacionado con el estudio de la ética del PGH es un tema de gran
controversia actual, y ha necesitado de grandes sumas de dinero estatales así como de un importante
trabajo de laboratorios e investigadores. Todo esto ha provocado un deterioro del apoyo a otros
proyectos de investigación no menos importantes, que se han visto muy afectados o incluso
cancelados.

Métodos de estudio
Existen dos técnicas de cartografía genética principales: el ligamiento, que intenta averiguar el
orden de los genes; y la cartografía física, que se encarga de estudiar la distancia de los genes en el
interior del cromosoma. Las dos técnicas utilizan marcadores genéticos, que son características
moleculares o físicas que se heredan, y son detectables y distintas para cada individuo.
Thomas Hunt Morgan desarrolló en la década de 1900 la cartografía mediante ligamiento al estudiar
la frecuencia con la que ciertas características se heredaban unidas en moscas de la fruta. Así llegó a
la conclusión de que algunos genes debían estar ligados en los cromosomas. Los mapas de
ligamiento humano se han creado estudiando pautas de herencia de familias muy extensas y con
varias generaciones conocidas. Aunque al principio se limitaban a los rasgos físicos heredables,
fácilmente reconocibles, actualmente hay técnicas más elaboradas que permiten crear mapas de
ligamiento comparando la posición de genes diana en comparación con el orden de los marcadores
genéticos o de partes conocidas del ADN.
La cartografía física es capaz de medir la distancia real entre puntos de los cromosomas. Las
técnicas más avanzadas combinan robótica, informática y uso de láser para calcular la distancia
entre marcadores genéticos conocidos. Para conseguirlo, se fragmenta el ADN de los cromosomas
humanos aleatoriamente. A continuación se duplican muchas veces para estudiar en los clones, que
son las secuencias duplicadas, la ausencia o presencia de marcas genéticas identificables. Los
clones que comparten varias marcas provienen de segmentos solapados normalmente. Estas
regiones pueden utilizarse después para determinar el orden de las marcas en los cromosomas y su
secuencia. Para obtener la secuencia real de nucleótidos hacen falta mapas físicos altamente
detallados que recogen el orden de las piezas clonadas con exactitud.
En el Proyecto Genoma Humano se utilizó un método de secuenciación desarrollado por Frederick
Sanger, bioquímico británico y dos veces premio Nobel. Este método replica piezas específicas de
ADN y las modifica de modo que acaben en una forma fluorescente.
Actualmente se detecta el nucleótido modificado del extremo de las cadenas con modernos
secuenciadores de ADN automáticos. Estos determinan los nucleótidos que hay exactamente en la
cadena. A continuación se combina esta información de manera informatizada, y así se reconstruye
la secuencia de pares de bases del ADN original. Un aspecto muy importante es duplicar
rápidamente y con exactitud el ADN, tanto para después cartografiarlo como para secuenciarlo. Al
comienzo de la investigación en este campo se clonaba el material genético introduciéndolo en
organismos unicelulares de rápida división, pero en la década de los ochenta se generalizó el uso de
la PCR (reacción en cadena de polimerasa). Esta técnica se puede automatizar fácilmente y es capaz
de copiar una sola molécula de ADN muchos millones de veces en poco tiempo. Kary Mullis
obtuvo el Premio Nobel de Química por idearla, en 1993.

Ventajas
El trabajo sobre la interpretación de los datos del genoma se encuentra todavía en sus etapas
iniciales. Se prevé que un conocimiento detallado del genoma humano ofrecerá nuevas vías para los
avances de la medicina y la biotecnología. Por ejemplo, un número de empresas, como Myriad
Genetics ha empezado a ofrecer formas sencillas de administrar las pruebas genéticas que pueden
mostrar la predisposición a una variedad de enfermedades, incluyendo cáncer de mama, los
trastornos de la hemostasia, la fibrosis quística, enfermedades hepáticas y muchas otras. Además, la
etiología de los cánceres, la enfermedad de Alzheimer y otras áreas de interés clínico se consideran
susceptibles de beneficiarse de la información sobre el genoma y, posiblemente, pueda a largo plazo
conducir a avances significativos en su gestión.
Hay también muchos beneficios tangibles para los biólogos. Por ejemplo, un investigador de la
investigación de un determinado tipo de cáncer puede haber reducido su búsqueda a un determinado
gen. Al visitar la base de datos del genoma humano en la World Wide Web, este investigador puede
examinar lo que otros científicos han escrito sobre este gen, incluyendo (potencialmente) la
estructura tridimensional de su producto; su/s función/es; sus relaciones evolutivas con otros genes
humanos, o genes de ratones, levaduras, moscas de la fruta; las posibles mutaciones perjudiciales;
las interacciones con otros genes; los tejidos del cuerpo en el que este gen es activado; las
enfermedades asociadas con este gen u otro tipo de datos. Además, la comprensión más profunda de
los procesos de la enfermedad en el ámbito de la biología molecular puede determinar nuevos
procedimientos terapéuticos. Dada la importancia del ADN en biología molecular y su papel central
en la determinación de la operación fundamental de los procesos celulares, es probable que la
ampliación de los conocimientos en este ámbito facilite los avances médicos en numerosas áreas de
interés clínico que puede no haber sido posible por otros métodos.
El análisis de las similitudes entre las secuencias de ADN de diferentes organismos es también la
apertura de nuevas vías en el estudio de la evolución. En muchos casos, las cuestiones de evolución
ahora se pueden enmarcar en términos de biología molecular y, de hecho, muchos de los grandes
hitos evolutivos (la aparición de los ribosomas y orgánulos, el desarrollo de planes de embriones
con el cuerpo, el sistema inmune de vertebrados) pueden estar relacionados a nivel molecular.
Muchas de las preguntas acerca de las similitudes y diferencias entre los seres humanos y nuestros
parientes más cercanos (los primates, y de hecho los otros mamíferos) se espera que sean
iluminados por los datos de este proyecto.
El Proyecto Diversidad del Genoma Humano (PDGH), derivado de investigaciones dirigidas a la
asignación del ADN humano - que varía entre los grupos étnicos - que se rumorea que ha sido
detenido, realmente continúa y hasta la fecha ha arrojado nuevas conclusiones. En el futuro, el PGH
podría exponer nuevos datos en la vigilancia de las enfermedades, el desarrollo humano y la
antropología. El PGH podría desbloquear secretos y crear nuevas estrategias para combatir la
vulnerabilidad de los grupos étnicos a ciertas enfermedades. También podría mostrar cómo las
poblaciones humanas se han adaptado a estas vulnerabilidades.
Además, el PGH tiene una consecuencia muy importante, y es que se pueden conocer la base
molecular de ciertas enfermedades hereditarias y que se puede realizar un diagnóstico de las
mismas.

-Conocer las bases moleculares de las enfermedades hereditarias:
Una de las aplicaciones más directas de conocer la secuencia de genes que componen el genoma
humano es que se puede conocer la base molecular de muchas enfermedades genéticas y se puede
realizar un diagnóstico adecuado. Algunas de estas enfermedades son las siguientes:
-Enfermedad de Gaucher: esta enfermedad es producida por una mutación recesiva en el gen que
codifica la proteína glucocerebrosidasa, que se localiza en el cromosoma 1. Esta enzima se encarga
de metabolizar los glucocerebrósidos (un tipo de lípidos). En los enfermos de Gaucher, estos lípidos
no pueden ser descompuestos y se acumulan principalmente en el hígado, en el bazo y en la médula
ósea. Los síntomas de la enfermedad de Gaucher incluyen fuertes dolores, fatiga, ictericia, daños
óseos, anemia y muerte. Gracias al PGH se pudo realizar la primera terapia efectiva contra esta
enfermedad, inyectándose la enzima sintetizada en escherichia coli en el torrente sanguíneo de los
enfermos. Esto detiene el avance de los síntomas y en muchos casos los revierte.
-Enfermedad de Alzheimer: Esta enfermedad es una enfermedad degenerativa que destruye el
cerebro, haciendo que los enfermos pierdan la memoria y el juicio, y que finalmente impide que se
puedan valer por sí solos. El único método seguro para diagnosticar la enfermedad de Alzheimer se
encuentra en la autopsia, pero se ha sabido que puede ser de origen genético en un 20% de los
casos. Gracias al PGH se han localizado marcadores para el Alzheimer de origen genético en los
cromosomas 1, 14, 19 y 21.
-Enfermedad de Huntington: Esta enfermedad es también una enfermedad degenerativa y
conduce a un deterioro mental que termina en demencia. Normalmente comienza a aparecer entre
los 30 y los 50 años y presenta síntomas tales como cambios en la personalidad y en el estado de
ánimo, depresión y pérdida gradual del control sobre los movimientos voluntarios, causando
espasmos primero y grandes movimientos al azar posteriormente. Esta enfermedad presenta una
herencia autosómica dominante, es decir, si uno de los padres la posee, sus hijos tienen el 50% de
probabilidad de padecerla también. La Enfermedad de Huntington no se salta generaciones. Si no se
hereda el gen, no se puede transmitir a la descendencia. Del mismo, modo, si se hereda el gen,
inevitablemente se padecerá la enfermedad, más tarde o más temprano. En 1993 se consiguió aislar
el gen que provoca esta enfermedad, localizado en el cromosoma 4, y en lo que se han ido
desarrollando las investigaciones posteriores, ha sido fundamentalmente en conocer las razones que
hacen que la Enfermedad de Huntingnton se manifieste de forma tardía, y muchas líneas de
investigación están dirigidas a encontrar un tratamiento y una cura.
-Síndrome de Marfan: Es una enfermedad congénita del tejido conectivo que afecta a numerosos
órganos y sistemas, incluyendo el esqueleto, los pulmones, los ojos, el corazón y los vasos
sanguíneos. Esta enfermedad se caracteriza por un crecimiento anormal de las extremidades
(especialmente de los dedos), una dislocación parcial del cristalino (en el 50% de los pacientes),
anormalidades cardiovasculares (la arteria aorta suele ser más ancha y más frágil que en las
personas normales) y otras deformaciones. El síndrome de Marfan es también una enfermedad
autosómica dominante, por lo que los descendientes de personas afectadas poseen el 50% de
posibilidades de padecerla. La enfermedad está asociada al gen FBN1, localizado en el cromosoma
15. El FBN1 codifica una proteína llamada fibrilina, que es esencial para la formación de fibras
elásticas del tejido conectivo. Sin el soporte estructural de las fibras elásticas, muchos tejidos
presentan una debilidad que puede conducir los síntomas comentados anteriormente.

-Diagnósticos de enfermedades posibles al PGH:
Estos son algunos ejemplos de enfermedades que se han podido diagnosticar gracias, de una u otra
manera, al conocimiento de las secuencias genéticas tras la secuenciación del genoma por el
Proyecto Genoma Humano. El diagnóstico de cierta enfermedad, gracias al PGH se puede realizar
de manera presintomática y prenatal.
El conocimiento de la base molecular de las enfermedades permite realizar el diagnóstico
presintomático y gracias a él tomar medidas preventivas, como alteraciones en el estilo de vida,
evitar la exposición a factores de riesgo, realizar un seguimiento continuo del individuo o realizar
intervenciones puntuales, para poder tratar la enfermedad aunque todavía no haya aparecido.
En cuanto al diagnóstico prenatal, éste consiste en un conjunto de técnicas que sirven para conocer
la adecuada formación y el correcto desarrollo del feto antes de su nacimiento, para poder conocer
posibles malformaciones desde los primeros estadios de desarrollo del embrión. La técnica más
común de diagnóstico prenatal es la amniocentesis, que consiste en el análisis del líquido amniótico
que rodea al feto durante el embarazo. Las células desprendidas del feto y que flotan en dicho
líquido sirven para obtener un recuento exacto de cromosomas y para detectar cualquier estructura
cromosómica anormal. El diagnóstico prenatal conlleva una importante polémica. Las mujeres cuyo
hijo se observe que presentan características de padecer cierta enfermedad o que presentan
malformaciones en sus cromosomas, decidirán abortar, lo que para los detractores del aborto es una
aberración. La polémica está también alimentada por el hecho de que se pueden conocer tanto
enfermedades que se desarrollen desde el primer día de vida del individuo como enfermedades que
pueden aparecer a su edad avanzada, como el Alzheimer, por ejemplo. En ese caso, ¿abortaríamos a
un feto que puede presentar la Enfermedad de Alzheimer casi al final de su vida, privándole de una
vida previa normal? Esto conlleva también a realizar un baremo de qué enfermedades podrían
considerarse suficientes para realizar el aborto, poniéndose por ejemplo, el daltonismo.
Por otra parte, y como consecuencia del desarrollo de las técnicas de la fecundación in vitro, hoy en
día se puede realizar el conocido como diagnóstico genético preimplantacional (DGPI). Éste
permite testar los embriones desde un punto de vista genético y cromosómico para así elegir el que
se encuentre sano e implantarlo en el útero de la madre. El DGPI evita la gestación de un niño
afectado genética o cromosómicamente, y conlleva la decisión de los padres de realizar, en su caso,
un aborto terapéutico.

-Terapia génica, terapia farmacológica y medicina predictiva:
Una vez que se conocen qué genes producen qué enfermedades, y las características para
diagnosticar una enfermedad conociendo la secuencia de bases, es necesario realizar una terapia
para acabar con esa enfermedad, ya que de ser de otra manera, el diagnóstico de una enfermedad no
es más que una carga emocional que el paciente tiene que soportar de la mejor manera posible,
conviviendo con la impotencia y la ansiedad que le puede suponer a un paciente el saber que en un
determinado lapso de tiempo es posible que padezca una enfermedad. Una consecuencia, por tanto,
del PGH es desarrollar terapias contra las enfermedades que ha diagnosticado. Se conocen la terapia
génica, la terapia farmacológica y la medicina predictiva:
-La terapia génica es una consecuencia directa del PGH y supone la probabilidad de curar las
enfermedades hereditarias cartografiadas por éste, insertando copias funcionales de genes
defectivos o ausentes en el genoma de un individuo para tratar dicha enfermedad. Las técnicas
actuales de terapia génica no pueden asegurar que el gen se inserte en un lugar apropiado del
genoma, existe la posibilidad de que interfiera con el funcionamiento de un gen importante o
incluso que active un oncogén, provocando así un cáncer en el paciente. Sin embargo, estas técnicas
sólo se utilizan con pacientes que ya corren peligro inminente de muerte, por lo que la posibilidad
de contraer un cáncer en un futuro incierto no constituye un impedimento muy grave para aceptar el
tratamiento.
El primer caso que se conoce de terapia génica tuvo lugar en los NIH (National Institutes of Health.
En español: Institutos Nacionales de la Salud), en Bethesda, Maryland. Consistió en la inoculación
de glóbulos blancos genéticamente modificados a una niña que padecía inmunodeficiencia severa
combinada (deficiencia de adenosina-desaminasa o ADA). Esta enfermedad es una enfermedad
rara, y la carencia de ADA se puede tratar con trasplantes de médula ósea. Sin embargo, el
trasplante sólo es posible si el paciente tiene un hermano que no esté afectado por la enfermedad y
que sea compatible. Otra posibilidad es inyectar la proteína directamente, pero las inyecciones no
llegan inmediatamente al lugar necesario y constituyen un mal sucedáneo de los sutiles mecanismos
que controlan y dirigen la producción de ADA en circunstancias normales. La operación consistió
en la extracción de linfocitos T de la paciente, su modificación genética y su reimplantación. Con
esto las células comenzaron a producir la ADA.
Cuando se realizó esta primera intervención, los doctores de los NIH estudiaron las implicaciones
éticas que podía tener esta operación y llegaron a la conclusión de que no existía diferencia moral
con respecto a cualquier tipo de trasplante de tejidos o de órganos. Esta comparación residía en que
los genes trasplantados sólo afetaban a las células somáticas del individuo, de modo que sólo
afectaban a la niña misma y que no lo harían por tanto a su descendencia. Podemos diferenciar
entonces dos tipos de terapia génica, en línea somática y en línea germinal. Esta última consiste en
introducir genes nuevos, biológicamente funcionales, en células germinales (óvulos y/o
espermatozoides) antes de que se produzca la fecundación. El embrión que surge tras la fecundación
partirá de una única célula modificada genéticamente, por lo que todas sus células posteriores
presentarán la misma modificación, incluyendo las futuras células germinales que producirá,
pudiendo transmitir sus características a las generaciones futuras.
Todos los estudios nacionales han rechazado la terapia en línea germinal, de momento, ya que
opinan que todavía no se dispone de los suficientes conocimientos para evaluar los riesgos que
supone este tipo de terapia y que es necesario realizar un estricto examen ético antes de comenzar a
aplicarla, si esto se acabara produciendo.

-La terapia farmacológica se ve también facilitada por el PGH ya que éste permite encontrar
alteraciones en la secuencia del ADN de genes específicos y esto conlleva a que se realice el
tratamiento con medicamentos de una manera dirigida, neutralizando las alteraciones y modificando
favorablemente el curso de la enfermedad de forma más efectiva que los tratamientos de la
medicina actual, que están generalmente dirigidos a aliviar los síntomas.
El PGH permite además, en relación con la farmacología, modificar los medicamentos para que se
ajusten a las características genéticas del paciente y así poder metabolizar el fármaco de la mejor
manera posible, lo que en consecuencia, elimina o minimiza los efectos secundarios indeseables del
mismo. Gracias al PGH el médico tendrá un perfil genético del paciente antes de iniciar el
tratamiento.

-La medicina predictiva permite diagnosticar enfermedades, gracias a los conocimientos del
genoma, que aún no se han desarrollado en el paciente. Se distinguen dos tipos de enfermedades
que se pueden diagnosticar mediante la medicina predictiva. Las monogénicas, que se pueden
identificar fácilmente ya que se conocen perfectamente las leyes deterministas que las regulan; y las
poligénicas, para cuyo buen estudio es necesario realizar sondeos poblacionales. Por ejemplo se
pueden encontrar los genes que regulan el nivel de colesterol en la sangre (unos veinte).
Determinadas combinaciones de variedades de estos genes sitúan al sujeto en un grupo de riesgo de
padecer enfermedades tempranas de las arterias coronarias y ataques cardíacos. Si además el sujeto
lleva una dieta rica en grasas animales y una vida sedentaria (también influyen por tanto agentes
externos como puede ser el modo de vida y la alimentación), es muy posible que muera de infarto
antes de los cincuenta años. La meta es conocer exactamente qué combinaciones de genes son
especialmente peligrosas y en esto tiene un papel muy importante el Proyecto Genoma Humano. La
medicina predictiva también causa una importante controversia en la sociedad ya que los estudios
poblaciones que se realizan para estudiar las enfermedades poligénicas se pueden utilizar para
discriminar a ciertas personas o grupos, lo que se llamaría discriminación genética
Aspectos éticos:
Aunque la medicina proporciona la base para la evolución de la bioética, actualmente somos
testigos de su aplicación a la investigación científica relacionada. Así pues, el PGH ha dado lugar a
una de las áreas de conocimiento biológico con mayor crecimiento. Los conocimientos genómicos
derivados del Proyecto Genoma Humano, se utilizan para mejores y más rápidos diagnósticos
basados en el análisis directo del ADN, e incluso para el diagnóstico prenatal en aquellos casos en
los que se sospecha que el bebé tenga alteraciones morfológicas, funcionales o ponga en peligro la
vida de su madre. También es posible aplicar este conocimiento a personas asintomáticas para
averiguar si han heredado de algún progenitor una mutación causal de una enfermedad genética que
pueda desarrollarse en el futuro.
Así planteado el tema, se percibe entonces una importante brecha entre la capacidad diagnóstica y
predictiva del conocimiento genómico por un lado, y la falta de intervenciones preventivas y
terapéuticas por otro, lo que lleva a conflictos éticos surgidos del Proyecto Genoma Humano.
Además hay determinadas áreas como el asesoramiento a parejas en riesgo de transmitir
enfermedades genéticas a su descendencia, que han suscitado mucho interés y para las que se han
dictado una serie de principios éticos:
• Respeto a la dignidad individual y a la inteligencia básica de las personas, así como a sus
decisiones médicas y reproductivas (libre elección de interrumpir o continuar un embarazo
con riesgo).
• Informar objetivamente al paciente sin tener en cuenta los valores subjetivos del profesional
médico.
• Protección a la privacidad de la información genética.
• Desmitificación del Proyecto Genoma Humano, aclarando verdaderamente su alcance con
acciones específicas en educación.
Otro problema de gran importancia es la obtención de patentes de genes por parte de compañías
biotecnológicas, gobiernos y centros de investigación universitarios, para una posterior venta o
explotación comercial, sin tener en cuenta que parte de los fondos empleados en el PGH era de los
contribuyentes. También debemos observar el PGH contextualizado social e históricamente,
atendiendo a la desigualdad social y económica entre países, que va a producir una inequidad en el
acceso a los beneficios que se extraigan de la investigación.
Una solución a todas estas tensiones podría ser la formación de profesores de ciencias o la
enseñanza directa a estudiantes como una forma de abrir las mentes y aclarar definitivamente el
alcance del Proyecto Genoma Humano en la sociedad. Pero es imprescindible incorporar temas de
bioética a los programas de enseñanza.
Tanto en Estados Unidos como en la Unión Europea se han desarrollado programas para contemplar
las consecuencias éticas y sociales de la investigación científica y que no se produzcan conflictos.
En Estados Unidos se encuentra el ELSI y fuera de ellos se encuentra la Declaración Universal
sobre el Genoma Humano y los Derechos Humanos, promovida por la UNESCO.
A continuación y para terminar se expondrán los descubrimientos y conclusiones sacados del
Proyecto Genoma Humano:

Componentes
Cromosomas:
El genoma humano (como el de cualquier organismo eucariota) está formado por cromosomas, que
son largas secuencias continuas de ADN altamente organizadas espacialmente (con ayuda de
proteínas histónicas y no histónicas) para adoptar una forma ultracondensada en metafase. Son
observables con microscopía óptica convencional o de fluorescencia mediante técnicas de
citogenética y se ordenan formando un cariotipo.
El cariotipo humano normal contiene un total de 23 pares de cromosomas distintos: 22 pares de
autosomas más 1 par de cromosomas sexuales que determinan el sexo del individuo. Los
cromosomas 1-22 fueron numerados en orden decreciente de tamaño en base al cariotipo. Sin
embargo, posteriormente pudo comprobarse que el cromosoma 22 es en realidad mayor que el 21.
Las células somáticas de un organismo poseen en su núcleo un total de 46 cromosomas (23 pares):
una dotación de 22 autosomas procedentes de cada progenitor y un par de cromosomas sexuales, un
cromosoma X de la madre y un X o un Y del padre. Los gametos -óvulos y espermatozoidesposeen una dotación haploide de 23 cromosomas.

Representación gráfica del cariotipo humano normal

ADN intragénico
-Genes:
Un gen es la unidad básica de la herencia, y porta la información genética necesaria para la síntesis
de una proteína (genes codificantes) o de un ARN no codificante (genes de ARN). Está formado por
una secuencia promotora, que regula su expresión, y una secuencia que se transcribe, compuesta a
su vez por: secuencias UTR (regiones flanqueantes no traducidas), necesarias para la traducción y la
estabilidad del ARNm, exones (codificantes) e intrones, que son secuencias de ADN no traducidas
situadas entre dos exones que serán eliminadas en el procesamiento del ARNm (ayuste).
Actualmente se estima que el genoma humano contiene entre 20.000 y 25.000 genes codificantes de
proteínas, estimación muy inferior a las predicciones iniciales que hablaban de unos 100.000 genes
o más. Esto implica que el genoma humano tiene menos del doble de genes que organismos
eucariotas mucho más simples, como la mosca de la fruta o el nematodo Caenorhabditis elegans.
Sin embargo, las células humanas recurren ampliamente al splicing (ayuste) alternativo para
producir varias proteínas distintas a partir de un mismo gen, como consecuencia de lo cual el
proteoma humano es más amplio que el de otros organismos mucho más simples. En la práctica, el
genoma tan sólo porta la información necesaria para una expresión perfectamente coordinada y
regulada del conjunto de proteínas que conforman el proteoma, siendo éste el encargado de ejecutar
la mayor parte de las funciones celulares.
Con base en los resultados iniciales arrojados por el proyecto ENCODE (acrónimo de
ENCyclopedia Of DNA Elements), algunos autores han propuesto redefinir el concepto actual de
gen. Las observaciones más recientes hacen difícilmente sostenible la visión tradicional de un gen,
como una secuencia formada por las regiones UTRs, los exones y los intrones. Estudios detallados
han hallado un número de secuencias de inicio de transcripción por gen muy superior a las
estimaciones iniciales, y algunas de estas secuencias se sitúan en regiones muy alejadas de la
traducida, por lo que los UTR 5' pueden abarcar secuencias largas dificultando la delimitación del
gen. Por otro lado, un mismo transcrito puede dar lugar a ARN maduros totalmente diferentes
(ausencia total de solapamiento), debido a una gran utilización del splicing alternativo. De este
modo, un mismo transcrito primario puede dar lugar a proteínas de secuencia y funcionalidad muy
dispar. En consecuencia, algunos autores han propuesto una nueva definición de gen, la unión de
secuencias genómicas que codifican un conjunto coherente de productos funcionales,
potencialmente solapantes. De este modo, se identifican como genes los genes ARN y los
conjuntos de secuencias traducidas parcialmente solapantes (se excluyen, así, las secuencias UTR y
los intrones, que pasan a ser considerados como "regiones asociadas a genes", junto con los
promotores). De acuerdo con esta definición, un mismo transcrito primario que da lugar a dos
transcritos secundarios (y dos proteínas) no solapantes debe considerarse en realidad dos genes
diferentes, independientemente de que estos presenten un solapamiento total o parcial de sus
transcritos primarios.
Las nuevas evidencias aportadas por ENCODE, según las cuales las regiones UTR no son
fácilmente delimitables y se extienden largas distancias, obligarían a reidentificar nuevamente los
genes que en realidad componen el genoma humano. De acuerdo con la definición tradicional
(actualmente vigente), sería necesario identificar como un mismo gen a todos aquellos que muestren
un solapamiento parcial (incluyendo las regiones UTR y los intrones), con lo que a la luz de las
nuevas observaciones, los genes incluirían múltiples proteínas de secuencia y funcionalidad muy
diversa. Colateralmente se reduciría el número de genes que componen el genoma humano. La
definición propuesta, en cambio, se fundamenta en el producto funcional del gen, por lo que se
mantiene una relación más coherente entre un gen y una función biológica. Como consecuencia,
con la adopción de esta nueva definición, el número de genes del genoma humano aumentará
significativamente.
-Genes de ARN:
Además de los genes codificantes de proteínas, el genoma humano contiene varios miles de genes
ARN, cuya transcripción reproduce ARN de transferencia (ARNt), ARN ribosómico (ARNr),
microARN (miARN), u otros genes ARN no codificantes. Los ARN ribosómico y de transferencia
son esenciales en la constitución de los ribosomas y en la traducción de las proteínas. Por su parte,
los microARN tienen gran importancia en la regulación de la expresión génica, estimándose que
hasta un 20-30% de los genes del genoma humano puede estar regulado por el mecanismo de
interferencia por miARN. Hasta el momento se han identificado más de 300 genes de miARN y se
estima que pueden existir unos 500.
-Distribución de genes:
A continuación se muestran algunos valores promedio del genoma humano. Cabe advertir, sin
embargo, que la enorme heterogeneidad que presentan estas variables hace poco representativos a
los valores promedio, aunque tienen valor orientativo.
La densidad media de genes es de 1 gen cada 100 kb, con un tamaño medio de 20-30 kb, y un
número de exones promedio de 7-8 por cada gen, con un tamaño medio de 150 nucleótidos. El
tamaño medio de un ARNm es de 1,8-2,2 kb, incluyendo las regiones UTR (regiones no traducidas
flanqueantes), siendo la longitud media de la región codificante de 1,4 kb.
El genoma humano se caracteriza por presentar una gran heterogeneidad en su secuencia. En
particular, la riqueza en bases de guanina (G) y citosina (C) frente a las de adenina (A) y timina (T)
se distribuye heterogéneamente, con regiones muy ricas en G+C flanqueadas por regiones muy
pobres, siendo el contenido medio de G+C del 41%, menor al teóricamente esperado (50%). Dicha
heterogeneidad esta correlacionada con la riqueza en genes, de manera que los genes tienden a
concentrarse en las regiones más ricas en G+C. Este hecho era conocido ya desde hace años gracias
a la separación mediante centrifugación en gradiente de densidad de regiones ricas en G+C (que
recibieron el nombre de isócoros H; del inglés High) y regiones ricas en A+T (isócoros L; del inglés
Low).

Isócoros. Riqueza en G+C y genes en el genoma humano

-Secuencias reguladoras:
El genoma tiene diversos sistemas de regulación de la expresión génica, basados en la regulación de
la unión de factores de transcripción a las secuencias promotoras, en mecanismos de modificación
epigenética (metilación del ADN o metilación-acetilación de histonas) o en el control de la
accesibilidad a los promotores determinada por el grado de condensación de la cromatina; todos
ellos muy interrelacionados. Además hay otros sistemas de regulación a nivel del procesamiento,
estabilidad y traducción del ARNm, entre otros. Por lo tanto, la expresión génica está intensamente
regulada, lo cual permite desarrollar los múltiples fenotipos que caracterizan los distintos tipos
celulares de un organismo eucariota multicelular, al mismo tiempo que dota a la célula de la
plasticidad necesaria para adaptarse a un medio cambiante. No obstante, toda la información
necesaria para la regulación de la expresión génica, en función del ambiente celular, está codificada
en la secuencia de ADN al igual que lo están los genes.
Las secuencias reguladoras son típicamente secuencias cortas presentes en las proximidades o en el
interior (frecuentemente en intrones) de los genes. En la actualidad, el conocimiento sistemático de
estas secuencias y de cómo actúan en complejas redes de regulación génica, sensibles a señales
exógenas, es muy escaso y está comenzando a desarrollarse mediante estudios de genómica
comparada, bioinformática y biología de sistemas. La identificación de secuencias reguladoras se
basa en parte en la búsqueda de regiones no codificantes evolutivamente conservadas. Por ejemplo,
la divergencia evolutiva entre el ratón y el ser humano ocurrió hace 70-90 millones de años.
Mediante estudios de genómica comparada, alineando secuencias de ambos genomas pueden
identificarse regiones con alto grado de coincidencia, muchas correspondientes a genes y otras a
secuencias no codificantes de proteínas pero de gran importancia funcional, dado que han estado
sometidas a presión selectiva.
-Elementos ultraconservados:
Reciben este nombre regiones que han mostrado una constancia evolutiva casi total, mayor incluso
que las secuencias codificantes de proteínas, mediante estudios de genómica comparada. Estas
secuencias generalmente se solapan con intrones de genes implicados en la regulación de la
transcripción o en el desarrollo embrionario y con exones de genes relacionados con el
procesamiento del ARN. Su función es generalmente poco conocida, pero probablemente de
extrema importancia dado su nivel de conservación evolutiva, tal y como se ha expuesto en el punto
anterior.
En la actualidad se han encontrado unos 500 segmentos de un tamaño mayor a 200 pares de bases
totalmente conservados (100% de coincidencia) entre los genomas de humano, ratón y rata, y casi
totalmente conservados en perro (99%) y pollo (95%).
-Pseudogenes:
En el genoma humano se han encontrado asimismo unos 19.000 pseudogenes, que son versiones
completas o parciales de genes que han acumulado diversas mutaciones y que generalmente no se
transcriben. Se clasifican en pseudogenes no procesados (30%) y pseudogenes procesados (70%):
-Los pseudogenes no procesados son copias de genes generalmente originadas por duplicación, que
no se transcriben por carecer de una secuencia promotora y haber acumulado múltiples mutaciones,
algunas de las cuales sin sentido (lo que origina codones de parada prematuros). Se caracterizan por
poseer tanto exones como intrones.
-Los pseudogenes procesados, por el contrario, son copias de ARN mensajero retrotranscritas e
insertadas en el genoma. En consecuencia carecen de intrones y de secuencia promotora.

ADN intergénico
Las regiones intergénicas o extragénicas comprenden la mayor parte de la secuencia del genoma
humano, y su función es generalmente desconocida. Buena parte de estas regiones está compuesta
por elementos repetitivos, clasificables como repeticiones en tándem o repeticiones dispersas,
aunque el resto de la secuencia no responde a un patrón definido y clasificable. Gran parte del ADN
intergénico puede ser un artefacto evolutivo sin una función determinada en el genoma actual, por
lo que tradicionalmente estas regiones han sido denominadas ADN "basura" (Junk DNA),
denominación que incluye también las secuencias intrónicas y pseudogenes. No obstante, esta
denominación no es la más acertada dado el papel regulador conocido de muchas de estas
secuencias. Además el notable grado de conservación evolutiva de algunas de estas secuencias
parece indicar que poseen otras funciones esenciales aún desconocidas o poco conocidas. Por lo
tanto, algunos prefieren denominarlo "ADN no codificante" (aunque el llamado "ADN basura"
incluye también transposones codificantes) o "ADN repetitivo". Algunas de estas regiones
constituyen en realidad genes precursores para la síntesis de microARN (reguladores de la
expresión génica y del silenciamiento génico).
Estudios recientes enmarcados en el proyecto ENCODE han obtenido resultados sorprendentes, que
exigen la reformulación de nuestra visión de la organización y la dinámica del genoma humano.
Según estos estudios, el 15% de la secuencia del genoma humano se transcribe a ARN maduros, y
hasta el 90% se transcribe al menos a transcritos inmaduros en algún tejido.Así, una gran parte del
genoma humano codifica genes de ARN funcionales. Esto es coherente con la tendencia de la
literatura científica reciente a asignar una importancia creciente al ARN en la regulación génica.
Asimismo, estudios detallados han identificado un número mucho mayor de secuencias de inicio de
transcripción por gen, algunas muy alejadas de la región próxima a la traducida. Como
consecuencia, actualmente resulta más complicado definir una región del genoma como génica o
intergénica, dado que los genes y las secuencias relacionadas con los genes se extienden en las
regiones habitualmente consideradas intergénicas.

ADN repetido en tándem
Son repeticiones que se ordenan de manera consecutiva, de modo que secuencias idénticas, o casi,
se disponen unas detrás de otras.
-Satélites:
El conjunto de repeticiones en tándem de tipo satélite comprende un total de
250 Mb del genoma humano. Son secuencias de entre 5 y varios cientos de nucleótidos que se
repiten en tándem miles de veces generando regiones repetidas con tamaños que oscilan entre 100
kb (100.000 nucleótidos) hasta varias megabases.
Reciben su nombre de las observaciones iniciales de centrifugaciones en gradiente de densidad del
ADN genómico fragmentado, que reportaban una banda principal correspondiente a la mayor parte
del genoma y tres bandas satélite de menor densidad. Esto se debe a que las secuencias satélite
tienen una riqueza en nuclétidos A+T superior a la media del genoma y en consecuencia son menos
densas.
Hay principalmente 6 tipos de repeticiones de ADN satélite
-Satélite 1: secuencia básica de 42 nucleótidos. Situado en los centrómeros de los cromosomas 3 y
4 y el brazo corto de los cromosomas acrocéntricos (en posición distal respecto al cluster
codificante de ARNr).
-Satélite 2: la secuencia básica es ATTCCATTCG. Presente en las proximidades de los centrómeros
de los cromosomas 2 y 10, y en la constricción secundaria de 1 y 16.
-Satélite 3: la secuencia básica es ATTCC. Presente en la constricción secundaria de los
cromosomas 9 e Y, y en posición proximal respecto al cluster de ADNr del brazo corto de los
cromosomas acrocéntricos.
-Satélite alfa: secuencia básica de 171 nucleótidos. Forma parte del ADN de los centrómeros
cromosómicos.
-Satélite beta: secuencia básica de 68 nucleótidos. Aparece en torno al centrómero en los
cromosomas acrocéntricos y en la constricción secundaria del cromosoma 1.
-Satélite gamma: secuencia básica de 220 nucleótidos. Próximo al centrómero de los cromosomas
8 y X.
-Minisatélites:
Están compuestas por una unidad básica de secuencia de 6-25 nucleótidos que se repite en tándem
generando secuencias de entre 100 y 20.000 pares de bases. Se estima que el genoma humano
contiene unos 30.000 minisatélites.
Diversos estudios han relacionado los minisatélites con procesos de regulación de la expresión
génica, como el control del nivel de transcripción, el ayuste (splicing) alternativo o la impronta
(imprinting). Asimismo, se han asociado con puntos de fragilidad cromosómica dado que se sitúan
próximos a lugares preferentes de rotura cromosómica, translocación genética y recombinación
meiótica. Por último, algunos minisatélites humanos (~10%) son hipermutables, presentando una
tasa media de mutación entre el 0.5% y el 20% en las células de la línea germinal, siendo así las
regiones más inestables del genoma humano conocidas hasta la fecha.
En el genoma humano, aproximadamente el 90% de los minisatélites se sitúan en los telómeros de
los cromosomas. La secuencia básica de seis nucleótidos TTAGGG se repite miles de veces en
tándem, generando regiones de 5-20 kb que conforman los telómeros.
Algunos minisatélites por su gran inestabilidad presentan una notable variabilidad entre individuos
distintos. Se consideran polimorfismos multialélicos, dado que pueden presentarse en un número de
repeticiones muy variable, y se denominan VNTR (acrónimo de Variable number tandem repeat).
Son marcadores muy utilizados en genética forense, ya que permiten establecer una huella genética
característica de cada individuo, y son identificables mediante Southern blot e hibridación.
-Microsatélites:
Están compuestos por secuencias básicas de 2-4 nucleótidos, cuya repetición en tándem origina
frecuentemente secuencias de menos de 150 nucleótidos. Algunos ejemplos importantes son el
dinucleótido CA y el trinucleótido CAG.
Los microsatélites son también polimorfismos multialélicos, denominados STR (acrónimo de Short
Tandem Repeats) y pueden identificarse mediante PCR, de modo rápido y sencillo. Se estima que el
genoma humano contiene unos 200.000 microsatélites, que se distribuyen más o menos
homogéneamente, al contrario que los minisatélites, lo que los hace más informativos como
marcadores.

ADN repetido disperso
Son secuencias de ADN que se repiten de modo disperso por todo el genoma, constituyendo el 45%
del genoma humano. Los elementos cuantitativamente más importantes son los LINEs y SINEs, que
se distinguen por el tamaño de la unidad repetida.
Estas secuencias tienen la potencialidad de autopropagarse al transcribirse a una ARNm
intermediario, retrotranscribirse e insertarse en otro punto del genoma. Este fenómeno se produce
con una baja frecuencia, estimándose que 1 de cada 100-200 neonatos portan una inserción nueva
de un Alu o un L1, que pueden resultar patogénicos por mutagénesis insercional, por desregulación
de la expresión de genes próximos (por los propios promotores de los SINE y LINE) o por
recombinación ilegítima entre dos copias idénticas de distinta localización cromosómica
(recombinación intra o intercromosómica), especialmente entre elementos Alu.
-SINE:
Acrónimo del inglés Short Interspersed Nuclear Elements (Elementos nucleares dispersos cortos).
Son secuencias cortas, generalmente de unos pocos cientos de bases, que aparecen repetidas miles
de veces en el genoma humano. Suponen el 13% del genoma humano, un 10% debido
exclusivamente a la familia de elementos Alu (característica de primates).
Los elementos Alu son secuencias de 250-280 nucleótidos presentes en 1.500.000 de copias
dispersas por todo el genoma. Estructuralmente son dímeros casi idénticos, excepto que la segunda
unidad contiene un inserto de 32 nucleótidos, siendo mayor que la primera. En cuanto a su
secuencia, tienen una considerable riqueza en G+C (56%), por lo que predominan en las bandas R,
y ambos monómeros presentan una cola poliA (secuencia de adeninas) vestigio de su origen de
ARNm. Además poseen un promotor de la ARN polimerasa III para transcribirse. Se consideran
retrotransposones no autónomos, ya que dependen para propagarse de la retrotranscripción de su
ARNm por una retrotranscriptasa presente en el medio.
-LINE:
Acrónimo del inglés Long Interspersed Nuclear Elements (Elementos nucleares dispersos largos).
Constituyen el 20% del genoma humano, contiene unos 100.000-500.000 copias de
retrotransposones L1 que es la familia de mayor importancia cuantitativa, es una secuencia de 6 kb
repetida unas 800.000 veces de modo disperso por todo el genoma, aunque la gran mayoría de las
copias es incompleta al presentar el extremo 5' truncado por una retrotranscripción incompleta. Así,
se estima que hay unas 5.000 copias completas de L1, sólo 90 de las cuales son activas, estando el
resto inhibidas por metilación de su promotor.
Su riqueza en G+C es del 42%, próxima a la media del genoma (41%) y se localizan
preferentemente en las bandas G de los cromosomas. Poseen además un promotor de la ARN
polimerasa II.
Los elementos LINE completos son codificantes. En concreto LINE-1 codifica dos proteínas:
-Proteína de unión a ARN (’’RNA-binding protein’’): codificada por el marco de lectura abierto 1
(ORF1, acrónimo del inglés ‘’Open reading Frame 1’’)
-Enzima con actividad retrotranscriptasa y endonucleasa: codificada por el ORF2. Ambas proteínas
son necesarias para la retrotransposición.
Estos elementos móviles están flanqueados por 2 regiones no codificantes, denominados como 5
´UTR y 3´UTR.
Por lo tanto, se consideran retrotransopsones autónomos, ya que codifican las proteínas que
necesitan para propagarse. La ARN polimerasa II presente en el medio transcribe el LINE, y este
ARNm se traduce en ambos marcos de lectura produciendo una retrotranscriptasa que actúa sobre el
ARNm generando una copia de ADN del LINE, potencialmente capaz de insertarse en el genoma.
Asimismo estas proteínas pueden ser utilizadas por pseudogenes procesados o elementos SINE para
su propagación.
La transcripción se inicia en un promotor interno del extremo 5´UTR. La endonucleasa de L1
genera una mella en una única cadena del ADN genómico, en una secuencia consenso 5´TTTTT/A3
´.
Diversos estudios han mostrado que las secuencias LINE pueden tener importancia en la regulación
de la expresión génica, habiéndose comprobado que los genes próximos a LINE presentan un nivel
de expresión inferior. Esto es especialmente relevante porque aproximadamente el 80% de los genes
del genoma humano contiene algún elemento L1 en sus intrones.
Se ha visto que la inserción aleatoria de L1 activos en el genoma humano ha dado lugar a
enfermedades genéticas, ya que interfiere en la expresión normal. También se observa una
predilección de L1 por regiones ricas en AT.

Variabilidad
Si bien dos seres humanos del mismo sexo comparten un porcentaje elevadísimo (en torno al
99,9%) de su secuencia de ADN, lo que nos permite trabajar con una única secuencia de referencia,
pequeñas variaciones genómicas fundamentan buena parte de la variabilidad fenotípica
interindividual. Una variación en el genoma, por sustitución, deleción o inserción, se denomina
polimorfismo o alelo genético. No todo polimorfismo genético provoca una alteración en la
secuencia de una proteína o de su nivel de expresión, es decir, muchos son silenciosos y carecen de
expresión fenotípica.
-SNP's:
La principal fuente de variabilidad en los genomas de dos seres humanos procede de las variaciones
en un sólo nucleótido, conocidas como SNP's (Single nucleotide polimorphisms), en las cuales se
han centrado la mayor parte de los estudios. Dada su importancia, en la actualidad existe un
proyecto internacional (International HapMap Project) para catalogar a gran escala los SNP's del
genoma humano. En este contexto, la denominación de SNP frecuentemente se restringe a aquellos
polimorfismos de un sólo nucleótido en los que el alelo menos frecuente aparece en al menos el 1%
de la población.
Los SNP son marcadores tetralélicos, dado que en teoría en una posición puede haber cuatro
nucleótidos distintos, cada uno de los cuales identificaría un alelo; sin embargo, en la práctica
suelen presentar sólo dos alelos en la población. Se estima que la frecuencia de SNP's en el genoma
humano es de un SNP cada 500-100 pares de bases, de los que una parte relevante son
polimorfismos codificantes, que causan la sustitución de un aminoácido por otro en una proteína.
Gracias a su abundancia y a que presentan una distribución aproximadamente uniforme en el
genoma, han tenido gran utilidad como marcadores para los mapas de ligamiento, herramienta
fundamental del Proyecto Genoma Humano. Además son fácilmente detectables a gran escala
mediante el empleo de chips de ADN (comúnmente conocidos como microarrays).
-Variación estructural:
Este tipo de variaciones se refiere a duplicaciones, inversiones, inserciones o variantes en el número
de copias de segmentos grandes del genoma (por lo general de 1000 nucléotidos o más). Estas
variantes implican a una gran proporción del genoma, por lo que se piensa que son, al menos, tan
importantes como los SNPs.
Variación estructural es el término general para abarcar un grupo de alteraciones genómicas que
implican segmentos de ADN mayores de 1Kb. La variación estructural puede ser cuantitativa
(variante en número de copia, que comprende: deleciones, inserciones y duplicaciones), posicional
(translocaciones) y orientacional (inversiones).
A pesar de que este campo de estudio es relativamente nuevo (los primeros estudios a gran escala se
publicaron en los años 2004 y 2005), ha tenido un gran auge, hasta el punto de que se ha creado un
nuevo proyecto para estudiar este tipo de variantes en los mismos individuos en los que se basó el
Proyecto HapMap.
Aunque aún quedan dudas acerca de las causas de este tipo de variantes, cada vez existe más
evidencia a favor de que es un fenómeno recurrente que todavía continua moldeando y creando
nuevas variantes del genoma.
Este tipo de variaciones han potenciado la idea de que el genoma humano no es una entidad
estática, sino que se encuentra en constante cambio y evolución.
Índice
-Pag. 2,3,4,5

Historia de la genética y sucesos destacados.

-Pag. 5,6,7

Contexto Proyecto Genoma Humano.

-Pag. 7,8,9

Objetivos Proyecto Genoma Humano.

-Pag. 9,10,11,12,13

Usos Proyecto Genoma Humano.

-Pag. 14

Aspectos éticos.

-Pag. 14-22

Componentes, estructura y variabilidad secuencia ADN.

Bibliografía
http://es.wikipedia.org/wiki/Proyecto_Genoma_Humano
http://es.wikipedia.org/wiki/Genoma_humano
http://es.wikipedia.org/wiki/Historia_de_la_gen%C3%A9tica
http://www.news-medical.net/health/History-of-Genetics-%28Spanish%29.aspx
http://www.ugr.es/~eianez/Biotecnologia/genoma-1.html
http://www.monografias.com/especiales/genoma/

Genoma humano

  • 1.
  • 2.
    Para situar elestudio sobre el genoma humano hay que remontarse a los primeros estudios sobre la genética y la herencia. La historia de la genética se considera que comienza con el trabajo del monje agustino Gregor Mendel. Su investigación sobre hibridación en guisantes, publicada en 1866, describe lo que más tarde se conocería como las leyes de Mendel. En experimentos de cruza realizados entre 1856 y 1863, Gregor Mendel trazó por primera vez los patrones hereditarios de ciertos rasgos en plantas de guisante y mostró que obedecían a reglas estadísticas sencillas. A pesar de que no todas las características muestran los patrones de la herencia mendeliana, su trabajo sirvió como prueba de que la aplicación de estadística a la herencia podía ser sumamente útil. A partir de esa época muchas formas más complejas de herencia han sido demostradas. A partir de su análisis estadístico, Mendel definió un concepto al que llamó alelo, al cual concibió como la unidad fundamental de la herencia. Esta utilización del término alelo es casi un sinónimo del contemporáneo término gen. Sin embargo, en la actualidad alelo indica a una variante específica de un gen en particular. El trabajo de Mendel se publicó en 1866 bajo el título Experimentos sobre hibridación de plantas (en alemán: "Versuche über Pflanzenhybriden") en las Actas de la Sociedad de Historia Natural de Brno (en alemán: Verhandlungen des Naturforschenden zu Brünn), después de haberlo dado a conocer en dos conferencias de la misma sociedad a principios de 1865. El trabajo de Mendel fue publicado en una revista académica relativamente desconocida, y no se le dio ninguna atención en la comunidad científica. En cambio, las discusiones sobre modalidades de la herencia fueron galvanizadas por la teoría de Charles Darwin de la evolución por selección natural, en la cual parecían requerirse mecanismos no lamarquianos de la herencia. La propia teoría de la herencia de Darwin, pangénesis, no encontró mucho nivel de aceptación. Una versión más matemática de la pangénesis, la cual descartaba mucho de los remanentes lamarquistas de Darwin, fue desarrollada como la escuela de la herencia "biométrica" por el primo de Darwin, Francis Galton. Bajo Galton, y su sucesor Karl Pearson, la escuela biométrica intentó construir modelos estadísticos para la herencia y la evolución, con éxito limitado pero auténtico, aunque los métodos exactos de la herencia eran desconocidos y se cuestionaban ampliamente.
  • 3.
    El año 1900marcó el «redescubrimiento de Mendel» por parte de Hugo de Vries, Carl Correns y Erich von Tschermak, y para 1915 los principios básicos de la genética mendeliana habían sido aplicados a una amplia variedad de organismos, donde destaca notablemente el caso de la mosca de la fruta (Drosophila melanogaster). Bajo el liderazgo de Thomas Hunt Morgan y sus compañeros «drosofilistas», los especialistas en genética desarrollaron la teoría mendeliana-cromosómica de la herencia, la cual fue ampliamente aceptada para 1925. Paralelamente al trabajo experimental, los matemáticos desarrollaron el marco estadístico de la genética de poblaciones, y llevaron la interpretación genética al estudio de la evolución. Con los patrones básicos de la herencia genética establecidos, muchos biólogos se volvieron hacia investigaciones sobre la naturaleza física de los genes. En los años cuarenta y a principios de los cincuenta, los experimentos señalaron al ADN como la parte de los cromosomas (y quizás otras nucleproteínas) que contenía genes. El enfoque sobre nuevos organismos modelo tales como virus y bacterias, junto con el descubrimiento en 1953 de la estructura en doble hélice del ADN, marcaron la transición a la era de la genética molecular. En los años siguientes, algunos químicos desarrollaron técnicas para secuenciar tanto a ácidos nucleicos como a proteínas, mientras otros solventaban la relación entre estos dos tipos de biomoléculas: el código genético. La regulación de la expresión génica se volvió un tema central en los años sesenta, y para los años setenta dicha expresión génica podía ser controlada y manipulada utilizando ingeniería genética. Durante lás últimas décadas del siglo XX
  • 4.
    muchos biólogos seenfocaron a proyectos genéticos a gran escala, secuenciando genomas enteros. A continuación se nombran algunos de los acontecimientos más destacables en el campo de la genética: 1865: Publicación del artículo de Gregor Mendel Experimentos sobre hibridación de plantas 1869: Friedrich Miescher descubre lo que hoy se conoce como ADN. 1880-1890: Walther Flemming, Eduard Strasburger, y Edouard Van Beneden describen la distribución cromosómica durante la división celular. 1903: Walter Sutton establece la hipótesis según la cual los cromosomas, segregados de modo mendeliano, son unidades hereditarias.1 1905: William Bateson acuña el término «genética» en una carta dirigida a Adam Sedgwick.2 1906: William Bateson propone el término «genética».3 1908: Ley de Hardy-Weinberg 1910: Thomas Hunt Morgan demuestra que los genes residen en los cromosomas. 1913: Alfred Sturtevant realiza el primer mapa genético de un cromosoma. 1913: Los mapas genéticos muestran cromosomas con genes organizados linealmente. 1918: Ronald Fisher publica "The Correlation Between Relatives on the Supposition of Mendelian Inheritance" (en español "La correlación entre parientes con base en la suposición de la herencia mendeliana"). Comienza la llamada síntesis evolutiva moderna. 1928: Frederick Griffith descubre que el material hereditario de bacterias muertas puede ser incorporado en bacterias vivas. 1931: El entrecruzamiento cromosómico se identifica como la causa de la recombinación genética. 1933: Jean Brachet demuestra que el ADN se encuentra en los cromosomas y que el ARN está presente en el citoplasma de todas las células. 1941: Edward Lawrie Tatum y George Wells Beadle muestran que los genes codifican las proteínas. 1944: Oswald Theodore Avery, Colin MacLeod y Maclyn McCarty aíslan ADN como material genético4 1950: Erwin Chargaff muestra que los cuatro nucleótidos no están presentes en los ácidos nucleicos en proporciones estables, pero que parecen existir algunas leyes generales. La cantidad de adenina (A), por ejemplo, tiende a ser igual a la de timina (T). Barbara McClintock descubre los transposones en el maíz. 1952: El experimento Hershey-Chase prueba que la información genética de los fagos (y de todos los organismos) es ADN. Rosalind Franklin obtiene la llamada Fotografía 51, la primera imagen del ADN realizada mediante difracción de rayos X. 1953: James D. Watson y Francis Crick demuestran la estructura de doble hélice del ADN5 1956: Joe Hin Tjio y Albert Levan determinan que es 46 el número de cromosomas en los seres humanos. 1958: El experimento Meselson-Stahl demuestra que el ADN se replica de modo semiconservador. 1961: El código genético se ordena en tripletes. 1964: Howard Temin muestra, utilizando virus de ARN, que la dirección de transcripción ADN-ARN puede revertirse. 1970: Se descubren las enzimas de restricción, lo que permite a los científicos cortar y pegar fragmentos de ADN. 1972: Walter Fiers y su equipo, en el Laboratorio de biología molecular de la Universidad de
  • 5.
    Gante (Gante, Bélgica),fueron los primeros en determinar la secuencia de un gen: el gen para la proteína del pelo del bacteriófago MS2.6 1976: Walter Fiers y su equipo determinan la secuencia completa del ARN del bacteriófago MS27 1977: Primera secuenciación del ADN por Fred Sanger, Walter Gilbert y Allan Maxam.8 1983: Kary Banks Mullis descubre la reacción en cadena de la polimerasa. 1989: Francis Collins y Lap-Chee Tsui secuencian el gen humano codificador de la proteína CFTR. 1995: Se secuencia por primera vez el genoma de un organismo vivo (Haemophilus influenzae). 1996: Primera secuenciación de un genoma eucariota: Saccharomyces cerevisiae. 1998: Primera secuenciación del genoma de un eucariota multicelular:Caenorhabditis elegans. 2001: Primeras secuencias del genoma humano por parte del Proyecto Genoma Humano y Celera Genomics 2003: El Proyecto Genoma Humano publica la primera secuenciación completa del genoma humano con un 99.99% de fidelidad. De todos estos proyectos el más actual e importante es el proyecto del genoma humano: El Proyecto Genoma Humano (PGH) fue un proyecto de investigación científica con el objetivo fundamental de determinar la secuencia de pares de bases químicas que componen el ADN e identificar y cartografiar los aproximadamente 20.000-25.000 genes del genoma humano desde un punto de vista físico y funcional. El proyecto, dotado con 3000 millones de dólares, fue fundado en 1990 en el Departamento de Energía y los Institutos Nacionales de la Salud de los Estados Unidos, bajo la dirección del doctor Francis Collins, quien lideraba el grupo de investigación público , conformado por múltiples científicos de diferentes países, con un plazo de realización de 15 años. Debido a la amplia colaboración internacional, a los avances en el campo de la genómica, así como los avances en la tecnología computacional, un borrador inicial del genoma fue terminado en el año 2000 (anunciado conjuntamente por el expresidente Bill Clinton y el ex-primer ministro británico Tony Blair el 26 de junio de 2000), finalmente el genoma completo fue presentado en abril del 2003, dos años antes de lo esperado. Un proyecto paralelo se realizó fuera del gobierno por parte de la Corporación Celera. La mayoría de la secuenciación se realizó en las universidades y centros de investigación de los Estados Unidos, Canadá, Nueva Zelanda, Gran Bretaña y España. El genoma humano es la secuencia de ADN de un ser humano. Está dividido en fragmentos que conforman los 23 pares de cromosomas distintos de la especie humana (22 pares de autosomas y 1 par de cromosomas sexuales). El genoma humano está compuesto por aproximadamente entre 22500 y 25000 genes distintos. Cada uno de estos genes contiene codificada la información necesaria para la síntesis de una o varias proteínas (o ARN funcionales, en el caso de los genes ARN). El "genoma" de cualquier persona (a excepción de los gemelos idénticos y los organismos clonados) es único. La secuencia de ADN que conforma el genoma humano contiene codificada la información necesaria para la expresión, altamente coordinada y adaptable al ambiente, del proteoma humano, es decir, del conjunto de las proteínas del ser humano. Las proteínas, y no el ADN, son las principales biomoléculas efectoras; poseen funciones estructurales, enzimáticas, metabólicas, reguladoras, señalizadoras..., organizándose en enormes redes funcionales de interacciones. En definitiva, el
  • 6.
    proteoma fundamenta laparticular morfología y funcionalidad de cada célula. Asimismo, la organización estructural y funcional de las distintas células conforma cada tejido y cada órgano, y, finalmente, el organismo vivo en su conjunto. Así, el genoma humano contiene la información básica necesaria para el desarrollo físico de un ser humano completo. Conocer la secuencia completa del genoma humano puede tener mucha relevancia cuanto a los estudios de biomedicina y genética clínica, desarrollando el conocimiento de enfermedades poco estudiadas, nuevas medicinas y diagnósticos más fiables y rápidos. Sin embargo descubrir toda la secuencia génica de un organismo no nos permite conocer su fenotipo. Como consecuencia, la ciencia de la genómica no podría hacerse cargo en la actualidad de todos los problemas éticos y sociales que ya están empezando a ser debatidos. Por eso el PGH necesita una regulación legislativa relativa al uso del conocimiento de la secuencia genómica, pero no tendría por qué ser un impedimento en su desarrollo, ya que el saber en sí, es inofensivo. Antes de los ochenta ya se conocía la secuencia de genes sueltos de algunos organismos, como también se conocían los genomas de entidades subcelulares, tales como virus y plásmidos. Así pues, no fue hasta 1986 cuando el Ministerio de Energía (DOE), concretó institucionalmente el Proyecto Genoma Humano (PGH) durante un congreso en Santa Fe. El PGH contaba con una buena suma económica y sería utilizado para estudiar los posibles efectos de las radiaciones sobre el ADN. Al siguiente año, en el congreso de biólogos en el Laboratorio de Cold Spring Harbor, el Instituto Nacional de la Salud (NIH) quiso participar del proyecto al ser otro organismo público con mucha más experiencia biológica, si bien no tanta en la organización de proyectos de esta magnitud. El debate público que suscitó la idea captó la atención de los responsables políticos, no solo porque el Proyecto Genoma Humano era un gran reto tecnocientífico, sino por las tecnologías de vanguardia que surgirían, así como porque el conocimiento obtenido aseguraría la superioridad tecnológica y comercial del país. Antes de dar luz verde a la iniciativa del PGH se necesitó por un lado el informe de 1988 de la Oficina de Evaluación Tecnológica del Congreso (OTA) y el del Consejo Nacional de Investigación (NRC). Ese año se inauguró HUGO (Organización del Genoma Humano) y James D. Watson fue nombrado alto cargo del proyecto. Sería reemplazado por Francis Collins en abril de 1993, en gran parte por su enemistad con Bernadine Healy que era su jefe por aquel entonces. Tras esto el nombre del Centro cambió a Instituto Nacional de Investigaciones del Genoma Humano (NHGRI). En 1990 se inauguró definitivamente el Proyecto Genoma Humano calculándose quince años de trabajo. Sus objetivos principales en una primera etapa eran la elaboración de mapas genéticos y físicos de gran resolución, mientras se ponían a punto nuevas técnicas de secuenciación, para poder abordar todo el genoma. Se calculó que el PGH americano necesitaría unos 3000 millones de dólares y terminaría en 2005. En 1993 los fondos públicos aportaron 170 millones de dólares, mientras que la industria gastó aproximadamente 80 millones. Con el paso de los años, la inversión privada cobró relevancia y amenazó con adelantar a las financiaciones públicas. En 1984 comenzaron las actividades propias del PGH, coincidiendo con la idea de fundar un instituto para la secuenciación del genoma humano por parte de Robert Sanshheimerm, en ese momento Rector de la Universidad de California. De forma independiente el Departamento de Energía de Estados Unidos (DOE) se interesó por el proyecto, al haber estudiado los efectos que las actividades de sus programas nucleares producían en la genética y en las mutaciones. Entonces se conocía como "Proyecto HUGO".
  • 7.
    En su comienzo,el Proyecto Genoma Humano, enfrentó a dos clases de científicos: de un lado, los biólogos moleculares universitarios y del otro, biólogos de institutos de investigación del Instituto Nacional de Salud, organismo estatal que percibía grandes sumas económicas federales destinadas a la investigación. Si bien el enfrentamiento se basó en la preocupación de ambos científicos por la magnitud y los costos de la empresa a llevar a cabo, existían sobre todo discrepancias para definir las vías más adecuadas a la hora de lograr los objetivos fijados. Solo debemos observar los 28.2 millones de dólares destinados al periodo 88-89 para ubicarnos “materialmente”. Por su parte, los Estados Unidos se comprometieron a destinar parte de los fondos económicos del proyecto al estudio de los aspectos éticos y sociales del PGH. James Watson asumió en 1988 la dirección ejecutiva de la Investigación del Genoma Humano en el NIH (Instituto Nacional de Salud). Al asumir el cargo, firmó un acuerdo de cooperación con el DOE mediante el cual ambas instituciones se ayudarían mutuamente. De esta forma el PGH comenzó con el liderazgo del NIH en lugar del DOE. El interés internacional por el proyecto creció de forma notable, motivado fundamentalmente por no quedar por detrás de Estados Unidos en un tema de tanta importancia. Para evitar repeticiones y solapamientos en los logros, se creó HUGO (Organización del Genoma Humano) para coordinar los trabajos de investigación. En 1994 Craig Venter funda, con un financiamiento mixto, el Instituto para la Investigación Genética (TIGR) que se dio a conocer públicamente en 1995 con el descubrimiento de la secuencia nucleotídica del primer organismo completo publicado, la bacteria Haemophilus influenzae con cerca de 1740 genes (1.8 Mb). En mayo de 1998 surgió la primera empresa relacionada con el PGH llamada Celera Genomics. La investigación del proyecto se convirtió en una carrera frenética en todos los laboratorios relacionados con el tema, ya que se intentaba secuenciar trozos de cromosomas para rápidamente incorporar sus secuencias a las bases de datos y atribuirse la prioridad de patentarlas. El 6 de abril de 2000 se anunció públicamente la terminación del primer borrador del genoma humano secuenciado que localizaba a los genes dentro de los cromosomas. Los días 15 y 16 de febrero de 2001, las dos prestigiosas publicaciones científicas americanas, Nature y Science, publicaron la secuenciación definitiva del Genoma Humano, con un 99.9% de fiabilidad y con un año de antelación a la fecha presupuesta. Sucesivas secuenciaciones condujeron finalmente al anuncio del genoma esencialmente completo en abril de 2003, dos años antes de lo previsto.1 En mayo de 2006 se alcanzó otro hito en la culminación del proyecto al publicarse la secuencia del último cromosoma humano en la revista Nature. Objetivos Desde el principio de la investigación, se propuso desarrollar el PGH a través de dos vías independientes, pero relacionadas y ambas esenciales: • Secuenciación: se trataba de averiguar la posición de todos los nucleótidos del genoma (cada una de las cuatro posibles bases nitrogenadas típicas del ADN). • Cartografía o mapeo genético: consistía en localizar los genes en cada uno de los 23 pares de cromosomas del ser humano.
  • 8.
    -Identificación de losgenes en el genoma humano:El Genoma humano está compuesto por aproximadamente 30.000 genes, cifra bastante próxima a la mencionada en el borrador del proyecto, publicado en el año 2000, ocasión en la que las genes oscilaban entre 26.000 y 38.000. Otra peculiaridad del PGH es que la cifra de genes humanos es solo dos o tres veces mayor que la encontrada en el genoma de Drosophila, y cualitativamente hablando, existen genes comunes a los de bacterias y que no han sido hallados en nuestros ancestros. -Determinación de la secuencia de las bases nitrogenadas que forman el ADN humano:Los humanos poseen poco más de 3 mil millones de bases nitrogenadas, similar al tamaño de genomas de otros vertebrados. -Mantenimiento a resguardo de la información anterior creando bases de datos de acceso público:En estos momentos son una realidad las bases de datos donde se almacena toda la información surgida del Proyecto Genoma Humano. Si accedemos a Internet podremos conocer libremente aspectos de alto interés en la comparación entre genomas de distintas especies de animales y plantas. Gracias al uso libre de este conocimiento es posible determinar la función de los genes, así como averiguar cómo las mutaciones influyen en la síntesis de proteínas. -Aprovisionamiento de herramientas multimedia para el análisis de datos:Se ha inducido un gran desarrollo tecnológico a partir de la creación de herramientas de análisis de datos generadas en el Proyecto Genoma Humano. Este desarrollo facilitará y hará posible definir los temas de estudio futuros con vistas a las tareas pendientes. Entre las tecnologías beneficiadas gracias al PGH figuran las de manejo computacional de datos, las que permiten la generación de las anteriores, técnicas de biología molecular relacionadas con la secuenciación de trozos de ADN automáticamente y aquellas que permiten ampliar la cantidad de material genético disponible como la PCR. -Transferencia de tecnología relacionada con el tema al sector privado:Se ha producido una importante corriente de liberación de derechos que anteriormente estaban en manos del Estado, en relación a la transferencia de tecnologías al sector privado. Esta medida ha suscitado aplausos y críticas. Por un lado se amplía el acceso libre a los datos del Proyecto con lo que muchas más personas pueden seguir estudiando este campo, pero por otro esto puede suponer el incremento de poder de ciertos sectores que a su vez, aumentaran su influencia en la sociedad. -Supervisión de los temas éticos, legales y sociales derivados del Proyecto:Para terminar, se puede afirmar que el objetivo relacionado con el estudio de la ética del PGH es un tema de gran controversia actual, y ha necesitado de grandes sumas de dinero estatales así como de un importante trabajo de laboratorios e investigadores. Todo esto ha provocado un deterioro del apoyo a otros proyectos de investigación no menos importantes, que se han visto muy afectados o incluso cancelados. Métodos de estudio Existen dos técnicas de cartografía genética principales: el ligamiento, que intenta averiguar el orden de los genes; y la cartografía física, que se encarga de estudiar la distancia de los genes en el interior del cromosoma. Las dos técnicas utilizan marcadores genéticos, que son características moleculares o físicas que se heredan, y son detectables y distintas para cada individuo. Thomas Hunt Morgan desarrolló en la década de 1900 la cartografía mediante ligamiento al estudiar la frecuencia con la que ciertas características se heredaban unidas en moscas de la fruta. Así llegó a la conclusión de que algunos genes debían estar ligados en los cromosomas. Los mapas de
  • 9.
    ligamiento humano sehan creado estudiando pautas de herencia de familias muy extensas y con varias generaciones conocidas. Aunque al principio se limitaban a los rasgos físicos heredables, fácilmente reconocibles, actualmente hay técnicas más elaboradas que permiten crear mapas de ligamiento comparando la posición de genes diana en comparación con el orden de los marcadores genéticos o de partes conocidas del ADN. La cartografía física es capaz de medir la distancia real entre puntos de los cromosomas. Las técnicas más avanzadas combinan robótica, informática y uso de láser para calcular la distancia entre marcadores genéticos conocidos. Para conseguirlo, se fragmenta el ADN de los cromosomas humanos aleatoriamente. A continuación se duplican muchas veces para estudiar en los clones, que son las secuencias duplicadas, la ausencia o presencia de marcas genéticas identificables. Los clones que comparten varias marcas provienen de segmentos solapados normalmente. Estas regiones pueden utilizarse después para determinar el orden de las marcas en los cromosomas y su secuencia. Para obtener la secuencia real de nucleótidos hacen falta mapas físicos altamente detallados que recogen el orden de las piezas clonadas con exactitud. En el Proyecto Genoma Humano se utilizó un método de secuenciación desarrollado por Frederick Sanger, bioquímico británico y dos veces premio Nobel. Este método replica piezas específicas de ADN y las modifica de modo que acaben en una forma fluorescente. Actualmente se detecta el nucleótido modificado del extremo de las cadenas con modernos secuenciadores de ADN automáticos. Estos determinan los nucleótidos que hay exactamente en la cadena. A continuación se combina esta información de manera informatizada, y así se reconstruye la secuencia de pares de bases del ADN original. Un aspecto muy importante es duplicar rápidamente y con exactitud el ADN, tanto para después cartografiarlo como para secuenciarlo. Al comienzo de la investigación en este campo se clonaba el material genético introduciéndolo en organismos unicelulares de rápida división, pero en la década de los ochenta se generalizó el uso de la PCR (reacción en cadena de polimerasa). Esta técnica se puede automatizar fácilmente y es capaz de copiar una sola molécula de ADN muchos millones de veces en poco tiempo. Kary Mullis obtuvo el Premio Nobel de Química por idearla, en 1993. Ventajas El trabajo sobre la interpretación de los datos del genoma se encuentra todavía en sus etapas iniciales. Se prevé que un conocimiento detallado del genoma humano ofrecerá nuevas vías para los avances de la medicina y la biotecnología. Por ejemplo, un número de empresas, como Myriad Genetics ha empezado a ofrecer formas sencillas de administrar las pruebas genéticas que pueden mostrar la predisposición a una variedad de enfermedades, incluyendo cáncer de mama, los trastornos de la hemostasia, la fibrosis quística, enfermedades hepáticas y muchas otras. Además, la etiología de los cánceres, la enfermedad de Alzheimer y otras áreas de interés clínico se consideran susceptibles de beneficiarse de la información sobre el genoma y, posiblemente, pueda a largo plazo conducir a avances significativos en su gestión. Hay también muchos beneficios tangibles para los biólogos. Por ejemplo, un investigador de la investigación de un determinado tipo de cáncer puede haber reducido su búsqueda a un determinado gen. Al visitar la base de datos del genoma humano en la World Wide Web, este investigador puede examinar lo que otros científicos han escrito sobre este gen, incluyendo (potencialmente) la estructura tridimensional de su producto; su/s función/es; sus relaciones evolutivas con otros genes humanos, o genes de ratones, levaduras, moscas de la fruta; las posibles mutaciones perjudiciales; las interacciones con otros genes; los tejidos del cuerpo en el que este gen es activado; las enfermedades asociadas con este gen u otro tipo de datos. Además, la comprensión más profunda de los procesos de la enfermedad en el ámbito de la biología molecular puede determinar nuevos
  • 10.
    procedimientos terapéuticos. Dadala importancia del ADN en biología molecular y su papel central en la determinación de la operación fundamental de los procesos celulares, es probable que la ampliación de los conocimientos en este ámbito facilite los avances médicos en numerosas áreas de interés clínico que puede no haber sido posible por otros métodos. El análisis de las similitudes entre las secuencias de ADN de diferentes organismos es también la apertura de nuevas vías en el estudio de la evolución. En muchos casos, las cuestiones de evolución ahora se pueden enmarcar en términos de biología molecular y, de hecho, muchos de los grandes hitos evolutivos (la aparición de los ribosomas y orgánulos, el desarrollo de planes de embriones con el cuerpo, el sistema inmune de vertebrados) pueden estar relacionados a nivel molecular. Muchas de las preguntas acerca de las similitudes y diferencias entre los seres humanos y nuestros parientes más cercanos (los primates, y de hecho los otros mamíferos) se espera que sean iluminados por los datos de este proyecto. El Proyecto Diversidad del Genoma Humano (PDGH), derivado de investigaciones dirigidas a la asignación del ADN humano - que varía entre los grupos étnicos - que se rumorea que ha sido detenido, realmente continúa y hasta la fecha ha arrojado nuevas conclusiones. En el futuro, el PGH podría exponer nuevos datos en la vigilancia de las enfermedades, el desarrollo humano y la antropología. El PGH podría desbloquear secretos y crear nuevas estrategias para combatir la vulnerabilidad de los grupos étnicos a ciertas enfermedades. También podría mostrar cómo las poblaciones humanas se han adaptado a estas vulnerabilidades. Además, el PGH tiene una consecuencia muy importante, y es que se pueden conocer la base molecular de ciertas enfermedades hereditarias y que se puede realizar un diagnóstico de las mismas. -Conocer las bases moleculares de las enfermedades hereditarias: Una de las aplicaciones más directas de conocer la secuencia de genes que componen el genoma humano es que se puede conocer la base molecular de muchas enfermedades genéticas y se puede realizar un diagnóstico adecuado. Algunas de estas enfermedades son las siguientes: -Enfermedad de Gaucher: esta enfermedad es producida por una mutación recesiva en el gen que codifica la proteína glucocerebrosidasa, que se localiza en el cromosoma 1. Esta enzima se encarga de metabolizar los glucocerebrósidos (un tipo de lípidos). En los enfermos de Gaucher, estos lípidos no pueden ser descompuestos y se acumulan principalmente en el hígado, en el bazo y en la médula ósea. Los síntomas de la enfermedad de Gaucher incluyen fuertes dolores, fatiga, ictericia, daños óseos, anemia y muerte. Gracias al PGH se pudo realizar la primera terapia efectiva contra esta enfermedad, inyectándose la enzima sintetizada en escherichia coli en el torrente sanguíneo de los enfermos. Esto detiene el avance de los síntomas y en muchos casos los revierte. -Enfermedad de Alzheimer: Esta enfermedad es una enfermedad degenerativa que destruye el cerebro, haciendo que los enfermos pierdan la memoria y el juicio, y que finalmente impide que se puedan valer por sí solos. El único método seguro para diagnosticar la enfermedad de Alzheimer se encuentra en la autopsia, pero se ha sabido que puede ser de origen genético en un 20% de los casos. Gracias al PGH se han localizado marcadores para el Alzheimer de origen genético en los cromosomas 1, 14, 19 y 21. -Enfermedad de Huntington: Esta enfermedad es también una enfermedad degenerativa y conduce a un deterioro mental que termina en demencia. Normalmente comienza a aparecer entre los 30 y los 50 años y presenta síntomas tales como cambios en la personalidad y en el estado de ánimo, depresión y pérdida gradual del control sobre los movimientos voluntarios, causando espasmos primero y grandes movimientos al azar posteriormente. Esta enfermedad presenta una herencia autosómica dominante, es decir, si uno de los padres la posee, sus hijos tienen el 50% de probabilidad de padecerla también. La Enfermedad de Huntington no se salta generaciones. Si no se hereda el gen, no se puede transmitir a la descendencia. Del mismo, modo, si se hereda el gen, inevitablemente se padecerá la enfermedad, más tarde o más temprano. En 1993 se consiguió aislar
  • 11.
    el gen queprovoca esta enfermedad, localizado en el cromosoma 4, y en lo que se han ido desarrollando las investigaciones posteriores, ha sido fundamentalmente en conocer las razones que hacen que la Enfermedad de Huntingnton se manifieste de forma tardía, y muchas líneas de investigación están dirigidas a encontrar un tratamiento y una cura. -Síndrome de Marfan: Es una enfermedad congénita del tejido conectivo que afecta a numerosos órganos y sistemas, incluyendo el esqueleto, los pulmones, los ojos, el corazón y los vasos sanguíneos. Esta enfermedad se caracteriza por un crecimiento anormal de las extremidades (especialmente de los dedos), una dislocación parcial del cristalino (en el 50% de los pacientes), anormalidades cardiovasculares (la arteria aorta suele ser más ancha y más frágil que en las personas normales) y otras deformaciones. El síndrome de Marfan es también una enfermedad autosómica dominante, por lo que los descendientes de personas afectadas poseen el 50% de posibilidades de padecerla. La enfermedad está asociada al gen FBN1, localizado en el cromosoma 15. El FBN1 codifica una proteína llamada fibrilina, que es esencial para la formación de fibras elásticas del tejido conectivo. Sin el soporte estructural de las fibras elásticas, muchos tejidos presentan una debilidad que puede conducir los síntomas comentados anteriormente. -Diagnósticos de enfermedades posibles al PGH: Estos son algunos ejemplos de enfermedades que se han podido diagnosticar gracias, de una u otra manera, al conocimiento de las secuencias genéticas tras la secuenciación del genoma por el Proyecto Genoma Humano. El diagnóstico de cierta enfermedad, gracias al PGH se puede realizar de manera presintomática y prenatal. El conocimiento de la base molecular de las enfermedades permite realizar el diagnóstico presintomático y gracias a él tomar medidas preventivas, como alteraciones en el estilo de vida, evitar la exposición a factores de riesgo, realizar un seguimiento continuo del individuo o realizar intervenciones puntuales, para poder tratar la enfermedad aunque todavía no haya aparecido. En cuanto al diagnóstico prenatal, éste consiste en un conjunto de técnicas que sirven para conocer
  • 12.
    la adecuada formacióny el correcto desarrollo del feto antes de su nacimiento, para poder conocer posibles malformaciones desde los primeros estadios de desarrollo del embrión. La técnica más común de diagnóstico prenatal es la amniocentesis, que consiste en el análisis del líquido amniótico que rodea al feto durante el embarazo. Las células desprendidas del feto y que flotan en dicho líquido sirven para obtener un recuento exacto de cromosomas y para detectar cualquier estructura cromosómica anormal. El diagnóstico prenatal conlleva una importante polémica. Las mujeres cuyo hijo se observe que presentan características de padecer cierta enfermedad o que presentan malformaciones en sus cromosomas, decidirán abortar, lo que para los detractores del aborto es una aberración. La polémica está también alimentada por el hecho de que se pueden conocer tanto enfermedades que se desarrollen desde el primer día de vida del individuo como enfermedades que pueden aparecer a su edad avanzada, como el Alzheimer, por ejemplo. En ese caso, ¿abortaríamos a un feto que puede presentar la Enfermedad de Alzheimer casi al final de su vida, privándole de una vida previa normal? Esto conlleva también a realizar un baremo de qué enfermedades podrían considerarse suficientes para realizar el aborto, poniéndose por ejemplo, el daltonismo. Por otra parte, y como consecuencia del desarrollo de las técnicas de la fecundación in vitro, hoy en día se puede realizar el conocido como diagnóstico genético preimplantacional (DGPI). Éste permite testar los embriones desde un punto de vista genético y cromosómico para así elegir el que se encuentre sano e implantarlo en el útero de la madre. El DGPI evita la gestación de un niño afectado genética o cromosómicamente, y conlleva la decisión de los padres de realizar, en su caso, un aborto terapéutico. -Terapia génica, terapia farmacológica y medicina predictiva: Una vez que se conocen qué genes producen qué enfermedades, y las características para diagnosticar una enfermedad conociendo la secuencia de bases, es necesario realizar una terapia para acabar con esa enfermedad, ya que de ser de otra manera, el diagnóstico de una enfermedad no es más que una carga emocional que el paciente tiene que soportar de la mejor manera posible, conviviendo con la impotencia y la ansiedad que le puede suponer a un paciente el saber que en un determinado lapso de tiempo es posible que padezca una enfermedad. Una consecuencia, por tanto, del PGH es desarrollar terapias contra las enfermedades que ha diagnosticado. Se conocen la terapia génica, la terapia farmacológica y la medicina predictiva: -La terapia génica es una consecuencia directa del PGH y supone la probabilidad de curar las enfermedades hereditarias cartografiadas por éste, insertando copias funcionales de genes defectivos o ausentes en el genoma de un individuo para tratar dicha enfermedad. Las técnicas actuales de terapia génica no pueden asegurar que el gen se inserte en un lugar apropiado del genoma, existe la posibilidad de que interfiera con el funcionamiento de un gen importante o incluso que active un oncogén, provocando así un cáncer en el paciente. Sin embargo, estas técnicas sólo se utilizan con pacientes que ya corren peligro inminente de muerte, por lo que la posibilidad de contraer un cáncer en un futuro incierto no constituye un impedimento muy grave para aceptar el tratamiento. El primer caso que se conoce de terapia génica tuvo lugar en los NIH (National Institutes of Health. En español: Institutos Nacionales de la Salud), en Bethesda, Maryland. Consistió en la inoculación de glóbulos blancos genéticamente modificados a una niña que padecía inmunodeficiencia severa combinada (deficiencia de adenosina-desaminasa o ADA). Esta enfermedad es una enfermedad rara, y la carencia de ADA se puede tratar con trasplantes de médula ósea. Sin embargo, el trasplante sólo es posible si el paciente tiene un hermano que no esté afectado por la enfermedad y que sea compatible. Otra posibilidad es inyectar la proteína directamente, pero las inyecciones no llegan inmediatamente al lugar necesario y constituyen un mal sucedáneo de los sutiles mecanismos que controlan y dirigen la producción de ADA en circunstancias normales. La operación consistió
  • 13.
    en la extracciónde linfocitos T de la paciente, su modificación genética y su reimplantación. Con esto las células comenzaron a producir la ADA. Cuando se realizó esta primera intervención, los doctores de los NIH estudiaron las implicaciones éticas que podía tener esta operación y llegaron a la conclusión de que no existía diferencia moral con respecto a cualquier tipo de trasplante de tejidos o de órganos. Esta comparación residía en que los genes trasplantados sólo afetaban a las células somáticas del individuo, de modo que sólo afectaban a la niña misma y que no lo harían por tanto a su descendencia. Podemos diferenciar entonces dos tipos de terapia génica, en línea somática y en línea germinal. Esta última consiste en introducir genes nuevos, biológicamente funcionales, en células germinales (óvulos y/o espermatozoides) antes de que se produzca la fecundación. El embrión que surge tras la fecundación partirá de una única célula modificada genéticamente, por lo que todas sus células posteriores presentarán la misma modificación, incluyendo las futuras células germinales que producirá, pudiendo transmitir sus características a las generaciones futuras. Todos los estudios nacionales han rechazado la terapia en línea germinal, de momento, ya que opinan que todavía no se dispone de los suficientes conocimientos para evaluar los riesgos que supone este tipo de terapia y que es necesario realizar un estricto examen ético antes de comenzar a aplicarla, si esto se acabara produciendo. -La terapia farmacológica se ve también facilitada por el PGH ya que éste permite encontrar alteraciones en la secuencia del ADN de genes específicos y esto conlleva a que se realice el tratamiento con medicamentos de una manera dirigida, neutralizando las alteraciones y modificando favorablemente el curso de la enfermedad de forma más efectiva que los tratamientos de la medicina actual, que están generalmente dirigidos a aliviar los síntomas. El PGH permite además, en relación con la farmacología, modificar los medicamentos para que se ajusten a las características genéticas del paciente y así poder metabolizar el fármaco de la mejor manera posible, lo que en consecuencia, elimina o minimiza los efectos secundarios indeseables del mismo. Gracias al PGH el médico tendrá un perfil genético del paciente antes de iniciar el tratamiento. -La medicina predictiva permite diagnosticar enfermedades, gracias a los conocimientos del genoma, que aún no se han desarrollado en el paciente. Se distinguen dos tipos de enfermedades que se pueden diagnosticar mediante la medicina predictiva. Las monogénicas, que se pueden identificar fácilmente ya que se conocen perfectamente las leyes deterministas que las regulan; y las poligénicas, para cuyo buen estudio es necesario realizar sondeos poblacionales. Por ejemplo se pueden encontrar los genes que regulan el nivel de colesterol en la sangre (unos veinte). Determinadas combinaciones de variedades de estos genes sitúan al sujeto en un grupo de riesgo de padecer enfermedades tempranas de las arterias coronarias y ataques cardíacos. Si además el sujeto lleva una dieta rica en grasas animales y una vida sedentaria (también influyen por tanto agentes externos como puede ser el modo de vida y la alimentación), es muy posible que muera de infarto antes de los cincuenta años. La meta es conocer exactamente qué combinaciones de genes son especialmente peligrosas y en esto tiene un papel muy importante el Proyecto Genoma Humano. La medicina predictiva también causa una importante controversia en la sociedad ya que los estudios poblaciones que se realizan para estudiar las enfermedades poligénicas se pueden utilizar para discriminar a ciertas personas o grupos, lo que se llamaría discriminación genética
  • 14.
    Aspectos éticos: Aunque lamedicina proporciona la base para la evolución de la bioética, actualmente somos testigos de su aplicación a la investigación científica relacionada. Así pues, el PGH ha dado lugar a una de las áreas de conocimiento biológico con mayor crecimiento. Los conocimientos genómicos derivados del Proyecto Genoma Humano, se utilizan para mejores y más rápidos diagnósticos basados en el análisis directo del ADN, e incluso para el diagnóstico prenatal en aquellos casos en los que se sospecha que el bebé tenga alteraciones morfológicas, funcionales o ponga en peligro la vida de su madre. También es posible aplicar este conocimiento a personas asintomáticas para averiguar si han heredado de algún progenitor una mutación causal de una enfermedad genética que pueda desarrollarse en el futuro. Así planteado el tema, se percibe entonces una importante brecha entre la capacidad diagnóstica y predictiva del conocimiento genómico por un lado, y la falta de intervenciones preventivas y terapéuticas por otro, lo que lleva a conflictos éticos surgidos del Proyecto Genoma Humano. Además hay determinadas áreas como el asesoramiento a parejas en riesgo de transmitir enfermedades genéticas a su descendencia, que han suscitado mucho interés y para las que se han dictado una serie de principios éticos: • Respeto a la dignidad individual y a la inteligencia básica de las personas, así como a sus decisiones médicas y reproductivas (libre elección de interrumpir o continuar un embarazo con riesgo). • Informar objetivamente al paciente sin tener en cuenta los valores subjetivos del profesional médico. • Protección a la privacidad de la información genética. • Desmitificación del Proyecto Genoma Humano, aclarando verdaderamente su alcance con acciones específicas en educación. Otro problema de gran importancia es la obtención de patentes de genes por parte de compañías biotecnológicas, gobiernos y centros de investigación universitarios, para una posterior venta o explotación comercial, sin tener en cuenta que parte de los fondos empleados en el PGH era de los contribuyentes. También debemos observar el PGH contextualizado social e históricamente, atendiendo a la desigualdad social y económica entre países, que va a producir una inequidad en el acceso a los beneficios que se extraigan de la investigación. Una solución a todas estas tensiones podría ser la formación de profesores de ciencias o la enseñanza directa a estudiantes como una forma de abrir las mentes y aclarar definitivamente el alcance del Proyecto Genoma Humano en la sociedad. Pero es imprescindible incorporar temas de bioética a los programas de enseñanza. Tanto en Estados Unidos como en la Unión Europea se han desarrollado programas para contemplar las consecuencias éticas y sociales de la investigación científica y que no se produzcan conflictos. En Estados Unidos se encuentra el ELSI y fuera de ellos se encuentra la Declaración Universal sobre el Genoma Humano y los Derechos Humanos, promovida por la UNESCO. A continuación y para terminar se expondrán los descubrimientos y conclusiones sacados del Proyecto Genoma Humano: Componentes Cromosomas:
  • 15.
    El genoma humano(como el de cualquier organismo eucariota) está formado por cromosomas, que son largas secuencias continuas de ADN altamente organizadas espacialmente (con ayuda de proteínas histónicas y no histónicas) para adoptar una forma ultracondensada en metafase. Son observables con microscopía óptica convencional o de fluorescencia mediante técnicas de citogenética y se ordenan formando un cariotipo. El cariotipo humano normal contiene un total de 23 pares de cromosomas distintos: 22 pares de autosomas más 1 par de cromosomas sexuales que determinan el sexo del individuo. Los cromosomas 1-22 fueron numerados en orden decreciente de tamaño en base al cariotipo. Sin embargo, posteriormente pudo comprobarse que el cromosoma 22 es en realidad mayor que el 21. Las células somáticas de un organismo poseen en su núcleo un total de 46 cromosomas (23 pares): una dotación de 22 autosomas procedentes de cada progenitor y un par de cromosomas sexuales, un cromosoma X de la madre y un X o un Y del padre. Los gametos -óvulos y espermatozoidesposeen una dotación haploide de 23 cromosomas. Representación gráfica del cariotipo humano normal ADN intragénico -Genes: Un gen es la unidad básica de la herencia, y porta la información genética necesaria para la síntesis de una proteína (genes codificantes) o de un ARN no codificante (genes de ARN). Está formado por una secuencia promotora, que regula su expresión, y una secuencia que se transcribe, compuesta a su vez por: secuencias UTR (regiones flanqueantes no traducidas), necesarias para la traducción y la estabilidad del ARNm, exones (codificantes) e intrones, que son secuencias de ADN no traducidas situadas entre dos exones que serán eliminadas en el procesamiento del ARNm (ayuste). Actualmente se estima que el genoma humano contiene entre 20.000 y 25.000 genes codificantes de proteínas, estimación muy inferior a las predicciones iniciales que hablaban de unos 100.000 genes o más. Esto implica que el genoma humano tiene menos del doble de genes que organismos eucariotas mucho más simples, como la mosca de la fruta o el nematodo Caenorhabditis elegans. Sin embargo, las células humanas recurren ampliamente al splicing (ayuste) alternativo para producir varias proteínas distintas a partir de un mismo gen, como consecuencia de lo cual el proteoma humano es más amplio que el de otros organismos mucho más simples. En la práctica, el genoma tan sólo porta la información necesaria para una expresión perfectamente coordinada y regulada del conjunto de proteínas que conforman el proteoma, siendo éste el encargado de ejecutar la mayor parte de las funciones celulares.
  • 16.
    Con base enlos resultados iniciales arrojados por el proyecto ENCODE (acrónimo de ENCyclopedia Of DNA Elements), algunos autores han propuesto redefinir el concepto actual de gen. Las observaciones más recientes hacen difícilmente sostenible la visión tradicional de un gen, como una secuencia formada por las regiones UTRs, los exones y los intrones. Estudios detallados han hallado un número de secuencias de inicio de transcripción por gen muy superior a las estimaciones iniciales, y algunas de estas secuencias se sitúan en regiones muy alejadas de la traducida, por lo que los UTR 5' pueden abarcar secuencias largas dificultando la delimitación del gen. Por otro lado, un mismo transcrito puede dar lugar a ARN maduros totalmente diferentes (ausencia total de solapamiento), debido a una gran utilización del splicing alternativo. De este modo, un mismo transcrito primario puede dar lugar a proteínas de secuencia y funcionalidad muy dispar. En consecuencia, algunos autores han propuesto una nueva definición de gen, la unión de secuencias genómicas que codifican un conjunto coherente de productos funcionales, potencialmente solapantes. De este modo, se identifican como genes los genes ARN y los conjuntos de secuencias traducidas parcialmente solapantes (se excluyen, así, las secuencias UTR y los intrones, que pasan a ser considerados como "regiones asociadas a genes", junto con los promotores). De acuerdo con esta definición, un mismo transcrito primario que da lugar a dos transcritos secundarios (y dos proteínas) no solapantes debe considerarse en realidad dos genes diferentes, independientemente de que estos presenten un solapamiento total o parcial de sus transcritos primarios. Las nuevas evidencias aportadas por ENCODE, según las cuales las regiones UTR no son fácilmente delimitables y se extienden largas distancias, obligarían a reidentificar nuevamente los genes que en realidad componen el genoma humano. De acuerdo con la definición tradicional (actualmente vigente), sería necesario identificar como un mismo gen a todos aquellos que muestren un solapamiento parcial (incluyendo las regiones UTR y los intrones), con lo que a la luz de las nuevas observaciones, los genes incluirían múltiples proteínas de secuencia y funcionalidad muy diversa. Colateralmente se reduciría el número de genes que componen el genoma humano. La definición propuesta, en cambio, se fundamenta en el producto funcional del gen, por lo que se mantiene una relación más coherente entre un gen y una función biológica. Como consecuencia, con la adopción de esta nueva definición, el número de genes del genoma humano aumentará significativamente. -Genes de ARN: Además de los genes codificantes de proteínas, el genoma humano contiene varios miles de genes ARN, cuya transcripción reproduce ARN de transferencia (ARNt), ARN ribosómico (ARNr), microARN (miARN), u otros genes ARN no codificantes. Los ARN ribosómico y de transferencia son esenciales en la constitución de los ribosomas y en la traducción de las proteínas. Por su parte, los microARN tienen gran importancia en la regulación de la expresión génica, estimándose que hasta un 20-30% de los genes del genoma humano puede estar regulado por el mecanismo de interferencia por miARN. Hasta el momento se han identificado más de 300 genes de miARN y se estima que pueden existir unos 500. -Distribución de genes: A continuación se muestran algunos valores promedio del genoma humano. Cabe advertir, sin embargo, que la enorme heterogeneidad que presentan estas variables hace poco representativos a los valores promedio, aunque tienen valor orientativo. La densidad media de genes es de 1 gen cada 100 kb, con un tamaño medio de 20-30 kb, y un número de exones promedio de 7-8 por cada gen, con un tamaño medio de 150 nucleótidos. El tamaño medio de un ARNm es de 1,8-2,2 kb, incluyendo las regiones UTR (regiones no traducidas flanqueantes), siendo la longitud media de la región codificante de 1,4 kb.
  • 17.
    El genoma humanose caracteriza por presentar una gran heterogeneidad en su secuencia. En particular, la riqueza en bases de guanina (G) y citosina (C) frente a las de adenina (A) y timina (T) se distribuye heterogéneamente, con regiones muy ricas en G+C flanqueadas por regiones muy pobres, siendo el contenido medio de G+C del 41%, menor al teóricamente esperado (50%). Dicha heterogeneidad esta correlacionada con la riqueza en genes, de manera que los genes tienden a concentrarse en las regiones más ricas en G+C. Este hecho era conocido ya desde hace años gracias a la separación mediante centrifugación en gradiente de densidad de regiones ricas en G+C (que recibieron el nombre de isócoros H; del inglés High) y regiones ricas en A+T (isócoros L; del inglés Low). Isócoros. Riqueza en G+C y genes en el genoma humano -Secuencias reguladoras: El genoma tiene diversos sistemas de regulación de la expresión génica, basados en la regulación de la unión de factores de transcripción a las secuencias promotoras, en mecanismos de modificación epigenética (metilación del ADN o metilación-acetilación de histonas) o en el control de la accesibilidad a los promotores determinada por el grado de condensación de la cromatina; todos ellos muy interrelacionados. Además hay otros sistemas de regulación a nivel del procesamiento, estabilidad y traducción del ARNm, entre otros. Por lo tanto, la expresión génica está intensamente regulada, lo cual permite desarrollar los múltiples fenotipos que caracterizan los distintos tipos celulares de un organismo eucariota multicelular, al mismo tiempo que dota a la célula de la plasticidad necesaria para adaptarse a un medio cambiante. No obstante, toda la información necesaria para la regulación de la expresión génica, en función del ambiente celular, está codificada en la secuencia de ADN al igual que lo están los genes. Las secuencias reguladoras son típicamente secuencias cortas presentes en las proximidades o en el interior (frecuentemente en intrones) de los genes. En la actualidad, el conocimiento sistemático de estas secuencias y de cómo actúan en complejas redes de regulación génica, sensibles a señales exógenas, es muy escaso y está comenzando a desarrollarse mediante estudios de genómica comparada, bioinformática y biología de sistemas. La identificación de secuencias reguladoras se basa en parte en la búsqueda de regiones no codificantes evolutivamente conservadas. Por ejemplo, la divergencia evolutiva entre el ratón y el ser humano ocurrió hace 70-90 millones de años. Mediante estudios de genómica comparada, alineando secuencias de ambos genomas pueden identificarse regiones con alto grado de coincidencia, muchas correspondientes a genes y otras a secuencias no codificantes de proteínas pero de gran importancia funcional, dado que han estado sometidas a presión selectiva. -Elementos ultraconservados: Reciben este nombre regiones que han mostrado una constancia evolutiva casi total, mayor incluso que las secuencias codificantes de proteínas, mediante estudios de genómica comparada. Estas secuencias generalmente se solapan con intrones de genes implicados en la regulación de la transcripción o en el desarrollo embrionario y con exones de genes relacionados con el procesamiento del ARN. Su función es generalmente poco conocida, pero probablemente de
  • 18.
    extrema importancia dadosu nivel de conservación evolutiva, tal y como se ha expuesto en el punto anterior. En la actualidad se han encontrado unos 500 segmentos de un tamaño mayor a 200 pares de bases totalmente conservados (100% de coincidencia) entre los genomas de humano, ratón y rata, y casi totalmente conservados en perro (99%) y pollo (95%). -Pseudogenes: En el genoma humano se han encontrado asimismo unos 19.000 pseudogenes, que son versiones completas o parciales de genes que han acumulado diversas mutaciones y que generalmente no se transcriben. Se clasifican en pseudogenes no procesados (30%) y pseudogenes procesados (70%): -Los pseudogenes no procesados son copias de genes generalmente originadas por duplicación, que no se transcriben por carecer de una secuencia promotora y haber acumulado múltiples mutaciones, algunas de las cuales sin sentido (lo que origina codones de parada prematuros). Se caracterizan por poseer tanto exones como intrones. -Los pseudogenes procesados, por el contrario, son copias de ARN mensajero retrotranscritas e insertadas en el genoma. En consecuencia carecen de intrones y de secuencia promotora. ADN intergénico Las regiones intergénicas o extragénicas comprenden la mayor parte de la secuencia del genoma humano, y su función es generalmente desconocida. Buena parte de estas regiones está compuesta por elementos repetitivos, clasificables como repeticiones en tándem o repeticiones dispersas, aunque el resto de la secuencia no responde a un patrón definido y clasificable. Gran parte del ADN intergénico puede ser un artefacto evolutivo sin una función determinada en el genoma actual, por lo que tradicionalmente estas regiones han sido denominadas ADN "basura" (Junk DNA), denominación que incluye también las secuencias intrónicas y pseudogenes. No obstante, esta denominación no es la más acertada dado el papel regulador conocido de muchas de estas secuencias. Además el notable grado de conservación evolutiva de algunas de estas secuencias parece indicar que poseen otras funciones esenciales aún desconocidas o poco conocidas. Por lo tanto, algunos prefieren denominarlo "ADN no codificante" (aunque el llamado "ADN basura" incluye también transposones codificantes) o "ADN repetitivo". Algunas de estas regiones constituyen en realidad genes precursores para la síntesis de microARN (reguladores de la expresión génica y del silenciamiento génico). Estudios recientes enmarcados en el proyecto ENCODE han obtenido resultados sorprendentes, que exigen la reformulación de nuestra visión de la organización y la dinámica del genoma humano. Según estos estudios, el 15% de la secuencia del genoma humano se transcribe a ARN maduros, y hasta el 90% se transcribe al menos a transcritos inmaduros en algún tejido.Así, una gran parte del genoma humano codifica genes de ARN funcionales. Esto es coherente con la tendencia de la literatura científica reciente a asignar una importancia creciente al ARN en la regulación génica. Asimismo, estudios detallados han identificado un número mucho mayor de secuencias de inicio de transcripción por gen, algunas muy alejadas de la región próxima a la traducida. Como consecuencia, actualmente resulta más complicado definir una región del genoma como génica o intergénica, dado que los genes y las secuencias relacionadas con los genes se extienden en las regiones habitualmente consideradas intergénicas. ADN repetido en tándem
  • 19.
    Son repeticiones quese ordenan de manera consecutiva, de modo que secuencias idénticas, o casi, se disponen unas detrás de otras. -Satélites: El conjunto de repeticiones en tándem de tipo satélite comprende un total de 250 Mb del genoma humano. Son secuencias de entre 5 y varios cientos de nucleótidos que se repiten en tándem miles de veces generando regiones repetidas con tamaños que oscilan entre 100 kb (100.000 nucleótidos) hasta varias megabases. Reciben su nombre de las observaciones iniciales de centrifugaciones en gradiente de densidad del ADN genómico fragmentado, que reportaban una banda principal correspondiente a la mayor parte del genoma y tres bandas satélite de menor densidad. Esto se debe a que las secuencias satélite tienen una riqueza en nuclétidos A+T superior a la media del genoma y en consecuencia son menos densas. Hay principalmente 6 tipos de repeticiones de ADN satélite -Satélite 1: secuencia básica de 42 nucleótidos. Situado en los centrómeros de los cromosomas 3 y 4 y el brazo corto de los cromosomas acrocéntricos (en posición distal respecto al cluster codificante de ARNr). -Satélite 2: la secuencia básica es ATTCCATTCG. Presente en las proximidades de los centrómeros de los cromosomas 2 y 10, y en la constricción secundaria de 1 y 16. -Satélite 3: la secuencia básica es ATTCC. Presente en la constricción secundaria de los cromosomas 9 e Y, y en posición proximal respecto al cluster de ADNr del brazo corto de los cromosomas acrocéntricos. -Satélite alfa: secuencia básica de 171 nucleótidos. Forma parte del ADN de los centrómeros cromosómicos. -Satélite beta: secuencia básica de 68 nucleótidos. Aparece en torno al centrómero en los cromosomas acrocéntricos y en la constricción secundaria del cromosoma 1. -Satélite gamma: secuencia básica de 220 nucleótidos. Próximo al centrómero de los cromosomas 8 y X. -Minisatélites: Están compuestas por una unidad básica de secuencia de 6-25 nucleótidos que se repite en tándem generando secuencias de entre 100 y 20.000 pares de bases. Se estima que el genoma humano contiene unos 30.000 minisatélites. Diversos estudios han relacionado los minisatélites con procesos de regulación de la expresión génica, como el control del nivel de transcripción, el ayuste (splicing) alternativo o la impronta (imprinting). Asimismo, se han asociado con puntos de fragilidad cromosómica dado que se sitúan próximos a lugares preferentes de rotura cromosómica, translocación genética y recombinación meiótica. Por último, algunos minisatélites humanos (~10%) son hipermutables, presentando una tasa media de mutación entre el 0.5% y el 20% en las células de la línea germinal, siendo así las regiones más inestables del genoma humano conocidas hasta la fecha. En el genoma humano, aproximadamente el 90% de los minisatélites se sitúan en los telómeros de los cromosomas. La secuencia básica de seis nucleótidos TTAGGG se repite miles de veces en tándem, generando regiones de 5-20 kb que conforman los telómeros. Algunos minisatélites por su gran inestabilidad presentan una notable variabilidad entre individuos distintos. Se consideran polimorfismos multialélicos, dado que pueden presentarse en un número de repeticiones muy variable, y se denominan VNTR (acrónimo de Variable number tandem repeat).
  • 20.
    Son marcadores muyutilizados en genética forense, ya que permiten establecer una huella genética característica de cada individuo, y son identificables mediante Southern blot e hibridación. -Microsatélites: Están compuestos por secuencias básicas de 2-4 nucleótidos, cuya repetición en tándem origina frecuentemente secuencias de menos de 150 nucleótidos. Algunos ejemplos importantes son el dinucleótido CA y el trinucleótido CAG. Los microsatélites son también polimorfismos multialélicos, denominados STR (acrónimo de Short Tandem Repeats) y pueden identificarse mediante PCR, de modo rápido y sencillo. Se estima que el genoma humano contiene unos 200.000 microsatélites, que se distribuyen más o menos homogéneamente, al contrario que los minisatélites, lo que los hace más informativos como marcadores. ADN repetido disperso Son secuencias de ADN que se repiten de modo disperso por todo el genoma, constituyendo el 45% del genoma humano. Los elementos cuantitativamente más importantes son los LINEs y SINEs, que se distinguen por el tamaño de la unidad repetida. Estas secuencias tienen la potencialidad de autopropagarse al transcribirse a una ARNm intermediario, retrotranscribirse e insertarse en otro punto del genoma. Este fenómeno se produce con una baja frecuencia, estimándose que 1 de cada 100-200 neonatos portan una inserción nueva de un Alu o un L1, que pueden resultar patogénicos por mutagénesis insercional, por desregulación de la expresión de genes próximos (por los propios promotores de los SINE y LINE) o por recombinación ilegítima entre dos copias idénticas de distinta localización cromosómica (recombinación intra o intercromosómica), especialmente entre elementos Alu. -SINE: Acrónimo del inglés Short Interspersed Nuclear Elements (Elementos nucleares dispersos cortos). Son secuencias cortas, generalmente de unos pocos cientos de bases, que aparecen repetidas miles de veces en el genoma humano. Suponen el 13% del genoma humano, un 10% debido exclusivamente a la familia de elementos Alu (característica de primates). Los elementos Alu son secuencias de 250-280 nucleótidos presentes en 1.500.000 de copias dispersas por todo el genoma. Estructuralmente son dímeros casi idénticos, excepto que la segunda unidad contiene un inserto de 32 nucleótidos, siendo mayor que la primera. En cuanto a su secuencia, tienen una considerable riqueza en G+C (56%), por lo que predominan en las bandas R, y ambos monómeros presentan una cola poliA (secuencia de adeninas) vestigio de su origen de ARNm. Además poseen un promotor de la ARN polimerasa III para transcribirse. Se consideran retrotransposones no autónomos, ya que dependen para propagarse de la retrotranscripción de su ARNm por una retrotranscriptasa presente en el medio. -LINE: Acrónimo del inglés Long Interspersed Nuclear Elements (Elementos nucleares dispersos largos). Constituyen el 20% del genoma humano, contiene unos 100.000-500.000 copias de
  • 21.
    retrotransposones L1 quees la familia de mayor importancia cuantitativa, es una secuencia de 6 kb repetida unas 800.000 veces de modo disperso por todo el genoma, aunque la gran mayoría de las copias es incompleta al presentar el extremo 5' truncado por una retrotranscripción incompleta. Así, se estima que hay unas 5.000 copias completas de L1, sólo 90 de las cuales son activas, estando el resto inhibidas por metilación de su promotor. Su riqueza en G+C es del 42%, próxima a la media del genoma (41%) y se localizan preferentemente en las bandas G de los cromosomas. Poseen además un promotor de la ARN polimerasa II. Los elementos LINE completos son codificantes. En concreto LINE-1 codifica dos proteínas: -Proteína de unión a ARN (’’RNA-binding protein’’): codificada por el marco de lectura abierto 1 (ORF1, acrónimo del inglés ‘’Open reading Frame 1’’) -Enzima con actividad retrotranscriptasa y endonucleasa: codificada por el ORF2. Ambas proteínas son necesarias para la retrotransposición. Estos elementos móviles están flanqueados por 2 regiones no codificantes, denominados como 5 ´UTR y 3´UTR. Por lo tanto, se consideran retrotransopsones autónomos, ya que codifican las proteínas que necesitan para propagarse. La ARN polimerasa II presente en el medio transcribe el LINE, y este ARNm se traduce en ambos marcos de lectura produciendo una retrotranscriptasa que actúa sobre el ARNm generando una copia de ADN del LINE, potencialmente capaz de insertarse en el genoma. Asimismo estas proteínas pueden ser utilizadas por pseudogenes procesados o elementos SINE para su propagación. La transcripción se inicia en un promotor interno del extremo 5´UTR. La endonucleasa de L1 genera una mella en una única cadena del ADN genómico, en una secuencia consenso 5´TTTTT/A3 ´. Diversos estudios han mostrado que las secuencias LINE pueden tener importancia en la regulación de la expresión génica, habiéndose comprobado que los genes próximos a LINE presentan un nivel de expresión inferior. Esto es especialmente relevante porque aproximadamente el 80% de los genes del genoma humano contiene algún elemento L1 en sus intrones. Se ha visto que la inserción aleatoria de L1 activos en el genoma humano ha dado lugar a enfermedades genéticas, ya que interfiere en la expresión normal. También se observa una predilección de L1 por regiones ricas en AT. Variabilidad Si bien dos seres humanos del mismo sexo comparten un porcentaje elevadísimo (en torno al 99,9%) de su secuencia de ADN, lo que nos permite trabajar con una única secuencia de referencia, pequeñas variaciones genómicas fundamentan buena parte de la variabilidad fenotípica interindividual. Una variación en el genoma, por sustitución, deleción o inserción, se denomina polimorfismo o alelo genético. No todo polimorfismo genético provoca una alteración en la secuencia de una proteína o de su nivel de expresión, es decir, muchos son silenciosos y carecen de expresión fenotípica. -SNP's: La principal fuente de variabilidad en los genomas de dos seres humanos procede de las variaciones en un sólo nucleótido, conocidas como SNP's (Single nucleotide polimorphisms), en las cuales se
  • 22.
    han centrado lamayor parte de los estudios. Dada su importancia, en la actualidad existe un proyecto internacional (International HapMap Project) para catalogar a gran escala los SNP's del genoma humano. En este contexto, la denominación de SNP frecuentemente se restringe a aquellos polimorfismos de un sólo nucleótido en los que el alelo menos frecuente aparece en al menos el 1% de la población. Los SNP son marcadores tetralélicos, dado que en teoría en una posición puede haber cuatro nucleótidos distintos, cada uno de los cuales identificaría un alelo; sin embargo, en la práctica suelen presentar sólo dos alelos en la población. Se estima que la frecuencia de SNP's en el genoma humano es de un SNP cada 500-100 pares de bases, de los que una parte relevante son polimorfismos codificantes, que causan la sustitución de un aminoácido por otro en una proteína. Gracias a su abundancia y a que presentan una distribución aproximadamente uniforme en el genoma, han tenido gran utilidad como marcadores para los mapas de ligamiento, herramienta fundamental del Proyecto Genoma Humano. Además son fácilmente detectables a gran escala mediante el empleo de chips de ADN (comúnmente conocidos como microarrays). -Variación estructural: Este tipo de variaciones se refiere a duplicaciones, inversiones, inserciones o variantes en el número de copias de segmentos grandes del genoma (por lo general de 1000 nucléotidos o más). Estas variantes implican a una gran proporción del genoma, por lo que se piensa que son, al menos, tan importantes como los SNPs. Variación estructural es el término general para abarcar un grupo de alteraciones genómicas que implican segmentos de ADN mayores de 1Kb. La variación estructural puede ser cuantitativa (variante en número de copia, que comprende: deleciones, inserciones y duplicaciones), posicional (translocaciones) y orientacional (inversiones). A pesar de que este campo de estudio es relativamente nuevo (los primeros estudios a gran escala se publicaron en los años 2004 y 2005), ha tenido un gran auge, hasta el punto de que se ha creado un nuevo proyecto para estudiar este tipo de variantes en los mismos individuos en los que se basó el Proyecto HapMap. Aunque aún quedan dudas acerca de las causas de este tipo de variantes, cada vez existe más evidencia a favor de que es un fenómeno recurrente que todavía continua moldeando y creando nuevas variantes del genoma. Este tipo de variaciones han potenciado la idea de que el genoma humano no es una entidad estática, sino que se encuentra en constante cambio y evolución.
  • 23.
    Índice -Pag. 2,3,4,5 Historia dela genética y sucesos destacados. -Pag. 5,6,7 Contexto Proyecto Genoma Humano. -Pag. 7,8,9 Objetivos Proyecto Genoma Humano. -Pag. 9,10,11,12,13 Usos Proyecto Genoma Humano. -Pag. 14 Aspectos éticos. -Pag. 14-22 Componentes, estructura y variabilidad secuencia ADN. Bibliografía http://es.wikipedia.org/wiki/Proyecto_Genoma_Humano http://es.wikipedia.org/wiki/Genoma_humano http://es.wikipedia.org/wiki/Historia_de_la_gen%C3%A9tica http://www.news-medical.net/health/History-of-Genetics-%28Spanish%29.aspx http://www.ugr.es/~eianez/Biotecnologia/genoma-1.html http://www.monografias.com/especiales/genoma/