INFORME DE LA PRACTICA N 04 ANALISIS DE SECUENCIAS DE ADN Y USO DEL BANCO DE GENES BLASTn y ciestionario.pdf
1. 1
UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
INFORME: ANÁLISIS DE SECUENCIAS DE ADN Y USO
DEL BANCO DE GENES BLAST
Biotecnología
Asesor:
Dr. Hebert Soto
Responsables:
Arevalo Navarro, Stefani Brilly 2019205021
Luna Merma, Mayra Alexandra 2019205034
VII Ciclo
Ilo, Moquegua, Perú
2021
3. 3
INTRODUCCIÓN
El ADN es una de las moléculas más importantes para la vida. Consiste de una doble
hélice donde cada una de las cadenas es un polímero integrado por miles o incluso
millones de nucleótidos (Stansfield 1992). Cada nucleótido, está formado por un azúcar
(desoxirribosa), una base nitrogenada que puede ser adenina (A), timina (T), citosina (C)
o guanina (G) y un grupo fosfato (Stansfield 1992). El orden que tienen los nucleótidos
en el ADN es lo que se denomina secuencia (Figura 1) y las técnicas y métodos que se
utilizan para conocer esa secuencia son llamados de secuenciación (de Necochea y Canul
2004). Conocer el orden de los nucleótidos es una herramienta con infinidad de
aplicaciones porque la diferencia fundamental entre todas las moléculas de ADN que
forman el material genético de los seres vivos es la secuencia de estas cuatro bases
nitrogenadas (de Necochea y Canul 2004).
La técnica enzimática se basa en la interrupción controlada de la replicación del ADN in
vitro. Se realiza una PCR del fragmento que se va a secuenciar pero, a diferencia de una
PCR convencional , se utiliza un solo iniciador y se agregan dideoxinucleótidos (ddNTPs)
que carecen del grupo hidroxilo en el extremo 3 y están marcados con radiactividad o con
fluoróforos. Cuando se incorpora un dideoxinucleótido a la cadena en elongación, se
termina su amplificación, de tal manera que al final, se tienen fragmentos de diferente
longitud, cada uno terminando en un ddNTPs . Los fragmentos obtenidos, se separan y
analizan electroforéticamente de manera manual o automática. Este método ha sido
utilizado ampliamente en muchas líneas de investigación, generando tal cantidad de
secuencias que a principios de los ochenta fue necesario crear bases de datos universales
para resguardar la información y hacerla accesible a los usuarios.
En 1982, año en que se crea el Genbank a través del National Center for Biotechnology
Information (NCBI), existían más de 2 000 secuencias y para principios del 2011 esta
base de datos estaba integrada por más de 100 000 000 secuencias. En cuanto a genomas
completos, en total se tienen registrados y en proceso de ser secuenciados cerca de 6.000
distintos, siendo los virus los que mayor número de variantes secuenciadas presentan
(NCBI 2011).
BLAST (Basic Local Alignment Search Tool) es un programa informático de
alineamiento de secuencias de tipo local, ya sea de ADN, ARN o proteínas. El programa
es capaz de comparar una secuencia problema contra una gran cantidad de secuencias que
4. 4
se encuentren en una base de datos. El algoritmo encuentra las secuencias de la base de
datos que tienen mayor parecido a la secuencia problema.
OBJETIVOS
OBJETIVO PRINCIPAL
● Analizar 15 secuencias de ADN con el apoyo del programa Bioedit y el BLAST
OBJETIVOS SECUNDARIOS
● Aprender a utilizar los programas bioinformáticos como el programa Bioedit y
BLAST
● Lograr que la bioinformática aporte su capacidad para facilitar y asegurar la
gestión , almacenamiento , salvaguarda,recuperación y presentación de la
información biotecnológica que se maneja en el ambiento ambiental
METODOLOGÍA
BioEdit
BioEdit es un editor de alineación de secuencia biológica escrito para Windows 95/98 /
NT / 2000 / XP / 7. Una interfaz intuitiva de documentos múltiples con características
convenientes hace que la alineación y la manipulación de secuencias sean relativamente
fáciles en su computadora de escritorio. Varias opciones de análisis y manipulación de
secuencias y enlaces a programas de análisis externos facilitan un entorno de trabajo que
le permite ver y manipular secuencias con simples operaciones de apuntar y hacer clic.
1.1 Identificar las muestras de la carpeta
● Utilizaremos 15 muestras de secuencias de ADN , las cuales rotulamos con los
siguientes códigos
CÓDIGO CÓDIGO CÓDIGO CÓDIGO
D03_07 A02_02 E02_10 H01_15
AO3_01 E01_09 F01_11 H04_16
D04_08 B02_04 C02_06 C04_06
F03_11 G02_14 D02_08 -
5. 5
De los cuales se analizó cada secuencia de ADN con la ayuda del programa Bioedit
1.2 Análisis de cada secuencia en BioEdit
a) D03_07
17. 17
RESULTADO
Luego del procesamiento de las secuencias de ADN en los programas de BioEdit y
BLAST se obtienen los siguientes resultados estructurados en el siguiente cuadro donde
evaluamos la calidad de la secuencia entre mala , regular y Buena , Tambien
indentificamos el porcentaje y la especie representative que se identifico en cada
secuencia :
19. 1
CONCLUSIONES
- Se concluyo que el programa BioEdit resulta muy util para el analisis de las
secuencias de AND , el cual mendiante el grafico que nos ilustra nos resulta facil
interpreter la calidad de las secuencias , se distingue claramente los picos altos y
bajos y con esto indicamos la calidad de la secuencia , Tambien vemos claramente
la presencia de “N” en el orden lo cual podemos interpreter facilmente
- Se logro manejar correctamente el programa BLAST con el cual pudimos
procesar correctamente nuestras secuencias y compararlas con otras secuencias
que han sido previamente caracterizadas, para así poder inferir su función.
ANEXOS
20. ANEXO 1
CUESTIONARIO PARA EL INFORME
1.- ¿QUÉ ES EL BLASTn? Y CÓMO NOS AYUDA EN LA PRÁCTICA.
BLAST es el acrónimo de Basic Local Alignment Search Tool y es el algoritmo más empleado por
el NCBI. La principal característica del BLAST es su velocidad, pudiendo tomar pocos minutos
cualquier búsqueda en la totalidad de la base de datos. De hecho, los resultados se presentan en
pantalla inmediatamente después de calculados. El BLAST puede hacer búsquedas en una base de
datos no redundante (nr) la cual tiene los registros no redundantes entre las dos bases de datos
principales a nivel mundial: GenBank en USA y EMBL (European Molecular Biology
Laboratories) en Europa.
El BLASTn en la práctica nos ayudó a identificar las especies que más predominan en cada
secuencia de ADN gracias a la gran base de datos que tiene a nivel mundial.
2.- QUE ES UNA SECUENCIA DE ADN Y COMO NOS SERVIRÁ EN INGENIERÍA
AMBIENTAL?
Una secuencia de ADN, secuencia de nucleótidos o secuencia genética es una sucesión de letras
representando la estructura primaria de una molécula real o hipotética de ADN o banda, con la
capacidad de transportar información. Las letras son A, C, G y T, que simbolizan las cuatro
subunidades de nucleótidos de una banda ADN - adenina, citosina, guanina, timina, que son bases
covalentemente ligadas a cadenas fosfóricas. En el típico caso, las secuencias se presentan pegadas
unas a las otras, sin espacios, como en la secuencia AAAGTCTGAC, yendo de 5' a 3' de izquierda a
derecha.
Una sucesión de cualquier número de nucleótidos mayor a cuatro es posible de llamarse una
secuencia. En relación a su función biológica, que puede depender del contexto, una secuencia
puede tener sentido o contrasentido, y ser tanto codificante o no codificante. Las secuencias de
ADN pueden contener "ADN no codificante". Las secuencias pueden derivarse de material
biológico de descarte a través del proceso de secuenciación del ADN.
La secuencia de ADN en la ingeniería ambiental nos ayuda en diferentes aplicaciones las cuales
podemos dividir en ámbitos como el estudio de ecosistemas antiguos, las interacciones
planta-polinizador, el análisis de las dietas, la detección de especies invasoras, las respuestas a la
contaminación o el análisis de la calidad del aire que se describen y ejemplifican en diferentes
investigaciones
21. 3.- DIBUJE LA ESTRUCTURA DEL ADN E INDIQUE LA HISTORIA PARA SU
DESCUBRIMIENTO.
IMAGEN 1
Durante el año de 1869 el biólogo suizo Johann Friedrich Miescher, utilizó alcohol caliente y luego
una pepsina enzimática, la cual separa la membrana celular y el citoplasma de la célula, lo que se
quería lograr era aislar el núcleo de la célula.Este proceso se llevó a cabo con los núcleos de las
células obtenidas del pus de vendajes quirúrgicos desechados y del esperma de salmón,
sometiéndose a estos materiales y a una fuerza centrifuga para aislar a los núcleos y luego realizó
un análisis químico a los núcleos.
De esta forma Miescher identificó a un nuevo grupo de sustancias celulares a las que denominó
nucleínas. Observó la presencia de fósforo, después Richard Altmann los identificó como ácidos y
les dio el nombre de ácidos nucleicos. En 1914 Robert Feulgen descubrió un método para revelar el
ADN, basado en el colorante fucsina. En el transcurso de los años 20, el bioquímico P.A. Levene
realizó un análisis a los componentes del ADN y encontró que contenía cuatro bases nitrogenadas:
citosina y timina, adenina y guanina; azúcar desoxirribosa; y fosfato. También señaló que se
encontraban unidas en un orden definido el cual es: fosfato-azúcar-base, formando lo que llamó
nucleótido. Levene también expuso que los nucleótidos se encontraban unidos por los fosfatos
formando el ADN.
James Watson y Francis CrickEllos descubrieron la forma que del ADN al interior de la célula: una
hélice doble, que le permite replicarse y traspasar información de una generación a otra. Este
descubrimiento fue el punto de partida para el estudio del genoma. Desde aquella fecha hasta hoy
han pasado 50 años, y los avances de la Genéticahan sido enormes.
4. ¿QUÉ ES EL MÉTODO DE SECUENCIACIÓN DE SANGER?
Esta estrategia se basa en sintetizar, de forma secuencial, una hebra de ADN complementaria a una
hebra de cadena simple (que se utiliza como molde), en presencia de ADN polimerasa, los cuatro
2’-deoxinucleótidos que componen la secuencia del ADN (dATP, dGTP, dCTP y dTTP) y cuatro
dideoxinucleótidos (ddATP, ddGTP, ddCTP y ddTTP). Estos últimos nucleótidos “especiales” o
nucleótidos de parada, están diseñados para que carezcan del grupo 3’-OH, que permite la adición
del nucleótido consecutivo, de forma que cuando uno de ellos es incorporado por la polimerasa se
interrumpe la síntesis de la nueva hebra. Esto lleva a que se obtengan fragmentos secuenciados de
diferente tamaño, según dónde se incorporen los dideoxinucleótidos. De este modo, y tras una
simple electroforesis, se va a poder dilucidar la secuencia.
22. La secuenciación de Sanger es un método de secuenciación de ADN que implica electroforesis y se
basa en la incorporación aleatoria de didesoxinucleótidos que terminan la cadena mediante la ADN
polimerasa durante la replicación del ADN in vitro .
5.- DIBUJE TODA LA METODOLOGÍA DE SECUENCIACIÓN DE ADN
(SECUENCIACIÓN SANGER).
IMAGEN 2
6.- ¿CUÁNTOS TIPOS DE SECUENCIACIÓN DE ADN EXISTE ACTUALMENTE?
Si bien los métodos para secuenciar el ADN han evolucionado a lo largo de los años, todos ellos
consisten en general en romper las largas cadenas de ADN en muchas piezas pequeñas y utilizar
luego uno de los diversos tipos de pruebas analíticas para determinar el orden de las bases de
nucleótidos que componen esas piezas. Los tipos de secuación mas usados son:
Secuenciación Sanger
Secuenciación masiva – Next Generation Sequencing (NSG)
7.- LOS 15 ARCHIVOS QUE USTED ANALIZÓ, A QUE SER VIVO CORRESPONDE?
CÓDIGO NOMBRE DE ESPECIE IMAGEN REFERENCIAL
D03_07 Enterobacter sp.
D04_08 Klebsiella oxytoca partia
25. C04_06 Pseudomonas jessenii stra
8.- REALICE UNA BREVE SINOPSIS DE LA HISTORIA DE LA SECUENCIACIÓN DE
ÁCIDOS NUCLEICOS
La historia de la secuenciación del ADN comienza en 1977 cuándo se publicaron los primeros
métodos de secuenciación del ADN en ser aceptados y utilizados de forma general por los
investigadores: la secuenciación con dideoxinucleótidos desarrollada por Sanger y Coulson y la
secuenciación química de Maxam y Gilbert. Cinco años después se utilizaba el método Sanger para
secuenciar el genoma completo del bacteriófago lambda, tras haberlo fragmentado y clonado en
diferentes vectores.En los años siguientes, la secuenciación mediante Sanger se automatizó, lo que
aumentó la capacidad de análisis e incrementó notablemente la cantidad de datos de secuencia
generados y disponibles para los investigadores. Ambas mejoras impulsaron la creación de los
primeros bancos de secuencias y el desarrollo de herramientas informáticas de análisis.
Sin embargo, el gran motor del desarrollo de las técnicas de secuenciación y análisis del ADN fue el
Proyecto Genoma Humano iniciado en 1990. Los retos técnicos y analíticos a los que tuvieron que
hacer frente los investigadores responsables del proyecto favorecieron la optimización de algunas
de las herramientas utilizadas y la creación de otras nuevas más acordes a la empresa de secuenciar
3.000 millones de pares de bases El primer borrador del Genoma Humano fue publicado en 2.001 y
desde entonces, en paralelo a la utilización de la secuenciación como pieza clave en múltiples
laboratorios de todo el mundo, se han secuenciado los genomas de muchos otros organismos
modelo.
El siguiente gran salto desde la automatización de la secuenciación Sanger fue el desarrollo de las
técnicas de secuenciación masiva en paralelo, principales protagonistas de la secuenciación del
ADN hoy en día. La gran ventaja de estos métodos es que ya no se necesita un tubo por reacción
química de secuenciación sino que utiliza una biblioteca de moléculas molde de ADN fijadas en un
soporte y se lanza la muestra a analizar frente a ella. Esta tecnología permite analizar cualquier
26. ADN sin que sea necesario un conocimiento previo de la secuencia.
Por último, el último gran avance técnico han sido las ya denominadas tecnologías de
secuenciación de tercera generación, que no requieren una amplificación previa del ADN a
secuenciar, permiten obtener la secuencia de moléculas de simple cadena en tiempo real, y son
capaces de leer moléculas de mayor longitud que las aproximaciones anteriores. Dentro de estas
nuevas herramientas se encuentran la síntesis mediada por polimerasa de PacBio y la secuenciación
mediante nanoporos.
9.- ¿QUÉ ES EL BIOEDIT?
BioEdit es un editor de alineación de secuencia biológica e. Una interfaz intuitiva de documentos
múltiples con características convenientes hace que la alineación y la manipulación de secuencias
sean relativamente fáciles en su computadora de escritorio. Varias opciones de análisis y
manipulación de secuencias y enlaces a programas de análisis externos facilitan un entorno de
trabajo que le permite ver y manipular secuencias con simples operaciones de apuntar y hacer clic.
10.- QUE ES EL NCBI (National Center for Biotechnology Information), INCLUIR SU
27. HISTORIA?
El Centro Nacional para la Información Biotecnológica o National Center for Biotechnology
Information (NCBI) es parte de la Biblioteca Nacional de Medicina de Estados Unidos (National
Library of Medicine), una rama de los Institutos Nacionales de Salud (National Institutes of Health
o NIH). Está localizado en Bethesda, Maryland y fue fundado el 4 de noviembre de 1988 con la
misión de ser una importante fuente de información de biología molecular. Almacena y
constantemente actualiza la información referente a secuencias genómicas en GenBank, un índice
de artículos científicos referentes a biomedicina, biotecnología, bioquímica, genética y genómica en
PubMed, una recopilación de enfermedades genéticas humanas en OMIM, además de otros datos
biotecnológicos de relevancia en diversas bases de datos.
El NCBI ha tenido la responsabilidad de hacer accesible la base de datos de secuencias de ADN de
GenBank desde 1992. GenBank se coordina con laboratorios individuales y otras bases de datos de
secuencias tales como las del European Molecular Biology Laboratory (EMBL) y la Base de Datos
de ADN de Japón.