1. “UNIVERSIDAD NACIONAL DE MOQUEGUA”
“Escuela Profesional de Ingeniería Ambiental
“ESCUELA PROFESIONAL DE INGENIERIA AMBIENTAL”
TEMA:
PRACTICA N°2 CON EL PROGRAMA MEGA X Y NCBI
DOCENTE:
Hebert Soto Gonzales
CURSO:
Biotecnología
ELABORADO POR:
Valeria Ampuero Herrera
CICLO:
VII
FECHA DE ENTREGA:
22/10/2021
Ilo - Perú
2. “UNIVERSIDAD NACIONAL DE MOQUEGUA”
“Escuela Profesional de Ingeniería Ambiental
1. INTRODUCCION
En la actualidad se dispone de las secuencias de una gran variedad de genomas, incluido
el humano.
El orden de las bases A, T, G y C de un genoma nos dice poco si no contamos con
formas de poder decodificar la información que contiene. Entonces cabe mencionar que
uno de los grandes logros relacionados con la secuenciación de diversos genomas es el
desarrollo de algoritmos computacionales que son empleados para traducir el
significado biológico contenido en el ADN.
La bioinformática es una ciencia que surge de la necesidad de interpretar la información
contenida en las secuencias de DNA, RNA y proteínas. Desde que se difundieron las
técnicas de secuenciación de DNA y proteínas, y se incrementó el volumen de
secuencias en los bancos de datos, surgió la necesidad de desarrollar algoritmos para
catalogar secuencias, analizar similitud entre ellas, así como descubrir sus propiedades
estructurales y funcionales. La bioinformática es una ciencia de naturaleza
interdisciplinaria, ya que se fundamenta en la biología y las ciencias de la computación;
empero, se nutre en grado considerable de la fisicoquímica, las matemáticas, la
estadística y la probabilidad.
En esta práctica se utilizó el programa Mega X y NCBI, para poder identificar una
muestra, después de obtenerla se procede a utilizar los programas ya mencionados para
así poder analizar y alinear secuencias de ADN. Finalmente, los resultados que se
obtienen, se analizan.
3. “UNIVERSIDAD NACIONAL DE MOQUEGUA”
“Escuela Profesional de Ingeniería Ambiental
2. OBJETIVOS
a. OBJETIVO GENERAL
Analizar a través del uso del programa MEGA DNA las muestras del ADN y
a su vez la creación del árbol genealógico.
b. OBJETIVOS ESPECIFICOS
Realizar la secuenciación de ADN empleando el programa MEGA DNA
Analizar 30 muestras de ADN con el programa MEGA DNA.
Obtener más información sobre el ADN de dichas muestras.
3. MARCO TEORICO
3.1. ADN.
ADN es la abreviatura para Ácido Desoxirribonucleico, una molécula compleja que se
encuentra dentro de cada célula de nuestro cuerpo y contiene todas las instrucciones
necesarias para crear y mantener la vida.
Para entender qué es el ADN debemos imaginarnos dos cadenas que se unen formando
una doble hélice o una escalera de caracol; ésta fue descrita por primera vez en 1953 por
James Watson y Francis Crick, lo que supuso un hito en la historia de la biología. Muchos,
miles, millones de adeninas, timinas, guaninas y citosinas se unen formando una
secuencia que sigue un orden determinado como por ejemplo
AAATTCGAGTCAATTGCCTATCCTCGAGTCAACCTATCCA. La secuencia
completa de estas sustancias químicas compone nuestro código genético, nuestro genoma
y determinadas secuencias de estas “letras” dan lugar a “frases” conocidas como “genes”.
Entonces el ADN es el material que contiene la información hereditaria en los humanos
y casi todos los demás organismos. Ademas la información en el ADN se almacena como
un código compuesto por cuatro bases químicas, adenina (A), guanina (G), citosina (C) y
timina (T).
4. “UNIVERSIDAD NACIONAL DE MOQUEGUA”
“Escuela Profesional de Ingeniería Ambiental
3.2.GEN
El diccionario de la Real Academia define el gen como cada una de las partículas
dispuestas en él, un orden fijo a lo largo de los cromosomas y que determinan la aparición
de los caracteres hereditarios en los virus, las bacterias, las plantas y los animales.
3.3.GENOMA
Es el conjunto de genes, es decir, es la información genética de un ser viviente, el que ya
descifrado nos dará a conocer la esencia de las características de cualquier ser viviente.
3.4.ALINEACION
Según el modelo propuesto por Watson y Crick, la molécula de ADN está compuesta por
dos hebras helicoidales (Torres, 2007), cada una siguiendo una secuencia de nucleótidos
{A;T;C;G}, y formando parejas de {C;G} y {A;T} entre las dos hélices (Ferrández,
Hernández & Pastor, 2003). Una vez extraído ADN de una muestra, se obtienen dos
secuencias de ADN (forward y reverse). Deben guardarse cada una en un documento con
formato FASTA (figura 1). Se debe realizar un BLAST a la secuencia forward, que
consiste en hacer una búsqueda en una base de datos de secuencias de ADN, para
encontrar datos similares y verificar si el amplificador es correcto (Altschul, Madden,
Schäffer1, Zhang, Zhang2, Miller2 & Lipman, 1997).
5. “UNIVERSIDAD NACIONAL DE MOQUEGUA”
“Escuela Profesional de Ingeniería Ambiental
3.5.PROGRAMA MEGA DNA
El software de Análisis de Genética Evolutiva Molecular (MEGA) implementa muchos
métodos y herramientas analíticos para filogenómica, filomedicina también nos sirve para
la secuenciación de ADN. MEGA se desarrolló por primera vez para MS DOS a
principios de la década de 1990 (Kumar et al. 1994) y luego se actualizó para su uso en
MS Windows ocho veces, incluyendo MEGA 1 a MEGA 6 y MEGA-CC y MEGA-MD
(Kumar et al. 2001, , 2016). Algunas de las versiones de MEGA se han empaquetado para
sistemas Linux utilizando la capa de compatibilidad WINE para sistemas operativos
compatibles con POSIX y la herramienta Wineskin (construida en WINE) para sistemas
macOS. Estas versiones se han descargado más de 200.000 veces. Pero la solución de
emulación de Windows ad hoc es lenta y relativamente inestable en comparación con el
rendimiento de MS Windows. Los emuladores no se pueden usar de manera efectiva para
la última versión de 64 bits de MEGA que está diseñada para manejar análisis intensivos
en memoria de grandes conjuntos de datos contemporáneos (Kumar et al.2016), por lo
que se requiere una solución más completa para los usuarios de plataformas alternativas.
(Sudhir, Stecher, Li, Knyaz, & Tamura, 2018)
3.6.PROGRAMA NCBI
Es un programa de investigación del Computational Biology Branch (CBB), realizado
por investigadores y estudiantes del postdoctorado, encargados de investigar sobre las
aplicaciones teóricas y analíticas para resolver problemas fundamentales en biología
molecular. Tales como análisis de secuencia, análisis de función y estructura de proteínas,
identificación de genes, incluyendo algoritmos para la búsqueda en bases de datos,
secuencias de baja complejidad, modelos matemáticos de evolución, métodos estadísticos
para virología, comportamiento dinámico para reacciones químicas.
Comparación de genomas, árboles taxonómicos, y genética de poblaciones. Muchas de
estas investigaciones han contribuido a la aplicación de las bases de datos de la NCBI
suministrando algoritmos innovadores como el BLAST,SEG,VAST COGs, entre otros.
(Parra & Ramirez, 2021) blastp compara una secuencia problema de aminoácidos contra
6. “UNIVERSIDAD NACIONAL DE MOQUEGUA”
“Escuela Profesional de Ingeniería Ambiental
una base de datos de secuencias de proteínas, compara una secuencia problema de
nucleótidos contra una base de datos de secuencias de nucleótidos, compara una secuencia
problema de nucleótidos traducida en sus seis posibles marcos de lectura contra una base
de secuencias de proteínas, compara una secuencia problema de aminoácidos contra toda
la base de datos de nucleótidos traducida en sus seis posibles marcos de lectura compara
las seis traducciones en sus marcos de lectura de la secuencia problema de nucleótidos,
contra las seis traducciones en sus marcos de lectura de toda la base de datos de
nucleótidos.
4. MATERIALES Y METODOS
4.2. MATERIALES
Secuencias crudas generadas por secuenciación Sanger
Computador
Software Bioedit
Software Mega 5.2 o Mega 7.0
Acceso a página Ribosomal Database Project.
Office (Excel)
Memoria USB
4.3.METODOLOGIA
Para empezar a hacer la secuenciación primero debemos instalar nuestro
programa MEGA X O MEGA DNA, este programa está colgada en la red de
forma gratuita.
Una vez descargado e instalado el programa, procedemos a abrirlo, ahí en la
imagen podemos observar una ventana principal
7. “UNIVERSIDAD NACIONAL DE MOQUEGUA”
“Escuela Profesional de Ingeniería Ambiental
Para empezar con la secuenciación nos vamos a dirigir a la opción de ALIGN y damos
clic.
Después saldrá una ventana:
Hacemos clic donde dice: “Show Web Browser
Luego nos dirigirá a una ventana en la cual extraeremos los datos de la NCBI, estos
datos se encuentran colgados en la red.
8. “UNIVERSIDAD NACIONAL DE MOQUEGUA”
“Escuela Profesional de Ingeniería Ambiental
Despues se procede a buscar los datos, él que se buscará en la NCBI será el 16S
Ahora aparecerá una ventana, en la cual debemos hacer clic en la opción “ok”:
9. “UNIVERSIDAD NACIONAL DE MOQUEGUA”
“Escuela Profesional de Ingeniería Ambiental
Al momento de que termine de cargar nos saldrá de la siguiente manera.
Todos los pasos descritos hasta el momento se deberá repetir las 30 veces por que son la
cantidad de muestras que se empleara.Estos pasos vamos a repetir unas 30 veces con
diferentes datos, para tener una buena alineación.
Al terminar con las 30 muestras, cmenzaremos con el alineamiento
Vamos a la opción ALIGN MUSCLE y hacemos clic.
11. “UNIVERSIDAD NACIONAL DE MOQUEGUA”
“Escuela Profesional de Ingeniería Ambiental
Hacemos clic en “OK.”
Nos saldrá la siguiente ventana y daremos clic:
12. “UNIVERSIDAD NACIONAL DE MOQUEGUA”
“Escuela Profesional de Ingeniería Ambiental
Cuando se complete nos saldrá asi:
Los espacios en blanco que se pueden observar se deberán eliminar.
Finalmente, la alineación nos resultara:
ARBOL GENEALOGICO:
Primero vamos a guardar el archivo en una carpeta, hacemos clic donde dice Data, se
desplegarán opciones, escogeremos donde dice Protein Sequences dado un clic.
13. “UNIVERSIDAD NACIONAL DE MOQUEGUA”
“Escuela Profesional de Ingeniería Ambiental
Despues vamos a la opcion de PHYLOGENY
Hacemos clic y se desplegaran varias opciones, vamos a dar clic en Construct/Test
UPGMA tree.
Nos saldrá una ventana en donde saldrá el archivo que guardamos anteriormente le damos
clic en abrir.
Y nos aparecerá la siguiente ventana; donde haremos clic en “OK”:
14. “UNIVERSIDAD NACIONAL DE MOQUEGUA”
“Escuela Profesional de Ingeniería Ambiental
Y de esa manera se crea el árbol genealógico e cual queda de la siguiente manera:
16. “UNIVERSIDAD NACIONAL DE MOQUEGUA”
“Escuela Profesional de Ingeniería Ambiental
6. CONCLUSIONES
Se empleo de forma exitosa el programa MEGA X, a la vez se comprobó su
efectividad en la obtención de los datos del ADN del gen.
Se efectuó una alineación de 30 muestras en dicho programa, para después hacer
un árbol genealógico de los microorganismos, que resulto pertenecer a la familia
de bacterias,
Se puede observar que cada bacteria tiene relación con cada una, las cuales tienen
similitudes en los ADN.
7. BIBLIOGRAFIA.
Holt RA. The genome sequence of the malaria mosquito Anopheles gambiae. Science.
2002;298:129-49. Obtenido de:
https://www.redalyc.org/pdf/106/10649028.pdf
Kanehisa M, Bork P. Bioinformatics in the post-sequence era. Nat Genet.
2003;33(Suppl):305-10. Obtenido de:
https://www.redalyc.org/pdf/106/10649028.pdf
Parra , C. P., & Ramirez, J. (16 de 09 de 2021). EMBnet Colombia. Obtenido de
EMBnet Colombia:
http://bioinf.ibun.unal.edu.co/documentos/Blast/blast.php#:~:text=BLAST%20es%2
0el %20acr%C3%B3nimo%20de, de%20la%20base%20de%20datos.