Valeria ampuero practica n°2

“UNIVERSIDAD NACIONAL DE MOQUEGUA”
“Escuela Profesional de Ingeniería Ambiental
“ESCUELA PROFESIONAL DE INGENIERIA AMBIENTAL”
TEMA:
PRACTICA N°2 CON EL PROGRAMA MEGA X Y NCBI
DOCENTE:
Hebert Soto Gonzales
CURSO:
Biotecnología
ELABORADO POR:
Valeria Ampuero Herrera
CICLO:
VII
FECHA DE ENTREGA:
22/10/2021
Ilo - Perú

1. INTRODUCCION
En la actualidad se dispone de las secuencias de una gran variedad de genomas, incluido
el humano.
El orden de las bases A, T, G y C de un genoma nos dice poco si no contamos con
formas de poder decodificar la información que contiene. Entonces cabe mencionar que
uno de los grandes logros relacionados con la secuenciación de diversos genomas es el
desarrollo de algoritmos computacionales que son empleados para traducir el
significado biológico contenido en el ADN.
La bioinformática es una ciencia que surge de la necesidad de interpretar la información
contenida en las secuencias de DNA, RNA y proteínas. Desde que se difundieron las
técnicas de secuenciación de DNA y proteínas, y se incrementó el volumen de
secuencias en los bancos de datos, surgió la necesidad de desarrollar algoritmos para
catalogar secuencias, analizar similitud entre ellas, así como descubrir sus propiedades
estructurales y funcionales. La bioinformática es una ciencia de naturaleza
interdisciplinaria, ya que se fundamenta en la biología y las ciencias de la computación;
empero, se nutre en grado considerable de la fisicoquímica, las matemáticas, la
estadística y la probabilidad.
En esta práctica se utilizó el programa Mega X y NCBI, para poder identificar una
muestra, después de obtenerla se procede a utilizar los programas ya mencionados para
así poder analizar y alinear secuencias de ADN. Finalmente, los resultados que se
obtienen, se analizan.

2. OBJETIVOS
a. OBJETIVO GENERAL
Analizar a través del uso del programa MEGA DNA las muestras del ADN y
a su vez la creación del árbol genealógico.
b. OBJETIVOS ESPECIFICOS
 Realizar la secuenciación de ADN empleando el programa MEGA DNA
 Analizar 30 muestras de ADN con el programa MEGA DNA.
 Obtener más información sobre el ADN de dichas muestras.
3. MARCO TEORICO
3.1. ADN.
ADN es la abreviatura para Ácido Desoxirribonucleico, una molécula compleja que se
encuentra dentro de cada célula de nuestro cuerpo y contiene todas las instrucciones
necesarias para crear y mantener la vida.
Para entender qué es el ADN debemos imaginarnos dos cadenas que se unen formando
una doble hélice o una escalera de caracol; ésta fue descrita por primera vez en 1953 por
James Watson y Francis Crick, lo que supuso un hito en la historia de la biología. Muchos,
miles, millones de adeninas, timinas, guaninas y citosinas se unen formando una
secuencia que sigue un orden determinado como por ejemplo
AAATTCGAGTCAATTGCCTATCCTCGAGTCAACCTATCCA. La secuencia
completa de estas sustancias químicas compone nuestro código genético, nuestro genoma
y determinadas secuencias de estas “letras” dan lugar a “frases” conocidas como “genes”.
Entonces el ADN es el material que contiene la información hereditaria en los humanos
y casi todos los demás organismos. Ademas la información en el ADN se almacena como
un código compuesto por cuatro bases químicas, adenina (A), guanina (G), citosina (C) y
timina (T).

3.2.GEN
El diccionario de la Real Academia define el gen como cada una de las partículas
dispuestas en él, un orden fijo a lo largo de los cromosomas y que determinan la aparición
de los caracteres hereditarios en los virus, las bacterias, las plantas y los animales.
3.3.GENOMA
Es el conjunto de genes, es decir, es la información genética de un ser viviente, el que ya
descifrado nos dará a conocer la esencia de las características de cualquier ser viviente.
3.4.ALINEACION
Según el modelo propuesto por Watson y Crick, la molécula de ADN está compuesta por
dos hebras helicoidales (Torres, 2007), cada una siguiendo una secuencia de nucleótidos
{A;T;C;G}, y formando parejas de {C;G} y {A;T} entre las dos hélices (Ferrández,
Hernández & Pastor, 2003). Una vez extraído ADN de una muestra, se obtienen dos
secuencias de ADN (forward y reverse). Deben guardarse cada una en un documento con
formato FASTA (figura 1). Se debe realizar un BLAST a la secuencia forward, que
consiste en hacer una búsqueda en una base de datos de secuencias de ADN, para
encontrar datos similares y verificar si el amplificador es correcto (Altschul, Madden,
Schäffer1, Zhang, Zhang2, Miller2 & Lipman, 1997).

3.5.PROGRAMA MEGA DNA
El software de Análisis de Genética Evolutiva Molecular (MEGA) implementa muchos
métodos y herramientas analíticos para filogenómica, filomedicina también nos sirve para
la secuenciación de ADN. MEGA se desarrolló por primera vez para MS DOS a
principios de la década de 1990 (Kumar et al. 1994) y luego se actualizó para su uso en
MS Windows ocho veces, incluyendo MEGA 1 a MEGA 6 y MEGA-CC y MEGA-MD
(Kumar et al. 2001, , 2016). Algunas de las versiones de MEGA se han empaquetado para
sistemas Linux utilizando la capa de compatibilidad WINE para sistemas operativos
compatibles con POSIX y la herramienta Wineskin (construida en WINE) para sistemas
macOS. Estas versiones se han descargado más de 200.000 veces. Pero la solución de
emulación de Windows ad hoc es lenta y relativamente inestable en comparación con el
rendimiento de MS Windows. Los emuladores no se pueden usar de manera efectiva para
la última versión de 64 bits de MEGA que está diseñada para manejar análisis intensivos
en memoria de grandes conjuntos de datos contemporáneos (Kumar et al.2016), por lo
que se requiere una solución más completa para los usuarios de plataformas alternativas.
(Sudhir, Stecher, Li, Knyaz, & Tamura, 2018)
3.6.PROGRAMA NCBI
Es un programa de investigación del Computational Biology Branch (CBB), realizado
por investigadores y estudiantes del postdoctorado, encargados de investigar sobre las
aplicaciones teóricas y analíticas para resolver problemas fundamentales en biología
molecular. Tales como análisis de secuencia, análisis de función y estructura de proteínas,
identificación de genes, incluyendo algoritmos para la búsqueda en bases de datos,
secuencias de baja complejidad, modelos matemáticos de evolución, métodos estadísticos
para virología, comportamiento dinámico para reacciones químicas.
Comparación de genomas, árboles taxonómicos, y genética de poblaciones. Muchas de
estas investigaciones han contribuido a la aplicación de las bases de datos de la NCBI
suministrando algoritmos innovadores como el BLAST,SEG,VAST COGs, entre otros.
(Parra & Ramirez, 2021) blastp compara una secuencia problema de aminoácidos contra

una base de datos de secuencias de proteínas, compara una secuencia problema de
nucleótidos contra una base de datos de secuencias de nucleótidos, compara una secuencia
problema de nucleótidos traducida en sus seis posibles marcos de lectura contra una base
de secuencias de proteínas, compara una secuencia problema de aminoácidos contra toda
la base de datos de nucleótidos traducida en sus seis posibles marcos de lectura compara
las seis traducciones en sus marcos de lectura de la secuencia problema de nucleótidos,
contra las seis traducciones en sus marcos de lectura de toda la base de datos de
nucleótidos.
4. MATERIALES Y METODOS
4.2. MATERIALES
 Secuencias crudas generadas por secuenciación Sanger
 Computador
 Software Bioedit
 Software Mega 5.2 o Mega 7.0
 Acceso a página Ribosomal Database Project.
 Office (Excel)
 Memoria USB
4.3.METODOLOGIA
 Para empezar a hacer la secuenciación primero debemos instalar nuestro
programa MEGA X O MEGA DNA, este programa está colgada en la red de
forma gratuita.
 Una vez descargado e instalado el programa, procedemos a abrirlo, ahí en la
imagen podemos observar una ventana principal

Para empezar con la secuenciación nos vamos a dirigir a la opción de ALIGN y damos
clic.
Después saldrá una ventana:
Hacemos clic donde dice: “Show Web Browser
Luego nos dirigirá a una ventana en la cual extraeremos los datos de la NCBI, estos
datos se encuentran colgados en la red.

Despues se procede a buscar los datos, él que se buscará en la NCBI será el 16S
Ahora aparecerá una ventana, en la cual debemos hacer clic en la opción “ok”:

Al momento de que termine de cargar nos saldrá de la siguiente manera.
Todos los pasos descritos hasta el momento se deberá repetir las 30 veces por que son la
cantidad de muestras que se empleara.Estos pasos vamos a repetir unas 30 veces con
diferentes datos, para tener una buena alineación.
Al terminar con las 30 muestras, cmenzaremos con el alineamiento
Vamos a la opción ALIGN MUSCLE y hacemos clic.

Hacemos clic en “OK.”
Nos saldrá la siguiente ventana y daremos clic:

Cuando se complete nos saldrá asi:
Los espacios en blanco que se pueden observar se deberán eliminar.
Finalmente, la alineación nos resultara:
ARBOL GENEALOGICO:
Primero vamos a guardar el archivo en una carpeta, hacemos clic donde dice Data, se
desplegarán opciones, escogeremos donde dice Protein Sequences dado un clic.

Despues vamos a la opcion de PHYLOGENY
Hacemos clic y se desplegaran varias opciones, vamos a dar clic en Construct/Test
UPGMA tree.
Nos saldrá una ventana en donde saldrá el archivo que guardamos anteriormente le damos
clic en abrir.
Y nos aparecerá la siguiente ventana; donde haremos clic en “OK”:

Y de esa manera se crea el árbol genealógico e cual queda de la siguiente manera:

Bacillus cereus strain CCM 2010
Streptococcus pneumoniae strain ATCC 33400 16S ribosomal RNA
Bacillus thuringiensis strain ATCC 10792 16S ribosomal RNA
Bacillus thuringiensis strain NBRC 101235 16S ribosomal RNA
Enterococcus faecium strain DSM 20477 16S ribosomal RNA
Lactobacillus plantarum strain NBRC 15891 16S ribosomal RNA
Lactobacillus plantarum strain CIP 103151 16S ribosomal RNA
Enterococcus faecium strain ATCC 19434 16S ribosomal RNA
Mycobacterium tuberculosis H37Rv 16S ribosomal RNA
Salmonella enterica subsp. enterica strain LT2 16S ribosomal RNA
Lactobacillus plantarum strain JCM 1149 16S ribosomal RNA
Lactobacillus plantarum strain JCM 1149 16S ribosomal RNA
Streptococcus pneumoniae strain NCTC 7465 16S ribosomal RNA
Streptococcus pneumoniae strain ATCC 33400 16S ribosomal RNA
Enterococcus faecium strain JCM 5804 16S ribosomal RNA
Mycobacterium tuberculosis strain ATCC 27294 16S ribosomal RNA
Enterococcus faecium strain NBRC 100486 16S ribosomal RNA
Mycobacterium tuberculosis H37Rv 16S ribosomal RNA
E.coli rrnA gene.
Klebsiella pneumoniae strain ATCC 13883
Klebsiella pneumoniae strain DSM 30104 16S ribosomal RNA
Klebsiella pneumoniae subsp. ozaenae strain ATCC 11296 16S
Salmonella enterica subsp. enterica serovar Typhimurium strain ATCC
Helicobacter pylori strain ATCC 43504 16S ribosomal RNA
Salmonella enterica subsp. enterica serovar Typhimurium strain ATCC
Helicobacter pylori strain ATCC 43504 16S ribosomal RNA
Bacillus thuringiensis strain IAM 12077 16S ribosomal RNA
Helicobacter pylori NCTC 11637 = CCUG 17874 = ATCC 43504 16S
5. RESULTADOS

6. CONCLUSIONES
 Se empleo de forma exitosa el programa MEGA X, a la vez se comprobó su
efectividad en la obtención de los datos del ADN del gen.
 Se efectuó una alineación de 30 muestras en dicho programa, para después hacer
un árbol genealógico de los microorganismos, que resulto pertenecer a la familia
de bacterias,
 Se puede observar que cada bacteria tiene relación con cada una, las cuales tienen
similitudes en los ADN.
7. BIBLIOGRAFIA.
Holt RA. The genome sequence of the malaria mosquito Anopheles gambiae. Science.
2002;298:129-49. Obtenido de:
https://www.redalyc.org/pdf/106/10649028.pdf
Kanehisa M, Bork P. Bioinformatics in the post-sequence era. Nat Genet.
2003;33(Suppl):305-10. Obtenido de:
https://www.redalyc.org/pdf/106/10649028.pdf
Parra , C. P., & Ramirez, J. (16 de 09 de 2021). EMBnet Colombia. Obtenido de
EMBnet Colombia:
http://bioinf.ibun.unal.edu.co/documentos/Blast/blast.php#:~:text=BLAST%20es%2
0el %20acr%C3%B3nimo%20de, de%20la%20base%20de%20datos.

Valeria ampuero practica n°2

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Valeria ampuero practica n°2

Similar a Valeria ampuero practica n°2 (20)

Último

Último (20)

Valeria ampuero practica n°2