Bioinformatica calidad y alineamiento de secuencia de adn y generacion de arboles filogeneticos en base al gene nif h

“Año de la Universalización de la Salud”
UNIVERSIDAD NACIONAL DE MOQUEGUA
FACULTAD DE INGENIERÍA
ESCUELA PROFESIONAL DE INGENIERÍA AMBIENTAL
NOMBRE DEL INFORME:
“PRÁCTICA DE BIOINFORMÁTICA-CALIDAD Y ALINEAMIENTO DE
SECUENCIAS DE ADN Y GENERACIÓN DE UN ÁRBOL FILOGENÉTICO EN
BASE AL GEN NIF H (FIJACIÓN BIOLÓGICA DEL NITRÓGENO)”
CURSO:
Biotecnología
PRESENTADO POR:
COLQUE LLOCLLA, Fiorella Pilar
MORALES QUISPE, Leticia Inés
DOCENTE:
Dr. Hebert Hernán Soto Gonzales
29-12-2020 ILO-PERU

ÍNDICE
Pág.
CAPITULO 1 PRÁCTICA DE BIOINFORMÁTICA-ANÁLISIS DE LAS SECUENCIAS DE
ADN G1 MEDIANTE EL PROGRAMA BIOEDIT...........................................................4
1.1. INTRODUCCIÓN................................................................................................4
1.2. OBJETIVOS........................................................................................................4
1.2.1. OBJETIVO GENERAL .................................................................................4
1.2.2. OBJETIVOS ESPECÍFICOS........................................................................4
1.3. MARCO TEÓRICO.............................................................................................4
1.3.1. BIOEDIT.......................................................................................................4
1.3.2. SECUENCIA DE ADN..................................................................................5
1.3.3. PÁGINA NCBI..............................................................................................5
1.3.4. HERRAMIENTA BLAST...............................................................................5
1.4. MATERIALES.....................................................................................................6
1.5. METODOLOGÍA.................................................................................................6
1.5.1. EVALUACIÓN DE LA CALIDAD DE LAS SECUENCIAS DE ADN..............6
1.5.2. DETERMINACIÓN DEL SER VIVO AL CUAL PERTENECEN LAS
SECUENCIAS DE ADN .........................................................................................8
1.6. RESULTADOS .................................................................................................10
1.6.1. EVALUACIÓN DE LA CALIDAD DE LAS SECUENCIAS DE ADN............10
SECUENCIAS DE ADN .......................................................................................11
1.7. CONCLUSIONES.............................................................................................12
CAPITULO 2 ...............................................................................................................13
2.1. INTRODUCION ................................................................................................13
2.1.1. OBJETIVOS...............................................................................................13
2.2. MATERIALES...................................................................................................13
2.3. MARCO TEORICO...........................................................................................14
2.3.1. MEGA X .....................................................................................................14
2.3.2. Árbol filogenético........................................................................................14
2.4. METODOLOGIA...............................................................................................15
2.4.1. Inicio de la practica ....................................................................................15
2.4.2. Alineamiento de secuencia de ADN Bacteriano.........................................19
2.4.3. Formación del árbol filogenético ................................................................21
2.5. RESULTADOS .................................................................................................23

2.6. CONCLUSIONES.............................................................................................24
BIBLIOGRAFÍA ............................................................. ¡Error! Marcador no definido.

CAPITULO 1
PRÁCTICA DE BIOINFORMÁTICA ANÁLISIS DE LAS SECUENCIAS DE ADN
G1 MEDIANTE EL PROGRAMA BIOEDIT
1.1. INTRODUCCIÓN
En la primera parte del informe evaluaremos la calidad de 11 secuencias
de ADN mediante el programa científico BioEdit. Esta primera parte incluye
conceptos sobre el programa científico BioEdit y sus aplicaciones, es, sin lugar
a duda, uno de los programas más conocidos para edición de secuencias para
dicho sistema operativo. Junto con NCBI, que es, el Centro Nacional de
Información Biotecnológica que promueve la ciencia y la salud al proporcionar
acceso a información biomédica y genómica, el NCBI ofrece además algunas
herramientas bioinformáticas para el análisis de secuencias de ADN, ARN y
proteínas, siendo BLAST una de las más usadas.
1.2. OBJETIVOS
1.2.1. OBJETIVO GENERAL
 Analizar las secuencias de ADN G1 mediante el programa Bioedit
1.2.2. OBJETIVOS ESPECÍFICOS
 Evaluar la calidad de las secuencias de ADN G1.
 Determinar a qué ser vivo pertenece las secuencias de ADN G1.
1.3. MARCO TEÓRICO
1.3.1. BIOEDIT
BioEdit es uno de los programas más utilizados en estudios de
biología molecular. Se desarrolló inicialmente como un editor de
alineación de secuencias escrito solo para Windows. Contiene muchas
funciones para modos de alineación de secuencias de fácil alineación
manual, vista de ventana dividida, color definido por el usuario,
sombreado basado en información e integración automática con otros
programas como ClustalW y Blast. (Hall, Biosciences, & C.A., 2011)
Sin embargo, en los últimos años se desarrolló de manera
espectacular para integrar muchas otras características y funciones y
herramientas moleculares útiles para biólogos moleculares, como varios
modos de alineación manual, dibujo de plásmidos y anotaciones, mapas
de restricciones y mucho más. Se convirtió en uno de los programas más
utilizados en biología molecular con sus herramientas polivalentes en
biología molecular. La licencia de software gratuito y sus módulos

eficientes y actualizados además de su capacidad rápida producir
resultados lo convierte en uno de los programas más populares para los
biólogos moleculares en la actualidad. (Hall, Biosciences, & C.A., 2011)
1.3.2. SECUENCIA DE ADN
El ADN consiste en una secuencia lineal de nucleótidos, o bases,
que por simplicidad se cita por las primeras letras de sus nombres
químicos–A o Adenina, T o Timina, C o Citosina y G o Guanina.
La secuenciación del ADN es una técnica de laboratorio utilizada
para determinar la secuencia exacta de las bases (A, C, G y T) en una
molécula de ADN. La secuencia de bases de ADN lleva la información
que una célula necesita para ensamblar proteínas y moléculas de ARN.
La información de la secuencia de ADN es importante para los científicos
que investigan las funciones de los genes.
1.3.3. PÁGINA NCBI
GenBank es una base de datos (BD) pública que contiene una
extensa colección de secuencias de nucleótidos obtenidas a partir de
más de 300.000 especies. Además de la secuencia, incluye información
bibliográfica, anotaciones funcionales y, si se trata deuna secuencia
codificante, su traducción conceptual a proteína.
De la gestión y distribución de GenBank se encarga el NCBI
(National Center for Biotechnology Information) en los Estados Unidos.
Junto con el ENA (European Nucleotide Archive) y el DDBJ (DNA Data
Bank of Japan) forma el consorcio INSDC (International Nucleotide
Sequence Database Collaboration). Cada día, las tres BD ponen al día
sus contenidos para que todas ellas dispongan de la misma información.
1.3.4. HERRAMIENTA BLAST
BLAST es la herramienta bioinformática más utilizada en todo el
mundo. Compara una secuencia problema (query sequence) de
nucleótidos o de proteínas con todas las secuencias de una BD de
nucleótidos o de proteínas. Se puede considerar como el “Google” de las
secuencias. Como resultado de esta comparación, puede ocurrir que:
 La secuencia problema coincida al 100% con una secuencia de la BD:
la secuencia problema ya se conocía con anterioridad.
 La secuencia problema coincida al 100% con parte de una secuencia
de la BD: la secuencia problema es una subsecuencia de otra
secuencia de la BD.

 La secuencia problema sea similar a otra(s) secuencia(s) de la BD:
las regiones de similitud pueden corresponder a dominios locales
conservados con una función conocida.
 No se encuentren parecidos: la secuencia problema puede
corresponder a un nuevo gen.
A partir de los resultados de una búsqueda con BLAST se pueden
inferir relaciones funcionales, estructurales o evolutivas entre dos
secuencias y, de este modo, identificar nuevos miembros de una familia
de genes o de proteínas. Además de encontrar secuencias idénticas o
con similitud local, BLAST hace un alineamiento con la secuencia
problema y calcula la significancia estadística de los resultados.
1.4. MATERIALES
 Internet
 Laptop
 Programa Bioedit
 Bloc de notas
 Página NCBI
 Herramienta Blast
1.5. METODOLOGÍA
1.5.1. EVALUACIÓN DE LA CALIDAD DE LAS SECUENCIAS DE ADN
Lo primero que haremos será abrir el programa Bioedit, después
de esto descargamos las secuencias de ADN G1 con las cuales
trabajaremos en este capítulo. Abrimos la primera secuencia de ADN en
G1 con el programa Bioedit y observamos los picos en el cromatograma
según eso podemos evaluar si la calidad de la secuencia se considera
buena o mala, luego exportamos la secuencia como Fasta, de tal forma
de poder abrirlo en un bloc de notas y observar así su orden. Si el orden
de una secuencia de ADN contiene muchas N (cualquier nucleótido) se
puede decir que la calidad no es buena. Así repetimos estos pasos con
las 10 secuencias de ADN restantes en G1.

Figura 1.
Archivos Bioedit y G1
Figura 2.
Secuencias de ADN G1
Figura 3.
Primera secuencia en el programa Bioedit

Figura 4.
Exportación de la primera secuencia como Fasta en Bioedit
Figura 5.
Archivo Fasta en Bloc de notas
SECUENCIAS DE ADN
A continuación, procederemos a abrir el primer archivo fasta en un
bloc de notas, copiaremos las 5 primeras líneas del orden de la primera
secuencia de ADN G1 y pegaremos en la página de NCBI, le daremos
click a la herramienta BLAST, luego solo esperaremos los resultados en
las cuales nos arrojara secuencias similares con el nombre del organismo
al que pertenecen. Repetimos los mismos pasos con las 10 secuencias
de ADN restantes en G1.

Figura 6.
Selección de las 5 primeras líneas
Figura 7.
Página NCBI
Figura 8.
Las 5 primeras líneas del orden de la primera secuencia en la página NCBI

Figura 9.
Utilización de la herramienta BLAST
1.6. RESULTADOS
1.6.1. EVALUACIÓN DE LA CALIDAD DE LAS SECUENCIAS DE ADN
Habiendo seguido los pasos para evaluar la calidad de las
secuencias de ADN. Se encontró que de las 11 secuencias analizadas
pertenecientes a G1 solo 6 son de buena calidad y 5 son de mala calidad.
Para la evaluación de la calidad de cada secuencia se tuvo en
cuenta los picos en el cromatograma y la presencia de N en el orden de
la secuencia.
Tabla 1.
Calidad de las secuencias de ADN G1
N° DE SECUENCIA CALIDAD
E09 5 09 BUENA
E10 13 10 MALA
F07 6H 11 BUENA
F09 6 11 BUENA
F10 14 12 MALA
G07 7H 13 BUENA
G09 7 13 MALA
G10 15 14 BUENA
H07 8H 15 MALA
H09 8 15 MALA
H10 16 16 BUENA

SECUENCIAS DE ADN
Tabla 2
Número de secuencia con el organismo que presenta un mayor porcentaje de identidad
N° DE SECUENCIA % DE INDENTIDAD ORGANISMO
E09 5 09 89,18%
Klebsiella pneumoniae
E10 13 10 0.00 N.O.
F07 6H 11 96,64%
Enterobacter ludwigii
F09 6 11 89,27%
Enterobacter asburiae
F10 14 12 0.00 N.O.
G07 7H 13 95,42%
Klebsiella sp. ICBR 115
G09 7 13 0.00 N.O.
G10 15 14 97,90%
Lelliottia nimipressuralis
H07 8H 15 0.00 N.O.
H09 8 15 0.00 N.O.
H10 16 16 90,18%
Enterobacter sp. IICDBZ9

1.7. CONCLUSIONES
Se concluyo que el programa Bioedit resulta muy útil para el análisis de
secuencias de ADN. Mediante el grafico que nos muestra nos resulta fácil
deducir la calidad de la secuencia, los picos altos y bajos son un indicador de
la calidad de la secuencia, la presencia de N en el orden también es un
indicador de este.
La página NCBI también fue de mucha utilidad, para identificar al
organismo que mas porcentaje de identidad tiene con la secuencia de ADN
buscada en la página.

CAPITULO 2
2.1. INTRODUCION
En la segunda parte se utilizó el programa MEGA para la construcción de un
árbol filogenético que contenía el gen NIF H con 15 secuencias. Para la obtención
del árbol se realizó una serie de pasos manipulando el programa MEGA.
MEGA DNA es un software el cual ha sido diseñada para el análisis
comparativo de secuencias de genes homólogos, ya sea de familias multigénicas
o de diferentes especies. (Sudhir Kumar, 2018)
Permite realizar una identificación más rápida de microorganismos,
bacterias, hongos y la construcción de un árbol filogenético. De manera
profundizada más acerca de la utilización de esta herramienta que nos facilita su
análisis mediante diversas funciones que contiene, a su vez permitirá conocer el
funcionamiento de un árbol filogenético de cada una de las muestras que se vaya
analizar. (Sudhir Kumar, 2018)
Cuando hablamos de una molécula de ADN, nos referimos a un Acido
Desoxirribonucleico. Ya que esta es una molécula de gran peso molecular
(macromolécula), constituida por tres sustancias distintas: ácido fosfórico, un
monosacáridos aldehído del tipo pentosa (la desoxirribosa), y una base nitrogenada
que puede ser púrica (por ser derivada de la purina de dos anillos heterocíclicos) o
pirimidinica (por ser derivada de la pirimidina de un solo anillo) (Christopher P.
Austin, s.f.)
Estas bases son anillos heterocíclicos, compuestos además de carbono e
hidrogeno por nitrógeno. Dichas bases son cinco, adenina, timina, guanina y
citosina, pero también se encuentra el uracilo que es correspondiente del ARN. La
unión de las bases nitrogenadas con el azúcar forma un nucleosido, éste, unido al
fósforo da como resultado un nucleótido. (HOMERO, 2008)
2.1.1. OBJETIVOS
2.1.1.1. Objetivo General
 Evaluar la calidad y alimento de ADN y generar un arbol filogenetico
en base al gen niFH.
2.1.1.2. Objetivo Especifico
 Reconocer la calidad de las secuencias de ADN (buena o mala).
 Realizar el alineamiento
 Elaboración de un árbol filogenético del gen NIF H.
2.2. MATERIALES
 Software MEGA X
 Una laptop
 Conectividad a Internet

2.3. MARCO TEORICO
2.3.1. MEGA X
Es un software informático para realizar análisis estadísticos de la
evolución molecular y para construir árboles filogenéticos. Incluye muchos
métodos sofisticados y herramientas para filogenética y filomedicina.
2.3.1.1. Mega En Plataformas Informáticas (Mega X)
MEGA se desarrolló por primera vez para MS DOS a principios de la
década de 1990 ( Kumar et al. 1994 ) y luego se actualizó para su uso en MS
Windows ocho veces, incluyendo MEGA 1 a MEGA 6 y MEGA-CC y MEGA-
MD ( Kumar et al. 2001 , 2016 ). Por lo tanto, MEGA se ha transformado en
una versión multiplataforma que se ejecuta de forma nativa en Linux y
Microsoft Windows. Este avance elimina la limitación exclusiva de Windows
de MEGA, que se ha vuelto particularmente aguda debido al creciente uso
de Linux en la investigación biológica. Esta transformación también allana el
camino para el desarrollo de una versión MEGA X para macos en un futuro
próximo.
2.3.2. Árbol filogenético
Es un esquema arborescente que muestra las relaciones evolutivas entre
varias especies u otras entidades que se cree que tienen una ascendencia
común. se construyen tomando en cuenta la evolución biológica, basándose en
la evidencia de que todos los organismos son descendientes de un ancestro
común. Así, todos los organismos, ya sean vivos o extintos, se encuentran
emparentados en algún grado. (Kham, 2015)

2.4. METODOLOGIA
2.4.1. Inicio de la practica
 Abrimos el Software MEGA X
 Hacemos clic en ALING y damos clic a Otroclic en Query Databanks
 Al abrir Query Databanks nos abrirá una página de Home- Nucleotide

 En nucleótido se pone NIFH, la cual dará muchas muestras y solo se
escogerá 15
 Damos el primer clic en la primera muestra
 Obtenemos

 Dar clic en T Add Alignmet
 Obtenemos lo siguiente y le damos clic en OK

 Al dar OK se abre una página de MIX:Alignment Explorer
 Y para todas las muestras se hará el mismo procedimiento, obtenemos
de la siguiente manera

2.4.2. Alineamiento de secuencia de ADN Bacteriano
 Dar clic a EDIT, Buscar SELECT ALL y darle clic, lo cual obtendremos lo
siguiente:
 Damos clic en el MUSCULO y dar en ALING DNA

 Obtenemos el alineamiento de las muestras insertadas
 Eliminación de columnas (BACIAS), Seleccionando y dando clic a X
 Al eliminar se obtiene de la siguiente manera

2.4.3. Formación del árbol filogenético
 Dar clic a DATA, clic en EXPORTAR, clic en MEGA
FORMAL/ALINEAMIENTO, clic guardar
 Guardar con el nombre de ALINEAMIENTO
 El segundo nombre se le pondrá ALINEAMIENTO y darle clic en OK, dar
clic en YES para la confirmación.

 Ir a MEGA X, clic en PHYLOGENY otro clic en CONSTRUCT/TES
UPGMA TREE
 Clic en OK
 Obtendremos el ÁRBOL FITOGENETICO

2.5. RESULTADOS
Para la realización de esta filogenia se puede establecer analizando las
similitudes y las diferencias de los rasgos. Las especies que comparten muchos
rasgos están estrechamente relacionadas y se sitúan cerca en el árbol de vida.
Se utilizo la herramienta MUSCLE para la alineación de las 15
secuencias del Gen nifH, después se procedió a la elaboración de el árbol
filogenético, dando como resultado la Figura 10.
El primer grupo está conformado por Mesorhizobium albiziae y
Mesorhizobium septentrionale. Estas dos son especies próximas ya que
presentan una cercanía de 100%, este grupo se encuentra a una cercanía de
98% con la especie Mesorhizobium sp.
El segundo grupo está conformado por Azospirillum brasilense y
Azospirillum formosense. Estas dos son especies próximas ya que presentan
una cercanía de 100%, este grupo se encuentra a una cercanía de 53% con el
género Mesorhizobium.
La especie Rhizobium leguminosarum bv trifolli no es próxima debido a
su cercanía de 35% y la especie Rhizobium leguminosarum bv viciae tampoco
se encuentra próxima debido a su cercanía 30%.
Figura 10.
Árbol filogenético del Gen nifH

2.6. CONCLUSIONES
Este documento describe un método para la construcción del árbol
filogenético para el gen niFH. Se obtuvo el árbol filogenético del gen nifH con
15 secuencias con el programa bioinformático MEGA el cual es muy fácil de
manejar y es una herramienta muy útil para cualquier bioinformático y un
programa de cajón para cualquier laboratorio.
En el programa mega, se puede observar que en algunas bacterias
tienen relación una con otra y también ofreció una explicación sólida de por qué
las especies cambian con el tiempo y por qué están tan bien adaptadas a sus
hábitats.
Es importante mencionar, que este trabajo muestra tan solo una
pequeña parte de las investigaciones desarrolladas, pero las opciones para
nuevas investigaciones son amplias. Sin embargo, son aún pocos los médicos
que poseen la información o experiencia necesaria para comprender estas
investigaciones.
Bibliografía
Christopher P. Austin, M. (s.f.). ADN (Ácido Desoxirribonucleico). Obtenido de
https://www.genome.gov/es/genetics-glossary/ADN-acido-
Desoxirribonucleico#:~:text=ADN%20es%20el%20nombre%20qu%C3%ADmic
o,(desoxirribosa)%20y%20grupos%20fosfato.
De Necochea, R., & Canul, J. (2004). Métodos fisicoquímicos en biotecnología:
Secuenciación de ácidos nucleicos. Instituto de Biotecnología. México:
Universidad Nacional Autónoma de México.
Hall, T., Biosciences, I., & C.A., C. (2011). BioEdit: Un software importante para la
biología molecular. GERF Bulletin of Biosciences, 60-61.
HOMERO, D. (2008). COMPUESTOS HETEROCICLICOS. Obtenido de
https://www.fcnym.unlp.edu.ar/catedras/quimicaorg/practicas/12_Guia_y_TP12
_Compuestos_Heterociclicos.pdf
Kham. (2015). Obtenido de https://es.khanacademy.org/science/ap-biology/natural-
selection/phylogeny/a/building-an-evolutionary-tree
Stansfield, W. (1992). Genética. México.
Sudhir Kumar, G. S. (2 de Mayo de 2018). Molecular Biology and Evolution. Obtenido
de https://doi.org/10.1093/molbev/msy096

Bioinformatica calidad y alineamiento de secuencia de adn y generacion de arboles filogeneticos en base al gene nif h

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Bioinformatica calidad y alineamiento de secuencia de adn y generacion de arboles filogeneticos en base al gene nif h

Similar a Bioinformatica calidad y alineamiento de secuencia de adn y generacion de arboles filogeneticos en base al gene nif h (20)

Más de leticiamorales38

Más de leticiamorales38 (13)

Último

Último (20)

Bioinformatica calidad y alineamiento de secuencia de adn y generacion de arboles filogeneticos en base al gene nif h