Imforme secuencia de adn

“Año de la Universalización de la Salud”
UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERIA AMBIENTAL
PRACTICA DE BIOINFORMATIVA: CALIDAD Y
ALINIAMIENTO DE SECUENCIAS DE ADN Y
GENERACIÓN DE ARBOL FILOGENETICO EN BASE AL
GEN NIF H (FIJACIÓN BIOLOGICA DE NITROGENO)
DOCENTE:
Dr. SOTO GONZALES HEBERT HERNAN
CURSO:
BIOTECNOLOGIA
ELABORADO POR:
TICONA MIRANDA, YESSICA KAREN
CLAUDIA YANETH, SANTACRUZ HUILLCA
SEMESTRE
VII
MOQUEGUA – PERÚ
DICIEMBRE – 2020

ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
2
INDICE
1. INTRODUCCIÓN..............................................................................................................5
2. OBJETIVOS.......................................................................................................................6
2.1 OBJETIVOS GENERAL ...............................................................................................6
2.2 OBJETIVO ESPECIFICOS............................................................................................6
2.3 MATERIALES...............................................................................................................6
3. FUNDAMENTOS TEORICOS..........................................................................................6
3.1 ESTRUCTURA DE LOS ÁCIDOS NUCLEICOS.........................................................6
3.2 ALINEAMIENTO DE SECEUNCIAS DE ADN...........................................................7
3.3 LA BIOINFORMÁTICA ...............................................................................................7
3.4 PROGRAMA BIOEDIT.................................................................................................8
3.5 HERRAMIENTA BLAST..............................................................................................8
3.6 NCBI ..............................................................................................................................8
3.7 MEGA-X........................................................................................................................9
4. METODOLOGIA...............................................................................................................9
4.1 USO DE PROGRAMA BioEdit PARA LA CLASIFICACIÓN DE CALIDAD EN
SECUENCIAS DE ADN ...................................................................................................................9
4.2 PROCEDIMIENTO PARA OBTENER FORMATO FASTA
DE SECUENCIAS DE ADN.....................................................................11
4.3 DETERMINACION DE CALIDAD DE SECUENCIAS DE ADN .............................14
4.4 USO DE HERRAMIENTA BLAST.............................................................................17
4.5 ALINEAMIENTO DE 11 SECUENCIAS DE ADN CON GEN NIFH .......................20
4.6 USO DE DATABANK NCBI ......................................................................................22
5. RESULTADOS Y DISCUSION ......................................................................................33
5.1 ÁRBOL FILOGENÉTICO...........................................................................................33
5.2 DETERMINACIÓN Y CLASIFICACIÓN DE SECUENCIAS DE ADN ...................35
5.3 CLASIFICACION DE SECUENCIAS DE ADN EN EL PROGRAMA BioEdit .......38
5.4 CLASIFICACION E IDENTIFICACION DE SECUENCIAS DE ADN.....................44
6. CONCLUSIONES Y RECOMENDACIONES................................................................44
6.1 CONCLUSIONES........................................................................................................44
6.2 RECOMENDACIONES...............................................................................................45
7. Bibliografía.......................................................................................................................45

ESCUELA PROFESIONAL
3
INDICE DE FIGURAS
Figura 1. Carpeta con archivos de secuencias de ADN ....................................................................... 9
Figura 2. Captura de página web del programa BioEdit.................................................................... 10
Figura 3. Uso de programa BioEdit................................................................................................... 10
Figura 4. Secuencia de AND "E09-5-09".......................................................................................... 11
Figura 5. Herramienta Export as Fasta .............................................................................................. 11
Figura 6. Secuencia de ADN en formato Fasta "E09-5-09" ............................................................. 12
Figura 7. Secuencias ADN en formato Fasta..................................................................................... 12
Figura 8. Uso de Bloc de Notas......................................................................................................... 13
Figura 9. E09-5-09............................................................................................................................ 14
Figura 10. E10_13_10....................................................................................................................... 14
Figura 11. F07_6H_11 ...................................................................................................................... 15
Figura 12. F09_6_11......................................................................................................................... 15
Figura 13. F10_14_12....................................................................................................................... 15
Figura 14. G07_7H_13...................................................................................................................... 15
Figura 15. G09_7_13 ........................................................................................................................ 16
Figura 16. G10_15_14 ...................................................................................................................... 16
Figura 17. H07_8H_15...................................................................................................................... 16
Figura 18. H09_8_15 ........................................................................................................................ 16
Figura 19. H10_16_16 ...................................................................................................................... 17
Figura 20. Página Web de herramienta BLAST ............................................................................... 17
Figura 21. Ingreso de números de secuencia de ADN en BLAST.................................................... 18
Figura 22. Uso de BLAST................................................................................................................. 18
Figura 23. Serie de datos proporcionada por el uso de BLAST......................................................... 19
Figura 24. Selección del microorganismo con mayor porcentaje de identidad.................................. 19
Figura 25. Identidad de microorganismos ......................................................................................... 20
Figura 26. Programa MEGA-X......................................................................................................... 20
Figura 27. Herramienta de MEGA-X " Query Data banks" .............................................................. 21
Figura 28. Databank NCBI................................................................................................................ 22
Figura 29. Busqueda de gen NIFH.................................................................................................... 22
Figura 30. Lista de microorganismos con gen NIFH......................................................................... 23
Figura 31. Herramienta Add to Alignment........................................................................................ 23
Figura 32. Uso de secuencia de ADN con gen NIFH ........................................................................ 24
Figura 33. Uso de 15 secuencias de ADN con gen NIFH.................................................................. 24
Figura 34. Alineamiento de secuencias con herramienta Align DNA en programa MEGA - X........ 25
Figura 35. Alineamiento en proceso.................................................................................................. 25

ESCUELA PROFESIONAL
4
Figura 36. Secuencias de ADN alineadas......................................................................................... 26
Figura 37. Eliminación de espacios sin alineamiento ........................................................................ 27
Figura 38. Alineamiento de secuencias de ADN con gen NIFH culminada ...................................... 28
Figura 39. Error de alineamiento de secuencias de ADN .................................................................. 28
Figura 40. Creación de archivo del alineamiento realizado anteriormente con la herramienta “Save the
alignment to a MEGA session file”............................................................................................................. 29
Figura 41. Exportacion de alineamineto finalizado a formato MEGA .............................................. 29
Figura 42. Creación de archivo "ARBOL-G1".................................................................................. 30
Figura 43. Visualización de archivos en formato MEGA.................................................................. 31
Figura 44. Creación de filogenético .................................................................................................. 31
Figura 45. Actualización de campos de editor para la posterior creación de árbol filogenético ........ 32
Figura 46. Árbol filogenético ............................................................................................................ 32
Figura 47. Escala Evolutiva de especies con gen NIFH .................................................................... 34
Figura 48. E09-5-09.......................................................................................................................... 35
Figura 49. E10_13_10....................................................................................................................... 35
Figura 50. F07_6H_11 ...................................................................................................................... 36
Figura 51. F09_6_11......................................................................................................................... 36
Figura 52. F10_14_12....................................................................................................................... 36
Figura 53. G07_7H_13...................................................................................................................... 36
Figura 54. G09_7_13 ........................................................................................................................ 37
Figura 55. G10_15_14 ...................................................................................................................... 37
Figura 56. H07_8H_15...................................................................................................................... 37
Figura 57. H09_8_15 ........................................................................................................................ 37
Figura 58. H10_16_16 ...................................................................................................................... 38
Figura 59. MUESTRA E09_5_09..................................................................................................... 38
Figura 60. MUESTRA E10_13_10 ................................................................................................... 39
Figura 61. MUESTRA F07_6H_11 .................................................................................................. 39
Figura 62. MUESTRA F09_6_11 ..................................................................................................... 40
Figura 63. MUESTRA F10_14_12 ................................................................................................... 40
Figura 64. MUESTRA G07_7H_13.................................................................................................. 41
Figura 65. MUESTRA G09_7_13..................................................................................................... 41
Figura 66. MUESTRA G10_15_14................................................................................................... 42
Figura 67. MUESTRA H07_8H_15.................................................................................................. 42
Figura 68. H07_8H_15...................................................................................................................... 43
Figura 69. MUESTRA H09_8_15..................................................................................................... 43

ESCUELA PROFESIONAL
5
1. INTRODUCCIÓN
Los sistemas de clasificación más modernos se basan en las relaciones evolutivas entre
organismos, esto es, en su filogenia. Los sistemas de clasificación basados en la filogenia
organizan las especies u otros grupos de manera que reflejen nuestra comprensión de su
proceso evolutivo a partir de sus ancestros comunes. (de Necochea Campion & Canul Tec,
2004)
La identificación de los genes hasta la obtención de los tratamientos efectivos, es largo
y complejo (Cañedo Andalia & Arencibia Jorge, 2004) por ende la secuenciación
determinación del orden en el que se disponen las bases que forman una molécula de DNA-
del genoma humano ha originado cantidades enormes de información que debe procesarse
para poderse utilizar convenientemente. Tal importancia de la genómica origina que la
bioinformática, considerada como la aplicación de informática en el procesamiento de la
información genética tienen una función primordial la fusión de las técnicas computacionales
con el entendimiento y apreciación de datos biológicos, el almacenamiento, recuperación,
manipulación y correlación de datos procedentes de distintas fuentes. (Cañedo Andalia &
Arencibia Jorge, 2004)
Con el objetivo de realizar el alineamiento de 15 secuencias de ADN con características
en común de contar con el gen NIFH y creación de su árbol filogenético.
En el presente informe, diseñamos la metodología para poder analizar, describir y
clasificar en calidad genómica de secuencias de ADN así mismo analizaremos el proceso
evolutivo en estos microorganismos en base a su árbol filogenético basado en la comparación
y alineamiento de secuencias de los genes NIFH con ayuda de herramientas propio de
programas aplicativos en bioinformática.

ESCUELA PROFESIONAL
6
2. OBJETIVOS
2.1 OBJETIVOS GENERAL
 Realizar el alineamiento de la secuencia del gen NIFH
2.2 OBJETIVO ESPECIFICOS
 Identificar la calidad de las secuencias AND
 Realizar el árbol filogenético
2.3 MATERIALES
 Laptop
 Internet
 Programa BioEdit
 Programa MEGA-X
 Herramienta BLAST
 NCBI
3. FUNDAMENTOS TEORICOS
3.1 ESTRUCTURA DE LOS ÁCIDOS NUCLEICOS.
El ADN es una doble hélice. Cada una de las hélices es un polímero integrado por millones de
nucleótidos que son los monómeros del polímero. Cada nucleótido está formado por una
desoxirribosa, una base púrica o pirimídica y un grupo fosfato. Las dos cadenas de ADN son
antiparalelas y se unen entre sí a través de puentes de hidrógeno que se forman entre las bases
complementarias (A·T y G·C) de las dos hebras del ADN. De esta manera, se obtiene una estructura
tipo doble hélice, donde las bases de los nucleótidos se encuentran orientadas hacia el interior,
mientras que los grupos fosfato y las desoxirribosas lo hacen hacia el exterior, formando los
esqueletos fosfodiéster de cada hélice. Los pares de nucleótidos se encuentran separados entre sí por
3.4 Å, cada diez pares de nucleótidos (34 Å) se alcanza una vuelta de la hélice. La diferencia
fundamental entre todas las moléculas de ADN que forman el material genético de los seres vivos es
la secuencia de los millones de estos cuatro tipos de nucleótidos con sus bases A, T, G y C en cada
molécula de ADN. (de Necochea Campion & Canul Tec, 2004)

ESCUELA PROFESIONAL
7
3.2 ALINEAMIENTO DE SECEUNCIAS DE ADN
La comparación de secuencias biológicas (ADN, ARN o proteínas) juega un papel
fundamental en la investigación genética, tanto a nivel teórico para el análisis evolutivo de las
especies mediante árboles filogenéticos como para la comprensión y tratamiento de enfermedades.
Las secuencias de ADN y proteína definen la función de las proteínas en los seres vivos.
Cuando más similares sean dos secuencias más similares tenderán a ser las funciones de las proteínas
codificadas por ellas.
Las secuencias de un mismo gen en un conjunto de especies serán más distintas cuanto más
alejadas filogenéticamente estén las especies comparadas. Normalmente dos secuencias tienen una
alta similitud porque son homólogas, es decir comparten un ancestro común.
Dependiendo del propósito del estudio, lo siguiente es generar hipótesis de homología de las
bases al comparar y alinear las secuencias entre los organismos secuenciados. En un proceso de
alineación de secuencias, el mecanismo básico es simplemente colocar en la misma posición a todas
las bases. Para esto se utilizan programas de cómputo como CLUSTAL X o en este caso MEGA-X
que son los más usados. Esta herramienta se incluye en los diversos programas de edición de
secuencias como BioEdit. ( Márquez Valdelamar, Serrato Díaz , & Cerritos Flores)
3.3 LA BIOINFORMÁTICA
Es una disciplina que se encuentra en la intersección entre las ciencias de la vida y de la
información. Proporciona herramientas y recursos para favorecer la investigación biomédica. Trata
de desarrollar sistemas que sirvan para entender el flujo de información desde los genes a las
estructuras moleculares, su función bioquímica, conducta biológica y, finalmente, su influencia en
las enfermedades y la salud.
La bioinformática es una nueva disciplina dentro de la biología, donde las herramientas de la
computación tienen una función primordial. Si bien algunos restringen el rango de estudio de la
bioinformática al manejo y análisis de bases de datos biológicas -principalmente de secuencias-,
podría atribuírsele un sentido más amplio, como la fusión de las técnicas computacionales con el
entendimiento y apreciación de datos biológicos, el almacenamiento, recuperación, manipulación y
correlación de datos procedentes de distintas fuentes.
Una definición más general, la ubica como el estudio de la información biológica a partir de
la teoría de la información, la computación y las matemáticas. El reto más importante al que se
enfrenta esta ciencia es responder a la avalancha de datos que provienen del proyecto "Genoma
humano" y de la genómica. (Cañedo Andalia & Arencibia Jorge, 2004)
La bioinformática comprende tres subespecialidades:

ESCUELA PROFESIONAL
8
 Bioinformática propiamente dicha, que abarca la investigación y desarrollo de la
infraestructura y de los sistemas de información y comunicación que requiere la biología
moderna -redes y bases de datos para el genoma, estaciones de trabajo para procesamiento
de imágenes, etcétera.
 Biología Computacional, que comprende la computación aplicada a la comprensión de
las cuestiones biológicas básicas, a partir de la modelación y simulación -sistemas de vida
artificial, algoritmos genéticos, redes de neuronas artificiales.
 Biocomputación, que incluye el desarrollo y utilización de sistemas computacionales
basados en modelos y materiales biológicos -biochips, biosensores, computación basada
en ADN, entre otros. Las computadoras basadas en DNA se están empleando para la
secuenciación masiva y el pesquisaje de diversas enfermedades, a partir de la explotación
del procesamiento paralelo implícito. (Cañedo Andalia & Arencibia Jorge, 2004)
3.4 PROGRAMA BIOEDIT
BioEdit es un programa gratuito para edición de alineamientos y análisis de secuencias que
funciona únicamente sobre ambiente MS/Windows. Es, sin lugar a duda, uno de los programas más
conocidos para edición de secuencias para dicho sistema operativo.
BioEdit es un editor de alineamiento de secuencias, sumamente amigable con el usuario. Con
este programa, se realizaron tres pasos importantes: reverso complementario, algoritmo Smith-
Waterman y algoritmo Needleman-Wunsch.
Con el programa BioEdit se abren las secuencias recibidas, que deben estar en formato
FASTA. El programa permite abrir los cromatogramas correspondientes a cada secuencia para su
edición y corrección de posibles errores cometidos en la lectura.
3.5 HERRAMIENTA BLAST
BLAST es el acrónimo de Basic Local Alignment Search Tool. Fue desarrollado por Altschul
en 1990 y es el algoritmo más empleado por el NCBI. La principal característica del BLAST es su
velocidad, pudiendo tomar pocos minutos cualquier búsqueda en la totalidad de la base de datos. De
hecho, los resultados se presentan en pantalla inmediatamente después de calculados. El BLAST
puede hacer búsquedas en una base de datos no redundante (nr) la cual tiene los registros no
redundantes entre las dos bases de datos principales a nivel mundial: GenBank en USA y EMBL
(European Molecular Biology Laboratories) en Europa.
3.6 NCBI

ESCUELA PROFESIONAL
9
Según la definición del Centro Nacional para la Información Biotecnológica "National Center
for Biotechnology Information" -NCBI por sus siglas en inglés: la Bioinformática es un campo de la
ciencia en el que confluyen varias disciplinas como son: la biología, la computación y las tecnologías
de la información. Su fin último es facilitar el descubrimiento de nuevos conocimientos y el
desarrollo de perspectivas globales a partir de las cuales puedan discernirse principios unificadores
en el campo de la biología. (Cañedo Andalia & Arencibia Jorge, 2004)
3.7 MEGA-X
El Análisis Genético Evolutivo Molecular (MEGA) es un software de computadora para
realizar análisis estadísticos de la evolución molecular y para construir árboles filogenéticos, incluye
muchos métodos y herramientas sofisticados para filogenómica y filomedicina.
4. METODOLOGIA
4.1 USO DE PROGRAMA BioEdit PARA LA CLASIFICACIÓN DE CALIDAD EN
SECUENCIAS DE ADN
PASO 1: Lo primero a realizar será de los cuatro archivos proporcionados, escoger uno de ellos
para poder identificar la calidad de las secuencias, en este caso escogeremos el archivo G1 y lo
guardaremos en una carpeta la cual la llamaremos “PRACTICA BIOINFORMATICA”
Figura 1. Carpeta con archivos de secuencias de ADN
Fuente: Elaboración propia
PASO 2: Antes de abrir la carpeta con el archivo guardado, instalaremos en nuestro equipo
el programa BioEdit, este programa nos ayudará a alinear las secuencias de ADN

ESCUELA PROFESIONAL
10
PASO 3: Luego de haber instalado el programa BioEdit, abriremos nuestra carpeta
“PRACTICA_BIOINFORMATICA” y abriremos nuestro archivo G1.
Figura 3. Uso de programa BioEdit
Figura 2. Captura de página web del programa BioEdit

ESCUELA PROFESIONAL
11
PASO 4: Luego de abrir el archivo, seleccionaremos el primero “E09_5_09.ab1” y lo
abriremos con el programa BioEdit, solo tendremos que hacer doble clic en él y
automáticamente nos llevara al programa con la secuencia ya abierta.
NOTA:
Una de las maneras de saber si las secuencias son de calidad buena o mala, debemos fijarnos en los
picos (cromatogramas), si los picos son altos quiere decir que la secuencia es de calidad BUENA,
pero si son picos bajos quiere decir que es de calidad MALA.
Ora manera de saber si las secuencias de ADN son de calidad buena o mala es exportando los datos.
4.2 PROCEDIMIENTO PARA OBTENER FORMATO FASTA DE SECUENCIAS DE ADN
PASO 5: Una vez abierto la secuencia, lo guardaremos seleccionando FILE, desplegamos y
seleccionaremos “EXPORT AS FASTA”
Figura 4. Secuencia de AND "E09-5-09"
Figura 5. Herramienta Export as Fasta

ESCUELA PROFESIONAL
12
PASO 6: Guardamos la secuencia en la carpeta creada “PRACTICA_BIOINFORMATICA” y
colocamos el nombre de la secuencia “E09_5_09”.
PASO 7: Procedemos a cambiar a formato fasta las demás secuencias.
Figura 6. Secuencia de ADN en formato Fasta "E09-5-09"
Figura 7. Secuencias ADN en formato Fasta

ESCUELA PROFESIONAL
13
PASO 8: Una vez guardado todas las secuencias, abriremos cada una de ellas con el bloc de notas
Figura 8. Uso de Bloc de Notas

ESCUELA PROFESIONAL
14
4.3 DETERMINACION DE CALIDAD DE SECUENCIAS DE ADN
Como ya hemos mencionado antes, una de las maneras para determinar si la calidad de la
secuencia es buena o mala es observando la cantidad de la letra “N” que se muestra en formato fasta
Como podemos observar en la primera secuencia, no tenemos una gran cantidad de “N” por lo
que nuestra secuencia es de calidad BUENA.
Figura 9. E09-5-09
CALIDAD: BUENA
CA
Figura 10. E10_13_10
CALIDAD: BUENA

ESCUELA PROFESIONAL
15
Figura 11. F10_14_12
CALIDAD: MALA
Figura 12. G07_7H_13
CALIDAD: BUENA
Figura 13. F07_6H_11
CALIDAD: BUENA
Figura 14. F09_6_11
CALIDAD: BUENA

ESCUELA PROFESIONAL
16
Figura 15. G09_7_13
CALIDAD: BUENA
Figura 16. G10_15_14
CALIDAD: MALA
Figura 17. H07_8H_15
CALIDAD: MALA
Figura 18. H09_8_15
CALIDAD: MALA

ESCUELA PROFESIONAL
17
4.4 USO DE HERRAMIENTA BLAST
PASO 9: Una vez ya identificada la calidad de las secuencias, ahora nos toca identificar que
microorganismo tiene cada secuencia, esto lo haremos con la ayuda de la herramienta proporcionada
por el internet llamado “BLAST”.
(link de la herramienta BLAST) https://blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE_TYPE=BlastSearch
Figura 19. H10_16_16
CALIDAD: BUENA
Figura 20. Página Web de herramienta BLAST

ESCUELA PROFESIONAL
18
PASO 10: Esta herramienta nos ayudara a identificar que microorganismo es para cada secuencia,
pero primero seleccionamos las 5 primeras líneas de cada secuencia del bloc de notas y lo llevaremos a la
herramienta BLAST
PASO 11: Luego iremos a la parte inferior de la herramienta y haremos clic en BLAST
Figura 21. Ingreso de números de secuencia de ADN en BLAST.
Figura 22. Uso de BLAST

ESCUELA PROFESIONAL
19
PASO 12: Esperamos unos segundos y nos aparecerá un cuadro con una serie de datos.
NOTA:
Como podemos observar nos dan distintos microorganismos o bacterias, ahora para poder saber
que bacteria es de nuestra muestra, nos enfocamos en el PORCENTAJE DE IDENTIDAD, el mayor
porcentaje de identidad de la muestra será nuestro microorganismo o bacteria.
PASO 13: En este caso nuestro microorganismo de nuestra muestra de mayor porcentaje de identidad
es el Klebsiella pneumoniae
Figura 23. Serie de datos proporcionada por el uso de BLAST
Figura 24. Selección del microorganismo con mayor porcentaje de identidad

ESCUELA PROFESIONAL
20
PASO 14: Haremos el mismo procedimiento con las demás muestras y todos los datos
obtenidos a partir de la calidad de la muestra hasta el reconocimiento de nuestros
microorganismos lo insertaremos en un cuadro de Excel:
4.5 ALINEAMIENTO DE 11 SECUENCIAS DE ADN CON GEN NIFH
PASO 15: Luego de haber previamente instalado el programa MEGA-X, abriremos el
programa para empezar a alinear nuestros microorganismos.
Figura 25. Identidad de microorganismos
Figura 26. Programa MEGA-X

ESCUELA PROFESIONAL
21
PASO 16: Una vez abierto el programa nos dirigimos a la opción ALIGN, se despliega la
ventana y nos dirigimos a la opción “Query Databanks” y hacemos clic en ella.
Figura 27. Herramienta de MEGA-X " Query Data banks"

ESCUELA PROFESIONAL
22
4.6 USO DE DATABANK NCBI
PASO 17: Una vez hecho esto, se abrirá una nueva ventana la cual es la página del NCBI donde
nos va a proporcionar toda la información de bioinformática de genes y proteínas.
PASO 18: Empezaremos buscando las secuencias de los microorganismos, entonces para buscar
empezamos poniendo el nombre del microorganismo y la palabra “NIFH” lo cual el gen NIFH
es la responsable de la fijación del nitrógeno.
Figura 28. Databank NCBI
Figura 29. Busqueda de gen NIFH

ESCUELA PROFESIONAL
23
PASO 19: Buscamos y nos aparecerá una lista de bacterias y microrganismos, aquí debemos
tener en cuenta que solo tenemos que añadir las muestras que tengan el nombre de “NIFH” luego
iremos añadiendo y haciendo clic en “Add to Alignment”.
PASO 20: Una vez añadido a la herramienta “Add to Alignment”, nos aparecerá otra ventana, tener
en cuenta que debe estar seleccionado el NIFH y le daremos a OK, luego nos aparecerá otra ventana y
haremos lo mismo.
Figura 30. Lista de microorganismos con gen NIFH
Figura 31. Herramienta Add to Alignment

ESCUELA PROFESIONAL
24
PASO 21: Una vez hecho esto, nos aparecerá la ventana de alineamiento con la secuencia del
microorganismo añadido.
Fuente:
Elaboración propia
PASO 22: Procedemos a realizar mismo procedimiento con los demás microorganismos hasta obtener
un total de 15 secuencias de microorganismos fijadores de nitrógeno.
Fuente:
Elaboración propia
Figura 32. Uso de secuencia de ADN con gen NIFH
Figura 33. Uso de 15 secuencias de ADN con gen NIFH

ESCUELA PROFESIONAL
25
PASO 23: Una vez obtenido nuestras secuencias de microorganismos, utilizaremos la herramienta
“Align using the MUSCLE algorithm” Haremos clic en ella y nos aparecerá dos opciones,
elegiremos la opción “Align DNA”.
PASO 24: Una vez hecho esto, nos aparecerá una ventana pequeña y le daremos a OK, y
automáticamente se seleccionará todas las secuencias de los microorganismos y nos
aparecerá otra ventana la cual también le daremos a OK.
Figura 34. Alineamiento de secuencias con herramienta Align DNA en programa MEGA - X
Figura 35. Alineamiento en proceso

ESCUELA PROFESIONAL
26
PASO 25: Como podemos observar, las secuencias ya han sido alineadas
Figura 36. Secuencias de ADN alineadas

ESCUELA PROFESIONAL
27
TENER EN CUENTA QUE LOS ESPACIOS EN BLANCO SON SECUENCIAS QUE NO
NECESITAMOS, ASI QUE HAREMOS LO SIGUIENTE:
PASO 26: Utilizaremos el mouse e iremos arrastrando con el lado izquierdo del mouse,
seleccionando los espacios vacíos y por ultimo utilizaremos la herramienta “Delete
selected block" y se borrarán, haremos el mismo procedimiento para los demás espacios vacíos, hasta
que solo quede las secuencias alineadas.
Figura 37. Eliminación de espacios sin alineamiento

ESCUELA PROFESIONAL
28
COMO PODEMOS OBSERVAR PODEMOS OBVIAR ALGUNOS ESPACIOS VACIOS,
PERO SOLO LOS ESPACIOS QUE TIENEN UNA LINEA VACIA
PASO 27: Una vez obtenido nuestras secuencias alineadas, procedemos a guardarlo con la
herramienta
“Save the alignment to a MEGA session file” y lo guardaremos a nuestra carpeta llamada
“PRACTICA_BIOINFORMATICA” con el nombre de “Alineamiento de ADN (gen NIFH)” y tener
en cuenta que el formato debe estar en “Aln Session”
Figura 38. Alineamiento de secuencias de ADN con gen NIFH culminada
Figura 39. Error de alineamiento de secuencias de ADN

ESCUELA PROFESIONAL
29
PASO 28: Luego nos dirigimos a “DATA”, y nos iremos a la opción “Export Alignment y
nos dará tres opciones, elegiremos la opción “MEGA Format” y lo guardamos con el mismo nombre
solo que este estará con otro formato en “MEGA Files”
Figura 40. Creación de archivo del alineamiento realizado anteriormente con la herramienta
“Save the alignment to a MEGA session file”
Figura 41. Exportacion de alineamineto finalizado a formato MEGA

ESCUELA PROFESIONAL
30
PASO 29: Luego nos aparecerá otra pequeña ventana y lo guardaremos con el nombre de
“ARBOL_G1” y le daremos OK a la siguiente ventana que también nos aparecerá.
Figura 42. Creación de archivo "ARBOL-G1"

ESCUELA PROFESIONAL
31
PASO 30: Finalmente iremos al programa mega y nos iremos a la opción “File” y
seleccionaremos la opción “Open a File/Session” y abriremos nuestro archivo en formato “MEGA
files”
PASO 30: Luego nos iremos a la opción “PHYLOGENY” para crear nuestro árbol filogenético
y nos iremos a la opción “Construct/Test UPGMA Tree”
Figura 43. Visualización de archivos en formato MEGA
Figura 44. Creación de filogenético

ESCUELA PROFESIONAL
32
PASO 31: Nos aparecerá una ventana la cual en este caso donde dice “None” lo cambiaremos
a “Bootstrap method” y también cambiaremos el 500 a “1000”, y le daremos OK
PASO 32: Esperamos unos segundos y obtendremos nuestro árbol filogenético.
Figura 45. Actualización de campos de editor para la posterior creación de
árbol filogenético
Figura 46. Árbol filogenético

ESCUELA PROFESIONAL
33
5. RESULTADOS Y DISCUSION
5.1 ÁRBOL FILOGENÉTICO
ÁRBOL FILOGENÉTICO
FIFILOGENÉTICO

ESCUELA PROFESIONAL
34
Analizando nuestro árbol filogenético podemos observar que la bacteria Klebsiella pneumoniae
isolate HUB_IV con la otra especie Klebsiella pneumoniae strain NG14 son especies próximas al 63%
ya que están en la misma rama, en comparación a las especies de Enterobacter sp. Strain IDRT-2 y
Enterobacter sp strain RPDRT-2 que son distintas porque están en otra rama.
También podemos observar que la especie Klebsiella sp., con la especie Enterobacter sp. Y4
son especies distintas.
También tenemos la escala evolutiva, en donde indica la evolución de las especies a lo largo de
la evolución, cuanto más próximo sea a 0 las especies son más próximas o iguales.
Figura 47. Escala Evolutiva de especies con gen NIFH

ESCUELA PROFESIONAL
35
5.2 DETERMINACIÓN Y CLASIFICACIÓN DE SECUENCIAS DE ADN
Las secuencias en formato fasta fueron debidamente clasificadas según la calidad que presentaban
tomando en cuenta su imagen cromatografía y formatos fastas ya presentado en el punto 4.3 del presente
informe a continuación se realiza una segunda muestra de cada una de las 11 secuencias clasificadas en
formato fasta .
CALIDAD DE LAS SECUENCIAS DE ADN
Figura 48. E09-5-09
CALIDAD: BUENA
CA
Figura 49. E10_13_10
CALIDAD: BUENA

ESCUELA PROFESIONAL
36
Figura 50. F07_6H_11
CALIDAD: BUENA
Figura 51. F09_6_11
CALIDAD: BUENA
Figura 52. F10_14_12
CALIDAD: MALA
Figura 53. G07_7H_13
CALIDAD: BUENA

ESCUELA PROFESIONAL
37
Figura 54. G09_7_13
CALIDAD: BUENA
Figura 55. G10_15_14
CALIDAD: MALA
CALIDAD: MALA
Figura 57. H09_8_15
CALIDAD: MALA

ESCUELA PROFESIONAL
38
5.3 CLASIFICACION DE SECUENCIAS DE ADN EN EL PROGRAMA BioEdit
Figura 59. MUESTRA E09_5_09
Figura 58. H10_16_16
CALIDAD: BUENA

ESCUELA PROFESIONAL
39
Figura 60. MUESTRA E10_13_10
Figura 61. MUESTRA F07_6H_11

ESCUELA PROFESIONAL
40
Figura 62. MUESTRA F09_6_11
Figura 63. MUESTRA F10_14_12

ESCUELA PROFESIONAL
41
Figura 64. MUESTRA G07_7H_13
Figura 65. MUESTRA G09_7_13

ESCUELA PROFESIONAL
42
Figura 66. MUESTRA G10_15_14
Figura 67. MUESTRA H07_8H_15

ESCUELA PROFESIONAL
43
Figura 69. MUESTRA H09_8_15

ESCUELA PROFESIONAL
44
5.4 CLASIFICACION E IDENTIFICACION DE SECUENCIAS DE ADN
TABLA: CALIDAD DE MUESTRAS DE SECUENCIAS DE ADN
6. CONCLUSIONES Y RECOMENDACIONES
6.1 CONCLUSIONES
Se evaluó la calidad de las secuencias de ADN de cada muestra con la ayuda del programa BioEdit,
ya que este programa nos ayuda a visualizar los cromatogramas de la secuencia, y se pudo determinar que de
las 11 muestras evaluadas solo 4 son de mala calidad y los restantes son de buena calidad.
N° MUESTRAS CALIDAD
% DE
IDENTIDAD
ORGANISMO
1 E09_5_09 BUENA 89.18% Klebsiella pneumoniae
2 E10_13_10 BUENA No se encontro ninguna similitud significativa
3 F07_6H_11 BUENA 96.64% Klebsiella pneumoniae
4 F09_6_11 BUENA 89.27% Enterobacter asburiae
5 F10_14_12 MALA No se encontro ninguna similitud significativa
6 G07_7H_13 BUENA 95.42% Klebsiella sp.
7 G09_7_13 BUENA No se encontro ninguna similitud significativa
8 G10_15_14 MALA 97.90% Enterobacter sp.
9 H07_8H_15 MALA No se encontro ninguna similitud significativa
10 H09_8_15 MALA No se encontro ninguna similitud significativa
11 H10_16_16 BUENA 90.18% Enterobacter sp.

ESCUELA PROFESIONAL
45
6.2 RECOMENDACIONES
 Se recomienda primo instalar los programas BioEdit y Mega-X ya que si no están instalados al
momento de saber si son de calidad buena o mala el archivo no se podrá abrir.
 También se recomienda que al momento de exportar en un bloc de notas las secuencias del
programa BioEdit para la determinación de la calidad de las muestras es fijarnos la cantidad de
“N” que hay en la secuencia ya que si hay muchas “N” indica que es de calidad mala.
 También al momento de hacer el alineamiento en el programa MEGA-X debemos tener en
cuenta que no debemos eliminar todos los posibles espacios vacíos que hay y alinear lo más que
podamos.
7. Bibliografía
Márquez Valdelamar, L., Serrato Díaz , A., & Cerritos Flores, R. (s.f.). Secuenciación de fragmentos
de ADN. Herramientas moleculares aplicadas en ecología. Instituto de Biología, UNAM,
México.
Anicet R. , B. (2010). Biotecnología ambiental. Aplicaciones biotecnológicas en la mejora del medio
ambiente. Universidad de Barcelona.
Cañedo Andalia, R., & Arencibia Jorge, R. (2004). Bioinformática: en busca de los secretos
moleculares de la vida. Centro Nacional de Información de Ciencias Médicas, Ciudad de la
Habana, Cuba. Obtenido de http://bvs.sld.cu/revistas/aci/vol12_6_04/aci02604.htm
Castillo Rodriguez, F. (2005). Biotecnología Ambiental. Madrid , España.
de Necochea Campion, R., & Canul Tec, J. (2004). SECUENCIACIÓN DE ÁCIDOS NUCLEICOS.
Métodos fisicoquímicos en biotecnología. Instituto de Biotecnología - UNAM, Cuernavaca.
 https://medium.com/el-blog-de-melquiades/alineamientos-de-secuencias-de-adn-y-
proteinas-57fcdfbfcb25
 http://bioinf.ibun.unal.edu.co/documentos/Blast/blast.php

Imforme secuencia de adn

Recomendados

Recomendados

Más contenido relacionado

Similar a Imforme secuencia de adn

Similar a Imforme secuencia de adn (20)

Más de YessicaTicona1

Más de YessicaTicona1 (6)

Último

Último (9)

Imforme secuencia de adn