Este documento describe un proyecto de bioinformática para realizar el alineamiento de 15 secuencias de ADN que contienen el gen NIFH y generar un árbol filogenético. Se utilizan herramientas como BioEdit, BLAST, NCBI y MEGA-X para analizar la calidad de las secuencias, alinearlas, obtener información de bancos de datos y construir el árbol filogenético respectivamente. El objetivo es estudiar las relaciones evolutivas entre los microorganismos basadas en la comparación de sus secuencias de ADN
1. “Año de la Universalización de la Salud”
UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERIA AMBIENTAL
PRACTICA DE BIOINFORMATIVA: CALIDAD Y
ALINIAMIENTO DE SECUENCIAS DE ADN Y
GENERACIÓN DE ARBOL FILOGENETICO EN BASE AL
GEN NIF H (FIJACIÓN BIOLOGICA DE NITROGENO)
DOCENTE:
Dr. SOTO GONZALES HEBERT HERNAN
CURSO:
BIOTECNOLOGIA
ELABORADO POR:
TICONA MIRANDA, YESSICA KAREN
CLAUDIA YANETH, SANTACRUZ HUILLCA
SEMESTRE
VII
MOQUEGUA – PERÚ
DICIEMBRE – 2020
2. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
2
INDICE
1. INTRODUCCIÓN..............................................................................................................5
2. OBJETIVOS.......................................................................................................................6
2.1 OBJETIVOS GENERAL ...............................................................................................6
2.2 OBJETIVO ESPECIFICOS............................................................................................6
2.3 MATERIALES...............................................................................................................6
3. FUNDAMENTOS TEORICOS..........................................................................................6
3.1 ESTRUCTURA DE LOS ÁCIDOS NUCLEICOS.........................................................6
3.2 ALINEAMIENTO DE SECEUNCIAS DE ADN...........................................................7
3.3 LA BIOINFORMÁTICA ...............................................................................................7
3.4 PROGRAMA BIOEDIT.................................................................................................8
3.5 HERRAMIENTA BLAST..............................................................................................8
3.6 NCBI ..............................................................................................................................8
3.7 MEGA-X........................................................................................................................9
4. METODOLOGIA...............................................................................................................9
4.1 USO DE PROGRAMA BioEdit PARA LA CLASIFICACIÓN DE CALIDAD EN
SECUENCIAS DE ADN ...................................................................................................................9
4.2 PROCEDIMIENTO PARA OBTENER FORMATO FASTA
DE SECUENCIAS DE ADN.....................................................................11
4.3 DETERMINACION DE CALIDAD DE SECUENCIAS DE ADN .............................14
4.4 USO DE HERRAMIENTA BLAST.............................................................................17
4.5 ALINEAMIENTO DE 11 SECUENCIAS DE ADN CON GEN NIFH .......................20
4.6 USO DE DATABANK NCBI ......................................................................................22
5. RESULTADOS Y DISCUSION ......................................................................................33
5.1 ÁRBOL FILOGENÉTICO...........................................................................................33
5.2 DETERMINACIÓN Y CLASIFICACIÓN DE SECUENCIAS DE ADN ...................35
5.3 CLASIFICACION DE SECUENCIAS DE ADN EN EL PROGRAMA BioEdit .......38
5.4 CLASIFICACION E IDENTIFICACION DE SECUENCIAS DE ADN.....................44
6. CONCLUSIONES Y RECOMENDACIONES................................................................44
6.1 CONCLUSIONES........................................................................................................44
6.2 RECOMENDACIONES...............................................................................................45
7. Bibliografía.......................................................................................................................45
3. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
3
INDICE DE FIGURAS
Figura 1. Carpeta con archivos de secuencias de ADN ....................................................................... 9
Figura 2. Captura de página web del programa BioEdit.................................................................... 10
Figura 3. Uso de programa BioEdit................................................................................................... 10
Figura 4. Secuencia de AND "E09-5-09".......................................................................................... 11
Figura 5. Herramienta Export as Fasta .............................................................................................. 11
Figura 6. Secuencia de ADN en formato Fasta "E09-5-09" ............................................................. 12
Figura 7. Secuencias ADN en formato Fasta..................................................................................... 12
Figura 8. Uso de Bloc de Notas......................................................................................................... 13
Figura 9. E09-5-09............................................................................................................................ 14
Figura 10. E10_13_10....................................................................................................................... 14
Figura 11. F07_6H_11 ...................................................................................................................... 15
Figura 12. F09_6_11......................................................................................................................... 15
Figura 13. F10_14_12....................................................................................................................... 15
Figura 14. G07_7H_13...................................................................................................................... 15
Figura 15. G09_7_13 ........................................................................................................................ 16
Figura 16. G10_15_14 ...................................................................................................................... 16
Figura 17. H07_8H_15...................................................................................................................... 16
Figura 18. H09_8_15 ........................................................................................................................ 16
Figura 19. H10_16_16 ...................................................................................................................... 17
Figura 20. Página Web de herramienta BLAST ............................................................................... 17
Figura 21. Ingreso de números de secuencia de ADN en BLAST.................................................... 18
Figura 22. Uso de BLAST................................................................................................................. 18
Figura 23. Serie de datos proporcionada por el uso de BLAST......................................................... 19
Figura 24. Selección del microorganismo con mayor porcentaje de identidad.................................. 19
Figura 25. Identidad de microorganismos ......................................................................................... 20
Figura 26. Programa MEGA-X......................................................................................................... 20
Figura 27. Herramienta de MEGA-X " Query Data banks" .............................................................. 21
Figura 28. Databank NCBI................................................................................................................ 22
Figura 29. Busqueda de gen NIFH.................................................................................................... 22
Figura 30. Lista de microorganismos con gen NIFH......................................................................... 23
Figura 31. Herramienta Add to Alignment........................................................................................ 23
Figura 32. Uso de secuencia de ADN con gen NIFH ........................................................................ 24
Figura 33. Uso de 15 secuencias de ADN con gen NIFH.................................................................. 24
Figura 34. Alineamiento de secuencias con herramienta Align DNA en programa MEGA - X........ 25
Figura 35. Alineamiento en proceso.................................................................................................. 25
4. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
4
Figura 36. Secuencias de ADN alineadas......................................................................................... 26
Figura 37. Eliminación de espacios sin alineamiento ........................................................................ 27
Figura 38. Alineamiento de secuencias de ADN con gen NIFH culminada ...................................... 28
Figura 39. Error de alineamiento de secuencias de ADN .................................................................. 28
Figura 40. Creación de archivo del alineamiento realizado anteriormente con la herramienta “Save the
alignment to a MEGA session file”............................................................................................................. 29
Figura 41. Exportacion de alineamineto finalizado a formato MEGA .............................................. 29
Figura 42. Creación de archivo "ARBOL-G1".................................................................................. 30
Figura 43. Visualización de archivos en formato MEGA.................................................................. 31
Figura 44. Creación de filogenético .................................................................................................. 31
Figura 45. Actualización de campos de editor para la posterior creación de árbol filogenético ........ 32
Figura 46. Árbol filogenético ............................................................................................................ 32
Figura 47. Escala Evolutiva de especies con gen NIFH .................................................................... 34
Figura 48. E09-5-09.......................................................................................................................... 35
Figura 49. E10_13_10....................................................................................................................... 35
Figura 50. F07_6H_11 ...................................................................................................................... 36
Figura 51. F09_6_11......................................................................................................................... 36
Figura 52. F10_14_12....................................................................................................................... 36
Figura 53. G07_7H_13...................................................................................................................... 36
Figura 54. G09_7_13 ........................................................................................................................ 37
Figura 55. G10_15_14 ...................................................................................................................... 37
Figura 56. H07_8H_15...................................................................................................................... 37
Figura 57. H09_8_15 ........................................................................................................................ 37
Figura 58. H10_16_16 ...................................................................................................................... 38
Figura 59. MUESTRA E09_5_09..................................................................................................... 38
Figura 60. MUESTRA E10_13_10 ................................................................................................... 39
Figura 61. MUESTRA F07_6H_11 .................................................................................................. 39
Figura 62. MUESTRA F09_6_11 ..................................................................................................... 40
Figura 63. MUESTRA F10_14_12 ................................................................................................... 40
Figura 64. MUESTRA G07_7H_13.................................................................................................. 41
Figura 65. MUESTRA G09_7_13..................................................................................................... 41
Figura 66. MUESTRA G10_15_14................................................................................................... 42
Figura 67. MUESTRA H07_8H_15.................................................................................................. 42
Figura 68. H07_8H_15...................................................................................................................... 43
Figura 69. MUESTRA H09_8_15..................................................................................................... 43
5. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
5
1. INTRODUCCIÓN
Los sistemas de clasificación más modernos se basan en las relaciones evolutivas entre
organismos, esto es, en su filogenia. Los sistemas de clasificación basados en la filogenia
organizan las especies u otros grupos de manera que reflejen nuestra comprensión de su
proceso evolutivo a partir de sus ancestros comunes. (de Necochea Campion & Canul Tec,
2004)
La identificación de los genes hasta la obtención de los tratamientos efectivos, es largo
y complejo (Cañedo Andalia & Arencibia Jorge, 2004) por ende la secuenciación
determinación del orden en el que se disponen las bases que forman una molécula de DNA-
del genoma humano ha originado cantidades enormes de información que debe procesarse
para poderse utilizar convenientemente. Tal importancia de la genómica origina que la
bioinformática, considerada como la aplicación de informática en el procesamiento de la
información genética tienen una función primordial la fusión de las técnicas computacionales
con el entendimiento y apreciación de datos biológicos, el almacenamiento, recuperación,
manipulación y correlación de datos procedentes de distintas fuentes. (Cañedo Andalia &
Arencibia Jorge, 2004)
Con el objetivo de realizar el alineamiento de 15 secuencias de ADN con características
en común de contar con el gen NIFH y creación de su árbol filogenético.
En el presente informe, diseñamos la metodología para poder analizar, describir y
clasificar en calidad genómica de secuencias de ADN así mismo analizaremos el proceso
evolutivo en estos microorganismos en base a su árbol filogenético basado en la comparación
y alineamiento de secuencias de los genes NIFH con ayuda de herramientas propio de
programas aplicativos en bioinformática.
6. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
6
2. OBJETIVOS
2.1 OBJETIVOS GENERAL
Realizar el alineamiento de la secuencia del gen NIFH
2.2 OBJETIVO ESPECIFICOS
Identificar la calidad de las secuencias AND
Realizar el árbol filogenético
2.3 MATERIALES
Laptop
Internet
Programa BioEdit
Programa MEGA-X
Herramienta BLAST
NCBI
3. FUNDAMENTOS TEORICOS
3.1 ESTRUCTURA DE LOS ÁCIDOS NUCLEICOS.
El ADN es una doble hélice. Cada una de las hélices es un polímero integrado por millones de
nucleótidos que son los monómeros del polímero. Cada nucleótido está formado por una
desoxirribosa, una base púrica o pirimídica y un grupo fosfato. Las dos cadenas de ADN son
antiparalelas y se unen entre sí a través de puentes de hidrógeno que se forman entre las bases
complementarias (A·T y G·C) de las dos hebras del ADN. De esta manera, se obtiene una estructura
tipo doble hélice, donde las bases de los nucleótidos se encuentran orientadas hacia el interior,
mientras que los grupos fosfato y las desoxirribosas lo hacen hacia el exterior, formando los
esqueletos fosfodiéster de cada hélice. Los pares de nucleótidos se encuentran separados entre sí por
3.4 Å, cada diez pares de nucleótidos (34 Å) se alcanza una vuelta de la hélice. La diferencia
fundamental entre todas las moléculas de ADN que forman el material genético de los seres vivos es
la secuencia de los millones de estos cuatro tipos de nucleótidos con sus bases A, T, G y C en cada
molécula de ADN. (de Necochea Campion & Canul Tec, 2004)
7. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
7
3.2 ALINEAMIENTO DE SECEUNCIAS DE ADN
La comparación de secuencias biológicas (ADN, ARN o proteínas) juega un papel
fundamental en la investigación genética, tanto a nivel teórico para el análisis evolutivo de las
especies mediante árboles filogenéticos como para la comprensión y tratamiento de enfermedades.
Las secuencias de ADN y proteína definen la función de las proteínas en los seres vivos.
Cuando más similares sean dos secuencias más similares tenderán a ser las funciones de las proteínas
codificadas por ellas.
Las secuencias de un mismo gen en un conjunto de especies serán más distintas cuanto más
alejadas filogenéticamente estén las especies comparadas. Normalmente dos secuencias tienen una
alta similitud porque son homólogas, es decir comparten un ancestro común.
Dependiendo del propósito del estudio, lo siguiente es generar hipótesis de homología de las
bases al comparar y alinear las secuencias entre los organismos secuenciados. En un proceso de
alineación de secuencias, el mecanismo básico es simplemente colocar en la misma posición a todas
las bases. Para esto se utilizan programas de cómputo como CLUSTAL X o en este caso MEGA-X
que son los más usados. Esta herramienta se incluye en los diversos programas de edición de
secuencias como BioEdit. ( Márquez Valdelamar, Serrato Díaz , & Cerritos Flores)
3.3 LA BIOINFORMÁTICA
Es una disciplina que se encuentra en la intersección entre las ciencias de la vida y de la
información. Proporciona herramientas y recursos para favorecer la investigación biomédica. Trata
de desarrollar sistemas que sirvan para entender el flujo de información desde los genes a las
estructuras moleculares, su función bioquímica, conducta biológica y, finalmente, su influencia en
las enfermedades y la salud.
La bioinformática es una nueva disciplina dentro de la biología, donde las herramientas de la
computación tienen una función primordial. Si bien algunos restringen el rango de estudio de la
bioinformática al manejo y análisis de bases de datos biológicas -principalmente de secuencias-,
podría atribuírsele un sentido más amplio, como la fusión de las técnicas computacionales con el
entendimiento y apreciación de datos biológicos, el almacenamiento, recuperación, manipulación y
correlación de datos procedentes de distintas fuentes.
Una definición más general, la ubica como el estudio de la información biológica a partir de
la teoría de la información, la computación y las matemáticas. El reto más importante al que se
enfrenta esta ciencia es responder a la avalancha de datos que provienen del proyecto "Genoma
humano" y de la genómica. (Cañedo Andalia & Arencibia Jorge, 2004)
La bioinformática comprende tres subespecialidades:
8. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
8
Bioinformática propiamente dicha, que abarca la investigación y desarrollo de la
infraestructura y de los sistemas de información y comunicación que requiere la biología
moderna -redes y bases de datos para el genoma, estaciones de trabajo para procesamiento
de imágenes, etcétera.
Biología Computacional, que comprende la computación aplicada a la comprensión de
las cuestiones biológicas básicas, a partir de la modelación y simulación -sistemas de vida
artificial, algoritmos genéticos, redes de neuronas artificiales.
Biocomputación, que incluye el desarrollo y utilización de sistemas computacionales
basados en modelos y materiales biológicos -biochips, biosensores, computación basada
en ADN, entre otros. Las computadoras basadas en DNA se están empleando para la
secuenciación masiva y el pesquisaje de diversas enfermedades, a partir de la explotación
del procesamiento paralelo implícito. (Cañedo Andalia & Arencibia Jorge, 2004)
3.4 PROGRAMA BIOEDIT
BioEdit es un programa gratuito para edición de alineamientos y análisis de secuencias que
funciona únicamente sobre ambiente MS/Windows. Es, sin lugar a duda, uno de los programas más
conocidos para edición de secuencias para dicho sistema operativo.
BioEdit es un editor de alineamiento de secuencias, sumamente amigable con el usuario. Con
este programa, se realizaron tres pasos importantes: reverso complementario, algoritmo Smith-
Waterman y algoritmo Needleman-Wunsch.
Con el programa BioEdit se abren las secuencias recibidas, que deben estar en formato
FASTA. El programa permite abrir los cromatogramas correspondientes a cada secuencia para su
edición y corrección de posibles errores cometidos en la lectura.
3.5 HERRAMIENTA BLAST
BLAST es el acrónimo de Basic Local Alignment Search Tool. Fue desarrollado por Altschul
en 1990 y es el algoritmo más empleado por el NCBI. La principal característica del BLAST es su
velocidad, pudiendo tomar pocos minutos cualquier búsqueda en la totalidad de la base de datos. De
hecho, los resultados se presentan en pantalla inmediatamente después de calculados. El BLAST
puede hacer búsquedas en una base de datos no redundante (nr) la cual tiene los registros no
redundantes entre las dos bases de datos principales a nivel mundial: GenBank en USA y EMBL
(European Molecular Biology Laboratories) en Europa.
3.6 NCBI
9. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
9
Según la definición del Centro Nacional para la Información Biotecnológica "National Center
for Biotechnology Information" -NCBI por sus siglas en inglés: la Bioinformática es un campo de la
ciencia en el que confluyen varias disciplinas como son: la biología, la computación y las tecnologías
de la información. Su fin último es facilitar el descubrimiento de nuevos conocimientos y el
desarrollo de perspectivas globales a partir de las cuales puedan discernirse principios unificadores
en el campo de la biología. (Cañedo Andalia & Arencibia Jorge, 2004)
3.7 MEGA-X
El Análisis Genético Evolutivo Molecular (MEGA) es un software de computadora para
realizar análisis estadísticos de la evolución molecular y para construir árboles filogenéticos, incluye
muchos métodos y herramientas sofisticados para filogenómica y filomedicina.
4. METODOLOGIA
4.1 USO DE PROGRAMA BioEdit PARA LA CLASIFICACIÓN DE CALIDAD EN
SECUENCIAS DE ADN
PASO 1: Lo primero a realizar será de los cuatro archivos proporcionados, escoger uno de ellos
para poder identificar la calidad de las secuencias, en este caso escogeremos el archivo G1 y lo
guardaremos en una carpeta la cual la llamaremos “PRACTICA BIOINFORMATICA”
Figura 1. Carpeta con archivos de secuencias de ADN
Fuente: Elaboración propia
PASO 2: Antes de abrir la carpeta con el archivo guardado, instalaremos en nuestro equipo
el programa BioEdit, este programa nos ayudará a alinear las secuencias de ADN
10. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
10
Fuente: Elaboración propia
PASO 3: Luego de haber instalado el programa BioEdit, abriremos nuestra carpeta
“PRACTICA_BIOINFORMATICA” y abriremos nuestro archivo G1.
Figura 3. Uso de programa BioEdit
Fuente: Elaboración propia
Figura 2. Captura de página web del programa BioEdit
11. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
11
PASO 4: Luego de abrir el archivo, seleccionaremos el primero “E09_5_09.ab1” y lo
abriremos con el programa BioEdit, solo tendremos que hacer doble clic en él y
automáticamente nos llevara al programa con la secuencia ya abierta.
Fuente: Elaboración propia
NOTA:
Una de las maneras de saber si las secuencias son de calidad buena o mala, debemos fijarnos en los
picos (cromatogramas), si los picos son altos quiere decir que la secuencia es de calidad BUENA,
pero si son picos bajos quiere decir que es de calidad MALA.
Ora manera de saber si las secuencias de ADN son de calidad buena o mala es exportando los datos.
4.2 PROCEDIMIENTO PARA OBTENER FORMATO FASTA DE SECUENCIAS DE ADN
PASO 5: Una vez abierto la secuencia, lo guardaremos seleccionando FILE, desplegamos y
seleccionaremos “EXPORT AS FASTA”
Fuente: Elaboración propia
Figura 4. Secuencia de AND "E09-5-09"
Figura 5. Herramienta Export as Fasta
12. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
12
PASO 6: Guardamos la secuencia en la carpeta creada “PRACTICA_BIOINFORMATICA” y
colocamos el nombre de la secuencia “E09_5_09”.
Fuente: Elaboración propia
PASO 7: Procedemos a cambiar a formato fasta las demás secuencias.
Fuente: Elaboración propia
Figura 6. Secuencia de ADN en formato Fasta "E09-5-09"
Figura 7. Secuencias ADN en formato Fasta
13. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
13
PASO 8: Una vez guardado todas las secuencias, abriremos cada una de ellas con el bloc de notas
Fuente: Elaboración propia
Figura 8. Uso de Bloc de Notas
14. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
14
4.3 DETERMINACION DE CALIDAD DE SECUENCIAS DE ADN
Como ya hemos mencionado antes, una de las maneras para determinar si la calidad de la
secuencia es buena o mala es observando la cantidad de la letra “N” que se muestra en formato fasta
Como podemos observar en la primera secuencia, no tenemos una gran cantidad de “N” por lo
que nuestra secuencia es de calidad BUENA.
Figura 9. E09-5-09
CALIDAD: BUENA
CA
Figura 10. E10_13_10
CALIDAD: BUENA
17. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
17
4.4 USO DE HERRAMIENTA BLAST
PASO 9: Una vez ya identificada la calidad de las secuencias, ahora nos toca identificar que
microorganismo tiene cada secuencia, esto lo haremos con la ayuda de la herramienta proporcionada
por el internet llamado “BLAST”.
(link de la herramienta BLAST) https://blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE_TYPE=BlastSearch
Fuente: Elaboración propia
Figura 19. H10_16_16
CALIDAD: BUENA
Figura 20. Página Web de herramienta BLAST
18. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
18
PASO 10: Esta herramienta nos ayudara a identificar que microorganismo es para cada secuencia,
pero primero seleccionamos las 5 primeras líneas de cada secuencia del bloc de notas y lo llevaremos a la
herramienta BLAST
Fuente: Elaboración propia
PASO 11: Luego iremos a la parte inferior de la herramienta y haremos clic en BLAST
Fuente: Elaboración propia
Figura 21. Ingreso de números de secuencia de ADN en BLAST.
Figura 22. Uso de BLAST
19. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
19
PASO 12: Esperamos unos segundos y nos aparecerá un cuadro con una serie de datos.
Fuente: Elaboración propia
NOTA:
Como podemos observar nos dan distintos microorganismos o bacterias, ahora para poder saber
que bacteria es de nuestra muestra, nos enfocamos en el PORCENTAJE DE IDENTIDAD, el mayor
porcentaje de identidad de la muestra será nuestro microorganismo o bacteria.
PASO 13: En este caso nuestro microorganismo de nuestra muestra de mayor porcentaje de identidad
es el Klebsiella pneumoniae
Fuente: Elaboración propia
Figura 23. Serie de datos proporcionada por el uso de BLAST
Figura 24. Selección del microorganismo con mayor porcentaje de identidad
20. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
20
PASO 14: Haremos el mismo procedimiento con las demás muestras y todos los datos
obtenidos a partir de la calidad de la muestra hasta el reconocimiento de nuestros
microorganismos lo insertaremos en un cuadro de Excel:
Fuente: Elaboración propia
4.5 ALINEAMIENTO DE 11 SECUENCIAS DE ADN CON GEN NIFH
PASO 15: Luego de haber previamente instalado el programa MEGA-X, abriremos el
programa para empezar a alinear nuestros microorganismos.
Figura 25. Identidad de microorganismos
Figura 26. Programa MEGA-X
21. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
21
Fuente: Elaboración propia
PASO 16: Una vez abierto el programa nos dirigimos a la opción ALIGN, se despliega la
ventana y nos dirigimos a la opción “Query Databanks” y hacemos clic en ella.
Fuente: Elaboración propia
Figura 27. Herramienta de MEGA-X " Query Data banks"
22. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
22
4.6 USO DE DATABANK NCBI
PASO 17: Una vez hecho esto, se abrirá una nueva ventana la cual es la página del NCBI donde
nos va a proporcionar toda la información de bioinformática de genes y proteínas.
Fuente: Elaboración propia
PASO 18: Empezaremos buscando las secuencias de los microorganismos, entonces para buscar
empezamos poniendo el nombre del microorganismo y la palabra “NIFH” lo cual el gen NIFH
es la responsable de la fijación del nitrógeno.
Fuente: Elaboración propia
Figura 28. Databank NCBI
Figura 29. Busqueda de gen NIFH
23. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
23
PASO 19: Buscamos y nos aparecerá una lista de bacterias y microrganismos, aquí debemos
tener en cuenta que solo tenemos que añadir las muestras que tengan el nombre de “NIFH” luego
iremos añadiendo y haciendo clic en “Add to Alignment”.
Fuente: Elaboración propia
PASO 20: Una vez añadido a la herramienta “Add to Alignment”, nos aparecerá otra ventana, tener
en cuenta que debe estar seleccionado el NIFH y le daremos a OK, luego nos aparecerá otra ventana y
haremos lo mismo.
Fuente: Elaboración propia
Figura 30. Lista de microorganismos con gen NIFH
Figura 31. Herramienta Add to Alignment
24. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
24
PASO 21: Una vez hecho esto, nos aparecerá la ventana de alineamiento con la secuencia del
microorganismo añadido.
Fuente:
Elaboración propia
PASO 22: Procedemos a realizar mismo procedimiento con los demás microorganismos hasta obtener
un total de 15 secuencias de microorganismos fijadores de nitrógeno.
Fuente:
Elaboración propia
Figura 32. Uso de secuencia de ADN con gen NIFH
Figura 33. Uso de 15 secuencias de ADN con gen NIFH
25. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
25
PASO 23: Una vez obtenido nuestras secuencias de microorganismos, utilizaremos la herramienta
“Align using the MUSCLE algorithm” Haremos clic en ella y nos aparecerá dos opciones,
elegiremos la opción “Align DNA”.
Fuente: Elaboración propia
PASO 24: Una vez hecho esto, nos aparecerá una ventana pequeña y le daremos a OK, y
automáticamente se seleccionará todas las secuencias de los microorganismos y nos
aparecerá otra ventana la cual también le daremos a OK.
Figura 34. Alineamiento de secuencias con herramienta Align DNA en programa MEGA - X
Figura 35. Alineamiento en proceso
26. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
26
Fuente: Elaboración propia
PASO 25: Como podemos observar, las secuencias ya han sido alineadas
Fuente: Elaboración propia
Figura 36. Secuencias de ADN alineadas
27. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
27
TENER EN CUENTA QUE LOS ESPACIOS EN BLANCO SON SECUENCIAS QUE NO
NECESITAMOS, ASI QUE HAREMOS LO SIGUIENTE:
PASO 26: Utilizaremos el mouse e iremos arrastrando con el lado izquierdo del mouse,
seleccionando los espacios vacíos y por ultimo utilizaremos la herramienta “Delete
selected block" y se borrarán, haremos el mismo procedimiento para los demás espacios vacíos, hasta
que solo quede las secuencias alineadas.
Fuente: Elaboración propia
Figura 37. Eliminación de espacios sin alineamiento
28. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
28
Fuente: Elaboración propia
COMO PODEMOS OBSERVAR PODEMOS OBVIAR ALGUNOS ESPACIOS VACIOS,
PERO SOLO LOS ESPACIOS QUE TIENEN UNA LINEA VACIA
Fuente: Elaboración propia
PASO 27: Una vez obtenido nuestras secuencias alineadas, procedemos a guardarlo con la
herramienta
“Save the alignment to a MEGA session file” y lo guardaremos a nuestra carpeta llamada
“PRACTICA_BIOINFORMATICA” con el nombre de “Alineamiento de ADN (gen NIFH)” y tener
en cuenta que el formato debe estar en “Aln Session”
Figura 38. Alineamiento de secuencias de ADN con gen NIFH culminada
Figura 39. Error de alineamiento de secuencias de ADN
29. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
29
Fuente: Elaboración propia
PASO 28: Luego nos dirigimos a “DATA”, y nos iremos a la opción “Export Alignment y
nos dará tres opciones, elegiremos la opción “MEGA Format” y lo guardamos con el mismo nombre
solo que este estará con otro formato en “MEGA Files”
Figura 40. Creación de archivo del alineamiento realizado anteriormente con la herramienta
“Save the alignment to a MEGA session file”
Figura 41. Exportacion de alineamineto finalizado a formato MEGA
30. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
30
Fuente: Elaboración propia
PASO 29: Luego nos aparecerá otra pequeña ventana y lo guardaremos con el nombre de
“ARBOL_G1” y le daremos OK a la siguiente ventana que también nos aparecerá.
Fuente: Elaboración propia
Figura 42. Creación de archivo "ARBOL-G1"
31. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
31
PASO 30: Finalmente iremos al programa mega y nos iremos a la opción “File” y
seleccionaremos la opción “Open a File/Session” y abriremos nuestro archivo en formato “MEGA
files”
Fuente: Elaboración propia
PASO 30: Luego nos iremos a la opción “PHYLOGENY” para crear nuestro árbol filogenético
y nos iremos a la opción “Construct/Test UPGMA Tree”
Fuente: Elaboración propia
Figura 43. Visualización de archivos en formato MEGA
Figura 44. Creación de filogenético
32. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
32
PASO 31: Nos aparecerá una ventana la cual en este caso donde dice “None” lo cambiaremos
a “Bootstrap method” y también cambiaremos el 500 a “1000”, y le daremos OK
Fuente: Elaboración propia
PASO 32: Esperamos unos segundos y obtendremos nuestro árbol filogenético.
Fuente: Elaboración propia
Figura 45. Actualización de campos de editor para la posterior creación de
árbol filogenético
Figura 46. Árbol filogenético
34. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
34
Analizando nuestro árbol filogenético podemos observar que la bacteria Klebsiella pneumoniae
isolate HUB_IV con la otra especie Klebsiella pneumoniae strain NG14 son especies próximas al 63%
ya que están en la misma rama, en comparación a las especies de Enterobacter sp. Strain IDRT-2 y
Enterobacter sp strain RPDRT-2 que son distintas porque están en otra rama.
También podemos observar que la especie Klebsiella sp., con la especie Enterobacter sp. Y4
son especies distintas.
También tenemos la escala evolutiva, en donde indica la evolución de las especies a lo largo de
la evolución, cuanto más próximo sea a 0 las especies son más próximas o iguales.
Fuente: Elaboración propia
Figura 47. Escala Evolutiva de especies con gen NIFH
35. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
35
5.2 DETERMINACIÓN Y CLASIFICACIÓN DE SECUENCIAS DE ADN
Las secuencias en formato fasta fueron debidamente clasificadas según la calidad que presentaban
tomando en cuenta su imagen cromatografía y formatos fastas ya presentado en el punto 4.3 del presente
informe a continuación se realiza una segunda muestra de cada una de las 11 secuencias clasificadas en
formato fasta .
CALIDAD DE LAS SECUENCIAS DE ADN
Figura 48. E09-5-09
CALIDAD: BUENA
CA
Figura 49. E10_13_10
CALIDAD: BUENA
38. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
38
5.3 CLASIFICACION DE SECUENCIAS DE ADN EN EL PROGRAMA BioEdit
Fuente: Elaboración propia
Figura 59. MUESTRA E09_5_09
Figura 58. H10_16_16
CALIDAD: BUENA
44. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
44
5.4 CLASIFICACION E IDENTIFICACION DE SECUENCIAS DE ADN
TABLA: CALIDAD DE MUESTRAS DE SECUENCIAS DE ADN
6. CONCLUSIONES Y RECOMENDACIONES
6.1 CONCLUSIONES
Se evaluó la calidad de las secuencias de ADN de cada muestra con la ayuda del programa BioEdit,
ya que este programa nos ayuda a visualizar los cromatogramas de la secuencia, y se pudo determinar que de
las 11 muestras evaluadas solo 4 son de mala calidad y los restantes son de buena calidad.
N° MUESTRAS CALIDAD
% DE
IDENTIDAD
ORGANISMO
1 E09_5_09 BUENA 89.18% Klebsiella pneumoniae
2 E10_13_10 BUENA No se encontro ninguna similitud significativa
3 F07_6H_11 BUENA 96.64% Klebsiella pneumoniae
4 F09_6_11 BUENA 89.27% Enterobacter asburiae
5 F10_14_12 MALA No se encontro ninguna similitud significativa
6 G07_7H_13 BUENA 95.42% Klebsiella sp.
7 G09_7_13 BUENA No se encontro ninguna similitud significativa
8 G10_15_14 MALA 97.90% Enterobacter sp.
9 H07_8H_15 MALA No se encontro ninguna similitud significativa
10 H09_8_15 MALA No se encontro ninguna similitud significativa
11 H10_16_16 BUENA 90.18% Enterobacter sp.
45. ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
45
6.2 RECOMENDACIONES
Se recomienda primo instalar los programas BioEdit y Mega-X ya que si no están instalados al
momento de saber si son de calidad buena o mala el archivo no se podrá abrir.
También se recomienda que al momento de exportar en un bloc de notas las secuencias del
programa BioEdit para la determinación de la calidad de las muestras es fijarnos la cantidad de
“N” que hay en la secuencia ya que si hay muchas “N” indica que es de calidad mala.
También al momento de hacer el alineamiento en el programa MEGA-X debemos tener en
cuenta que no debemos eliminar todos los posibles espacios vacíos que hay y alinear lo más que
podamos.
7. Bibliografía
Márquez Valdelamar, L., Serrato Díaz , A., & Cerritos Flores, R. (s.f.). Secuenciación de fragmentos
de ADN. Herramientas moleculares aplicadas en ecología. Instituto de Biología, UNAM,
México.
Anicet R. , B. (2010). Biotecnología ambiental. Aplicaciones biotecnológicas en la mejora del medio
ambiente. Universidad de Barcelona.
Cañedo Andalia, R., & Arencibia Jorge, R. (2004). Bioinformática: en busca de los secretos
moleculares de la vida. Centro Nacional de Información de Ciencias Médicas, Ciudad de la
Habana, Cuba. Obtenido de http://bvs.sld.cu/revistas/aci/vol12_6_04/aci02604.htm
Castillo Rodriguez, F. (2005). Biotecnología Ambiental. Madrid , España.
de Necochea Campion, R., & Canul Tec, J. (2004). SECUENCIACIÓN DE ÁCIDOS NUCLEICOS.
Métodos fisicoquímicos en biotecnología. Instituto de Biotecnología - UNAM, Cuernavaca.
https://medium.com/el-blog-de-melquiades/alineamientos-de-secuencias-de-adn-y-
proteinas-57fcdfbfcb25
http://bioinf.ibun.unal.edu.co/documentos/Blast/blast.php