SlideShare una empresa de Scribd logo
1 de 45
Descargar para leer sin conexión
“Año de la Universalización de la Salud”
UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERIA AMBIENTAL
PRACTICA DE BIOINFORMATIVA: CALIDAD Y
ALINIAMIENTO DE SECUENCIAS DE ADN Y
GENERACIÓN DE ARBOL FILOGENETICO EN BASE AL
GEN NIF H (FIJACIÓN BIOLOGICA DE NITROGENO)
DOCENTE:
Dr. SOTO GONZALES HEBERT HERNAN
CURSO:
BIOTECNOLOGIA
ELABORADO POR:
TICONA MIRANDA, YESSICA KAREN
CLAUDIA YANETH, SANTACRUZ HUILLCA
SEMESTRE
VII
MOQUEGUA – PERÚ
DICIEMBRE – 2020
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
2
INDICE
1. INTRODUCCIÓN..............................................................................................................5
2. OBJETIVOS.......................................................................................................................6
2.1 OBJETIVOS GENERAL ...............................................................................................6
2.2 OBJETIVO ESPECIFICOS............................................................................................6
2.3 MATERIALES...............................................................................................................6
3. FUNDAMENTOS TEORICOS..........................................................................................6
3.1 ESTRUCTURA DE LOS ÁCIDOS NUCLEICOS.........................................................6
3.2 ALINEAMIENTO DE SECEUNCIAS DE ADN...........................................................7
3.3 LA BIOINFORMÁTICA ...............................................................................................7
3.4 PROGRAMA BIOEDIT.................................................................................................8
3.5 HERRAMIENTA BLAST..............................................................................................8
3.6 NCBI ..............................................................................................................................8
3.7 MEGA-X........................................................................................................................9
4. METODOLOGIA...............................................................................................................9
4.1 USO DE PROGRAMA BioEdit PARA LA CLASIFICACIÓN DE CALIDAD EN
SECUENCIAS DE ADN ...................................................................................................................9
4.2 PROCEDIMIENTO PARA OBTENER FORMATO FASTA
DE SECUENCIAS DE ADN.....................................................................11
4.3 DETERMINACION DE CALIDAD DE SECUENCIAS DE ADN .............................14
4.4 USO DE HERRAMIENTA BLAST.............................................................................17
4.5 ALINEAMIENTO DE 11 SECUENCIAS DE ADN CON GEN NIFH .......................20
4.6 USO DE DATABANK NCBI ......................................................................................22
5. RESULTADOS Y DISCUSION ......................................................................................33
5.1 ÁRBOL FILOGENÉTICO...........................................................................................33
5.2 DETERMINACIÓN Y CLASIFICACIÓN DE SECUENCIAS DE ADN ...................35
5.3 CLASIFICACION DE SECUENCIAS DE ADN EN EL PROGRAMA BioEdit .......38
5.4 CLASIFICACION E IDENTIFICACION DE SECUENCIAS DE ADN.....................44
6. CONCLUSIONES Y RECOMENDACIONES................................................................44
6.1 CONCLUSIONES........................................................................................................44
6.2 RECOMENDACIONES...............................................................................................45
7. Bibliografía.......................................................................................................................45
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
3
INDICE DE FIGURAS
Figura 1. Carpeta con archivos de secuencias de ADN ....................................................................... 9
Figura 2. Captura de página web del programa BioEdit.................................................................... 10
Figura 3. Uso de programa BioEdit................................................................................................... 10
Figura 4. Secuencia de AND "E09-5-09".......................................................................................... 11
Figura 5. Herramienta Export as Fasta .............................................................................................. 11
Figura 6. Secuencia de ADN en formato Fasta "E09-5-09" ............................................................. 12
Figura 7. Secuencias ADN en formato Fasta..................................................................................... 12
Figura 8. Uso de Bloc de Notas......................................................................................................... 13
Figura 9. E09-5-09............................................................................................................................ 14
Figura 10. E10_13_10....................................................................................................................... 14
Figura 11. F07_6H_11 ...................................................................................................................... 15
Figura 12. F09_6_11......................................................................................................................... 15
Figura 13. F10_14_12....................................................................................................................... 15
Figura 14. G07_7H_13...................................................................................................................... 15
Figura 15. G09_7_13 ........................................................................................................................ 16
Figura 16. G10_15_14 ...................................................................................................................... 16
Figura 17. H07_8H_15...................................................................................................................... 16
Figura 18. H09_8_15 ........................................................................................................................ 16
Figura 19. H10_16_16 ...................................................................................................................... 17
Figura 20. Página Web de herramienta BLAST ............................................................................... 17
Figura 21. Ingreso de números de secuencia de ADN en BLAST.................................................... 18
Figura 22. Uso de BLAST................................................................................................................. 18
Figura 23. Serie de datos proporcionada por el uso de BLAST......................................................... 19
Figura 24. Selección del microorganismo con mayor porcentaje de identidad.................................. 19
Figura 25. Identidad de microorganismos ......................................................................................... 20
Figura 26. Programa MEGA-X......................................................................................................... 20
Figura 27. Herramienta de MEGA-X " Query Data banks" .............................................................. 21
Figura 28. Databank NCBI................................................................................................................ 22
Figura 29. Busqueda de gen NIFH.................................................................................................... 22
Figura 30. Lista de microorganismos con gen NIFH......................................................................... 23
Figura 31. Herramienta Add to Alignment........................................................................................ 23
Figura 32. Uso de secuencia de ADN con gen NIFH ........................................................................ 24
Figura 33. Uso de 15 secuencias de ADN con gen NIFH.................................................................. 24
Figura 34. Alineamiento de secuencias con herramienta Align DNA en programa MEGA - X........ 25
Figura 35. Alineamiento en proceso.................................................................................................. 25
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
4
Figura 36. Secuencias de ADN alineadas......................................................................................... 26
Figura 37. Eliminación de espacios sin alineamiento ........................................................................ 27
Figura 38. Alineamiento de secuencias de ADN con gen NIFH culminada ...................................... 28
Figura 39. Error de alineamiento de secuencias de ADN .................................................................. 28
Figura 40. Creación de archivo del alineamiento realizado anteriormente con la herramienta “Save the
alignment to a MEGA session file”............................................................................................................. 29
Figura 41. Exportacion de alineamineto finalizado a formato MEGA .............................................. 29
Figura 42. Creación de archivo "ARBOL-G1".................................................................................. 30
Figura 43. Visualización de archivos en formato MEGA.................................................................. 31
Figura 44. Creación de filogenético .................................................................................................. 31
Figura 45. Actualización de campos de editor para la posterior creación de árbol filogenético ........ 32
Figura 46. Árbol filogenético ............................................................................................................ 32
Figura 47. Escala Evolutiva de especies con gen NIFH .................................................................... 34
Figura 48. E09-5-09.......................................................................................................................... 35
Figura 49. E10_13_10....................................................................................................................... 35
Figura 50. F07_6H_11 ...................................................................................................................... 36
Figura 51. F09_6_11......................................................................................................................... 36
Figura 52. F10_14_12....................................................................................................................... 36
Figura 53. G07_7H_13...................................................................................................................... 36
Figura 54. G09_7_13 ........................................................................................................................ 37
Figura 55. G10_15_14 ...................................................................................................................... 37
Figura 56. H07_8H_15...................................................................................................................... 37
Figura 57. H09_8_15 ........................................................................................................................ 37
Figura 58. H10_16_16 ...................................................................................................................... 38
Figura 59. MUESTRA E09_5_09..................................................................................................... 38
Figura 60. MUESTRA E10_13_10 ................................................................................................... 39
Figura 61. MUESTRA F07_6H_11 .................................................................................................. 39
Figura 62. MUESTRA F09_6_11 ..................................................................................................... 40
Figura 63. MUESTRA F10_14_12 ................................................................................................... 40
Figura 64. MUESTRA G07_7H_13.................................................................................................. 41
Figura 65. MUESTRA G09_7_13..................................................................................................... 41
Figura 66. MUESTRA G10_15_14................................................................................................... 42
Figura 67. MUESTRA H07_8H_15.................................................................................................. 42
Figura 68. H07_8H_15...................................................................................................................... 43
Figura 69. MUESTRA H09_8_15..................................................................................................... 43
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
5
1. INTRODUCCIÓN
Los sistemas de clasificación más modernos se basan en las relaciones evolutivas entre
organismos, esto es, en su filogenia. Los sistemas de clasificación basados en la filogenia
organizan las especies u otros grupos de manera que reflejen nuestra comprensión de su
proceso evolutivo a partir de sus ancestros comunes. (de Necochea Campion & Canul Tec,
2004)
La identificación de los genes hasta la obtención de los tratamientos efectivos, es largo
y complejo (Cañedo Andalia & Arencibia Jorge, 2004) por ende la secuenciación
determinación del orden en el que se disponen las bases que forman una molécula de DNA-
del genoma humano ha originado cantidades enormes de información que debe procesarse
para poderse utilizar convenientemente. Tal importancia de la genómica origina que la
bioinformática, considerada como la aplicación de informática en el procesamiento de la
información genética tienen una función primordial la fusión de las técnicas computacionales
con el entendimiento y apreciación de datos biológicos, el almacenamiento, recuperación,
manipulación y correlación de datos procedentes de distintas fuentes. (Cañedo Andalia &
Arencibia Jorge, 2004)
Con el objetivo de realizar el alineamiento de 15 secuencias de ADN con características
en común de contar con el gen NIFH y creación de su árbol filogenético.
En el presente informe, diseñamos la metodología para poder analizar, describir y
clasificar en calidad genómica de secuencias de ADN así mismo analizaremos el proceso
evolutivo en estos microorganismos en base a su árbol filogenético basado en la comparación
y alineamiento de secuencias de los genes NIFH con ayuda de herramientas propio de
programas aplicativos en bioinformática.
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
6
2. OBJETIVOS
2.1 OBJETIVOS GENERAL
 Realizar el alineamiento de la secuencia del gen NIFH
2.2 OBJETIVO ESPECIFICOS
 Identificar la calidad de las secuencias AND
 Realizar el árbol filogenético
2.3 MATERIALES
 Laptop
 Internet
 Programa BioEdit
 Programa MEGA-X
 Herramienta BLAST
 NCBI
3. FUNDAMENTOS TEORICOS
3.1 ESTRUCTURA DE LOS ÁCIDOS NUCLEICOS.
El ADN es una doble hélice. Cada una de las hélices es un polímero integrado por millones de
nucleótidos que son los monómeros del polímero. Cada nucleótido está formado por una
desoxirribosa, una base púrica o pirimídica y un grupo fosfato. Las dos cadenas de ADN son
antiparalelas y se unen entre sí a través de puentes de hidrógeno que se forman entre las bases
complementarias (A·T y G·C) de las dos hebras del ADN. De esta manera, se obtiene una estructura
tipo doble hélice, donde las bases de los nucleótidos se encuentran orientadas hacia el interior,
mientras que los grupos fosfato y las desoxirribosas lo hacen hacia el exterior, formando los
esqueletos fosfodiéster de cada hélice. Los pares de nucleótidos se encuentran separados entre sí por
3.4 Å, cada diez pares de nucleótidos (34 Å) se alcanza una vuelta de la hélice. La diferencia
fundamental entre todas las moléculas de ADN que forman el material genético de los seres vivos es
la secuencia de los millones de estos cuatro tipos de nucleótidos con sus bases A, T, G y C en cada
molécula de ADN. (de Necochea Campion & Canul Tec, 2004)
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
7
3.2 ALINEAMIENTO DE SECEUNCIAS DE ADN
La comparación de secuencias biológicas (ADN, ARN o proteínas) juega un papel
fundamental en la investigación genética, tanto a nivel teórico para el análisis evolutivo de las
especies mediante árboles filogenéticos como para la comprensión y tratamiento de enfermedades.
Las secuencias de ADN y proteína definen la función de las proteínas en los seres vivos.
Cuando más similares sean dos secuencias más similares tenderán a ser las funciones de las proteínas
codificadas por ellas.
Las secuencias de un mismo gen en un conjunto de especies serán más distintas cuanto más
alejadas filogenéticamente estén las especies comparadas. Normalmente dos secuencias tienen una
alta similitud porque son homólogas, es decir comparten un ancestro común.
Dependiendo del propósito del estudio, lo siguiente es generar hipótesis de homología de las
bases al comparar y alinear las secuencias entre los organismos secuenciados. En un proceso de
alineación de secuencias, el mecanismo básico es simplemente colocar en la misma posición a todas
las bases. Para esto se utilizan programas de cómputo como CLUSTAL X o en este caso MEGA-X
que son los más usados. Esta herramienta se incluye en los diversos programas de edición de
secuencias como BioEdit. ( Márquez Valdelamar, Serrato Díaz , & Cerritos Flores)
3.3 LA BIOINFORMÁTICA
Es una disciplina que se encuentra en la intersección entre las ciencias de la vida y de la
información. Proporciona herramientas y recursos para favorecer la investigación biomédica. Trata
de desarrollar sistemas que sirvan para entender el flujo de información desde los genes a las
estructuras moleculares, su función bioquímica, conducta biológica y, finalmente, su influencia en
las enfermedades y la salud.
La bioinformática es una nueva disciplina dentro de la biología, donde las herramientas de la
computación tienen una función primordial. Si bien algunos restringen el rango de estudio de la
bioinformática al manejo y análisis de bases de datos biológicas -principalmente de secuencias-,
podría atribuírsele un sentido más amplio, como la fusión de las técnicas computacionales con el
entendimiento y apreciación de datos biológicos, el almacenamiento, recuperación, manipulación y
correlación de datos procedentes de distintas fuentes.
Una definición más general, la ubica como el estudio de la información biológica a partir de
la teoría de la información, la computación y las matemáticas. El reto más importante al que se
enfrenta esta ciencia es responder a la avalancha de datos que provienen del proyecto "Genoma
humano" y de la genómica. (Cañedo Andalia & Arencibia Jorge, 2004)
La bioinformática comprende tres subespecialidades:
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
8
 Bioinformática propiamente dicha, que abarca la investigación y desarrollo de la
infraestructura y de los sistemas de información y comunicación que requiere la biología
moderna -redes y bases de datos para el genoma, estaciones de trabajo para procesamiento
de imágenes, etcétera.
 Biología Computacional, que comprende la computación aplicada a la comprensión de
las cuestiones biológicas básicas, a partir de la modelación y simulación -sistemas de vida
artificial, algoritmos genéticos, redes de neuronas artificiales.
 Biocomputación, que incluye el desarrollo y utilización de sistemas computacionales
basados en modelos y materiales biológicos -biochips, biosensores, computación basada
en ADN, entre otros. Las computadoras basadas en DNA se están empleando para la
secuenciación masiva y el pesquisaje de diversas enfermedades, a partir de la explotación
del procesamiento paralelo implícito. (Cañedo Andalia & Arencibia Jorge, 2004)
3.4 PROGRAMA BIOEDIT
BioEdit es un programa gratuito para edición de alineamientos y análisis de secuencias que
funciona únicamente sobre ambiente MS/Windows. Es, sin lugar a duda, uno de los programas más
conocidos para edición de secuencias para dicho sistema operativo.
BioEdit es un editor de alineamiento de secuencias, sumamente amigable con el usuario. Con
este programa, se realizaron tres pasos importantes: reverso complementario, algoritmo Smith-
Waterman y algoritmo Needleman-Wunsch.
Con el programa BioEdit se abren las secuencias recibidas, que deben estar en formato
FASTA. El programa permite abrir los cromatogramas correspondientes a cada secuencia para su
edición y corrección de posibles errores cometidos en la lectura.
3.5 HERRAMIENTA BLAST
BLAST es el acrónimo de Basic Local Alignment Search Tool. Fue desarrollado por Altschul
en 1990 y es el algoritmo más empleado por el NCBI. La principal característica del BLAST es su
velocidad, pudiendo tomar pocos minutos cualquier búsqueda en la totalidad de la base de datos. De
hecho, los resultados se presentan en pantalla inmediatamente después de calculados. El BLAST
puede hacer búsquedas en una base de datos no redundante (nr) la cual tiene los registros no
redundantes entre las dos bases de datos principales a nivel mundial: GenBank en USA y EMBL
(European Molecular Biology Laboratories) en Europa.
3.6 NCBI
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
9
Según la definición del Centro Nacional para la Información Biotecnológica "National Center
for Biotechnology Information" -NCBI por sus siglas en inglés: la Bioinformática es un campo de la
ciencia en el que confluyen varias disciplinas como son: la biología, la computación y las tecnologías
de la información. Su fin último es facilitar el descubrimiento de nuevos conocimientos y el
desarrollo de perspectivas globales a partir de las cuales puedan discernirse principios unificadores
en el campo de la biología. (Cañedo Andalia & Arencibia Jorge, 2004)
3.7 MEGA-X
El Análisis Genético Evolutivo Molecular (MEGA) es un software de computadora para
realizar análisis estadísticos de la evolución molecular y para construir árboles filogenéticos, incluye
muchos métodos y herramientas sofisticados para filogenómica y filomedicina.
4. METODOLOGIA
4.1 USO DE PROGRAMA BioEdit PARA LA CLASIFICACIÓN DE CALIDAD EN
SECUENCIAS DE ADN
PASO 1: Lo primero a realizar será de los cuatro archivos proporcionados, escoger uno de ellos
para poder identificar la calidad de las secuencias, en este caso escogeremos el archivo G1 y lo
guardaremos en una carpeta la cual la llamaremos “PRACTICA BIOINFORMATICA”
Figura 1. Carpeta con archivos de secuencias de ADN
Fuente: Elaboración propia
PASO 2: Antes de abrir la carpeta con el archivo guardado, instalaremos en nuestro equipo
el programa BioEdit, este programa nos ayudará a alinear las secuencias de ADN
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
10
Fuente: Elaboración propia
PASO 3: Luego de haber instalado el programa BioEdit, abriremos nuestra carpeta
“PRACTICA_BIOINFORMATICA” y abriremos nuestro archivo G1.
Figura 3. Uso de programa BioEdit
Fuente: Elaboración propia
Figura 2. Captura de página web del programa BioEdit
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
11
PASO 4: Luego de abrir el archivo, seleccionaremos el primero “E09_5_09.ab1” y lo
abriremos con el programa BioEdit, solo tendremos que hacer doble clic en él y
automáticamente nos llevara al programa con la secuencia ya abierta.
Fuente: Elaboración propia
NOTA:
Una de las maneras de saber si las secuencias son de calidad buena o mala, debemos fijarnos en los
picos (cromatogramas), si los picos son altos quiere decir que la secuencia es de calidad BUENA,
pero si son picos bajos quiere decir que es de calidad MALA.
Ora manera de saber si las secuencias de ADN son de calidad buena o mala es exportando los datos.
4.2 PROCEDIMIENTO PARA OBTENER FORMATO FASTA DE SECUENCIAS DE ADN
PASO 5: Una vez abierto la secuencia, lo guardaremos seleccionando FILE, desplegamos y
seleccionaremos “EXPORT AS FASTA”
Fuente: Elaboración propia
Figura 4. Secuencia de AND "E09-5-09"
Figura 5. Herramienta Export as Fasta
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
12
PASO 6: Guardamos la secuencia en la carpeta creada “PRACTICA_BIOINFORMATICA” y
colocamos el nombre de la secuencia “E09_5_09”.
Fuente: Elaboración propia
PASO 7: Procedemos a cambiar a formato fasta las demás secuencias.
Fuente: Elaboración propia
Figura 6. Secuencia de ADN en formato Fasta "E09-5-09"
Figura 7. Secuencias ADN en formato Fasta
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
13
PASO 8: Una vez guardado todas las secuencias, abriremos cada una de ellas con el bloc de notas
Fuente: Elaboración propia
Figura 8. Uso de Bloc de Notas
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
14
4.3 DETERMINACION DE CALIDAD DE SECUENCIAS DE ADN
Como ya hemos mencionado antes, una de las maneras para determinar si la calidad de la
secuencia es buena o mala es observando la cantidad de la letra “N” que se muestra en formato fasta
Como podemos observar en la primera secuencia, no tenemos una gran cantidad de “N” por lo
que nuestra secuencia es de calidad BUENA.
Figura 9. E09-5-09
CALIDAD: BUENA
CA
Figura 10. E10_13_10
CALIDAD: BUENA
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
15
Figura 11. F10_14_12
CALIDAD: MALA
Figura 12. G07_7H_13
CALIDAD: BUENA
Figura 13. F07_6H_11
CALIDAD: BUENA
Figura 14. F09_6_11
CALIDAD: BUENA
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
16
Figura 15. G09_7_13
CALIDAD: BUENA
Figura 16. G10_15_14
CALIDAD: MALA
Figura 17. H07_8H_15
CALIDAD: MALA
Figura 18. H09_8_15
CALIDAD: MALA
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
17
4.4 USO DE HERRAMIENTA BLAST
PASO 9: Una vez ya identificada la calidad de las secuencias, ahora nos toca identificar que
microorganismo tiene cada secuencia, esto lo haremos con la ayuda de la herramienta proporcionada
por el internet llamado “BLAST”.
(link de la herramienta BLAST) https://blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE_TYPE=BlastSearch
Fuente: Elaboración propia
Figura 19. H10_16_16
CALIDAD: BUENA
Figura 20. Página Web de herramienta BLAST
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
18
PASO 10: Esta herramienta nos ayudara a identificar que microorganismo es para cada secuencia,
pero primero seleccionamos las 5 primeras líneas de cada secuencia del bloc de notas y lo llevaremos a la
herramienta BLAST
Fuente: Elaboración propia
PASO 11: Luego iremos a la parte inferior de la herramienta y haremos clic en BLAST
Fuente: Elaboración propia
Figura 21. Ingreso de números de secuencia de ADN en BLAST.
Figura 22. Uso de BLAST
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
19
PASO 12: Esperamos unos segundos y nos aparecerá un cuadro con una serie de datos.
Fuente: Elaboración propia
NOTA:
Como podemos observar nos dan distintos microorganismos o bacterias, ahora para poder saber
que bacteria es de nuestra muestra, nos enfocamos en el PORCENTAJE DE IDENTIDAD, el mayor
porcentaje de identidad de la muestra será nuestro microorganismo o bacteria.
PASO 13: En este caso nuestro microorganismo de nuestra muestra de mayor porcentaje de identidad
es el Klebsiella pneumoniae
Fuente: Elaboración propia
Figura 23. Serie de datos proporcionada por el uso de BLAST
Figura 24. Selección del microorganismo con mayor porcentaje de identidad
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
20
PASO 14: Haremos el mismo procedimiento con las demás muestras y todos los datos
obtenidos a partir de la calidad de la muestra hasta el reconocimiento de nuestros
microorganismos lo insertaremos en un cuadro de Excel:
Fuente: Elaboración propia
4.5 ALINEAMIENTO DE 11 SECUENCIAS DE ADN CON GEN NIFH
PASO 15: Luego de haber previamente instalado el programa MEGA-X, abriremos el
programa para empezar a alinear nuestros microorganismos.
Figura 25. Identidad de microorganismos
Figura 26. Programa MEGA-X
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
21
Fuente: Elaboración propia
PASO 16: Una vez abierto el programa nos dirigimos a la opción ALIGN, se despliega la
ventana y nos dirigimos a la opción “Query Databanks” y hacemos clic en ella.
Fuente: Elaboración propia
Figura 27. Herramienta de MEGA-X " Query Data banks"
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
22
4.6 USO DE DATABANK NCBI
PASO 17: Una vez hecho esto, se abrirá una nueva ventana la cual es la página del NCBI donde
nos va a proporcionar toda la información de bioinformática de genes y proteínas.
Fuente: Elaboración propia
PASO 18: Empezaremos buscando las secuencias de los microorganismos, entonces para buscar
empezamos poniendo el nombre del microorganismo y la palabra “NIFH” lo cual el gen NIFH
es la responsable de la fijación del nitrógeno.
Fuente: Elaboración propia
Figura 28. Databank NCBI
Figura 29. Busqueda de gen NIFH
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
23
PASO 19: Buscamos y nos aparecerá una lista de bacterias y microrganismos, aquí debemos
tener en cuenta que solo tenemos que añadir las muestras que tengan el nombre de “NIFH” luego
iremos añadiendo y haciendo clic en “Add to Alignment”.
Fuente: Elaboración propia
PASO 20: Una vez añadido a la herramienta “Add to Alignment”, nos aparecerá otra ventana, tener
en cuenta que debe estar seleccionado el NIFH y le daremos a OK, luego nos aparecerá otra ventana y
haremos lo mismo.
Fuente: Elaboración propia
Figura 30. Lista de microorganismos con gen NIFH
Figura 31. Herramienta Add to Alignment
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
24
PASO 21: Una vez hecho esto, nos aparecerá la ventana de alineamiento con la secuencia del
microorganismo añadido.
Fuente:
Elaboración propia
PASO 22: Procedemos a realizar mismo procedimiento con los demás microorganismos hasta obtener
un total de 15 secuencias de microorganismos fijadores de nitrógeno.
Fuente:
Elaboración propia
Figura 32. Uso de secuencia de ADN con gen NIFH
Figura 33. Uso de 15 secuencias de ADN con gen NIFH
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
25
PASO 23: Una vez obtenido nuestras secuencias de microorganismos, utilizaremos la herramienta
“Align using the MUSCLE algorithm” Haremos clic en ella y nos aparecerá dos opciones,
elegiremos la opción “Align DNA”.
Fuente: Elaboración propia
PASO 24: Una vez hecho esto, nos aparecerá una ventana pequeña y le daremos a OK, y
automáticamente se seleccionará todas las secuencias de los microorganismos y nos
aparecerá otra ventana la cual también le daremos a OK.
Figura 34. Alineamiento de secuencias con herramienta Align DNA en programa MEGA - X
Figura 35. Alineamiento en proceso
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
26
Fuente: Elaboración propia
PASO 25: Como podemos observar, las secuencias ya han sido alineadas
Fuente: Elaboración propia
Figura 36. Secuencias de ADN alineadas
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
27
TENER EN CUENTA QUE LOS ESPACIOS EN BLANCO SON SECUENCIAS QUE NO
NECESITAMOS, ASI QUE HAREMOS LO SIGUIENTE:
PASO 26: Utilizaremos el mouse e iremos arrastrando con el lado izquierdo del mouse,
seleccionando los espacios vacíos y por ultimo utilizaremos la herramienta “Delete
selected block" y se borrarán, haremos el mismo procedimiento para los demás espacios vacíos, hasta
que solo quede las secuencias alineadas.
Fuente: Elaboración propia
Figura 37. Eliminación de espacios sin alineamiento
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
28
Fuente: Elaboración propia
COMO PODEMOS OBSERVAR PODEMOS OBVIAR ALGUNOS ESPACIOS VACIOS,
PERO SOLO LOS ESPACIOS QUE TIENEN UNA LINEA VACIA
Fuente: Elaboración propia
PASO 27: Una vez obtenido nuestras secuencias alineadas, procedemos a guardarlo con la
herramienta
“Save the alignment to a MEGA session file” y lo guardaremos a nuestra carpeta llamada
“PRACTICA_BIOINFORMATICA” con el nombre de “Alineamiento de ADN (gen NIFH)” y tener
en cuenta que el formato debe estar en “Aln Session”
Figura 38. Alineamiento de secuencias de ADN con gen NIFH culminada
Figura 39. Error de alineamiento de secuencias de ADN
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
29
Fuente: Elaboración propia
PASO 28: Luego nos dirigimos a “DATA”, y nos iremos a la opción “Export Alignment y
nos dará tres opciones, elegiremos la opción “MEGA Format” y lo guardamos con el mismo nombre
solo que este estará con otro formato en “MEGA Files”
Figura 40. Creación de archivo del alineamiento realizado anteriormente con la herramienta
“Save the alignment to a MEGA session file”
Figura 41. Exportacion de alineamineto finalizado a formato MEGA
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
30
Fuente: Elaboración propia
PASO 29: Luego nos aparecerá otra pequeña ventana y lo guardaremos con el nombre de
“ARBOL_G1” y le daremos OK a la siguiente ventana que también nos aparecerá.
Fuente: Elaboración propia
Figura 42. Creación de archivo "ARBOL-G1"
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
31
PASO 30: Finalmente iremos al programa mega y nos iremos a la opción “File” y
seleccionaremos la opción “Open a File/Session” y abriremos nuestro archivo en formato “MEGA
files”
Fuente: Elaboración propia
PASO 30: Luego nos iremos a la opción “PHYLOGENY” para crear nuestro árbol filogenético
y nos iremos a la opción “Construct/Test UPGMA Tree”
Fuente: Elaboración propia
Figura 43. Visualización de archivos en formato MEGA
Figura 44. Creación de filogenético
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
32
PASO 31: Nos aparecerá una ventana la cual en este caso donde dice “None” lo cambiaremos
a “Bootstrap method” y también cambiaremos el 500 a “1000”, y le daremos OK
Fuente: Elaboración propia
PASO 32: Esperamos unos segundos y obtendremos nuestro árbol filogenético.
Fuente: Elaboración propia
Figura 45. Actualización de campos de editor para la posterior creación de
árbol filogenético
Figura 46. Árbol filogenético
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
33
5. RESULTADOS Y DISCUSION
5.1 ÁRBOL FILOGENÉTICO
ÁRBOL FILOGENÉTICO
FIFILOGENÉTICO
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
34
Analizando nuestro árbol filogenético podemos observar que la bacteria Klebsiella pneumoniae
isolate HUB_IV con la otra especie Klebsiella pneumoniae strain NG14 son especies próximas al 63%
ya que están en la misma rama, en comparación a las especies de Enterobacter sp. Strain IDRT-2 y
Enterobacter sp strain RPDRT-2 que son distintas porque están en otra rama.
También podemos observar que la especie Klebsiella sp., con la especie Enterobacter sp. Y4
son especies distintas.
También tenemos la escala evolutiva, en donde indica la evolución de las especies a lo largo de
la evolución, cuanto más próximo sea a 0 las especies son más próximas o iguales.
Fuente: Elaboración propia
Figura 47. Escala Evolutiva de especies con gen NIFH
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
35
5.2 DETERMINACIÓN Y CLASIFICACIÓN DE SECUENCIAS DE ADN
Las secuencias en formato fasta fueron debidamente clasificadas según la calidad que presentaban
tomando en cuenta su imagen cromatografía y formatos fastas ya presentado en el punto 4.3 del presente
informe a continuación se realiza una segunda muestra de cada una de las 11 secuencias clasificadas en
formato fasta .
CALIDAD DE LAS SECUENCIAS DE ADN
Figura 48. E09-5-09
CALIDAD: BUENA
CA
Figura 49. E10_13_10
CALIDAD: BUENA
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
36
Figura 50. F07_6H_11
CALIDAD: BUENA
Figura 51. F09_6_11
CALIDAD: BUENA
Figura 52. F10_14_12
CALIDAD: MALA
Figura 53. G07_7H_13
CALIDAD: BUENA
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
37
Figura 54. G09_7_13
CALIDAD: BUENA
Figura 55. G10_15_14
CALIDAD: MALA
Figura 56. H07_8H_15
CALIDAD: MALA
Figura 57. H09_8_15
CALIDAD: MALA
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
38
5.3 CLASIFICACION DE SECUENCIAS DE ADN EN EL PROGRAMA BioEdit
Fuente: Elaboración propia
Figura 59. MUESTRA E09_5_09
Figura 58. H10_16_16
CALIDAD: BUENA
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
39
Fuente: Elaboración propia
Fuente: Elaboración propia
Figura 60. MUESTRA E10_13_10
Figura 61. MUESTRA F07_6H_11
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
40
Fuente: Elaboración propia
Fuente: Elaboración propia
Figura 62. MUESTRA F09_6_11
Figura 63. MUESTRA F10_14_12
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
41
Fuente: Elaboración propia
Fuente: Elaboración propia
Figura 64. MUESTRA G07_7H_13
Figura 65. MUESTRA G09_7_13
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
42
Fuente: Elaboración propia
Fuente: Elaboración propia
Figura 66. MUESTRA G10_15_14
Figura 67. MUESTRA H07_8H_15
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
43
Fuente: Elaboración propia
Fuente: Elaboración propia
Figura 69. MUESTRA H09_8_15
Figura 68. H07_8H_15
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
44
5.4 CLASIFICACION E IDENTIFICACION DE SECUENCIAS DE ADN
TABLA: CALIDAD DE MUESTRAS DE SECUENCIAS DE ADN
6. CONCLUSIONES Y RECOMENDACIONES
6.1 CONCLUSIONES
Se evaluó la calidad de las secuencias de ADN de cada muestra con la ayuda del programa BioEdit,
ya que este programa nos ayuda a visualizar los cromatogramas de la secuencia, y se pudo determinar que de
las 11 muestras evaluadas solo 4 son de mala calidad y los restantes son de buena calidad.
N° MUESTRAS CALIDAD
% DE
IDENTIDAD
ORGANISMO
1 E09_5_09 BUENA 89.18% Klebsiella pneumoniae
2 E10_13_10 BUENA No se encontro ninguna similitud significativa
3 F07_6H_11 BUENA 96.64% Klebsiella pneumoniae
4 F09_6_11 BUENA 89.27% Enterobacter asburiae
5 F10_14_12 MALA No se encontro ninguna similitud significativa
6 G07_7H_13 BUENA 95.42% Klebsiella sp.
7 G09_7_13 BUENA No se encontro ninguna similitud significativa
8 G10_15_14 MALA 97.90% Enterobacter sp.
9 H07_8H_15 MALA No se encontro ninguna similitud significativa
10 H09_8_15 MALA No se encontro ninguna similitud significativa
11 H10_16_16 BUENA 90.18% Enterobacter sp.
ESCUELA PROFESIONAL
INGENIERÍA AMBIENTAL
45
6.2 RECOMENDACIONES
 Se recomienda primo instalar los programas BioEdit y Mega-X ya que si no están instalados al
momento de saber si son de calidad buena o mala el archivo no se podrá abrir.
 También se recomienda que al momento de exportar en un bloc de notas las secuencias del
programa BioEdit para la determinación de la calidad de las muestras es fijarnos la cantidad de
“N” que hay en la secuencia ya que si hay muchas “N” indica que es de calidad mala.
 También al momento de hacer el alineamiento en el programa MEGA-X debemos tener en
cuenta que no debemos eliminar todos los posibles espacios vacíos que hay y alinear lo más que
podamos.
7. Bibliografía
Márquez Valdelamar, L., Serrato Díaz , A., & Cerritos Flores, R. (s.f.). Secuenciación de fragmentos
de ADN. Herramientas moleculares aplicadas en ecología. Instituto de Biología, UNAM,
México.
Anicet R. , B. (2010). Biotecnología ambiental. Aplicaciones biotecnológicas en la mejora del medio
ambiente. Universidad de Barcelona.
Cañedo Andalia, R., & Arencibia Jorge, R. (2004). Bioinformática: en busca de los secretos
moleculares de la vida. Centro Nacional de Información de Ciencias Médicas, Ciudad de la
Habana, Cuba. Obtenido de http://bvs.sld.cu/revistas/aci/vol12_6_04/aci02604.htm
Castillo Rodriguez, F. (2005). Biotecnología Ambiental. Madrid , España.
de Necochea Campion, R., & Canul Tec, J. (2004). SECUENCIACIÓN DE ÁCIDOS NUCLEICOS.
Métodos fisicoquímicos en biotecnología. Instituto de Biotecnología - UNAM, Cuernavaca.
 https://medium.com/el-blog-de-melquiades/alineamientos-de-secuencias-de-adn-y-
proteinas-57fcdfbfcb25
 http://bioinf.ibun.unal.edu.co/documentos/Blast/blast.php

Más contenido relacionado

Similar a Imforme secuencia de adn

Manual de zonificacion_ecologica_de_espe
Manual de zonificacion_ecologica_de_espeManual de zonificacion_ecologica_de_espe
Manual de zonificacion_ecologica_de_espe
LenSJulca
 
Guía de poríferos y celentéreos
Guía  de  poríferos  y  celentéreosGuía  de  poríferos  y  celentéreos
Guía de poríferos y celentéreos
Giuliana Tinoco
 
08 01150 plan de marketing turistico de júzcar
08 01150 plan de marketing turistico de júzcar08 01150 plan de marketing turistico de júzcar
08 01150 plan de marketing turistico de júzcar
Quidamtur SLL
 
Tesissss satisfaccccion
Tesissss  satisfaccccionTesissss  satisfaccccion
Tesissss satisfaccccion
Javier German
 

Similar a Imforme secuencia de adn (20)

Tif producción
Tif producciónTif producción
Tif producción
 
proyecto de siembra de yuca (1).pdf
proyecto de siembra de yuca (1).pdfproyecto de siembra de yuca (1).pdf
proyecto de siembra de yuca (1).pdf
 
proyecto de siembra de yuca (1).pdf
proyecto de siembra de yuca (1).pdfproyecto de siembra de yuca (1).pdf
proyecto de siembra de yuca (1).pdf
 
Trabajo final
Trabajo finalTrabajo final
Trabajo final
 
Manual de zonificacion_ecologica_de_espe
Manual de zonificacion_ecologica_de_espeManual de zonificacion_ecologica_de_espe
Manual de zonificacion_ecologica_de_espe
 
Guía de poríferos y celentéreos
Guía  de  poríferos  y  celentéreosGuía  de  poríferos  y  celentéreos
Guía de poríferos y celentéreos
 
humedal el burro
humedal el burrohumedal el burro
humedal el burro
 
08 01150 plan de marketing turistico de júzcar
08 01150 plan de marketing turistico de júzcar08 01150 plan de marketing turistico de júzcar
08 01150 plan de marketing turistico de júzcar
 
Ingeniería Agronómica
Ingeniería AgronómicaIngeniería Agronómica
Ingeniería Agronómica
 
proyecto de inversion empanadas.pdf
proyecto de inversion empanadas.pdfproyecto de inversion empanadas.pdf
proyecto de inversion empanadas.pdf
 
Cuadernillo matemática ingreso 2014 UNER Paraná
Cuadernillo matemática ingreso 2014 UNER ParanáCuadernillo matemática ingreso 2014 UNER Paraná
Cuadernillo matemática ingreso 2014 UNER Paraná
 
Rendimiento de biomasa y contenido de lípidos de Tetraselmis suecica utilizan...
Rendimiento de biomasa y contenido de lípidos de Tetraselmis suecica utilizan...Rendimiento de biomasa y contenido de lípidos de Tetraselmis suecica utilizan...
Rendimiento de biomasa y contenido de lípidos de Tetraselmis suecica utilizan...
 
PLAN DE MANEJO DE RECURSO Suelo
PLAN DE MANEJO DE RECURSO Suelo PLAN DE MANEJO DE RECURSO Suelo
PLAN DE MANEJO DE RECURSO Suelo
 
Azucar organica
Azucar organicaAzucar organica
Azucar organica
 
Proyecto contaminacion ambiental
Proyecto contaminacion ambientalProyecto contaminacion ambiental
Proyecto contaminacion ambiental
 
PROYECTO.docx
PROYECTO.docxPROYECTO.docx
PROYECTO.docx
 
INFORME EQUIPOS DE LABORATORIO - PAYE ZEBALLOS FRESIA.pdf
INFORME EQUIPOS DE LABORATORIO - PAYE ZEBALLOS FRESIA.pdfINFORME EQUIPOS DE LABORATORIO - PAYE ZEBALLOS FRESIA.pdf
INFORME EQUIPOS DE LABORATORIO - PAYE ZEBALLOS FRESIA.pdf
 
Norma Aguacate Hass - ICONTEC
Norma Aguacate Hass - ICONTECNorma Aguacate Hass - ICONTEC
Norma Aguacate Hass - ICONTEC
 
Tesissss satisfaccccion
Tesissss  satisfaccccionTesissss  satisfaccccion
Tesissss satisfaccccion
 
Estudio de la accidentabilidad de las personas mayores fuera del hogar 2010
Estudio de la accidentabilidad de las personas mayores fuera del hogar 2010Estudio de la accidentabilidad de las personas mayores fuera del hogar 2010
Estudio de la accidentabilidad de las personas mayores fuera del hogar 2010
 

Más de YessicaTicona1 (6)

Art. 5 ticona miranda yessica k. toxicidad
Art. 5  ticona miranda yessica k. toxicidadArt. 5  ticona miranda yessica k. toxicidad
Art. 5 ticona miranda yessica k. toxicidad
 
Art. 5 ticona miranda yessica k. toxicidad
Art. 5  ticona miranda yessica k. toxicidadArt. 5  ticona miranda yessica k. toxicidad
Art. 5 ticona miranda yessica k. toxicidad
 
Mapa conceptual art. 22
Mapa conceptual art. 22Mapa conceptual art. 22
Mapa conceptual art. 22
 
Mapa conceptual biopesticidas
Mapa conceptual biopesticidasMapa conceptual biopesticidas
Mapa conceptual biopesticidas
 
Enzimas y sus aplicaciones biotecnologicas
Enzimas y sus aplicaciones biotecnologicasEnzimas y sus aplicaciones biotecnologicas
Enzimas y sus aplicaciones biotecnologicas
 
Metabolismos microbianos
Metabolismos microbianosMetabolismos microbianos
Metabolismos microbianos
 

Último (9)

345576088-Mapa-Conceptual-Mantenimiento-mecanica-industrial.pdf
345576088-Mapa-Conceptual-Mantenimiento-mecanica-industrial.pdf345576088-Mapa-Conceptual-Mantenimiento-mecanica-industrial.pdf
345576088-Mapa-Conceptual-Mantenimiento-mecanica-industrial.pdf
 
SENATI - Plantilla Power Point - horizontal.pptx
SENATI - Plantilla  Power Point - horizontal.pptxSENATI - Plantilla  Power Point - horizontal.pptx
SENATI - Plantilla Power Point - horizontal.pptx
 
sistema-electrico-carroceria del motor de un vehículo.pdf
sistema-electrico-carroceria del motor de un vehículo.pdfsistema-electrico-carroceria del motor de un vehículo.pdf
sistema-electrico-carroceria del motor de un vehículo.pdf
 
3 Curso_Introduccion_a_la_Electroneumatica Movimientos y estados de conmutaci...
3 Curso_Introduccion_a_la_Electroneumatica Movimientos y estados de conmutaci...3 Curso_Introduccion_a_la_Electroneumatica Movimientos y estados de conmutaci...
3 Curso_Introduccion_a_la_Electroneumatica Movimientos y estados de conmutaci...
 
propoketapropoketapropoketapropoketa.pptx
propoketapropoketapropoketapropoketa.pptxpropoketapropoketapropoketapropoketa.pptx
propoketapropoketapropoketapropoketa.pptx
 
Esquema audio Nissan Almera N16, parte electrica y codigos electricos
Esquema audio Nissan Almera N16, parte electrica y codigos electricosEsquema audio Nissan Almera N16, parte electrica y codigos electricos
Esquema audio Nissan Almera N16, parte electrica y codigos electricos
 
tipos de suspension automotriz -rea marlon.pdf
tipos de suspension automotriz -rea marlon.pdftipos de suspension automotriz -rea marlon.pdf
tipos de suspension automotriz -rea marlon.pdf
 
unidades de medida aplicadas en gastronomia.pdf
unidades de medida aplicadas en gastronomia.pdfunidades de medida aplicadas en gastronomia.pdf
unidades de medida aplicadas en gastronomia.pdf
 
Montero Sport Manual de Propietario.pdf.
Montero Sport Manual de Propietario.pdf.Montero Sport Manual de Propietario.pdf.
Montero Sport Manual de Propietario.pdf.
 

Imforme secuencia de adn

  • 1. “Año de la Universalización de la Salud” UNIVERSIDAD NACIONAL DE MOQUEGUA ESCUELA PROFESIONAL DE INGENIERIA AMBIENTAL PRACTICA DE BIOINFORMATIVA: CALIDAD Y ALINIAMIENTO DE SECUENCIAS DE ADN Y GENERACIÓN DE ARBOL FILOGENETICO EN BASE AL GEN NIF H (FIJACIÓN BIOLOGICA DE NITROGENO) DOCENTE: Dr. SOTO GONZALES HEBERT HERNAN CURSO: BIOTECNOLOGIA ELABORADO POR: TICONA MIRANDA, YESSICA KAREN CLAUDIA YANETH, SANTACRUZ HUILLCA SEMESTRE VII MOQUEGUA – PERÚ DICIEMBRE – 2020
  • 2. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 2 INDICE 1. INTRODUCCIÓN..............................................................................................................5 2. OBJETIVOS.......................................................................................................................6 2.1 OBJETIVOS GENERAL ...............................................................................................6 2.2 OBJETIVO ESPECIFICOS............................................................................................6 2.3 MATERIALES...............................................................................................................6 3. FUNDAMENTOS TEORICOS..........................................................................................6 3.1 ESTRUCTURA DE LOS ÁCIDOS NUCLEICOS.........................................................6 3.2 ALINEAMIENTO DE SECEUNCIAS DE ADN...........................................................7 3.3 LA BIOINFORMÁTICA ...............................................................................................7 3.4 PROGRAMA BIOEDIT.................................................................................................8 3.5 HERRAMIENTA BLAST..............................................................................................8 3.6 NCBI ..............................................................................................................................8 3.7 MEGA-X........................................................................................................................9 4. METODOLOGIA...............................................................................................................9 4.1 USO DE PROGRAMA BioEdit PARA LA CLASIFICACIÓN DE CALIDAD EN SECUENCIAS DE ADN ...................................................................................................................9 4.2 PROCEDIMIENTO PARA OBTENER FORMATO FASTA DE SECUENCIAS DE ADN.....................................................................11 4.3 DETERMINACION DE CALIDAD DE SECUENCIAS DE ADN .............................14 4.4 USO DE HERRAMIENTA BLAST.............................................................................17 4.5 ALINEAMIENTO DE 11 SECUENCIAS DE ADN CON GEN NIFH .......................20 4.6 USO DE DATABANK NCBI ......................................................................................22 5. RESULTADOS Y DISCUSION ......................................................................................33 5.1 ÁRBOL FILOGENÉTICO...........................................................................................33 5.2 DETERMINACIÓN Y CLASIFICACIÓN DE SECUENCIAS DE ADN ...................35 5.3 CLASIFICACION DE SECUENCIAS DE ADN EN EL PROGRAMA BioEdit .......38 5.4 CLASIFICACION E IDENTIFICACION DE SECUENCIAS DE ADN.....................44 6. CONCLUSIONES Y RECOMENDACIONES................................................................44 6.1 CONCLUSIONES........................................................................................................44 6.2 RECOMENDACIONES...............................................................................................45 7. Bibliografía.......................................................................................................................45
  • 3. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 3 INDICE DE FIGURAS Figura 1. Carpeta con archivos de secuencias de ADN ....................................................................... 9 Figura 2. Captura de página web del programa BioEdit.................................................................... 10 Figura 3. Uso de programa BioEdit................................................................................................... 10 Figura 4. Secuencia de AND "E09-5-09".......................................................................................... 11 Figura 5. Herramienta Export as Fasta .............................................................................................. 11 Figura 6. Secuencia de ADN en formato Fasta "E09-5-09" ............................................................. 12 Figura 7. Secuencias ADN en formato Fasta..................................................................................... 12 Figura 8. Uso de Bloc de Notas......................................................................................................... 13 Figura 9. E09-5-09............................................................................................................................ 14 Figura 10. E10_13_10....................................................................................................................... 14 Figura 11. F07_6H_11 ...................................................................................................................... 15 Figura 12. F09_6_11......................................................................................................................... 15 Figura 13. F10_14_12....................................................................................................................... 15 Figura 14. G07_7H_13...................................................................................................................... 15 Figura 15. G09_7_13 ........................................................................................................................ 16 Figura 16. G10_15_14 ...................................................................................................................... 16 Figura 17. H07_8H_15...................................................................................................................... 16 Figura 18. H09_8_15 ........................................................................................................................ 16 Figura 19. H10_16_16 ...................................................................................................................... 17 Figura 20. Página Web de herramienta BLAST ............................................................................... 17 Figura 21. Ingreso de números de secuencia de ADN en BLAST.................................................... 18 Figura 22. Uso de BLAST................................................................................................................. 18 Figura 23. Serie de datos proporcionada por el uso de BLAST......................................................... 19 Figura 24. Selección del microorganismo con mayor porcentaje de identidad.................................. 19 Figura 25. Identidad de microorganismos ......................................................................................... 20 Figura 26. Programa MEGA-X......................................................................................................... 20 Figura 27. Herramienta de MEGA-X " Query Data banks" .............................................................. 21 Figura 28. Databank NCBI................................................................................................................ 22 Figura 29. Busqueda de gen NIFH.................................................................................................... 22 Figura 30. Lista de microorganismos con gen NIFH......................................................................... 23 Figura 31. Herramienta Add to Alignment........................................................................................ 23 Figura 32. Uso de secuencia de ADN con gen NIFH ........................................................................ 24 Figura 33. Uso de 15 secuencias de ADN con gen NIFH.................................................................. 24 Figura 34. Alineamiento de secuencias con herramienta Align DNA en programa MEGA - X........ 25 Figura 35. Alineamiento en proceso.................................................................................................. 25
  • 4. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 4 Figura 36. Secuencias de ADN alineadas......................................................................................... 26 Figura 37. Eliminación de espacios sin alineamiento ........................................................................ 27 Figura 38. Alineamiento de secuencias de ADN con gen NIFH culminada ...................................... 28 Figura 39. Error de alineamiento de secuencias de ADN .................................................................. 28 Figura 40. Creación de archivo del alineamiento realizado anteriormente con la herramienta “Save the alignment to a MEGA session file”............................................................................................................. 29 Figura 41. Exportacion de alineamineto finalizado a formato MEGA .............................................. 29 Figura 42. Creación de archivo "ARBOL-G1".................................................................................. 30 Figura 43. Visualización de archivos en formato MEGA.................................................................. 31 Figura 44. Creación de filogenético .................................................................................................. 31 Figura 45. Actualización de campos de editor para la posterior creación de árbol filogenético ........ 32 Figura 46. Árbol filogenético ............................................................................................................ 32 Figura 47. Escala Evolutiva de especies con gen NIFH .................................................................... 34 Figura 48. E09-5-09.......................................................................................................................... 35 Figura 49. E10_13_10....................................................................................................................... 35 Figura 50. F07_6H_11 ...................................................................................................................... 36 Figura 51. F09_6_11......................................................................................................................... 36 Figura 52. F10_14_12....................................................................................................................... 36 Figura 53. G07_7H_13...................................................................................................................... 36 Figura 54. G09_7_13 ........................................................................................................................ 37 Figura 55. G10_15_14 ...................................................................................................................... 37 Figura 56. H07_8H_15...................................................................................................................... 37 Figura 57. H09_8_15 ........................................................................................................................ 37 Figura 58. H10_16_16 ...................................................................................................................... 38 Figura 59. MUESTRA E09_5_09..................................................................................................... 38 Figura 60. MUESTRA E10_13_10 ................................................................................................... 39 Figura 61. MUESTRA F07_6H_11 .................................................................................................. 39 Figura 62. MUESTRA F09_6_11 ..................................................................................................... 40 Figura 63. MUESTRA F10_14_12 ................................................................................................... 40 Figura 64. MUESTRA G07_7H_13.................................................................................................. 41 Figura 65. MUESTRA G09_7_13..................................................................................................... 41 Figura 66. MUESTRA G10_15_14................................................................................................... 42 Figura 67. MUESTRA H07_8H_15.................................................................................................. 42 Figura 68. H07_8H_15...................................................................................................................... 43 Figura 69. MUESTRA H09_8_15..................................................................................................... 43
  • 5. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 5 1. INTRODUCCIÓN Los sistemas de clasificación más modernos se basan en las relaciones evolutivas entre organismos, esto es, en su filogenia. Los sistemas de clasificación basados en la filogenia organizan las especies u otros grupos de manera que reflejen nuestra comprensión de su proceso evolutivo a partir de sus ancestros comunes. (de Necochea Campion & Canul Tec, 2004) La identificación de los genes hasta la obtención de los tratamientos efectivos, es largo y complejo (Cañedo Andalia & Arencibia Jorge, 2004) por ende la secuenciación determinación del orden en el que se disponen las bases que forman una molécula de DNA- del genoma humano ha originado cantidades enormes de información que debe procesarse para poderse utilizar convenientemente. Tal importancia de la genómica origina que la bioinformática, considerada como la aplicación de informática en el procesamiento de la información genética tienen una función primordial la fusión de las técnicas computacionales con el entendimiento y apreciación de datos biológicos, el almacenamiento, recuperación, manipulación y correlación de datos procedentes de distintas fuentes. (Cañedo Andalia & Arencibia Jorge, 2004) Con el objetivo de realizar el alineamiento de 15 secuencias de ADN con características en común de contar con el gen NIFH y creación de su árbol filogenético. En el presente informe, diseñamos la metodología para poder analizar, describir y clasificar en calidad genómica de secuencias de ADN así mismo analizaremos el proceso evolutivo en estos microorganismos en base a su árbol filogenético basado en la comparación y alineamiento de secuencias de los genes NIFH con ayuda de herramientas propio de programas aplicativos en bioinformática.
  • 6. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 6 2. OBJETIVOS 2.1 OBJETIVOS GENERAL  Realizar el alineamiento de la secuencia del gen NIFH 2.2 OBJETIVO ESPECIFICOS  Identificar la calidad de las secuencias AND  Realizar el árbol filogenético 2.3 MATERIALES  Laptop  Internet  Programa BioEdit  Programa MEGA-X  Herramienta BLAST  NCBI 3. FUNDAMENTOS TEORICOS 3.1 ESTRUCTURA DE LOS ÁCIDOS NUCLEICOS. El ADN es una doble hélice. Cada una de las hélices es un polímero integrado por millones de nucleótidos que son los monómeros del polímero. Cada nucleótido está formado por una desoxirribosa, una base púrica o pirimídica y un grupo fosfato. Las dos cadenas de ADN son antiparalelas y se unen entre sí a través de puentes de hidrógeno que se forman entre las bases complementarias (A·T y G·C) de las dos hebras del ADN. De esta manera, se obtiene una estructura tipo doble hélice, donde las bases de los nucleótidos se encuentran orientadas hacia el interior, mientras que los grupos fosfato y las desoxirribosas lo hacen hacia el exterior, formando los esqueletos fosfodiéster de cada hélice. Los pares de nucleótidos se encuentran separados entre sí por 3.4 Å, cada diez pares de nucleótidos (34 Å) se alcanza una vuelta de la hélice. La diferencia fundamental entre todas las moléculas de ADN que forman el material genético de los seres vivos es la secuencia de los millones de estos cuatro tipos de nucleótidos con sus bases A, T, G y C en cada molécula de ADN. (de Necochea Campion & Canul Tec, 2004)
  • 7. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 7 3.2 ALINEAMIENTO DE SECEUNCIAS DE ADN La comparación de secuencias biológicas (ADN, ARN o proteínas) juega un papel fundamental en la investigación genética, tanto a nivel teórico para el análisis evolutivo de las especies mediante árboles filogenéticos como para la comprensión y tratamiento de enfermedades. Las secuencias de ADN y proteína definen la función de las proteínas en los seres vivos. Cuando más similares sean dos secuencias más similares tenderán a ser las funciones de las proteínas codificadas por ellas. Las secuencias de un mismo gen en un conjunto de especies serán más distintas cuanto más alejadas filogenéticamente estén las especies comparadas. Normalmente dos secuencias tienen una alta similitud porque son homólogas, es decir comparten un ancestro común. Dependiendo del propósito del estudio, lo siguiente es generar hipótesis de homología de las bases al comparar y alinear las secuencias entre los organismos secuenciados. En un proceso de alineación de secuencias, el mecanismo básico es simplemente colocar en la misma posición a todas las bases. Para esto se utilizan programas de cómputo como CLUSTAL X o en este caso MEGA-X que son los más usados. Esta herramienta se incluye en los diversos programas de edición de secuencias como BioEdit. ( Márquez Valdelamar, Serrato Díaz , & Cerritos Flores) 3.3 LA BIOINFORMÁTICA Es una disciplina que se encuentra en la intersección entre las ciencias de la vida y de la información. Proporciona herramientas y recursos para favorecer la investigación biomédica. Trata de desarrollar sistemas que sirvan para entender el flujo de información desde los genes a las estructuras moleculares, su función bioquímica, conducta biológica y, finalmente, su influencia en las enfermedades y la salud. La bioinformática es una nueva disciplina dentro de la biología, donde las herramientas de la computación tienen una función primordial. Si bien algunos restringen el rango de estudio de la bioinformática al manejo y análisis de bases de datos biológicas -principalmente de secuencias-, podría atribuírsele un sentido más amplio, como la fusión de las técnicas computacionales con el entendimiento y apreciación de datos biológicos, el almacenamiento, recuperación, manipulación y correlación de datos procedentes de distintas fuentes. Una definición más general, la ubica como el estudio de la información biológica a partir de la teoría de la información, la computación y las matemáticas. El reto más importante al que se enfrenta esta ciencia es responder a la avalancha de datos que provienen del proyecto "Genoma humano" y de la genómica. (Cañedo Andalia & Arencibia Jorge, 2004) La bioinformática comprende tres subespecialidades:
  • 8. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 8  Bioinformática propiamente dicha, que abarca la investigación y desarrollo de la infraestructura y de los sistemas de información y comunicación que requiere la biología moderna -redes y bases de datos para el genoma, estaciones de trabajo para procesamiento de imágenes, etcétera.  Biología Computacional, que comprende la computación aplicada a la comprensión de las cuestiones biológicas básicas, a partir de la modelación y simulación -sistemas de vida artificial, algoritmos genéticos, redes de neuronas artificiales.  Biocomputación, que incluye el desarrollo y utilización de sistemas computacionales basados en modelos y materiales biológicos -biochips, biosensores, computación basada en ADN, entre otros. Las computadoras basadas en DNA se están empleando para la secuenciación masiva y el pesquisaje de diversas enfermedades, a partir de la explotación del procesamiento paralelo implícito. (Cañedo Andalia & Arencibia Jorge, 2004) 3.4 PROGRAMA BIOEDIT BioEdit es un programa gratuito para edición de alineamientos y análisis de secuencias que funciona únicamente sobre ambiente MS/Windows. Es, sin lugar a duda, uno de los programas más conocidos para edición de secuencias para dicho sistema operativo. BioEdit es un editor de alineamiento de secuencias, sumamente amigable con el usuario. Con este programa, se realizaron tres pasos importantes: reverso complementario, algoritmo Smith- Waterman y algoritmo Needleman-Wunsch. Con el programa BioEdit se abren las secuencias recibidas, que deben estar en formato FASTA. El programa permite abrir los cromatogramas correspondientes a cada secuencia para su edición y corrección de posibles errores cometidos en la lectura. 3.5 HERRAMIENTA BLAST BLAST es el acrónimo de Basic Local Alignment Search Tool. Fue desarrollado por Altschul en 1990 y es el algoritmo más empleado por el NCBI. La principal característica del BLAST es su velocidad, pudiendo tomar pocos minutos cualquier búsqueda en la totalidad de la base de datos. De hecho, los resultados se presentan en pantalla inmediatamente después de calculados. El BLAST puede hacer búsquedas en una base de datos no redundante (nr) la cual tiene los registros no redundantes entre las dos bases de datos principales a nivel mundial: GenBank en USA y EMBL (European Molecular Biology Laboratories) en Europa. 3.6 NCBI
  • 9. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 9 Según la definición del Centro Nacional para la Información Biotecnológica "National Center for Biotechnology Information" -NCBI por sus siglas en inglés: la Bioinformática es un campo de la ciencia en el que confluyen varias disciplinas como son: la biología, la computación y las tecnologías de la información. Su fin último es facilitar el descubrimiento de nuevos conocimientos y el desarrollo de perspectivas globales a partir de las cuales puedan discernirse principios unificadores en el campo de la biología. (Cañedo Andalia & Arencibia Jorge, 2004) 3.7 MEGA-X El Análisis Genético Evolutivo Molecular (MEGA) es un software de computadora para realizar análisis estadísticos de la evolución molecular y para construir árboles filogenéticos, incluye muchos métodos y herramientas sofisticados para filogenómica y filomedicina. 4. METODOLOGIA 4.1 USO DE PROGRAMA BioEdit PARA LA CLASIFICACIÓN DE CALIDAD EN SECUENCIAS DE ADN PASO 1: Lo primero a realizar será de los cuatro archivos proporcionados, escoger uno de ellos para poder identificar la calidad de las secuencias, en este caso escogeremos el archivo G1 y lo guardaremos en una carpeta la cual la llamaremos “PRACTICA BIOINFORMATICA” Figura 1. Carpeta con archivos de secuencias de ADN Fuente: Elaboración propia PASO 2: Antes de abrir la carpeta con el archivo guardado, instalaremos en nuestro equipo el programa BioEdit, este programa nos ayudará a alinear las secuencias de ADN
  • 10. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 10 Fuente: Elaboración propia PASO 3: Luego de haber instalado el programa BioEdit, abriremos nuestra carpeta “PRACTICA_BIOINFORMATICA” y abriremos nuestro archivo G1. Figura 3. Uso de programa BioEdit Fuente: Elaboración propia Figura 2. Captura de página web del programa BioEdit
  • 11. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 11 PASO 4: Luego de abrir el archivo, seleccionaremos el primero “E09_5_09.ab1” y lo abriremos con el programa BioEdit, solo tendremos que hacer doble clic en él y automáticamente nos llevara al programa con la secuencia ya abierta. Fuente: Elaboración propia NOTA: Una de las maneras de saber si las secuencias son de calidad buena o mala, debemos fijarnos en los picos (cromatogramas), si los picos son altos quiere decir que la secuencia es de calidad BUENA, pero si son picos bajos quiere decir que es de calidad MALA. Ora manera de saber si las secuencias de ADN son de calidad buena o mala es exportando los datos. 4.2 PROCEDIMIENTO PARA OBTENER FORMATO FASTA DE SECUENCIAS DE ADN PASO 5: Una vez abierto la secuencia, lo guardaremos seleccionando FILE, desplegamos y seleccionaremos “EXPORT AS FASTA” Fuente: Elaboración propia Figura 4. Secuencia de AND "E09-5-09" Figura 5. Herramienta Export as Fasta
  • 12. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 12 PASO 6: Guardamos la secuencia en la carpeta creada “PRACTICA_BIOINFORMATICA” y colocamos el nombre de la secuencia “E09_5_09”. Fuente: Elaboración propia PASO 7: Procedemos a cambiar a formato fasta las demás secuencias. Fuente: Elaboración propia Figura 6. Secuencia de ADN en formato Fasta "E09-5-09" Figura 7. Secuencias ADN en formato Fasta
  • 13. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 13 PASO 8: Una vez guardado todas las secuencias, abriremos cada una de ellas con el bloc de notas Fuente: Elaboración propia Figura 8. Uso de Bloc de Notas
  • 14. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 14 4.3 DETERMINACION DE CALIDAD DE SECUENCIAS DE ADN Como ya hemos mencionado antes, una de las maneras para determinar si la calidad de la secuencia es buena o mala es observando la cantidad de la letra “N” que se muestra en formato fasta Como podemos observar en la primera secuencia, no tenemos una gran cantidad de “N” por lo que nuestra secuencia es de calidad BUENA. Figura 9. E09-5-09 CALIDAD: BUENA CA Figura 10. E10_13_10 CALIDAD: BUENA
  • 15. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 15 Figura 11. F10_14_12 CALIDAD: MALA Figura 12. G07_7H_13 CALIDAD: BUENA Figura 13. F07_6H_11 CALIDAD: BUENA Figura 14. F09_6_11 CALIDAD: BUENA
  • 16. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 16 Figura 15. G09_7_13 CALIDAD: BUENA Figura 16. G10_15_14 CALIDAD: MALA Figura 17. H07_8H_15 CALIDAD: MALA Figura 18. H09_8_15 CALIDAD: MALA
  • 17. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 17 4.4 USO DE HERRAMIENTA BLAST PASO 9: Una vez ya identificada la calidad de las secuencias, ahora nos toca identificar que microorganismo tiene cada secuencia, esto lo haremos con la ayuda de la herramienta proporcionada por el internet llamado “BLAST”. (link de la herramienta BLAST) https://blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE_TYPE=BlastSearch Fuente: Elaboración propia Figura 19. H10_16_16 CALIDAD: BUENA Figura 20. Página Web de herramienta BLAST
  • 18. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 18 PASO 10: Esta herramienta nos ayudara a identificar que microorganismo es para cada secuencia, pero primero seleccionamos las 5 primeras líneas de cada secuencia del bloc de notas y lo llevaremos a la herramienta BLAST Fuente: Elaboración propia PASO 11: Luego iremos a la parte inferior de la herramienta y haremos clic en BLAST Fuente: Elaboración propia Figura 21. Ingreso de números de secuencia de ADN en BLAST. Figura 22. Uso de BLAST
  • 19. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 19 PASO 12: Esperamos unos segundos y nos aparecerá un cuadro con una serie de datos. Fuente: Elaboración propia NOTA: Como podemos observar nos dan distintos microorganismos o bacterias, ahora para poder saber que bacteria es de nuestra muestra, nos enfocamos en el PORCENTAJE DE IDENTIDAD, el mayor porcentaje de identidad de la muestra será nuestro microorganismo o bacteria. PASO 13: En este caso nuestro microorganismo de nuestra muestra de mayor porcentaje de identidad es el Klebsiella pneumoniae Fuente: Elaboración propia Figura 23. Serie de datos proporcionada por el uso de BLAST Figura 24. Selección del microorganismo con mayor porcentaje de identidad
  • 20. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 20 PASO 14: Haremos el mismo procedimiento con las demás muestras y todos los datos obtenidos a partir de la calidad de la muestra hasta el reconocimiento de nuestros microorganismos lo insertaremos en un cuadro de Excel: Fuente: Elaboración propia 4.5 ALINEAMIENTO DE 11 SECUENCIAS DE ADN CON GEN NIFH PASO 15: Luego de haber previamente instalado el programa MEGA-X, abriremos el programa para empezar a alinear nuestros microorganismos. Figura 25. Identidad de microorganismos Figura 26. Programa MEGA-X
  • 21. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 21 Fuente: Elaboración propia PASO 16: Una vez abierto el programa nos dirigimos a la opción ALIGN, se despliega la ventana y nos dirigimos a la opción “Query Databanks” y hacemos clic en ella. Fuente: Elaboración propia Figura 27. Herramienta de MEGA-X " Query Data banks"
  • 22. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 22 4.6 USO DE DATABANK NCBI PASO 17: Una vez hecho esto, se abrirá una nueva ventana la cual es la página del NCBI donde nos va a proporcionar toda la información de bioinformática de genes y proteínas. Fuente: Elaboración propia PASO 18: Empezaremos buscando las secuencias de los microorganismos, entonces para buscar empezamos poniendo el nombre del microorganismo y la palabra “NIFH” lo cual el gen NIFH es la responsable de la fijación del nitrógeno. Fuente: Elaboración propia Figura 28. Databank NCBI Figura 29. Busqueda de gen NIFH
  • 23. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 23 PASO 19: Buscamos y nos aparecerá una lista de bacterias y microrganismos, aquí debemos tener en cuenta que solo tenemos que añadir las muestras que tengan el nombre de “NIFH” luego iremos añadiendo y haciendo clic en “Add to Alignment”. Fuente: Elaboración propia PASO 20: Una vez añadido a la herramienta “Add to Alignment”, nos aparecerá otra ventana, tener en cuenta que debe estar seleccionado el NIFH y le daremos a OK, luego nos aparecerá otra ventana y haremos lo mismo. Fuente: Elaboración propia Figura 30. Lista de microorganismos con gen NIFH Figura 31. Herramienta Add to Alignment
  • 24. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 24 PASO 21: Una vez hecho esto, nos aparecerá la ventana de alineamiento con la secuencia del microorganismo añadido. Fuente: Elaboración propia PASO 22: Procedemos a realizar mismo procedimiento con los demás microorganismos hasta obtener un total de 15 secuencias de microorganismos fijadores de nitrógeno. Fuente: Elaboración propia Figura 32. Uso de secuencia de ADN con gen NIFH Figura 33. Uso de 15 secuencias de ADN con gen NIFH
  • 25. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 25 PASO 23: Una vez obtenido nuestras secuencias de microorganismos, utilizaremos la herramienta “Align using the MUSCLE algorithm” Haremos clic en ella y nos aparecerá dos opciones, elegiremos la opción “Align DNA”. Fuente: Elaboración propia PASO 24: Una vez hecho esto, nos aparecerá una ventana pequeña y le daremos a OK, y automáticamente se seleccionará todas las secuencias de los microorganismos y nos aparecerá otra ventana la cual también le daremos a OK. Figura 34. Alineamiento de secuencias con herramienta Align DNA en programa MEGA - X Figura 35. Alineamiento en proceso
  • 26. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 26 Fuente: Elaboración propia PASO 25: Como podemos observar, las secuencias ya han sido alineadas Fuente: Elaboración propia Figura 36. Secuencias de ADN alineadas
  • 27. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 27 TENER EN CUENTA QUE LOS ESPACIOS EN BLANCO SON SECUENCIAS QUE NO NECESITAMOS, ASI QUE HAREMOS LO SIGUIENTE: PASO 26: Utilizaremos el mouse e iremos arrastrando con el lado izquierdo del mouse, seleccionando los espacios vacíos y por ultimo utilizaremos la herramienta “Delete selected block" y se borrarán, haremos el mismo procedimiento para los demás espacios vacíos, hasta que solo quede las secuencias alineadas. Fuente: Elaboración propia Figura 37. Eliminación de espacios sin alineamiento
  • 28. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 28 Fuente: Elaboración propia COMO PODEMOS OBSERVAR PODEMOS OBVIAR ALGUNOS ESPACIOS VACIOS, PERO SOLO LOS ESPACIOS QUE TIENEN UNA LINEA VACIA Fuente: Elaboración propia PASO 27: Una vez obtenido nuestras secuencias alineadas, procedemos a guardarlo con la herramienta “Save the alignment to a MEGA session file” y lo guardaremos a nuestra carpeta llamada “PRACTICA_BIOINFORMATICA” con el nombre de “Alineamiento de ADN (gen NIFH)” y tener en cuenta que el formato debe estar en “Aln Session” Figura 38. Alineamiento de secuencias de ADN con gen NIFH culminada Figura 39. Error de alineamiento de secuencias de ADN
  • 29. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 29 Fuente: Elaboración propia PASO 28: Luego nos dirigimos a “DATA”, y nos iremos a la opción “Export Alignment y nos dará tres opciones, elegiremos la opción “MEGA Format” y lo guardamos con el mismo nombre solo que este estará con otro formato en “MEGA Files” Figura 40. Creación de archivo del alineamiento realizado anteriormente con la herramienta “Save the alignment to a MEGA session file” Figura 41. Exportacion de alineamineto finalizado a formato MEGA
  • 30. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 30 Fuente: Elaboración propia PASO 29: Luego nos aparecerá otra pequeña ventana y lo guardaremos con el nombre de “ARBOL_G1” y le daremos OK a la siguiente ventana que también nos aparecerá. Fuente: Elaboración propia Figura 42. Creación de archivo "ARBOL-G1"
  • 31. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 31 PASO 30: Finalmente iremos al programa mega y nos iremos a la opción “File” y seleccionaremos la opción “Open a File/Session” y abriremos nuestro archivo en formato “MEGA files” Fuente: Elaboración propia PASO 30: Luego nos iremos a la opción “PHYLOGENY” para crear nuestro árbol filogenético y nos iremos a la opción “Construct/Test UPGMA Tree” Fuente: Elaboración propia Figura 43. Visualización de archivos en formato MEGA Figura 44. Creación de filogenético
  • 32. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 32 PASO 31: Nos aparecerá una ventana la cual en este caso donde dice “None” lo cambiaremos a “Bootstrap method” y también cambiaremos el 500 a “1000”, y le daremos OK Fuente: Elaboración propia PASO 32: Esperamos unos segundos y obtendremos nuestro árbol filogenético. Fuente: Elaboración propia Figura 45. Actualización de campos de editor para la posterior creación de árbol filogenético Figura 46. Árbol filogenético
  • 33. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 33 5. RESULTADOS Y DISCUSION 5.1 ÁRBOL FILOGENÉTICO ÁRBOL FILOGENÉTICO FIFILOGENÉTICO
  • 34. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 34 Analizando nuestro árbol filogenético podemos observar que la bacteria Klebsiella pneumoniae isolate HUB_IV con la otra especie Klebsiella pneumoniae strain NG14 son especies próximas al 63% ya que están en la misma rama, en comparación a las especies de Enterobacter sp. Strain IDRT-2 y Enterobacter sp strain RPDRT-2 que son distintas porque están en otra rama. También podemos observar que la especie Klebsiella sp., con la especie Enterobacter sp. Y4 son especies distintas. También tenemos la escala evolutiva, en donde indica la evolución de las especies a lo largo de la evolución, cuanto más próximo sea a 0 las especies son más próximas o iguales. Fuente: Elaboración propia Figura 47. Escala Evolutiva de especies con gen NIFH
  • 35. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 35 5.2 DETERMINACIÓN Y CLASIFICACIÓN DE SECUENCIAS DE ADN Las secuencias en formato fasta fueron debidamente clasificadas según la calidad que presentaban tomando en cuenta su imagen cromatografía y formatos fastas ya presentado en el punto 4.3 del presente informe a continuación se realiza una segunda muestra de cada una de las 11 secuencias clasificadas en formato fasta . CALIDAD DE LAS SECUENCIAS DE ADN Figura 48. E09-5-09 CALIDAD: BUENA CA Figura 49. E10_13_10 CALIDAD: BUENA
  • 36. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 36 Figura 50. F07_6H_11 CALIDAD: BUENA Figura 51. F09_6_11 CALIDAD: BUENA Figura 52. F10_14_12 CALIDAD: MALA Figura 53. G07_7H_13 CALIDAD: BUENA
  • 37. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 37 Figura 54. G09_7_13 CALIDAD: BUENA Figura 55. G10_15_14 CALIDAD: MALA Figura 56. H07_8H_15 CALIDAD: MALA Figura 57. H09_8_15 CALIDAD: MALA
  • 38. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 38 5.3 CLASIFICACION DE SECUENCIAS DE ADN EN EL PROGRAMA BioEdit Fuente: Elaboración propia Figura 59. MUESTRA E09_5_09 Figura 58. H10_16_16 CALIDAD: BUENA
  • 39. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 39 Fuente: Elaboración propia Fuente: Elaboración propia Figura 60. MUESTRA E10_13_10 Figura 61. MUESTRA F07_6H_11
  • 40. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 40 Fuente: Elaboración propia Fuente: Elaboración propia Figura 62. MUESTRA F09_6_11 Figura 63. MUESTRA F10_14_12
  • 41. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 41 Fuente: Elaboración propia Fuente: Elaboración propia Figura 64. MUESTRA G07_7H_13 Figura 65. MUESTRA G09_7_13
  • 42. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 42 Fuente: Elaboración propia Fuente: Elaboración propia Figura 66. MUESTRA G10_15_14 Figura 67. MUESTRA H07_8H_15
  • 43. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 43 Fuente: Elaboración propia Fuente: Elaboración propia Figura 69. MUESTRA H09_8_15 Figura 68. H07_8H_15
  • 44. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 44 5.4 CLASIFICACION E IDENTIFICACION DE SECUENCIAS DE ADN TABLA: CALIDAD DE MUESTRAS DE SECUENCIAS DE ADN 6. CONCLUSIONES Y RECOMENDACIONES 6.1 CONCLUSIONES Se evaluó la calidad de las secuencias de ADN de cada muestra con la ayuda del programa BioEdit, ya que este programa nos ayuda a visualizar los cromatogramas de la secuencia, y se pudo determinar que de las 11 muestras evaluadas solo 4 son de mala calidad y los restantes son de buena calidad. N° MUESTRAS CALIDAD % DE IDENTIDAD ORGANISMO 1 E09_5_09 BUENA 89.18% Klebsiella pneumoniae 2 E10_13_10 BUENA No se encontro ninguna similitud significativa 3 F07_6H_11 BUENA 96.64% Klebsiella pneumoniae 4 F09_6_11 BUENA 89.27% Enterobacter asburiae 5 F10_14_12 MALA No se encontro ninguna similitud significativa 6 G07_7H_13 BUENA 95.42% Klebsiella sp. 7 G09_7_13 BUENA No se encontro ninguna similitud significativa 8 G10_15_14 MALA 97.90% Enterobacter sp. 9 H07_8H_15 MALA No se encontro ninguna similitud significativa 10 H09_8_15 MALA No se encontro ninguna similitud significativa 11 H10_16_16 BUENA 90.18% Enterobacter sp.
  • 45. ESCUELA PROFESIONAL INGENIERÍA AMBIENTAL 45 6.2 RECOMENDACIONES  Se recomienda primo instalar los programas BioEdit y Mega-X ya que si no están instalados al momento de saber si son de calidad buena o mala el archivo no se podrá abrir.  También se recomienda que al momento de exportar en un bloc de notas las secuencias del programa BioEdit para la determinación de la calidad de las muestras es fijarnos la cantidad de “N” que hay en la secuencia ya que si hay muchas “N” indica que es de calidad mala.  También al momento de hacer el alineamiento en el programa MEGA-X debemos tener en cuenta que no debemos eliminar todos los posibles espacios vacíos que hay y alinear lo más que podamos. 7. Bibliografía Márquez Valdelamar, L., Serrato Díaz , A., & Cerritos Flores, R. (s.f.). Secuenciación de fragmentos de ADN. Herramientas moleculares aplicadas en ecología. Instituto de Biología, UNAM, México. Anicet R. , B. (2010). Biotecnología ambiental. Aplicaciones biotecnológicas en la mejora del medio ambiente. Universidad de Barcelona. Cañedo Andalia, R., & Arencibia Jorge, R. (2004). Bioinformática: en busca de los secretos moleculares de la vida. Centro Nacional de Información de Ciencias Médicas, Ciudad de la Habana, Cuba. Obtenido de http://bvs.sld.cu/revistas/aci/vol12_6_04/aci02604.htm Castillo Rodriguez, F. (2005). Biotecnología Ambiental. Madrid , España. de Necochea Campion, R., & Canul Tec, J. (2004). SECUENCIACIÓN DE ÁCIDOS NUCLEICOS. Métodos fisicoquímicos en biotecnología. Instituto de Biotecnología - UNAM, Cuernavaca.  https://medium.com/el-blog-de-melquiades/alineamientos-de-secuencias-de-adn-y- proteinas-57fcdfbfcb25  http://bioinf.ibun.unal.edu.co/documentos/Blast/blast.php