Este documento describe el desarrollo de un análisis filogenético de cuatro especies bacterianas (Escherichia coli, Pseudomonas aeruginosa, Salmonella enterica y Bacillus cereus) utilizando el gen ribosomal 16S. Se seleccionaron múltiples secuencias del gen 16S de cada especie y se analizaron en el programa MEGA para construir un dendrograma que muestre las relaciones evolutivas entre las especies.
PRACTICA N.- 05_ FILOGENIA MOLECULAR DE GENES RIBOMALES Y CONSTRUCCIÓN DE UN DENDOGRAMA.pdf
1. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
INFORME: FILOGENIA MOLECULAR DE GENES RIBOSOMALES Y
CONSTRUCCIÓN DE UN DENDOGRAMA
Biotecnología
Asesor:
Dr. Hebert Hernan Soto Gonzales
Responsables:
Arevalo Navarro, Stefani Brilly 2019205021
Luna Merma, Mayra Alexandra 2019205034
VII Ciclo
Ilo, Moquegua, Perú
2022
2. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
2
ÍNDICE
1. INTRODUCCIÓN 3
2. OBJETIVOS 3
2.1. OBJETIVO PRINCIPAL 3
2.2. OBJETIVOS SECUNDARIOS 4
3. MARCO TEÓRICO 4
3.1 Filogenética 4
3.2 Filogenia 4
3.3 Homología 4
3.4 Reconstrucción Filogenética 5
3.4.1 Árboles 5
3.4.2 Tipos de Árboles 6
3.4.2.1 Fenograma 6
3.4.2.2 Cladograma 6
3.4.2.3 Filograma 7
MATERIALES 7
4. DESARROLLO 7
4.1. SELECION DE ESPECIES EN EL SELECIONADOR QUERY DATABANK
DE MEGA. 8
4.1.1. ESCHERICHIA COLI 8
4.1.2. PSEUDOMONAS AERUGINOSA 16S rRNA 13
4.1.3. SALMONELLA ENTERICA 16S rRNA 18
4.1.4. BACILLUS CEREUS 16S rRNA 23
4.2. ORDENAR EN EL MEGA LAS ESPECIES 28
4.3. ESQUEMA CON LA FUNCION PHYLOGENY 29
5. CONCLUSIONES 30
CUESTIONARIO 31
3. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
3
INTRODUCCIÓN
Las bacterias de los géneros Raoultella y Klebsiella son patógenos oportunistas
para los cuales no existe un sistema uniforme de clasificación taxonómica internacional.
En el presente estudio se propone una filogenia molecular basada en el gen ribosomal 16S
(ADNr 16S) y el gen codificante de la subunidad de la ARN polimerasa (rpoB) de los
géneros Klebsiella y Raoultella con el fin de establecer relaciones evolutivas entre dichos
géneros. Los resultados evidencian una agrupación acorde con la taxonomía y las
características bioquímicas, reportadas en el Genbank. Se estableció una bifurcación en
los árboles, lo cual confirma la separación de los géneros Klebsiella y Raoultella.
Adicionalmente, se confirmó el carácter polifilético de K. aerogenes por el gen ADNr
16S y la agrupación de R. terrigena y K. oxytoca de acuerdo con el gen rpoB. La
comparación entre los árboles obtenidos permitió determinar relaciones evolutivas entre
las especies, a partir de los genes evaluados, lo cual refleja cambios aparentes a nivel
taxonómico y corrobora la importancia del análisis a nivel de multilocus. Este tipo de
estudios permite monitorear la estabilidad de los genotipos microbianos sobre la escala
temporal y espacial, mejorar la precisión de las anotaciones taxonómicas (mejor
descripción de taxones o subdivisiones genéticas) y evaluar la diversidad genética y
adaptabilidad en términos de virulencia. Arenas, N. E., Gutiérrez, A. J., Salazar, L. M.,
Polanco, J. C., & Gómez, A. (2010).
El análisis de secuencias biológicas está fundamentado en los principios de la
evolución, las Similitudes y divergencias entre secuencias biológicas relacionadas
(reveladas con alineamiento) a menudo requieren ser analizadas y visualizadas en el
contexto de árboles filogenéticos por esta razón la filogenética molecular es un área de
gran importancia dentro de la bioinformática. (Rodriguez Tello, 2013).
1. OBJETIVOS
1.1. OBJETIVO PRINCIPAL
- Conocer los términos asociados al análisis filogenético de moléculas de
genes ribomales.
4. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
4
1.2. OBJETIVOS SECUNDARIOS
- Aprender el funcionamiento de programas informáticos como el MEGA
en el análisis filogenético de moléculas.
- Realizar la construcción de un dendrograma de secuencias genéticas.
2. MARCO TEÓRICO
3.1 Filogenética
Uno de los paradigmas centrales de la biología es la comparación. A través de comparar
a los organismos a distinta escala (desde moléculas hasta rasgos físicos visibles) se les ha
podido clasificar en estratos que nos permiten entender la historia evolutiva de la vida
misma, desde las bacterias hasta los seres humanos. La filogenética es una rama de la
biología evolutiva que se encarga de trazar la relación ancestro descendiente de los
organismos a diferentes niveles taxonómicos con base a diversos caracteres homólogos
tanto morfológicos como moleculares. Una de las maneras más utilizadas para representar
la historia evolutiva de los organismos es a través de una filogenia. Una filogenia describe
la historia evolutiva del flujo hereditario a distintos niveles evolutivos/temporales, desde
la genealogía de genes en poblaciones (microescala) hasta el árbol universal de la
vida(macro-escala). Conogasi. (2015).
3.2 Filogenia
La filogenia es la historia de la evolución de un grupo de organismos o, de acuerdo
con Colin Tudge, la «genealogía con mayúscula», ya que se ocupa de la relación
existente entre especies, familias, órdenes... Para ello, los biólogos se han basado en la
morfología, la citología, el registro fósil, etc. La filogenia se puede representar
gráficamente mediante árboles filogenéticos. Como su nombre indica, se trata de dibujos
con aspecto de árbol. En la base del tronco estaría el antepasado común de todos los
organismos, y de él partirían unas ramas, de las cuales saldrían ramas más finas, y de
estas ramitas, etc., hasta llegar a las especies actuales, dispuestas en los extremos de las
últimas ramificaciones.
3.3 Homología
Homología es la relación entre dos caracteres que han descendido, generalmente con
modificación, de un ancestro común. Estrictamente se refiere a ancestría común inferida.
5. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
5
Esta homología biológica es una consecuencia de la evolución. Puede haber
homología entre órganos de dos especies si dichas estructuras provienen del órgano
correspondiente de un antepasado común. El paso de los años puede haber hecho que los
órganos actúan
Por tanto, para cuantificar el parecido entre un par de secuencias homólogas se dice que
presentan globalmente un 70% y 95% de identidad y similitud, respectivamente. (no
existe algo cómo 95% de homología). El concepto de homología es simplemente una
abstracción sobre la relación entre caracteres, sobre su ascendencia común, relación que
es indispensable determinar para poder hacer reconstrucciones filogenéticas que reflejan
la historia del “flujo de la herencia”.
3.4 Reconstrucción Filogenética
3.4.1 Árboles
Los árboles o dendrogramas son diagramas ramificados que representan las relaciones
genealógicas entre las unidades en estudio o unidades taxonómicas operativas (OTUs) o
terminales (especies, poblaciones, individuos, o genes). Dependiendo de sus
características y usos reciben distintos nombres. Los árboles pueden, o no, presentar una
raíz (que representa el ancestro común más antiguo del grupo). El patrón de ramificación
se conoce como topología; las ramas o internodos de un árbol pueden girar libremente en
los nodos sin afectar la formación de los grupos. Los nodos internos representan a los
ancestros comunes hipotéticos. Si la raíz está abajo, el eje vertical es proporcional al
tiempo.
6. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
6
3.4.2 Tipos de Árboles
3.4.2.1 Fenograma
Cuando el árbol o dendrograma fue construido a partir de una metodología fenética o de
distancia se denomina fenograma. Estos árboles tienen la propiedad de ser aditivos (las
longitudes de las ramas se suman) y, en algunos casos, pueden también ser ultramétricos
(es decir, todas las ramas alcanzan la misma altura). Para los fenogramas, la longitud de
ramas es proporcional al grado de semejanza fenotípica o similitud global (ya sea
molecular o morfológica) entre las unidades estudiadas. Cuando las ramas tienen distintos
largos, dicha medida es una estimación de las distancias evolutivas entre los terminales.
3.4.2.2 Cladograma
Cuando el árbol o dendrograma ha sido construido con la metodología cladística, lo
denominamos cladograma. Este refleja la jerarquía de grupos hermanos entre los taxones
en un diagrama ramificado. Un árbol filogenético combina la información cladística con
los rangos estratigráficos de los taxones, reconstruyendo la evolución de los taxones en
el tiempo; los nodos están calibrados en el tiempo geológico mediante el registro fósil.
7. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
7
3.4.2.3 Filograma
Si el árbol fue obtenido por un método probabilístico lo denominamos Filograma, cuyas
ramas llevan implícito el tiempo de divergencia (T) y la tasa de evolución molecular (k),
siendo la longitud de las ramas k x T. Así, la longitud de las ramas es proporcional al
grado de divergencia filogenética al igual que en los fenogramas con longitud de rama
variable.
MATERIALES
MEGA
3. DESARROLLO
En el desarrollo de la presente práctica, elegimos 4 especies del gen 16s.
8. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
8
3.1. SELECION DE ESPECIES EN EL SELECIONADOR QUERY
DATABANK DE MEGA.
Hemos elegidos 4 especies:
3.1.1. ESCHERICHIA COLI
• Escherichia coli strain U 5/41 16S ribosomal RNA, partial
sequence
9. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
9
• E.coli rrnA gene
10. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
10
• Escherichia coli H7 gene for 16S rRNA, partial sequence
11. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
11
• Escherichia coli JCM 20377 gene for 16S rRNA, partial
sequence.
12. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
12
• Escherichia coli JCM 20350 gene for 16S rRNA, partial sequence
13. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
13
3.1.2. PSEUDOMONAS AERUGINOSA 16S rRNA
• Pseudomonas aeruginosa strain DSM 50071 16S ribosomal RNA,
complete sequence
14. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
14
• Pseudomonas aeruginosa 57 16S ribosomal RNA gene, partial
sequence
15. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
15
• Pseudomonas aeruginosa NO6 16S ribosomal RNA gene, partial
sequence
16. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
16
• Pseudomonas aeruginosa CJM 16S ribosomal RNA gene,
partial sequence
17. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
17
• Pseudomonas aeruginosa partial 16S rRNA gene, strain KSG,
Isolate Pseudomonas aeruginosa KSG
18. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
18
3.1.3. SALMONELLA ENTERICA 16S rRNA
• Salmonella enterica subsp. arizonae strain ATCC 13314 16S
ribosomal RNA, partial sequence
19. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
19
• Salmonella enterica partial 16S rRNA gene, strain 22/M185/01/98
20. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
20
• Salmonella enterica gene for 16S rRNA, partial sequence, strain:
NBRC 3163
21. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
21
• Salmonella enterica gene for 16S rRNA, partial sequence,
strain: NBRC 15335
22. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
22
• Salmonella enterica strain LGS5 16S ribosomal RNA gene,
partial sequence
23. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
23
3.1.4. BACILLUS CEREUS 16S rRNA
• Bacillus cereus ATCC 14579 16S ribosomal RNA (rrnA), partial
sequence
24. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
24
• Bacillus cereus partial 16S rRNA gene, strain ISUWYZ04
•
25. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
25
• Bacillus cereus partial 16S rRNA gene, isolate BB613
26. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
26
• Bacillus cereus partial 16S rRNA gene, Isolate BCsd
27. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
27
• Bacillus cereus gene for 16S rRNA, partial sequence,
specimen_voucher: GTC:12031
28. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
28
3.2. ORDENAR EN EL MEGA LAS ESPECIES
Ahora con la función de La Comparación de Secuencias Múltiples por Log-
Expectativa ( MUSCLE ) es un software de computadora para el alineamiento
de secuencias múltiples de secuencias de proteínas y nucleótidos.
Nos va a dar de las especies un orden por secuencia en la que podemos
diferenciar por colores.
Luego de ello se elimina los espacios en blancos hasta poder tener una
secuencia en orden y sin espacios en blanco por todas las especies.
29. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
29
3.3. ESQUEMA CON LA FUNCION PHYLOGENY
Con los datos seleccionados en el Mega tenemos la funcionalidad con
phylogeny en la cual nos brinda un esquema según lo deseado, donde clasifica
las especies por su gen y/o similitudes.
En el trabajo practico nuestro esquema es el siguiente:
30. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
30
5. CONCLUSIONES
• El presente trabajo presenta como es la construcción de un árbol filogenetico con
la herramienta de MEGAX enla cual este nos ayuda a tener una búsqueda por un
banco genético en la cual nosotros utilizamos el gen ribomales 16S rRNA, en el
software mediante una herramienta llamada phylogeny nos brinda un esquema de
20 secuencias según elegidas, clasificadas por su gen en donde son 4.
31. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
31
CUESTIONARIO
1.- ¿Qué es el MEGA DNA?
MEGA (Molecular Evolutionary Genetics Analysis) es una herramienta utilizada para
analizar secuencias evolutivas de ADN y proteínas. La aplicación está disponible como
una edición de interfaz GUI y una edición de línea de comandos.
MEGA soporta varios formatos de secuencias de ADN y proteínas, incluyendo FASTA,
GCG, PIR/NBRF, PHYLIP y Clustal W. La aplicación puede utilizarse para construir
alineaciones de secuencias, estimar tiempos de divergencia, inferir historias filogenéticas,
diagnosticar mutaciones, estimar tasas de evolución molecular y probar hipótesis
evolutivas. La aplicación también viene con tutoriales y archivos de ejemplo para ayudar
a los usuarios principiantes.
MEGA está diseñado para que los biólogos lo utilicen en la investigación de laboratorio
para reconstruir las historias evolutivas de los genes y las especies. Es compatible con
varios formatos populares de secuencias de ADN y proteínas, al tiempo que le ofrece
herramientas para examinar los datos y realizar una variedad de pruebas. MEGA es una
herramienta necesaria para aquellos que realizan investigaciones con secuencias de ADN
y proteínas
2.- ¿EN ING. AMBIENTAL PARA QUE NOS SERVIRÁ EL MEGA DNA?
El programa MEGA DNA, en ingeniería ambiental nos abre grandes posibilidades gracias
a las funciones que ofrece, un ejemplo lo vemos en el ADN ambiental, Ya hace algunos
años los ecólogos de todo el mundo comenzaron a estudiar el ADN que, perteneciente a
todo tipo de organismos, vaga libremente y puede hallarse a la deriva en el agua de
32. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
32
océanos, ríos o lagos de cualquier rincón del planeta. Conocido como ADN ambiental
-ADNe- este material genético presenta un gran potencial para evaluar la distribución de
los organismos en todo tipo de ecosistemas acuáticos, y aunque la disciplina aún se
enfrenta a numerosos desafíos en el futuro, parece que las aplicaciones cuantitativas del
ADN Ambiental comienzan a dar sus primeros frutos.
Por otro lado, otra prueba de la buena herramienta que es el MEGA DNA nos lo muestra
otro artículo titulado “Científicos estudiarán el ADN ambiental para monitorear el efecto
del cambio climático en sitios marinos del Patrimonio Mundial” En la cual podemos
resaltar el estudio del ADN ambiental.
3.- ¿EL PROGRAMA MUSCLE, QUÉ FUNCIÓN TIENE?
La Comparación de Secuencias Múltiples por Log-Expectativa ( MUSCLE ) es un
software de computadora para el alineamiento de secuencias múltiples de secuencias de
proteínas y nucleótidos . Se licencia como dominio público . El método fue publicado por
Robert C. Edgar en dos artículos en 2004.
El algoritmo MUSCLE avanza en tres etapas: el borrador progresivo, el progresivo
mejorado y las etapas de refinamiento. En la etapa de borrador progresivo, el algoritmo
produce un borrador de alineación múltiple, enfatizando la velocidad sobre la precisión.
En la etapa progresiva mejorada, la distancia de Kimura se utiliza para volver a estimar
el árbol binario para crear la alineación de borrador, lo que a su vez produce una
alineación múltiple más precisa. La etapa de refinamiento final refina la alineación
mejorada realizada en el paso dos. Hay varias alineaciones disponibles al final de cada
etapa. En las dos primeras etapas del algoritmo, la complejidad temporal es O (N 2 L +
NL 2), la complejidad espacial es O (N 2 + NL + L 2). La etapa de refinamiento agrega a
la complejidad del tiempo otro término, O (N 3 L). MUSCLE se usa a menudo como un
reemplazo de Clustal , ya que generalmente (pero no siempre) da mejores alineaciones de
secuencia, dependiendo de las opciones elegidas. Además, MUSCLE es
significativamente más rápido que Clustal, más aún para alineaciones más grandes.
33. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
33
4.- EN BASE AL ARTÍCULO: Agrociencia versión On-line ISSN 2521-9766versión
impresa ISSN 1405-3195 Agrociencia vol.50 no.2 Texcoco feb./mar. 2016
BIOTECNOLOGÍA
Actividad antifúngica e identificación molecular de cepas nativas de Bacillus subtilis
Elabore un mapa conceptual de 1 o 2 slides
5. – INDICAR Y CONCEPTUALIZAR CUALES SON LOS GENES QUE SE
UTILIZAN EN TAXONOMÍA MOLECULAR, Por ejm, el gen 16S, 23s, entre otros.
GEN DESCRIPCIÓN
16S rRNA El ARNr 16S es un polirribonucleótido de aproximadamente 1500 nucleótidos
codificado por el gen rrs, también denominado ADN ribosomal 16S. Como
cualquier secuencia nucleotídica de cadena sencilla, el ARNr 16S se pliega y
adquiere una estructura secundaria que se caracteriza por tener segmentos de
doble cadena que permiten la formación de asas y hélices. Esta molécula ha sido
reconocida como un poderoso marcador universal debido a que se encuentra en
todos los organismos conocidos. Su estructura parece mantenerse por largos
periodos de tiempo y, como su función no ha cambiado, los cambios en la
secuencia probablemente son aleatorios. En su contraparte eucariota, el ARNr
34. UNIVERSIDAD NACIONAL DE MOQUEGUA
Escuela Profesional de Ingeniería Ambiental
34
18S, las mutaciones son adquiridas lentamente, y es posible obtener
información acerca de todos los organismos en una escala evolutiva. Sin
embargo, los ARNr poseen suficiente variabilidad para diferenciar no sólo los
organismos más alejados, sino también los más próximos, y es posible
diferenciar especies, cepas o variedades. Además, el tamaño relativamente largo
de los ARNr 16S (1500 nucleótidos) minimiza las fluctuaciones estadísticas, y
la conservación de su estructura secundaria favorece el alineamiento preciso
durante la comparación de secuencias (Rodicio, Mendoza, 2004).
23S rDNA Es un gen de aproximadamente 3,000 nucleótidos de longitud que se
localiza en la subunidad grande de los ribosomas en procariotas. Este gen
presenta inserciones y deleciones más grandes que el gen 16S rRNA. Las
inserciones estables y deleciones de algunas bases en el gen 23S rDNA
son características comunes en algunas clases y subclases de bacterias.
Estos cambios complican los análisis, ya que las diferentes posiciones no
pueden considerarse para realizar clasificaciones filogenéticas correctas
(22). El gen 23S rDNA se ha utilizado en conjunto con el 16S rRNA para
la clasificación taxonómica de bacterias no cultivables. Además, se ha
utilizado el espaciador intergénico (ITS) localizado en la región 16S-23S,
la cual es una región muy variable para diferenciar entre dos cepas
pertenecientes a la misma subespecie
5S rDNA Es un gen de aproximadamente 120 nucleótidos de longitud, se encuentra
prácticamente en todos los ribosomas con excepción de los
mitocondriales, de algunos hongos, de animales superiores y de la
mayoría de las protistas. Aunque la secuencia de este gen está altamente
conservada, la fiabilidad de este gen como marcador está cuestionada
debido a que su longitud es muy pequeña y por lo tanto no ofrece la
suficiente resolución para contribuir significativamente a comprender
relaciones filogenéticas entre taxones
18S ARNr Es la macromolécula equivalente. Dado que los ARNr 16S y 18S
proceden de las subunidades pequeñas de los ribosomas, el acrónimo
ARNr SSU (del inglés, small subunit) se utiliza para ambos. Los ARNr
SSU se encuentran altamente conservados, presentando regiones
comunes a todos los organismos, pero contienen además variaciones que
se concentran en zonas específicas.