Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Análisis de secuencias del gen 16S
1. UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERÍA AMBIENTAL
17 Setiembre
Análisis de Secuencias del
Gen 16S
DOCENTE :
❖ SOTO GONZALES, Heberth Hernan
INTEGRANTES:
❖ ANCACHI MAMANI, Judith Nancy
BIOTECNOLOGÍA
INFORME N°1
2. UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERÍA AMBIENTAL
ÍNDICE
1 INTRODUCCIÓN................................................................................................................ 4
2 OBJETIVO........................................................................................................................... 5
3 MATERIALES Y MÉTODO ............................................................................................... 5
3.1 Materiales .................................................................................................................... 5
3.2 Método ......................................................................................................................... 5
4 RESULTADOS.................................................................................................................. 10
5 CONCLUSIÓN .................................................................................................................. 14
6 BIBLIOGRAFÍA................................................................................................................. 15
3. UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERÍA AMBIENTAL
ÍNDICE DE FIGURAS
Figura 1 Software BioEdit ............................................................................................5
Figura 2 Export as Fasta..............................................................................................6
Figura 3 Bloc de notas .................................................................................................6
Figura 4 Clicar en Nucleotide BLAST...........................................................................6
Figura 5 BLAST ...........................................................................................................7
Figura 6 Copiamos la secuencia a la página BLAST....................................................7
Figura 7 Seleccionamos la opción Secuencias muy similares y clicamos en
EXPLOSIÓN.................................................................................................................7
Figura 8 Opciones a seleccionar..................................................................................8
Figura 9 Longitud de la consulta ..................................................................................8
Figura 10 Nombre científico y el porcentaje de identidad.............................................9
4. UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERÍA AMBIENTAL
1 INTRODUCCIÓN
La secuenciación genética es una tecnología que permite conocer y descifrar el
código genético que tienen todos los seres vivos. Se trata de 'leer' ese código, que
contiene información imprescindible para su desarrollo y funcionamiento, como si
de un libro de instrucciones genéticas se tratase. Estas señas de identidad, que
definen las características y la 'firma genética' de los organismos biológicos, vienen
'inscritas' en moléculas llamadas ácidos nucleicos, formadas por nucleótidos.
El BioEdit es un programa gratuito para la edición de alineamientos y análisis de
secuencias que funcionan únicamente sobre ambientes MS/Windows. Es uno de
los programas más conocidos para edición de secuencias para dicho sistema
operativo. BioEdit cuenta con varias herramientas que van desde la creación de
alineamientos hasta la anotación de plásmidos. En la ventana principal de BioEdit,
el alineamiento de nuestra secuencia, por defecto cada aminoácido es resaltado en
un color diferente, este esquema de colores puede ser cambiado en cualquier
momento mediante la utilización de las diferentes opciones en la barra de
herramienta. (BioEdit, [s.f.])
Por otro lado el BLAST (Basic Local Alignment Search Tool) es
un programa informático de alineamiento de secuencias de tipo local, ya sea
de ADN, ARN o de proteínas. El programa es capaz de comparar una secuencia
problema (también denominada en la literatura secuencia query) contra una gran
cantidad de secuencias que se encuentren en una base de datos.
El algoritmo encuentra las secuencias de la base de datos que tienen mayor
parecido a la secuencia problema. Es importante mencionar que BLAST usa
un algoritmo heurístico por lo que no nos puede garantizar que ha encontrado la
solución correcta. Sin embargo, BLAST es capaz de calcular la significación de sus
resultados, por lo que nos provee de un parámetro para juzgar los resultados que
se obtienen.
Normalmente el BLAST es usado para encontrar probables genes homólogos. Por
lo general, cuando una nueva secuencia es obtenida, se usa el BLAST para
compararla con otras secuencias que han sido previamente caracterizadas, para
así poder inferir su función.
5. UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERÍA AMBIENTAL
2 OBJETIVO
❖ Revisar los fundamentos de las técnicas de secuenciación de ácidos nucleicos.
❖ Efectuar el análisis y la selección de electroferogramas automatizados de
secuenciación mediante la aplicación de software libre BIOEDIT en específico el
estudio del gen ribosomal 16S.
3 MATERIALES Y MÉTODO
3.1 Materiales
❖ Software BioEdit
❖ Página de NCBI
❖ Excel
❖ Laptop
3.2 Método
❖ Como primer paso usamos el software BioEdit que nos sirve para la edición de
alineamientos y análisis de secuencias. Abrirá dos ventanas, una mostrará el
electroferograma y la otra la secuencia.
Figura 1 Software BioEdit
6. UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERÍA AMBIENTAL
❖ Guardamos la secuencia en formato FASTA.
❖ Abrimos el archivo con bloc de notas y si en necesario borramos parte de la
secuencia mala (los N). para luego pasarlo al BLAST.
❖ Abrimos la página de NCBI, clicamos en la opción BLAST y seleccionamos
Nucleotide BLAST.
Figura 2 Export as Fasta
Figura 3 Bloc de notas
7. UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERÍA AMBIENTAL
❖ Copiamos la secuencia, seleccionamos “Secuencias muy similares” y clicamos
en “EXPLOSIÓN”
Figura 6 Copiamos la secuencia a la página BLAST
Figura 5 BLAST
8. UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERÍA AMBIENTAL
❖ La página nos mostrará diferentes datos, de las cuales, para el presente trabajo
tomaremos la longitud de la consulta, nombre científico y porcentaje de
identidad.
Figura 9 Longitud de la consulta
Figura 8 Opciones a seleccionar
9. UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERÍA AMBIENTAL
❖ Finalmente anotamos todos los datos en nuestros cuadros de Excel.
Figura 10 Nombre científico y el porcentaje de identidad
10. UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERÍA AMBIENTAL
4 RESULTADOS
❖ ZIP Hernan3
Hernan3
CÓDIGO
CALIDAD DE LA SECUENCIA TAMAÑO DE LA
SECUENCIA
ORGANISMOS
% de
identidad
BUENA MALO REGULAR
DIVERSOS-_A07_1H_01 X 978 Negativo …
DIVERSOS-_A08_9H_02 X 384
Bacteria (Herbaspirillum
rubrisubalbicans)
96,33%
DIVERSOS-_A09_1_01 X 1007 Bacteria (Pseudomonas putida) 83,21%
DIVERSOS-_A10_9_02 X 925
Bacteria no cultivada (Gen de
ARN)
87,70%
DIVERSOS-_A11_17_01 X 1163 Negativo …
DIVERSOS-_B07_2H_03 X 618 Negativo …
DIVERSOS-_B08_10H_04 X 650 Bacteria (Enterobacter) 85,65%
DIVERSOS-_B09_2_03 X 519 Bacteria (Klebsiella oxytoca) 84,84%
DIVERSOS-_B10_10_04 X 648 Negativo …
DIVERSOS-_B11_18_03 X 573 Negativo …
DIVERSOS-_C07_3H_05 X 576 Bacteria (Enterobacter sp) 93,32%
DIVERSOS-_C08_11H_06 X 965 Bacteria (Enterobacter sp.) 92,51%
DIVERSOS-_C09_3_05 X 627
Bacteria (Phytobacter
diazotrophicus)
86,91%
DIVERSOS-_C10_11_06 X 979 Ninguna …
DIVERSOS-_C11_19_05 X 950 Ninguna …
DIVERSOS-_D07_4H_07 X 679 bacteria no cultivada 90,18%
DIVERSOS-_D08_12H_08 X 678
Bacteria (Staphylococcus
haemolyticus)
85,37%
DIVERSOS-_D09_4_07 X 983
Bacteria (Phytobacter
diazotrophicus)
89,23%
DIVERSOS-_D10_12_08 X 578 Bacteria (Pseudomonas sp.) 87,07%
DIVERSOS-_E07_5H_09 X 926 Ninguna …
DIVERSOS-_E08_13H_10 X 634
Bacteria (uncultured beta
proteobacterium)
73,24%
DIVERSOS-_E09_5_09 X 981
Bacteria (klebsiella
pneumoniae)
89,35%
DIVERSOS-_E10_13_10 X 1057 Ninguna …
DIVERSOS-_F07_6H_11 X 619 Bacteria (Enterobacter ludwigii) 96,22%
DIVERSOS-_F09_6_11 X 956 Bacteri (Klebsiella sp) 83,93%
DIVERSOS-_F10_14_12 X 1204 Ninguna …
DIVERSOS-_G07_7H_13 X 615 Bacteria (Kosakonia oryzae) 92,16%
DIVERSOS-_G09_7_13 X 935 Ninguna …
DIVERSOS-_G10_15_14 X 950 Bacteria (Enterobacter cloacae) 96,28%
DIVERSOS-_H07_8H_15 X 1101 Ninguna …
DIVERSOS-_H09_8_15 X 1262 Ninguna …
DIVERSOS-_H10_16_16 X 948 Bacteria (Enterobacter) 84,59%
Elaboración propia
11. UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERÍA AMBIENTAL
De los 32 datos, 13 son malas debido a que tienen sombras, ruido, la secuencia pierde
bruscamente la señal y caen. Las buenas por el contrario tienen menos ruido y menos
sombras.
Podemos observar que nuestros porcentajes son iguales entre los resultados regulares
y malos. Los regulares nos muestran una secuencia poco deforme.
❖ ZIP SeqsHerbert
SeqsHerbert
CÓDIGO
CALIDAD DE LA SECUENCIA
TAMAÑO DE LA
SECUENCIA
ORGANISMOS
% de
identidad
BUENA MALA REGULAR
USER_04set2007_01-419NZ_A01_01 X 950 Ninguna 0,00%
USER_04set2007_02-526NZ_B01_03 X 877 Bacteria (Klebsiella variicola) 86,71%
USER_04set2007_03-419AZ_C01_05 X 895 Bacteria (Klebsiella sp) 97,35%
USER_04set2007_04-88NZ_D01_07 X 872 Bacteria (Klebsiella pneumoniae) 94,39%
USER_04set2007_05-88AZ_E01_09 X 839 Bacteria (Klebsiella pneumoniae) 93,07%
MALAS 13
REGULAR 13
BUENAS 6
TOTAL 32
40%
40%
20%
PORCENTAJES
MALAS REGULAR BUENAS
12. UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERÍA AMBIENTAL
USER_04set2007_06-526Y1_F01_11 X 989 Bacteria (Klebsiella pneumoniae) 95,91%
USER_04set2007_07-419Y1_G01_13 X 980 Bacteria (Enterobacter) 98,61%
USER_04set2007_08-375H_H01_15 X 1002 Ninguna 0,00%
USER_04set2007_09-419YZ_A02_02 X 329 Bacteria no Cultivada 96,45%
USER_04set2007_10-88H_B02_04 X 971 Ninguna 0,00%
USER_04set2007_11-375NZ_C02_06 X 976 Ninguna 0,00%
USER_04set2007_12-526YZ_D02_08 X 880 Bacteria (Klebsiella sp) 95,50%
USER_04set2007_13-483NZ_E02_10 X 587 Bacteria (Enterobacter sp) 91,07%
USER_04set2007_14-483H_F02_12 X 536 Bacteria (Enterobacter asburiae) 86,09%
USER_04set2007_15-456NZ_G02_14 X 903 Bacteria (Bacillus sp) 91,48%
Elaboración propia
De los 15 datos, 4 son malas debido a que tienen sombras, ruido, la secuencia pierde
bruscamente la señal y caen. Las buenas por el contrario tienen menos ruido y menos
sombras.
Podemos observar que existen más resultados buenos que malos, lo que significa que
gran parte de las secuencias no presentaban tanto ruido ni sombras.
MALAS 4
REGULAR 2
BUENAS 9
TOTAL 15
27%
13%
60%
PORCENTAJES
MALAS REGULAR BUENAS
13. UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERÍA AMBIENTAL
❖ ZIP SeqsHerbert_9
SeqsHerbert_9
CÓDIGO
CALIDAD DE LA SECUENCIA TAMAÑO DE
LA
SECUENCIA
ORGANISMOS
% de
identidad
BUENA MALA REGULAR
user_12set2007_01_A03_01 X 942
Bacteria (Kosakonia
radicincitans)
81,90%
user_12set2007_02_B03_03 X 1024 Ninguna 0,00%
user_12set2007_03_C03_05 X 997
Bacteria (Klebsiella
variicola)
75,12%
user_12set2007_04_D03_07 X 893
Bacteria (Kosakonia
oryzae)
81,30%
user_12set2007_05_E03_09 X 921
Bacteria (Enterobacter
sp.)
89,23%
user_12set2007_06_F03_11 X 1347 Ninguna 0,00%
user_12set2007_07_G03_13 X 1185 Ninguna 0,00%
user_12set2007_08_H03_15 X 991 Ninguna 0,00%
user_12set2007_09_A04_02 X 1163 Ninguna 0,00%
user_12set2007_10_B04_04 X 964
Bacteria (uncultured
Treponema)
77,06%
user_12set2007_11_C04_06 X 959 Ninguna 0,00%
user_12set2007_12_D04_08 X 860 Ninguna 0,00%
user_12set2007_13_E04_10 X 928 Ninguna 0,00%
user_12set2007_14_F04_12 X 977 Bacteria (Pantoea deleyi) 94,92%
user_12set2007_15_G04_14 X 944
Bacteria (Klebsiella
variicola)
89,38%
user_12set2007_16_H04_16 X 959 Ninguna 0,00%
usuarios_12set2007_1Y2_F04_12 X 984
Bacteria (proteobacterium
no cultivado)
81,62%
usuarios_12set2007_2Y2_G04_14 X 1005
Bacteria (Herbaspirillum
seropedicae)
81,20%
usuarios_12set2007_3Y2_H04_16 X 1006 Ninguna 0,00%
usuarios_12set2007_17_A04_02 X 1056 Ninguna 0,00%
usuarios_12set2007_18_B04_04 X 951 Bacteria (Enterobacter sp.) 79,83%
usuarios_12set2007_19_C04_06 X 1116 Ninguna 0,00%
usuarios_12set2007_20_D04_08 X 949 Ninguna 0,00%
usuarios_12set2007_21_E04_10 X 866 Ninguna 0,00%
Elaboración propia
De los 24 datos, 14 son malas debido a que tienen sombras, ruido, la secuencia pierde
bruscamente la señal y caen. Las buenas por el contrario tienen menos ruido y menos
sombras.
MALAS 14
REGULAR 9
BUENAS 1
TOTAL 24
14. UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERÍA AMBIENTAL
Observar que existen más resultados malos que buenos, lo que significa que hubo
mucho ruido sombras y caídas.
5 CONCLUSIÓN
Todas nuestras secuencias presentaban caídas, ruido y sombras. Algunas menos
que otras y de acuerdo a lo visto es los electroferogramas lo dividimos en BUENA,
MALA y REGULAR. Sin embargo, a pesar de la presencia de caídas, ruidos y
sombras, nuestras secuencias problema fueron identificadas por la base de datos
de BLAST. Donde la mayoría de los organismos fueron BACTERIAS y otras fueron
bacterias sin cultivar, por otro lado, también hubo secuencias que el algoritmo del
BLAS no pudo reconocer, ya que, estas tenían mucho ruido, sombras y caídas.
58%
38%
4%
PORCENTAJES
MALAS REGULAR BUENAS
15. UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERÍA AMBIENTAL
6 BIBLIOGRAFÍA
Biological sequence alignment editor, Bio Edit (s.f.) Consultado en línea el 15 de
septiembre del 2021 en: http //www.mbio.ncsu.edu/bioedit/bioedit.html
NIH. (2021). Herramientas básicas de búsqueda de alineación local. BLAST.
Consultado en línea en: https://blast.ncbi.nlm.nih.gov/Blast.cgi
MICINN. (2020). Secuenciación Genética: ¿Qué es y para qué sirve?
https://www.conprueba.es/sites/default/files/noticias/2020-
04/SECUENCIACI%C3%93N%20GEN%C3%89TICA_1.pdf
MICINN. (2020). ¿Qué es la secuenciación genética? Una herramienta más para
combatir el nuevo coronavirus.
https://www.isciii.es/InformacionCiudadanos/DivulgacionCulturaCientifica/D
ivulgacionISCIII/Paginas/Divulgacion/InformeCoronavirusSecuenciacion.as
px