En el presente trabajo se analiza el estudio del gen ribosomal 16S, mediante la secuenciación de Sanger, el cual se basa en la polimerización del ADN y la utilización de dideoxinucleótidos que sirven como terminadores de la reacción.
Además, cabe señalar que en el Centro Nacional para la Información Biotecnológica (NCBI) se depositan algunos de los cromatogramas obtenidos en los proyectos de secuenciación. Es así como a partir de los cromatogramas se obtiene la secuencia de nucleótidos.
Informe nro.01 análisis de secuencias del gen 16 s
1. BIOTECNOLOGÍA
INFORME N°01
ANÁLISIS DE SECUENCIAS DEL GEN 16S
Estudiante: Marians Romina Luque Checalla
Docente: Prof. Dr. Hebert Hernan Soto Gonzales
Ilo – Perú
Septiembre 19, 2021
VII ciclo
Escuela Profesional de
Ingeniería Ambiental
Facultad de ingenierías:
3. Í n d i c e | 3
Índice
Pág.
1. Introducción....................................................................................................................... 4
2. Objetivos ............................................................................................................................ 5
3. Materiales y métodos ........................................................................................................ 5
3.1. Materiales......................................................................................................................... 5
3.2. Métodos............................................................................................................................ 5
a) Descargar programa BioEdit.......................................................................................... 5
b) Análisis de cromatogramas en BioEdit (Lectura) ......................................................... 5
c) Ingresar a la página oficial del NCBI............................................................................. 6
d) Análisis de cromatogramas con BLAST ........................................................................ 6
e) Toma de información dada por BLAST ........................................................................ 7
4. Resultados.......................................................................................................................... 7
5. Conclusión.......................................................................................................................... 9
Bibliografía.................................................................................................................................. 10
Anexos.......................................................................................................................................... 11
4. I n t r o d u c c i ó n | 4
1. Introducción
La secuenciación de ADN es el proceso que determina la secuencia de bases de los nucleótidos
de un fragmento de ADN del organismo que está siendo analizado.
Así mismo, la idea de secuenciar un genoma completo, es decir, todo el ADN del organismo
aún forma parte de un proceso complejo, ya que, para realizar el proceso de secuenciamiento
es necesario separar o quebrar el ADN del genoma en fragmentos pequeños, seguidamente se
debe secuenciar dichos fragmentos para conocer y descifrar el código genético que tiene el
organismo.
En el presente trabajo se analiza el estudio del gen ribosomal 16S, mediante la secuenciación
de Sanger, el cual se basa en la polimerización del ADN y la utilización de dideoxinucleótidos
que sirven como terminadores de la reacción.
Además, cabe señalar que en el Centro Nacional para la Información Biotecnológica (NCBI)
se depositan algunos de los cromatogramas obtenidos en los proyectos de secuenciación. Es
así como a partir de los cromatogramas se obtiene la secuencia de nucleótidos. No obstante, a
pesar de que este proceso se realiza automáticamente por el programa BLAST de la página del
NCBI, es conveniente revisar el secuenciamiento manualmente (por el programa BioEdit), ya
que, en ciertas ocasiones se producen errores, esto es debido a que mayormente una gran parte
al final del secuenciamiento es inestable, es por ello que, hay que eliminar esa parte.
La calidad es la probabilidad estimada de que cada uno de los nucleótidos secuenciados por el
sistema de secuenciación sean erróneos.
La interpretación de los cromatogramas de secuencia en teoría siempre deberían ser perfectos,
sin embargo, no siempre es así.
5. P á g i n a | 5
2. Objetivos
- Revisar los fundamentos de las técnicas de secuenciación de ácidos nucleicos.
- Efectuar el análisis y la selección de electroferogramas automatizados de secuenciación
mediante la aplicación de software libre BioEdit es específico el estudio del gen ribosomal
16S.
3. Materiales y métodos
3.1.Materiales
- BioEdit
- Página del NCBI (Centro Nacional para la Información Biotecnológica)
- Blast (The basic Local Alignment Search Tool)
- Excel
- Bloc de notas
- Laptop
3.2.Métodos
a) Descargar programa BioEdit
Para la descarga del programa, se utilizó el buscador de Google para encontrar el
instalador. Y una vez encontrado el instalador en una página segura y confiable, se
procede a hacer la descarga respectiva del programa. Consecuentemente, después de
obtener una descarga exitosa, el siguiente paso corresponde a ejecutar el instalador en
la laptop o computador.
b) Análisis de cromatogramas en BioEdit (Lectura)
Seguidamente de la instalación del programa BioEdit. Abrir la secuencia Forward o
“F” con el programa. Se abrirán dos ventanas, una mostrará el cromatograma y otra la
6. P á g i n a | 6
secuencia (Figura 1). Para este procedimiento, se mantiene ambas ventanas abiertas,
ubicándolas en la pantalla de la laptop, de tal manera que ambas puedan verse en
simultáneo. Después de ello, visualizar y analizar el cromatograma y secuencia que
muestra en pantalla, seguidamente recurrir a la opción de “file” y exportar como “fasta”
(Figura 2).
Previamente, debe crear una carpeta específicamente para los archivos exportados en
formato “fasta”, para evitar confusión y desorden.
Abrir el archivo “fasta” guardado mediante el bloc de notas (Figura 3).
c) Ingresar a la página oficial del NCBI
En el buscador de Google colocar “NCBI”. Después de que Google muestre los
resultados de búsqueda, hay dos opciones para ingresar a la página de BLAST.
- Ingresar directamente en la primera opción de resultados de búsqueda “National
Center for Biotechnoly Information”, para luego ir al apartado de “Popular
Resources” y hacer click en “BLAST”
- Ingresar directamente a la segunda opción de la primera columna que aparece
debajo de la página oficial del NCBI. Esta opción está titulada como BLAST. Esta
opción es la más directa.
d) Análisis de cromatogramas con BLAST
- Ingresar a la opción “Nucleotide BLAST” (Figura 4).
- Copiar la secuencia guardada anteriormente en formato FASTA en el apartado
“Enter Query Sequence” (Figura 5).
- Colocar en Optimize for para Somewhat similar sequences (blastn) (Figura 6).
- Dar click en el botón “BLAST” y esperar los resultados (Figura 7).
7. P á g i n a | 7
e) Toma de información dada por BLAST
Previamente en Excel realizar una tabla en la que se va a organizar la información de
algunos fragmentos del gen ribosómico de organismos unicelulares.
Seguidamente extraer los datos del resultado de BLAST y colocarlos en el apartado
específico que indica la tabla (Tabla 1, 2 y 3).
4. Resultados
Los resultados obtenidos fueron colocados y organizados en una tabla en Excel, de tal manera
que permanezca el orden al momento de anotar la información brindada por el programa y por
la página de BLAST. Es así como, en las siguientes tablas, Tabla 1, Tabla 2 y Tabla 3 se
muestra la información de cada fragmento del gen ribosómico de organismos unicelulares
analizado.
Tabla 1. Análisis de secuencia
CÓDIGO
CALIDAD DE SECUENCIA TAMAÑO DE
SECUENCIA
ORGANISMO
%
IDENTIDAD
BUENA MALA REGULAR
DIVERSOS-_A07_1H_01.ab1 X 978 Negativo Negativo
DIVERSOS-_A08_9H_02.ab1 X 908 Herbaspirillum seropedicae 88.73%
DIVERSOS-_A09_1_01.ab1 X 1007 Pseudomonas putida 83.21%
DIVERSOS_A10_9_02.ab1 X 925 uncultured bacterium 86.14%
DIVERSOS-_A11_17_01.ab1 X 1163 Negativo Negativo
DIVERSOS-_B07_2H_03.ab1 X 944 Stenotrophomonas sp. UYSB32 74.24%
DIVERSOS-_B08_10H_04.ab1 X 958 Leclercia adecarboxylata 83.45%
DIVERSOS-_B09_2_03.ab1 X 939 Klebsiella grimontii 82.35%
DIVERSOS-_B10_10_04.ab1 X 1020 Enterobacter soli 71.76%
DIVERSOS-_B11_18_03.ab1 X 993 uncultured Pseudomonas sp. 72.62%
DIVERSOS-_C07_3H_05.ab1 X 963 Leclercia adecarboxylata 91.9%
DIVERSOS-_C08_11H_06.ab1 X 965 Enterobacter mori 91.07%
DIVERSOS-_C09_3_05.ab1 X 944 Phytobacter diazotrophicus 86.58%
DIVERSOS-_C10_11_06.ab1 X 979 uncultured Pseudomonas sp. 69.01%
DIVERSOS-_C11_19_05.ab1 X 950 Klebsiella aerogenes 69.01%
DIVERSOS-_D07_4H_07.ab1 X 928 uncultured bacterium 90.18%
DIVERSOS-_D08_12H_08.ab1 X 963 Staphylococcus sp. US-13 84.27%
DIVERSOS-_D09_4_07.ab1 X 983 Phytobacter diazotrophicus 88.43%
DIVERSOS-_D10_12_08.ab1 X 986 Pseudomonas putida 81.82%
DIVERSOS-_E07_5H_09.ab1 X 926 Negativo Negativo
DIVERSOS-_E08_13H_10.ab1 X 932 Paraburkholderia silvatlantica 79.97%
DIVERSOS-_E09_5_09.ab1 X 981
Enterobacter hormaechei subsp.
Xiangfangensis
85.02%
DIVERSOS-_E10_13_10.ab1 X 1057 uncultured bacterium 67.47%
DIVERSOS-_F07_6H_11.ab1 X 915 Enterobacter ludwigii 95.89%
DIVERSOS-_F09_6_11.ab1 X 956 Klebsiella sp. 81.75%
DIVERSOS-_F10_14_12.ab1 X 1204 Negativo Negativo
DIVERSOS-_G07_7H_13.ab1 X 931 Enterobacter sp. ICBR 189 91.07%
DIVERSOS-_G09_7_13.ab1 X 935 uncultured Enterobacter sp. 73.78%
DIVERSOS-_G10_15_14.ab1 X 950 Enterobacter asburiae 93.4%
DIVERSOS-_H07_8H_15.ab1 X 1101 Negativo Negativo
DIVERSOS-_H09_8_15.ab1 X 1262 Negativo Negativo
DIVERSOS-_H10_16_16.ab1 X 948 Enterobacter sp. IICDBZ9 84.42%
Fuente: Elaboración propia.
8. P á g i n a | 8
Tabla 2. Análisis de secuencia
CÓDIGO
CALIDAD DE SECUENCIA TAMAÑO DE
SECUENCIA
ORGANISMO
%
IDENTIDAD
BUENA MALA REGULAR
USER_04set2007_01-
419NZ_A01_01.ab1
X 950 Klebsiella michiganensis 74.54%
USER_04set2007_02-
526NZ_B01_03.ab1
X 877 Klebsiella variicola 85.85%
USER_04set2007_03-
419AZ_C01_05.ab1
X 895 Klebsiella sp. MPUS7 97.35%
USER_04set2007_04-
88NZ_D01_07.ab1
X 872 Klebsiella pneumoniae 94.39%
USER_04set2007_05-
88AZ_E01_09
X 839 Klebsiella pneumoniae 93.25%
USER_04set2007_06-
526Y1_F01_11
X 989 Klebsiella pneumoniae 95.91%
USER_04set2007_07-
419Y1_G01_13.ab1
X 980 Enterobacter sp. WF14-6 98.61%
USER_04set2007_08-
375H_H01_15.ab1
X 1002 Klebsiella oxytoca 73.75%
USER_04set2007_09-
419YZ_A02_02.ab1
X 896 Enterobacter sp. CB7 95.81%
USER_04set2007_10-
88H_B02_04.ab1
X 971 endosymbiont of Sphenophorus 72.46%
USER_04set2007_11-
375NZ_C02_06.ab1
X 976 uncultured bacterium 75.43%
USER_04set2007_12-
526YZ_D02_08.ab1
X 880 Klebsiella sp. BR3357 95.25%
USER_04set2007_13-
483NZ_E02_10.ab1
X 891 Enterobacter sp. 88.89%
USER_04set2007_14-
483H_F02_12.ab1
X 947 Enterobacter hormaechei 88.47%
USER_04set2007_15-
456NZ_G02_14.ab1
X 903 Bacillus thuringiensis 91.54%
Fuente: Elaboración propia.
Tabla 2. Análisis de secuencia
CÓDIGO
CALIDAD DE SECUENCIA TAMAÑO DE
SECUENCIA
ORGANISMO
%
IDENTIDAD
BUENA MALA REGULAR
user_12set2007_01_A03_01.ab1 X 942 Klebsiella oxytoca 77.87%
user_12set2007_02_B03_03.ab1 X 1024 uncultured soil bacterium 71.52%
user_12set2007_03_C03_05.ab1 X 997 Klebsiella variicola 74.5%
user_12set2007_04_D03_07.ab1 X 983 Kosakonia oryzae 80.55%
user_12set2007_05_E03_09.ab1 X 921 Klebsiella pneumoniae 85.05%
user_12set2007_06_F03_11.ab1 X 1347 Negativo Negativo
user_12set2007_07_G03_13.ab1 X 1185 Negativo Negativo
user_12set2007_08_H03_15.ab1 X 991 uncultured bacterium 72.17%
user_12set2007_09_A04_02.ab1 X 1163 Negativo Negativo
user_12set2007_10_B04_04.ab1 X 964 Achromobacter sp. 76.67%
user_12set2007_11_C04_06.ab1 X 959 Enterobacter cloacae 72.58%
user_12set2007_12_D04_08.ab1 X 860
Enterobacteriaceae
bacterium HGH0104
85.71%
user_12set2007_13_E04_10.ab1 X 928 Pantoea stewartii 71.86%
user_12set2007_14_F04_12.ab1 X 977 Pantoea deleyi 75.82%
user_12set2007_15_G04_14.ab1 X 944 Klebsiella quasivariicola 88.22%
user_12set2007_16_H04_16.ab1 X 959 Kosakonia sacchari 77.42%
usuarios_12set2007_1Y2_F04_12.ab1 X 984 Kosakonia radicincitans 79.2%
usuarios_12set2007_2Y2_G04_14.ab1 X 1005 Herbaspirillum sp. 86.75%
usuarios_12set2007_3Y2_H04_16.ab1 X 1006 Klebsiella sp. MB42 79.04%
usuarios_12set2007_17_A04_02.ab1 X 1056 Rhizobium lusitanum 71.09%
usuarios_12set2007_18_B04_04.ab1 X 951 Enterobacter sp. 78.88%
usuarios_12set2007_19_C04_06.ab1 X 1116 Pseudomonas jessenii 67.07%
usuarios_12set2007_20_D04_08.ab1 X 949 Klebsiella pneumoniae 73.08%
usuarios_12set2007_21_E04_10.ab1 X 866 uncultured bacterium 74.24%
Fuente: Elaboración propia.
9. C o n c l u s i ó n | 9
5. Conclusión
- La opción BLAST que brinda la página del NCBI es conveniente para todo investigador
que desee analizar el secuenciamiento del genoma objetivo de su investigación, ya que no
hay necesidad de descargar algún programa externo para conocer el código, nombre
científico, porcentaje de identidad, y entre otras características del genoma para proceder
con la respectiva identificación de calidad del secuenciamiento de cada fragmento del
genoma.
- El programa BioEdit sirve para la edición de alineamientos y el análisis de secuencias, no
obstante, en el presente trabajo se utilizó solamente para la visualización y el análisis de
secuencias del genoma para la identificación de la calidad de secuencia de cada fragmento
de ADN.
- El programa BioEdit se complementa con BLAST con respecto a la identificación y análisis
del organismo unicelular objeto en el presente trabajo. La utilización de ambos programas
facilitó y sirvió para obtener información específica de cada fragmento del gen ribosomal
16S.
10. B i b l i o g r a f í a | 10
Bibliografía
Bioinformatics at COMAV (s.f.). Secuenciación de Sanger. Enlace:
https://bioinf.comav.upv.es/courses/intro_bioinf/sanger.html
Bioinformatics at COMAV (s.f.). Búsqueda de secuencias utilizando BLAST. Enlace:
https://bioinf.comav.upv.es/courses/intro_bioinf/practica_blast.html
Curso de Análisis Químico. (s.f.). Introducción a las separaciones analíticas. Enlace:
https://aulavirtual.agro.unlp.edu.ar/pluginfile.php/35288/mod_resource/content/1/2%20cromatog
rafia%202017.pdf
Khan Academy (s.f.). Secuenciación del ADN. Biotecnología.
11. A n e x o s | 11
Anexos
Figura 1. Cromatograma y secuencia del fragmento del genoma
Nota: El programa BioEdit permite la visualización y análisis de secuencia del genoma. Si el
cromatograma contiene varias “N” en la secuencia, es índice de tener una mala calidad de
secuencia.
Figura 2. Exportación FASTA
Nota: Guardar el archivo Fasta en una carpeta exclusivamente para estos archivos, de tal modo
que se evitará desorden y pérdida de algunos archivos.
12. A n e x o s | 12
Figura 3. Analizar la secuencia en el block de notas
Nota: Al seleccionar el archivo FASTA, seleccionar la opción de abrir con bloc de notas.
Figura 4. Nucleotide BLAST
Nota: Después de ingresar a la página del NCBI. Ingresar a la opción de BLAST y seleccionar
“Nucleotide BLAST”
13. A n e x o s | 13
Figura 5. Enter Query Sequence
Nota: Colocar la secuencia copiada del bloc de notas en el apartado que se muestra en la figura
(No mover, ni aumentar nada)
Figura 6. Program Selection
Figura 7. BLAST
Nota: Seleccionar la opción BLAST y esperar un corto tiempo, para obtener resultados del
secuenciamiento.
14. A n e x o s | 14
Figura 8. Resultado de BLAST
Nota: Anotar el tamaño de secuencia “Query Lenght”.
Figura 9. Resultado de BLAST. Identificación específica del genoma
Nota: Anotar la primera opción de las columnas Scientific Name & Per. Ident.
Figura 10. Relleno de datos en Excel
Nota: Realizar el mismo procedimiento con todos los fragmentos del genoma objeto y colocarlos
en una tabla y dividirlos según la información que se necesite.