1. UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERÍA AMBIENTAL
INFORME Nº 1 PRACTICA VIRTUAL - ANALISIS DE SECUENCIAS
DEL GEN 16S
CURSO : BIOTECNOLOGIA
SEMESTRE : VII
DOCENTE : DR. HEBERT SOTO
ALUMNA : EMILY CUSILAYME ROMERO
ILO - PERÙ
2021
2. CONTENIDO
1. INTRODUCCIÓN:.......................................................................................................................3
2. OBJETIVOS: ................................................................................................................................4
3. MARCO TEORICO:....................................................................................................................4
3.1. SECUENCIACIÓN DEL ADN: ..........................................................................................4
3.1.1. ¿QUÉ ES LA SECUENCIACIÓN DEL ADN?: ........................................................4
3.1.2. ¿QUÉ TAN RECIENTE ES LA SECUENCIACIÓN DE ADN? .............................5
3.1.3. ¿QUÉ NUEVOS MÉTODOS DE SECUENCIACIÓN SE HAN CREADO? .........5
3.1.4. ¿HAY TECNOLOGÍAS DE SECUENCIACIÓN MÁS NUEVAS EN
DESARROLLO?...........................................................................................................................6
3.1.5. ¿QUÉ SIGNIFICAN LAS MEJORAS EN LA SECUENCIACIÓN DEL ADN
PARA LA SALUD HUMANA?...................................................................................................7
4. MATERIALES Y MÉTODOS:...................................................................................................9
4.1. MATERIALES: ....................................................................................................................9
4.1.1. BIOEDIT:......................................................................................................................9
4.1.2. EXCEL: .........................................................................................................................9
4.1.3. NCBI: .............................................................................................................................9
4.2. MÉTODO:...........................................................................................................................10
5. RESULTADOS: ..........................................................................................................................13
6. BIBLIOGRAFÍA.........................................................................................................................16
3. INFORME Nº 1 PRACTICA VIRTUAL - ANALISIS DE SECUENCIAS
DEL GEN 16S
1. INTRODUCCIÓN:
La secuenciación del ADN es un conjunto de métodos y técnicas bioquímicas cuya
finalidad es la determinación del orden de los nucleótidos en un oligonucleótido de ADN.
La secuencia de ADN constituye la información genética heredable que forman la base de
los programas de desarrollo de los seres vivos.
Un cromatograma es una representación gráfica o de otro tipo de la respuesta del detector,
de la concentración del o los analitos en el efluente u otra cantidad usada como una medida
de concentración en el efluente en función del volumen de este o del tiempo.
En el presente informe encontraremos información sobre la secuencia de ácidos nucleicos,
un análisis de secuencias del gen 16s en el cual utilizamos datos proporcionados por el Dr.
Hebert Soto, dichos datos son de su autoría, utilizaremos los programas de BIOEDIT,
BLAST, etc.
BLAST es un programa informático de alineamiento de secuencias de tipo local, ya sea de
ADN, ARN o de proteínas. El programa es capaz de comparar una secuencia problema
contra una gran cantidad de secuencias que se encuentren en una base de datos.
4. 2. OBJETIVOS:
• Revisar los fundamentos de las técnicas de secuenciación de ácidos nucleicos.
• Efectuar el análisis y la selección de electroferogramas automatizados de secuenciación
mediante la aplicación de software libre BIOEDIT en específico el estudio del gen
ribosomal 16S.
3. MARCO TEORICO:
3.1. SECUENCIACIÓN DEL ADN:
3.1.1. ¿QUÉ ES LA SECUENCIACIÓN DEL ADN?:
La secuenciación del ADN significa determinar el orden de los cuatro
componentes básicos químicos, llamados "bases", que forman la molécula de
ADN. La secuencia les informa a los científicos la clase de información
genética que se transporta en un segmento específico de ADN. Por ejemplo,
los científicos pueden usar la información de las secuencias para determinar
qué tramos de ADN contienen genes y qué tramos transportan instrucciones
regulatorias, que activan o desactivan genes. Además, y de manera muy
importante, los datos de las secuencias pueden resaltar los cambios en un gen
que pueden causar enfermedades. (INSTITUTE, 2019)
En la doble hélice de ADN, las cuatro bases químicas se unen siempre
con la misma pareja para formar "pares de bases". Adenina (A) siempre forma
pareja con timina (T); citosina (C) siempre forma pareja con guanina (G). Este
emparejamiento es la base para el mecanismo mediante el que las moléculas
de ADN se copian cuando las células se dividen, y también es la base para los
métodos usados en la mayoría de los experimentos de secuenciación de ADN.
5. El genoma humano contiene alrededor de tres mil millones de pares de bases
que detallan las instrucciones para crear y mantener a un ser humano.
(INSTITUTE, 2019)
3.1.2. ¿QUÉ TAN RECIENTE ES LA SECUENCIACIÓN DE ADN?
Desde la finalización del Proyecto del Genoma Humano, las mejoras
tecnológicas y la automatización han aumentado la velocidad y reducido los
costos al punto en que genes individuales pueden secuenciarse de manera
rutinaria, y en algunos laboratorios se pueden secuenciar más de 100 billones
de bases al año, y un genoma completo puede secuenciarse por tan sólo unos
cuantos miles de dólares. (INSTITUTE, 2019)
Muchas de estas nuevas tecnologías se desarrollaron con el apoyo del
Programa de Tecnología Genómica del Instituto Nacional de Investigación del
Genoma Humano (National Human Genome Research Institute, NHGRI) y
sus concesiones para Tecnología de Secuenciación de ADN Avanzada. Uno
de los objetivos del NHGRI es promover nuevas tecnologías que a la larga
puedan reducir el costo de la secuenciación de un genoma humano a menos de
$1,000 y ser de incluso una calidad mayor a la que es posible hoy en día.
3.1.3. ¿QUÉ NUEVOS MÉTODOS DE SECUENCIACIÓN SE HAN CREADO?
Desde la finalización del Proyecto del Genoma Humano, las mejoras
tecnológicas y la automatización han aumentado la velocidad y reducido los
costos al punto en que genes individuales pueden secuenciarse de manera
rutinaria, y en algunos laboratorios se pueden secuenciar más de 100 billones
de bases al año, y un genoma completo puede secuenciarse por tan sólo unos
cuantos miles de dólares. (INSTITUTE, 2019)
6. Muchas de estas nuevas tecnologías se desarrollaron con el apoyo del
Programa de Tecnología Genómica del NHGRI y sus concesiones para
Tecnología de Secuenciación de ADN Avanzada. Uno de los objetivos del
NHGRI es promover nuevas tecnologías que a la larga puedan reducir el costo
de la secuenciación de un genoma humano a menos de $1,000 y ser de incluso
una calidad mayor a la que es posible hoy en día.
3.1.4. ¿HAY TECNOLOGÍAS DE SECUENCIACIÓN MÁS NUEVAS EN
DESARROLLO?
Una nueva tecnología de secuenciación implica observar moléculas de
ADN-polimerasa a medida que copian el ADN (las mismas moléculas que
producen nuevas copias de ADN en nuestras células) con un microscopio y
una cámara cinematográfica muy rápida, e incorporar distintos colores de
tintes brillantes, uno para cada una de las letras A, T, C y G. Este método ofrece
información muy valiosa y diferente de la que proporcionan los sistemas
instrumentales más frecuentemente utilizados.
Otra nueva tecnología en desarrollo implica el uso de nanoporos para
secuenciar el ADN. La secuenciación del ADN basada en nanoporos implica
ensartar hebras de ADN monocatenario a través de poros muy diminutos en
una membrana. Las bases de ADN se leen una a la vez a medida que pasan
apretadamente por el nanoporo. Las bases se identifican al medir las
diferencias en el efecto que producen en los iones y la corriente eléctrica que
fluye a través del poro. (INSTITUTE, 2019)
El uso de nanoporos para secuenciar ADN ofrece muchas posibles
ventajas en comparación con los métodos actuales. El objetivo es que la
7. secuenciación coste menos y sea más rápida. A diferencia de los métodos de
secuenciación utilizados hoy en día, la secuenciación de ADN por nanoporos
significa que los investigadores pueden estudiar la misma molécula una y otra
vez.
3.1.5. ¿QUÉ SIGNIFICAN LAS MEJORAS EN LA SECUENCIACIÓN DEL
ADN PARA LA SALUD HUMANA?
Los investigadores ahora pueden comparar largos tramos de ADN, de un
millón de bases o más, de distintos individuos rápida y económicamente. Tales
comparaciones pueden generar una enorme cantidad de información acerca de
la función de la herencia en la propensión a enfermedades y en la respuesta a
las influencias ambientales. Además, la capacidad de secuenciar el genoma
más rápidamente y con mayor eficacia en función del costo crea un gran
potencial para el diagnóstico y tratamiento.
Aunque todavía falten muchos años para la secuenciación rutinaria de
ADN en el consultorio médico, algunos centros médicos grandes han
comenzado a usar la secuenciación para detectar y tratar algunas
enfermedades. En el caso del cáncer, por ejemplo, es cada vez más frecuente
que los médicos puedan usar datos de secuenciación para identificar el tipo
específico de cáncer que tenga un paciente. Esto le permite al médico tomar
mejores decisiones para los tratamientos. (INSTITUTE, 2019)
Los investigadores en el Programa de Enfermedades sin Diagnosticar,
financiado por el NHGRI, usan la secuenciación de ADN para tratar de
identificar las causas genéticas de enfermedades poco frecuentes. Otros
8. investigadores están estudiando su uso en la evaluación de recién nacidos para
la detección de enfermedades y el riesgo de enfermedades.
Asimismo, en el proyecto del Atlas del Genoma del Cáncer, financiado
por el NHGRI y el Instituto Nacional del Cáncer, se está usando la
secuenciación del ADN para descifrar los detalles genómicos de unos 30 tipos
de cáncer. En otro programa de los Institutos Nacionales de la Salud se
examina cómo se controla la actividad génica en diferentes tejidos, y la función
de la regulación génica en las enfermedades. En otros proyectos a gran escala,
tanto en curso como planificados, se usa la secuenciación del ADN para
examinar el desarrollo de enfermedades comunes y complejas, tales como las
enfermedades del corazón y la diabetes, y enfermedades hereditarias que
causan deformidades físicas, retraso del desarrollo y enfermedades
metabólicas.
La comparación de las secuencias genómicas de distintos tipos de
animales y organismos, tales como los chimpancés y la levadura, también
puede proporcionar conocimientos sobre la biología del desarrollo y la
evolución. (INSTITUTE, 2019)
9. 4. MATERIALES Y MÉTODOS:
4.1. MATERIALES:
4.1.1. BIOEDIT:
Bioedit es un programa gratuito para edición de alineamientos y análisis de
secuencias que funciona únicamente sobre ambiente MS/Windows. Es, sin lugar
a duda, uno de los programas más conocidos para edición de secuencias para
dicho sistema operativo.
4.1.2. EXCEL:
Microsoft Excel es una hoja de cálculo desarrollada por Microsoft para
Windows, macOS, Android e iOS. Cuenta con cálculo, gráficas, tablas
calculares y un lenguaje de programación macro llamado Visual Basic para
aplicaciones.
4.1.3. NCBI:
El Centro Nacional para la Información Biotecnológica es parte de la Biblioteca
Nacional de Medicina de Estados Unidos, una rama de los Institutos Nacionales
de Salud. Está localizado en Bethesda y fue fundado el 4 de noviembre de 1988
con la misión de ser una importante fuente de información de biología
molecular.
10. 4.2. MÉTODO:
• Abrimos uno de los archivos con el programa BIOEDIT, se abrirán dos
ventanas una con el electroferograma y otra la secuencia.
• Luego guardaremos el archivo en formato FASTA.
Figura 1 INTERFAZ DE BIOEDIT
Figura 2 FORMATO FASTA
11. • Abrimos el archivo nuevo con el bloc de notas para proceder a copiar la
secuencia.
• Copiamos la secuencia y la llevamos a analizar en el BLAST, pegamos la
secuencia en el apartado que corresponde.
• Activamos la opción de “mostrar en una nueva ventana” y damos click en
BLAST.
Figura 3 BLOC DE NOTAS
Figura 4 INTEFAZ DE BLAST
12. • Se abrirá otra ventana y nos darán los resultados y datos que necesitamos para
nuestro análisis como la longitud de la secuencia, el nombre científico y el
porcentaje de identidad.
Figura 6 ACTIVACIÓN DE OPCION
Figura 5 obtencion de datos
13. 5. RESULTADOS:
N° CÓDIGO
CALIDAD DE LA
SECUENCIA
TAMAÑO
DE LA
SECUENCIA
ORGANISMO
% DE
IDENTIDAD
BUENA MALA REGULAR
1 DIVERSOS-_H10_16_16.ab1 X 948 Enterobacter sp. IICDBZ9 84,59%
2 DIVERSOS-_H09_8_15.ab1 X 1262 NEGATIVO 0%
3 DIVERSOS-_H07_8H_15.ab1 X 1101 NEGATIVO 0%
4 DIVERSOS-_G10_15_14.ab1 X 950 Enterobacter cloacae 96,28%
5 DIVERSOS-_G09_7_13.ab1 X 935 NEGATIVO 0%
6 DIVERSOS-_G07_7H_13.ab1 X 931 Kosakonia oryzae 92,16%
7 DIVERSOS-_F10_14_12.ab1 X 1204 NEGATIVO 0%
8 DIVERSOS-_F09_6_11.ab1 X 956 Klebsiella sp. 83,93%
9 DIVERSOS-_F07_6H_11.ab1 X 915 Enterobacter ludwigii 96,22%
10 DIVERSOS-_E10_13_10.ab1 X 1057 NEGATIVO 0%
11 DIVERSOS-_E09_5_09.ab1 X 981 Klebsiella pneumoniae 89,35%
12 DIVERSOS-_E08_13H_10.ab1 X 932 beta proteobacteria no cultivada 73,24%
13 DIVERSOS-_E07_5H_09.ab1 X 926 NEGATIVO 0%
14 DIVERSOS-_D10_12_08.ab1 X 986 Pseudomonas guariconensis 83,87%
15 DIVERSOS-_D09_4_07.ab1 X 983 Phytobacter diazotrophicus 89,23%
16 DIVERSOS-_D08_12H_08.ab1 X 963 bacteria no cultivada 85,40%
17 DIVERSOS-_D07_4H_07.ab1 X 928 bacteria no cultivada 90,18%
18 DIVERSOS-_C11_19_05.ab1 X 950 NEGATIVO 0%
19 DIVERSOS-_C10_11_06.ab1 X 979 NEGATIVO 0%
20 DIVERSOS-_C09_3_05.ab1 X 944 Phytobacter diazotrophicus 86,91%
21 DIVERSOS-_C08_11H_06.ab1 X 965 Enterobacter sp. NA10140 92,51%
22 DIVERSOS-_C07_3H_05.ab1 X 963 Enterobacter sp. NA10140 92,53%
14. 23 DIVERSOS-_B11_18_03.ab1 X 993 NEGATIVO 0%
24 DIVERSOS-_B10_10_04.ab1 X 1020 NEGATIVO 0%
25 DIVERSOS-_B09_2_03.ab1 X 939 Klebsiella oxytoca 84,01%
26 DIVERSOS-_B08_10H_04.ab1 X 958 Leclercia adecarboxilata 85,62%
27 DIVERSOS-_B07_2H_03.ab1 X 944 NEGATIVO 0%
28 DIVERSOS-_A11_17_01.ab1 X 1163 NEGATIVO 0%
29 DIVERSOS-_A10_9_02.ab1 X 925 bacteria no cultivada 87,70%
30 DIVERSOS-_A09_1_01.ab1 X 1007 Pseudomonas sp. 82,08%
31 DIVERSOS-_A08_9H_02.ab1 X 908 Herbaspirillum seropedicae 91,51%
32 DIVERSOS-_A07_1H_01.ab1 X 978 NEGATIVO 0%
33 USER_04set2007_15-456NZ_G02_14.ab1 X 903 Bacillus sp. S82 91,48%
34 USER_04set2007_14-483H_F02_12.ab1 X 947 Enterobacter asburiae 86,09%
35 USER_04set2007_13-483NZ_E02_10.ab1 X 891 Enterobacter sp. 89,55%
36 USER_04set2007_12-526YZ_D02_08.ab1 X 880 Klebsiella sp. BR3357 95,25%
37 USER_04set2007_11-375NZ_C02_06.ab1 X 976 NEGATIVO 0%
38 USER_04set2007_10-88H_B02_04.ab1 X 971 NEGATIVO 0%
39 USER_04set2007_09-419YZ_A02_02.ab1 X 896 bacteria no cultivada 96,45%
40 USER_04set2007_08-375H_H01_15.ab1 X 1002 NEGATIVO 0%
41 USER_04set2007_07-419Y1_G01_13.ab1 X 980 Enterobacter sp. WF14-6 98,61%
42 USER_04set2007_06-526Y1_F01_11.ab1 X 989 Klebsiella pneumoniae 95,91%
43 USER_04set2007_05-88AZ_E01_09.ab1 X 839 Klebsiella pneumoniae 93,07%
44 USER_04set2007_04-88NZ_D01_07.ab1 X 872 Klebsiella pneumoniae 94,39%
45 USER_04set2007_03-419AZ_C01_05.ab1 X 895 Klebsiella sp. MPUS7 97,35%
46 USER_04set2007_02-526NZ_B01_03.ab1 X 877 Klebsiella variicola 86,71%
47 USER_04set2007_01-419NZ_A01_01.ab1 X 950 NEGATIVO 0%
48 usuarios_12set2007_21_E04_10.ab1 X 866 NEGATIVO 0%
49 usuarios_12set2007_20_D04_08.ab1 X 949 NEGATIVO 0%
50 usuarios_12set2007_19_C04_06.ab1 X 1116 NEGATIVO 0%
51 usuarios_12set2007_18_B04_04.ab1 X 951 Enterobacter sp. 79,83%
15. 52 usuarios_12set2007_17_A04_02.ab1 X 1056 NEGATIVO 0%
53 usuarios_12set2007_3Y2_H04_16.ab1 X 1006 NEGATIVO 0%
54 usuarios_12set2007_2Y2_G04_14.ab1 X 1005 Herbaspirillum seropedicae 81,20%
55 usuarios_12set2007_1Y2_F04_12.ab1 X 984 proteobacterias no cultivadas 81,62%
56 user_12set2007_16_H04_16.ab1 X 959 NEGATIVO 0%
57 user_12set2007_15_G04_14.ab1 X 944 Klebsiella variicola 89,38%
58 user_12set2007_14_F04_12.ab1 X 977 Pantoea deleyi 94,92%
59 user_12set2007_13_E04_10.ab1 X 928 NEGATIVO 0%
60 user_12set2007_12_D04_08.ab1 X 860 NEGATIVO 0%
61 user_12set2007_11_C04_06.ab1 X 959 NEGATIVO 0%
62 user_12set2007_10_B04_04.ab1 X 964
clon RsDiSp8 de Treponema no
cultivado
77,06%
63 user_12set2007_09_A04_02.ab1 X 1163 NEGATIVO 0%
64 user_12set2007_08_H03_15.ab1 X 991 NEGATIVO 0%
65 user_12set2007_07_G03_13.ab1 X 1185 NEGATIVO 0%
66 user_12set2007_06_F03_11.ab1 X 1347 NEGATIVO 0%
67 user_12set2007_05_E03_09.ab1 X 921 Enterobacter sp. 89,23%
68 user_12set2007_04_D03_07.ab1 X 983 Kosakonia oryzae 81,30%
69 user_12set2007_03_C03_05.ab1 X 997 Klebsiella variicola 75,12%
70 user_12set2007_02_B03_03.ab1 X 1024 NEGATIVO 0%
71 user_12set2007_01_A03_01.ab1 X 942 Kosakonia radicincitans 81,90%
• Como resultado tenemos 30 secuencias malas, 26 regulares y 15 secuencias regulares.
16. 6. BIBLIOGRAFÍA
INSTITUTE, N. H. (09 de SETIEMBRE de 2019). NATIONAL HUMAN GENOME
RESEARCH INSTITUTE. Obtenido de https://www.genome.gov/es/about-
genomics/fact-sheets/Secuenciacion-del-ADN
21%
42%
37%
RESULTADOS
BUENAS
MALAS
REGULARES