Este documento describe los pasos del proceso de secuenciamiento del virus de la inmunodeficiencia humana tipo 1 (VIH-1). Incluye la preparación de la muestra, la extracción de ARN, la transcripción inversa, la reacción en cadena de la polimerasa, el ciclo de secuenciación, y el análisis de resultados. El objetivo es determinar la secuencia del genoma del VIH-1 para identificar mutaciones asociadas con resistencia a medicamentos antirretrovirales.
2. Virus responsable del SIDA (las personas pueden
tener VIH y no desarrollar SIDA)
9 genes: gag, pol, env, tat, rev, nef, vif, vpr, vpu
gag – proteinas estructurales
pol – enzimas
env – glicoproteinas
Tropismo puede ser R5, X4 o X4R5
Virus entra a las celulas en medio de replicación
No hay membrana nuclear, por lo tanto el ADN viral se
puede incorporar en el genoma humano
ACERCA DEL VIH-1
5. PROCESO GENERAL VIROSEQ
Preparación de muestra
(aislamiento de plasma)
Extracción de ARN
Transcripción inversa (RT)
Reacción de cadena de la
polimerasa (PCR)
Ciclo de secuencia (usando
Big Dye Terminators)
Análisis de resultados
(revisión y reporte)
8. Siguiendo el protocolo
Soluciones utilizadas:
Lyse: para romper el virus y liberar ARN
Isopropanol 100%: precipita el ARN
Etanol 70%: humecta el ARN antes de diluirlo
RNA diluent: disuelve ARN en solución
EXTRACCIÓN DE ARN
9. Siguiendo el protocolo y la hoja de trabajo
Soluciones utilizadas
RT-mix: contiene deoxynucleotidos y 1 tipo de primer
RNAse inhibitor: evita la degradación de ARN
MuLV: la enzima que polimeriza cADN
DTT: Afloja la estructura segundaria de ARN
TRANSCRIPCIÓN INVERSA
10. Siguiendo el protocolo y la hoja de trabajo
Soluciones utilizadas
PCR-mix: contiene deoxynucleotidos y 2 tipos de primer
Amplitaq Gold: polimerasa de ADN
UNG: regulación de contaminantes
Destruye las cadenas de ADN que contienen deoxyuridina
REACCIÓN DE CADENA DE LA POLIMERASA
11. ELECTROFORESIS EN GEL
Para asegurar que se amplificó el ADN
Se diluyen los amplicones de acuerdo con cuanto
ADN contienen
Control
negativo (5) y
positivo (6)
Se pueden observar la escalera de
peso (1,6), las muestras y control
positivo (2 – 4), y control negativo (5)
12. PURIFICACIÓN DE PRODUCTOS DE PCR
Exosap (PCR cleanup reagent)
Elimina los nucleótidos libres que sobraron
Evita “noise” en ciclo de secuenciación
13. CICLO DE SECUENCIACIÓN
BigDye Terminators
Dideoxynucleótidos etiquetados con colores
fluorescentes
Hay 7 primers (A – H pero no E)
Se agregan a un plato de 96 pocillos
Se polimeriza por 25 ciclos
Habrán fragmentos de ADN
de diversas longitudes
El color fluorescente es
detectado por el Genetic
Analyzer 3130xl
14. ANÁLISIS DE RESULTADOS (REVISOR 1)
La data cruda se analiza en Sequencher
Se corta cada secuencia
Se cambian las bases equivocadas, y se marcan
las ambigüedades
Se anotan las bases ambiguas en la hoja de
Edición de Secuencias
15. ANÁLISIS DE RESULTADOS (REVISOR 2)
Se compara la secuencia con una de wild type
Wild type VIH es una secuencia fasta que se obtiene
por el internet y es usada universalmente
Wild type VIH no contiene mutaciones de resistencia
Se crea una secuencia consenso
La secuencia consenso se copia a la base de datos
de Stanford
Substituciones: K103N
Inserciones: Se agrega “i” al final
Se añade la información a la base de ICGES
17. Se utiliza para re-analizar muestras
Usa QIAmp Mini Spin
Se pasan las muestras 2 veces por PCR
PROCESO GENERAL GENOTIPAJE ABIERTO
Notas del editor
Buenos días, presentaré lo que he aprendido en las dos semanas de pasantía en la sección de secuenciamiento.
Primeramente, aprendí más sobre el virus de inmunodeficiencia humana, conocido como VIH.
En secuenciamiento, se realizan genotipajes de VIH-1 solamente, aunque existe VIH-2, cual es menos patogénico que el otro.
El VIH es responsable de la enfermedad del SIDA. Esta enfermedad pone en riesgo el sistema inmune, porque reduce la cantidad de células linfáticas CD4 que son necesarias para combatir infecciones oportunistas.
El VIH tiene los 9 genes listados aquí. Los más importantes que son atacados por los medicamentos son gag, pol y env. Específicamente, se secuencian el entero gen de proteasa y 2/3 de transcriptasa inversa localizados en pol.
El virus ataca a las celulas CD4 usando este receptor y uno o dos correceptores. El tipo de virus que usa CCR5 se le dice que tiene un tropismo de R5, el que usa CXCR4 como tropismo de X4, y si usa los dos correceptores, tropismo de X4R5.
El virus contiene dos copias de ARN, que en la célula se convierten en ADN y son incorporados en el genoma humano mientras la célula está en medio de replicación. Como la membrana nuclear ha sido temporalmente destruida, el ADN viral se puede incorporar en el genoma fácilmente.
La estructura del virus es como se puede observar en el diagrama.
Tiene dos glicoproteínas importantes en la membrana que interactúan con los receptores de las células CD4: gp120 y gp41.
En su interior tiene doble cobertura de proteína, una hecha de p17 y la capsid que está hecha por p24. En medio de estas dos estructuras se encuentran las proteasas.
En el interior de la capsid están dos copias de ARN, transcriptasa inversa, integrasa y otras proteínas.
Esta gráfica muestra la progresión natural de una persona VIH+.
Como se puede observar, la infección causa un rápido aumento de carga viral, mientras el número de células CD4 baja.
Después de unas semanas, en las cuales los anticuerpos han empezado a incrementar y el sistema inmune trata de controlar la cantidad de patógenos, la carga viral baja a una cantidad más o menos constante. En estos momentos se empieza a secuenciar el ADN del virus, pero se requiere que el paciente tenga una carga viral mayor que 2,000 copias de ARN por mL de plasma.
Los medicamentos tratan de controlar la proliferación del virus para mantener una carga viral baja y una cantidad de células CD4 saludable.
Si se nota que la carga viral ha subido aunque sigue tomando los mismos medicamentos, esto puede indicar que los virus del paciente han desarrollado mutaciones que les brindan resistencia a estos medicamentos. Según las secuencias de ADN, se puede obtener la información de resistencia para cambiar la esquema a una con medicamentos que el virus es aún susceptible.
La sección de secuenciamiento usa dos tipos de sistemas de genotipaje: el de Viroseq y el abierto.
Se empieza con el de Viroseq, pero si la secuenciación no es valida, se puede rehacer la prueba con el sistema abierto.
En el sistema Viroseq, este es el procedimiento general.
Primero se preparan las muestras, en este caso de plasma. Se extrae el ARN, se pone a transcripción reversa, a PCR, después en ciclo de secuencia usando los BigDye terminators, y finalmente se hace el análisis de resultados obtenidos.
Estas son las hojas de trabajo para el sistema Viroseq.
La primera contiene información del número de paciente, el medico que solicitó la prueba, el nombre de paciente y la carga viral.
Esta segunda señala las cantidades de reactivos que se deben mesclar en cada reacción.
La tercera se utiliza en la última parte del proceso, cuando se analizan las secuencias de cada muestra.
Hay que también rellenar la base de datos con la información de cada paciente.
El primer paso una vez obtenida las muestras de plasma, es extraer el ARN viral.
Hay un protocolo que se sigue para obtener una solución de ARN lista para usarse en transcripción reversa.
En este paso, se utilizan 4 soluciones.
La solución de lyse funciona para romper el virus en partes separadas y liberar el ARN.
El isopropanol tiene función de precipitar el ARN.
Después este producto se humecta con etanol al 70% para poder diluirlo en el diluent sin degradar el ARN.
También la transcripción inversa tiene su protocolo separadamente.
En la hoja de trabajo se indican las cantidades que son utilizadas para preparar el RT master mix, cual se le agrega a las muestras.
Las soluciones que se utilizan son el RT-mix que contiene deoxynucleotidos y 1 tipo de primer, el RNAse inhibitor, que evita la degradación de ARN, MuLV que polimeriza ADN complementario, y DTT que afloja la estructura segundaria de ARN.
Igualmente hay un protocolo para PCR, y la hoja de trabajo nota las cantidades de soluciones para preparar el master mix.
Se mesclan el PCR mix que contiene deoxynucleotidos y 2 tipos de primer, amplitaq gold, la polimerasa de ADN que funciona solo en temperaturas altas, y UNG para la regulación de contaminantes.
Los productos de PCR se pasan por electroforesis en gel para asegurar que se amplificó el ADN.
La escalera de peso se le añade a una fila para estimar la cantidad de ADN presente en cada muestra.
De acuerdo con esto se diluyen las muestras.
Como el PCR mix contenía exceso de deoxynucleótidos, estos necesitan ser purificados usando el Exosap antes de proceder con el ciclo de secuenciación.
En el ciclo de secuenciación se utilizan los BigDye terminators, que son soluciones que contienen dideoxynucleotidos etiquetados con colores fluorescentes.
Los colores son verde para adenina, amarillo para guanina, azul para citosina y rojo para timina.
Además los BigDye vienen con 7 primers, A – H pero no E, de los cuales 4 polimerizan forward, y 3 reverse.
Los BigDye y las muestras se añaden en un plato de 96 espacios. Los números indican el numero de muestra, y las letras el primer de BigDye usado.
El plato se polimeriza por 25 ciclos. Como resultado, en cada muestra se encontrarán fragmentos de ADN de diversas longitudes, ya que la polimerasa habrá incluido dideoxynucleotidos en algunas partes, consecuentemente terminando la elongación de cada fragmento de ADN.
Después de purificar con el X-terminator u otro método de purificación, el plato es colocado en el Genetic Analyzer. Cada grupo de fragmentos de ADN difieres en longitud por una base, y pasan por los capilares del Genetic Analyzer de acuerdo con su tamaño. Esto genera una secuencia, porque el color fluorescente de la última base de cada grupo es detectado en orden.
Una vez terminada el ciclo de secuenciación, la data cruda se analiza en Sequencher. En este programa, uno puede cortar cada secuencia para dejar solo las bases que la maquina detectó correctamente, y también cambiar las bases equivocadas y marcar las ambigüedades. La maquina detecta la presencia de una base de nucleótido cuando hay 20% de ella, pero normalmente se marcan como ambigüedades si hay 30% o más, y el revisor decidió incluirlo como ambigüedad.
Al final, se anotan las bases ambiguas en la hoja de Edición de Secuencias.
El revisor 2 se encarga de comparar la secuencia con una de wild type. Esta secuencia de VIH es una secuencia fasta que se obtiene por el internet y es utilizada universalmente. Además wild type VIH no contiene mutaciones de resistencia.
El revisor 2 también crea una secuencia consenso para poder copiarla en la base de datos de Stanford. En esta página se analizan las mutaciones de la secuencia, y genera un reporte de resistencia a medicamentos inhibidores de proteasa y transcriptasa inversa nucleosidicos y no nucleosidicos. La notación de mutaciones es como sigue: las substituciones de codon se denotan como el amino acido que originalmente estaba en este numero de codon se cambió a este amino acido. Cuando son inserciones, se le agrega una i al final. La inserción en el codon 69 da resistencia a muchos medicamentos.
Finalmente se añade la información a la base de datos del ICGES para generar un reporte formal.
El programa de Recall se utiliza para generar un árbol que señala el grado de distinción entre muestras.
Si las muestras salen cerca de una y otra, significa que ocurrió una contaminación entre muestras, lo cual indicaría que se debe repetir el genotipaje.
Hay un segundo método de genotipaje, que se llama genotipaje abierto.
Se utiliza para re-analizar muestras y usa el QIAmp Mini Spin. Una diferencia entre este y el Viroseq es que se pasan las muestras 2 veces por PCR.
El proceso tiene una hoja de trabajo separadamente, que indica las cantidades de reactivos cómo en el sistema Viroseq.