SlideShare una empresa de Scribd logo
1 de 56
Descargar para leer sin conexión
UNIVERSIDAD	
  AUTÓNOMA	
  DE	
  NUEVO	
  LEÓN	
  
FACULTAD	
  DE	
  CIENCIAS	
  BIOLÓGICAS	
  
INSTITUTO	
  DE	
  BIOTECNOLOGÍA	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
Construcción	
  de	
  un	
  modelo	
  in	
  silico	
  de	
  la	
  interacción	
  entre	
  el	
  factor	
  de	
  trascripción	
  Brn3a	
  y	
  la	
  
región	
  promotora	
  URR	
  de	
  la	
  variante	
  16	
  del	
  Virus	
  del	
  papiloma	
  humano	
  en	
  un	
  contexto	
  de	
  
terapia	
  génica	
  contra	
  el	
  Cáncer	
  de	
  Cérvix	
  
	
  
	
  
	
  
TESIS	
  QUE	
  PRESENTA	
  
	
  
	
  
	
  
JAVIER	
  ALEJANDRO	
  RENDÓN	
  CARRILLO	
  
	
  
	
  
	
  
TESIS	
  COMO	
  REQUISITO	
  	
  PARA	
  OBTENER	
  EL	
  	
  TÍTULO	
  PROFESIONAL	
  	
  DE:	
  
	
  
	
  
LICENCIADO	
  EN	
  BIOTECNOLOGÍA	
  GENÓMICA	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
San	
  Nicolás	
  de	
  los	
  Garza,	
  N.L.	
   	
   	
   	
   	
   	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  2	
  de	
  Junio	
  del	
  2014	
  
RC-­‐07-­‐026	
  
REV.00-­‐09/06	
  
	
  
  II	
  
CONSTRUCCIÓN	
  DE	
  UN	
  MODELO	
  IN	
  SILICO	
  DE	
  LA	
  INTERACCIÓN	
  ENTRE	
  EL	
  FACTOR	
  DE	
  
TRASCRIPCIÓN	
  BRN3A	
  Y	
  LA	
  REGIÓN	
  PROMOTORA	
  URR	
  DE	
  LA	
  VARIANTE	
  16	
  DEL	
  VIRUS	
  DEL	
  
PAPILOMA	
  HUMANO	
  EN	
  UN	
  CONTEXTO	
  DE	
  TERAPIA	
  GÉNICA	
  CONTRA	
  EL	
  CÁNCER	
  DE	
  CÉRVIX	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
TESIS	
  
	
  
PRESENTADA	
  COMO	
  REQUISITO	
  	
  PARA	
  OBTENER	
  EL	
  	
  TÍTULO	
  PROFESIONAL	
  	
  DE:	
  
	
  
LICENCIADO	
  EN	
  BIOTECNOLOGÍA	
  GENÓMICA	
  
	
  
	
  
JAVIER	
  ALEJANDRO	
  RENDÓN	
  CARRILLO	
  
	
  
	
  
APROBADA:	
  
	
  
	
  
COMISIÓN	
  DE	
  EXAMEN:	
  
	
  
	
  
	
  
	
  
DR.	
  JOSÉ	
  MARÍA	
  VIADER	
  SALVADÓ	
   	
   	
   ________________________________	
  
	
  	
  	
  	
  PRESIDENTE	
  
	
  
	
  
M.C.	
  JOSÉ	
  CLAUDIO	
  MORENO	
  ROCHA	
   	
   	
   ________________________________
	
   	
  
	
  	
  	
  	
  SECRETARIO	
  
	
  
	
  
DRA.	
  MARTHA	
  GUERRERO	
  OLAZARÁN	
   	
   	
   ________________________________	
  
	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  VOCAL	
  
	
  
	
  
DR.	
  JUAN	
  ANTONIO	
  GALLEGOS	
  LÓPEZ	
   ________________________________	
  
	
  	
  	
  	
  	
  SUPLENTE	
  
	
  
	
  
	
  
	
  
RC-­‐07-­‐026	
  
REV.00-­‐09/06	
  
	
  
  III	
  
CONSTRUCCIÓN	
  DE	
  UN	
  MODELO	
  IN	
  SILICO	
  DE	
  LA	
  INTERACCIÓN	
  ENTRE	
  EL	
  FACTOR	
  DE	
  
TRASCRIPCIÓN	
  BRN3A	
  Y	
  LA	
  REGIÓN	
  PROMOTORA	
  URR	
  DE	
  LA	
  VARIANTE	
  16	
  DEL	
  VIRUS	
  DEL	
  
PAPILOMA	
  HUMANO	
  EN	
  UN	
  CONTEXTO	
  DE	
  TERAPIA	
  GÉNICA	
  CONTRA	
  EL	
  CÁNCER	
  DE	
  CÉRVIX	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
TESIS	
  
	
  
PRESENTADA	
  COMO	
  REQUISITO	
  	
  PARA	
  OBTENER	
  EL	
  	
  TÍTULO	
  PROFESIONAL	
  	
  DE:	
  
	
  
LICENCIADO	
  EN	
  BIOTECNOLOGÍA	
  GENÓMICA	
  
	
  
	
  
JAVIER	
  ALEJANDRO	
  RENDÓN	
  CARRILLO	
  
	
  
	
  
APROBADA:	
  
	
  
	
  
COMISIÓN	
  DE	
  TESIS:	
  
	
  
	
  
	
  
	
  
DR.	
  JOSÉ	
  MARÍA	
  VIADER	
  SALVADÓ	
   	
   	
   ________________________________	
  
	
  	
  	
  	
  	
  DIRECTOR	
  
	
  
	
  
M.C.	
  JOSÉ	
  CLAUDIO	
  MORENO	
  ROCHA	
   	
   	
   ________________________________
	
   	
  
	
  	
  	
  CO-­‐DIRECTOR	
  
	
  
	
  
DRA.	
  MARTHA	
  GUERRERO	
  OLAZARÁN	
   	
   	
   ________________________________	
  
	
  	
  	
  	
  	
  	
  SECRETARIO	
  
	
  
	
  
DR.	
  JUAN	
  ANTONIO	
  GALLEGOS	
  LÓPEZ	
   ________________________________	
  
	
  	
  	
  	
  	
  SUPLENTE	
  
	
  
	
  
	
  
	
  
RC-­‐07-­‐026	
  
REV.00-­‐09/06	
  
	
  
  IV	
  
CONSTRUCCIÓN	
  DE	
  UN	
  MODELO	
  IN	
  SILICO	
  DE	
  LA	
  INTERACCIÓN	
  ENTRE	
  EL	
  FACTOR	
  DE	
  
TRASCRIPCIÓN	
  BRN3A	
  Y	
  LA	
  REGIÓN	
  PROMOTORA	
  URR	
  DE	
  LA	
  VARIANTE	
  16	
  DEL	
  VIRUS	
  DEL	
  
PAPILOMA	
  HUMANO	
  EN	
  UN	
  CONTEXTO	
  DE	
  TERAPIA	
  GÉNICA	
  CONTRA	
  EL	
  CÁNCER	
  DE	
  CÉRVIX	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
TESIS	
  
	
  
PRESENTADA	
  COMO	
  REQUISITO	
  	
  PARA	
  OBTENER	
  EL	
  	
  TÍTULO	
  PROFESIONAL	
  	
  DE:	
  
	
  
LICENCIADO	
  EN	
  BIOTECNOLOGÍA	
  GENÓMICA	
  
	
  
	
  
JAVIER	
  ALEJANDRO	
  RENDÓN	
  CARRILLO	
  
	
  
	
  
APROBADA:	
  
	
  
	
  
COMISIÓN	
  DE	
  TESIS:	
  
	
  
	
  
	
  
	
  
DR.	
  JOSÉ	
  MARÍA	
  VIADER	
  SALVADÓ	
   	
   	
   ________________________________	
  
	
  	
  	
  	
  	
  DIRECTOR	
  
	
  
	
  
M.C.	
  JOSÉ	
  CLAUDIO	
  MORENO	
  ROCHA	
   	
   	
   ________________________________
	
   	
  
	
  	
  	
  CO-­‐DIRECTOR	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
RC-­‐07-­‐026	
  
REV.00-­‐09/06	
  
	
  
  V	
  
	
  
ÍNDICE	
  
	
  
V.	
  	
   Dedicatoria	
  	
  ..................................................................................................................	
  VII	
  
VI.	
  	
  	
  	
  Agradecimientos	
  .........................................................................................................	
  VIII	
  
VII.	
  	
  	
  Lista	
  de	
  abreviaturas	
  .....................................................................................................	
  IX	
  
VIII.	
  	
  Lista	
  de	
  tablas	
  ................................................................................................................	
  X	
  
IX.	
  	
  	
  	
  	
  Lista	
  de	
  figuras	
  ............................................................................................................	
  XII	
  
X.	
  	
  	
  	
  	
  	
  Resumen	
  ...................................................................................................................	
  XIV	
  
1.	
   Introducción	
  ...................................................................................................................	
  1	
  
2.	
   Importancia	
  ....................................................................................................................	
  2	
  
3.	
   Hipótesis	
  ........................................................................................................................	
  3	
  
4.	
   Objetivos	
  ........................................................................................................................	
  3	
  
4.1	
   Objetivo	
  general:	
  ................................................................................................................	
  3	
  
4.2	
   Objetivos	
  específicos:	
  .........................................................................................................	
  3	
  
5.	
   Antecedentes	
  .................................................................................................................	
  3	
  
5.1	
   Epidemiología	
  y	
  etiología	
  del	
  cáncer	
  cérvicouterino	
  ..........................................................	
  3	
  
5.2	
   Brn3a	
  y	
  el	
  desarrollo	
  del	
  CaCu	
  mediante	
  la	
  regulación	
  del	
  VPH	
  ........................................	
  5	
  
5.3	
   Sitios	
  de	
  unión	
  de	
  los	
  homeodominios	
  ...............................................................................	
  6	
  
5.4	
   Reconocimiento	
  específico	
  de	
  una	
  secuencia	
  de	
  ADN	
  por	
  los	
  dominios	
  POU	
  ...................	
  7	
  
5.5	
   Predicción	
  de	
  la	
  estructura	
  tridimensional	
  de	
  una	
  proteína	
  ..............................................	
  9	
  
5.5.1	
   Modelaje	
  por	
  homología	
  ...........................................................................................	
  10	
  
5.5.2	
   Modelaje	
  por	
  reconocimiento	
  de	
  plegamientos	
  ........................................................	
  11	
  
5.5.3	
   Modelaje	
  por	
  predicción	
  Ab-­‐initio	
  .............................................................................	
  11	
  
6.	
   Metodología	
  ................................................................................................................	
  12	
  
6.1	
   Materiales	
  y	
  equipo	
  ..........................................................................................................	
  12	
  
6.2	
   Estrategia	
  General	
  ............................................................................................................	
  12	
  
6.3	
   Construcción	
  y	
  validación	
  de	
  la	
  estructura	
  tridimensional	
  	
  de	
  la	
  proteína	
  Brn3a	
  ............	
  13	
  
6.4	
   Construcción	
  y	
  validación	
  del	
  modelo	
  tridimensional	
  de	
  interacción	
  de	
  la	
  estructura	
  
tridimensional	
  de	
  Brn3a	
  con	
  la	
  región	
  URR	
  de	
  tres	
  subtipos	
  de	
  VPH-­‐16	
  ..........................	
  13	
  
6.4.1	
  	
  Construcción	
  del	
  modelo	
  tridimensional	
  de	
  interacción	
  Brn3a	
  con	
  la	
  región	
  URR	
  de	
  	
  
VPH-­‐16	
  ..........................................................................................................................	
  13	
  
6.4.2	
  Determinación	
  de	
  la	
  energía	
  del	
  complejo	
  proteína-­‐ADN	
  ............................................	
  14	
  
	
  
6.5	
   Optimización	
  y	
  cálculo	
  de	
  la	
  energía	
  de	
  interacción	
  de	
  los	
  modelos	
  tridimensionales	
  de	
  
interacción	
  de	
  Brn3a	
  con	
  los	
  tres	
  subtipos	
  de	
  VPH-­‐16	
  .....................................................	
  14	
  
7.	
   Resultados	
  ...................................................................................................................	
  15	
  
7.1	
   Construcción	
  y	
  validación	
  de	
  la	
  estructura	
  tridimensional	
  	
  de	
  la	
  proteína	
  Brn3a.	
  ...........	
  15	
  
7.2	
   Construcción	
  y	
  validación	
  del	
  modelo	
  tridimensional	
  de	
  interacción	
  de	
  la	
  estructura	
  
tridimensional	
  de	
  Brn3a	
  con	
  la	
  región	
  URR	
  de	
  tres	
  subtipos	
  de	
  VPH-­‐16	
  ..........................	
  19	
  
7.2.1	
  	
   Construcción	
  del	
  modelo	
  tridimensional	
  de	
  interacción	
  Brn3a	
  con	
  la	
  región	
  URR	
  de	
  
VPH-­‐16	
  .......................................................................................................................	
  19	
  
7.2.2	
   Determinación	
  de	
  la	
  energía	
  del	
  complejo	
  proteína-­‐ADN	
  .........................................	
  27	
  
7.2.3	
   	
  Optimización	
  y	
  cálculo	
  de	
  la	
  energía	
  de	
  interacción	
  de	
  los	
  modelos	
  tridimensionales	
  
de	
  interacción	
  de	
  Brn-­‐3a	
  con	
  los	
  tres	
  subtipos	
  de	
  VPH-­‐16	
  en	
  forma	
  de	
  logo.	
  ............	
  33	
  
  VI	
  
8.	
   Discusión	
  ......................................................................................................................	
  36	
  
9.	
   Literatura	
  citada	
  ...........................................................................................................	
  40	
  
	
  
  VII	
  
DEDICATORIA	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
Con todo mi cariño y mi amor para las personas que
hicieron todo en la vida para que yo pudiera lograr
mis sueños, por motivarme y darme la mano cuando
sentía que el camino se terminaba, a ustedes por
siempre mi corazón y mi agradecimiento.
A mi madre y padre.
Sapere aude.
  VIII	
  
	
  
AGRADECIMIENTOS	
  
	
  
Agradezco	
  por	
  este	
  trabajo	
  en	
  primer	
  lugar:	
  a	
  mis	
  padres	
  por	
  todo	
  su	
  apoyo	
  para	
  finalizar	
  la	
  
licenciatura,	
   asimismo	
   al	
   Doctor	
   José	
   Ma.	
   Viader	
   Salvadó	
   por	
   permitirme	
   terminar	
   este	
  
proyecto	
  &	
  al	
  M.C.	
  José	
  Claudio	
  Rocha	
  Moreno.	
  
	
  
Un	
   agradecimiento	
   muy	
   especial	
   a	
   la	
   Dra.	
   Elisa	
   Shaefer	
   Satu	
   por	
   su	
   asesoría	
   personal	
   en	
  
programación,	
   instalación	
   y	
   ejecución	
   del	
   software	
   necesario	
   para	
   la	
   implementación	
   del	
  
trabajo.	
  
	
  
Se	
  agradece	
  al	
  Centro	
  Nacional	
  de	
  Supercómputo	
  (CNS)	
  del	
  IPICYT,	
  A.C.	
  por	
  los	
  recursos	
  de	
  
Supercómputo	
  proporcionados	
  asignados,	
  los	
  cuales	
  se	
  enlistan	
  a	
  continuación:	
  Thubat	
  Kaal.	
  
	
  
Agradezco	
  por	
  igual	
  a	
  mis	
  amigos	
  Marco,	
  Aracely	
  y	
  muy	
  especialmente	
  a	
  Laura	
  por	
  todo	
  el	
  
apoyo	
   para	
   poder	
   continuar	
   con	
   el	
   presente	
   proyecto	
   y	
   concluirlo	
   a	
   pesar	
   de	
   todos	
   los	
  
inconvenientes	
  y	
  retos	
  técnicos	
  que	
  presento.	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
  IX	
  
	
  
LISTA	
  DE	
  ABREVIATURAS	
  
	
  
	
  
	
  
ARN	
  	
   	
   Ácido	
  ribonucleico	
  
°C	
  	
   	
   Grados	
  Celsius	
  
CaCu	
   	
   Cáncer	
  Cérvicouterino	
  	
  
ADN	
  	
   	
   Ácido	
  desoxirribonucleico	
  
et	
  al.	
   	
   Et	
  alii	
  (y	
  colaboradores)	
  
g	
  	
   	
   Gramos	
  
h	
  	
   	
   Horas	
  
K	
   	
   Grados	
  Kelvin	
  
kb	
  	
   	
   Kilobase=mil	
  pares	
  de	
  bases	
  
kDa	
  	
   	
   Kilodaltones	
  
M	
  	
   	
   Concentración	
  Molar	
  
mA	
  	
   	
   Miliamperes	
  
mg	
  	
   	
   Miligramos	
  
min	
  	
   	
   Minutos	
  
μg	
  	
   Microgramo	
  
μL	
  	
   Microlitro	
  
μM	
  	
   Micromolar	
  
mL	
  	
  	
  	
  	
   Mililitros	
  
mM	
  	
   Concentración	
  Milimolar	
  
N°	
   Número	
  
NaCl	
  	
   Cloruro	
  de	
  sodio	
  
NaOH	
  	
   Hidróxido	
  de	
  sodio	
  
NCBI	
  	
   National	
  Center	
  for	
  Biotechnology	
  Information	
  
ng	
  	
   Nangramos	
  
nm	
  	
   Nanómetros	
  
ns	
   Nanosegundos	
  
LCR	
   Región	
  larga	
  de	
  control	
  
pb	
  	
   Pares	
  de	
  bases	
  
ps	
   picosegundos	
  
P	
  	
   Fósforo	
  
RMSD	
   Raíz	
  cuadrada	
  media	
  de	
  la	
  desviación	
  de	
  posiciones	
  atómicas	
  	
  	
  
s	
  	
   Segundos	
  
SD	
  	
   Desviación	
  estándar	
  
t	
  	
   Tiempo	
  
to	
  	
   Tiempo	
  inicial	
  
URR	
   Región	
  reguladora	
  río	
  arriba	
  
V	
  	
   Volts	
  
VPH-­‐16	
   Virus	
  del	
  papiloma	
  humano	
  variante	
  16	
  
%	
  	
   Porcentaje	
  
3D	
   Tridimensional	
  
	
  
	
  
	
  
	
  
	
  
	
  
  X	
  
LISTA	
  DE	
  TABLAS	
  
	
  
	
  
TABLA	
  
	
  
DESCRIPCIÓN	
  
	
  
PÁGINA	
  
	
  
1	
  
VPH	
  y	
  su	
  asociación	
  con	
  las	
  principales	
  enfermedades	
  que	
  origina	
  
obtenida	
  del	
  reporte	
  anual	
  de	
  la	
  Secretaria	
  de	
  Salud.	
  
4	
  
2	
  
	
  
Lista	
  de	
  las	
  20	
  proteínas	
  con	
  mayor	
  identidad	
  y	
  valor	
  E	
  mas	
  alto,	
  
listadas	
   por	
   su	
   clave	
   pdb	
   generado	
   por	
   el	
   archivo	
   ejecutable	
  
build_profile.py	
  obtenidas	
  de	
  Modeller.	
  
16	
  
3	
  
	
  
Matriz	
   de	
   distancias	
   de	
   identidad	
   de	
   secuencia,	
   se	
   presenta	
   la	
  
clave	
   del	
   archivos	
   pdb	
   que	
   presentaron	
   mayor	
   identidad	
   en	
  
secuencia	
  a	
  Brn3a.	
  
16	
  
4	
  
	
  
Criterios	
   para	
   seleccionar	
   el	
   archivo	
   pdb	
   que	
   servirá	
   como	
  
modelo	
  para	
  construir	
  la	
  estructura	
  tridimensional	
  de	
  Brn3a.	
  
17	
  
5	
  
	
  
Evaluación	
  mediante	
  los	
  3	
  criterios	
  de	
  inclusión	
  para	
  escoger	
  la	
  
mejor	
   estructura	
   tridimensional	
   para	
   construir	
   el	
   modelo	
   de	
  
Brn3a.	
  
17	
  
6	
  
	
  
Puntuaciones	
   de	
   energía	
   de	
   acuerdo	
   a	
   los	
   3	
   algoritmos	
   de	
  
evaluación	
   usados	
   por	
   Modeller	
   que	
   corresponden	
   a	
   las	
  
estructuras	
  tridimensionales	
  (PDB)	
  generados	
  por	
  Modeller.	
  
18	
  
7	
  
	
  
Puntuaciones	
   de	
   energía	
   de	
   acuerdo	
   a	
   los	
   3	
   algoritmos	
   de	
  
evaluación	
   usados	
   por	
   Modeller	
   que	
   corresponden	
   a	
   las	
  
estructuras	
   tridimensionales	
   (PDB)	
   generados	
   por	
   el	
   archivo	
  
ejecutable	
  ligand.py.	
  
19	
  
8	
  
	
  
Puntuaciones	
   de	
   energía	
   de	
   acuerdo	
   a	
   los	
   3	
   algoritmos	
   de	
  
evaluación	
   usados	
   por	
   Modeller	
   que	
   corresponden	
   a	
   las	
  
estructuras	
   tridimensionales	
   (PDB)	
   generados	
   por	
   el	
   archivo	
  
ejecutable	
  loop-­‐refine.py.	
  
	
  
20	
  
9	
  
	
  
Puntuaciones	
   de	
   energía	
   de	
   acuerdo	
   a	
   los	
   3	
   algoritmos	
   de	
  
evaluación	
   usados	
   por	
   Modeller	
   que	
   corresponden	
   a	
   las	
  
estructuras	
   tridimensionales	
   (PDB)	
   generados	
   por	
   el	
   archivo	
  
ejecutable	
  loop-­‐refine.py.	
  
	
  
22	
  
	
  
10	
  
	
  
Cantidad	
   de	
   ángulos	
   diédricos	
   Ψ	
   (psi)	
   y	
   	
   Φ	
   (phi)	
   	
   favorables	
  
permitidos	
   y	
   atípicos	
   que	
   del	
   total	
   de	
   aminoácidos	
   de	
   la	
  
estructura	
  tridimensional	
  Brn3a-­‐ADN.	
  
	
  
24	
  
	
  
11	
  
11	
  A:	
  Energía	
  total	
  previa	
  a	
  la	
  simulación	
  molecular	
  
11	
  B:	
  Energía	
  total	
  al	
  final	
  de	
  la	
  simulación	
  molecular	
  
29	
  
12	
   Resultados	
  de	
  la	
  dinámica	
  molecular	
  por	
  	
  MMPBSA.	
   36	
  
  XI	
  
LISTA	
  DE	
  FIGURAS	
  
	
  
FIGURA	
  
	
  
DESCRIPCIÓN	
  
	
  
PÁGINA	
  
	
  
1	
  
Estructura	
   de	
   un	
   factor	
   de	
   transcripción	
   el	
   cual	
   contiene	
   un	
  
homeodominio.	
  
6	
  
2	
  
	
  
Interacciones	
   del	
   motivo	
   hélice-­‐giro-­‐hélice	
   de	
   la	
   proteína	
  
Antennapedia	
   de	
   D.	
   melanogaster	
   (código	
   PDB:	
   1AHD)	
   con	
   los	
  
surcos	
  mayores	
  y	
  menores	
  del	
  ADN,	
  obtenido	
  de	
  la	
  base	
  de	
  datos	
  
Protein	
  Data	
  Bank	
  (www.rcsb.org).	
  
7	
  
3	
  
	
  
a)	
   Alineamiento	
   de	
   secuencias	
   de	
   aminoácidos	
   de	
   los	
   dominios	
  
POU	
  de	
  las	
  proteínas	
  humanas	
  Brn-­‐5,	
  Oct-­‐1	
  y	
  Pit-­‐1.	
  Los	
  residuos	
  
conservados	
   están	
   resaltados	
   en	
   letra	
   negrita.	
   Los	
   residuos	
   de	
  
POUS	
  y	
  POUH	
  implicados	
  en	
  los	
  enlaces	
  de	
  puentes	
  de	
  hidrógeno	
  
con	
  el	
  ADN	
  están	
  resaltados.	
  b)	
  Representación	
  esquemática	
  de	
  
la	
   estructura	
   del	
   dominio	
   POU	
   de	
   Brn-­‐5.	
   El	
   dominio	
   POUS	
   se	
  
muestra	
  en	
  color	
  rosa,	
  el	
  enlazador	
  en	
  amarillo	
  y	
  POUH	
  en	
  verde.	
  
Las	
   hélices	
   de	
   los	
   dominios	
   POU	
   están	
   numeradas	
   como	
   se	
  
muestra	
   en	
   el	
   alineamiento	
   de	
   la	
   parte	
   superior.	
   (N)	
   extremo	
  
amino-­‐terminal,	
  (C)	
  extremo	
  carboxilo-­‐terminal.	
  	
  
	
  
8	
  
4	
   Procedimiento	
  del	
  modelaje	
  por	
  homología.	
   10	
  
5	
  
	
  
Esquema	
  que	
  presenta	
  en	
  forma	
  de	
  jerarquía	
  las	
  rutas	
  de	
  acceso	
  
a	
  los	
  archivos	
  ejecutables	
  del	
  presente	
  trabajo,	
  de	
  esta	
  manera	
  se	
  
ordenaron	
   las	
   carpetas	
   contenidas	
   dentro	
   del	
   directorio	
  
Modelaje_básico.	
  
	
  
15	
  
6	
  
Dominios	
   	
   y	
   familias	
   de	
   proteínas	
   relacionadas	
   a	
   los	
   dominios	
  
presentes	
  en	
  la	
  secuencia	
  de	
  Brn3a,	
  la	
  familia	
  POU	
  a	
  la	
  izquierda	
  
y	
  la	
  familia	
  de	
  los	
  homeodominios	
  a	
  la	
  derecha,	
  descritos	
  en	
  la	
  
base	
   de	
   datos	
   "Conserved	
   Domains"	
   del	
   NCBI	
   y	
   localizados	
  
mediante	
  la	
  herramienta	
  BLASTp.	
  
15	
  
7	
  
	
  
Gráfico	
   que	
   muestra	
   el	
   puntaje	
   DOPE	
   de	
   cada	
   aminoácido	
  
comparado	
   con	
   la	
   estructura	
   PDB	
   2XSD	
   usada	
   como	
   modelo	
  
base.	
   La	
   región	
   enmarcada	
   por	
   el	
   rectángulo	
   corresponde	
   al	
  
bucle	
   de	
   la	
   región	
   interdominios	
   donde	
   se	
   presenta	
   un	
  
incremento	
  de	
  energía.	
  
18	
  
8	
  
	
  
Gráfico	
  que	
  muestra	
  el	
  puntaje	
  DOPE	
  de	
  cada	
  aminoácido	
  de	
  la	
  
nueva	
  estructura	
  PDB	
  Brn3a.B99990001	
  	
  la	
  cual	
  se	
  encuentra	
  en	
  
interacción	
  con	
  el	
  ADN	
  (azul)	
  obtenido	
  de	
  el	
  archivo	
  pdb	
  2XSD,	
  
comparado	
   con	
   la	
   estructura	
   PDB	
   2XSD	
   (verde)	
   usada	
   como	
  
modelo	
   comparativo,	
   la	
   región	
   enmarcada	
   por	
   el	
   rectángulo	
  
corresponde	
   a	
   la	
   región	
   interdominio	
   donde	
   presenta	
   un	
  
incremento	
  de	
  energía.	
  
20	
  
	
  
9	
  
	
  
Gráfico	
  que	
  muestra	
  el	
  puntaje	
  DOPE	
  de	
  cada	
  aminoácido	
  de	
  la	
  
	
  
21	
  
  XII	
  
nueva	
   estructura	
   PDB	
   Brn3a.BL0006001	
   el	
   cual	
   	
   fue	
   el	
   mejor	
  
modelo	
  de	
  Brn3a	
  en	
  interacción	
  con	
  el	
  ADN	
  denominado	
  Brn3a-­‐
looprefine	
  (rojo),	
  comparado	
  con	
  la	
  estructura	
  PDB	
  2XSD	
  (verde)	
  
usada	
  como	
  control	
  o	
  modelo	
  comparativo,	
  en	
  azul	
  se	
  muestra	
  el	
  
modelo	
  previo	
  sin	
  el	
  proceso	
  de	
  refinamiento	
  de	
  bucle,	
  la	
  región	
  
enmarcada	
  por	
  el	
  rectángulo	
  corresponde	
  al	
  bucle	
  en	
  la	
  región	
  C	
  
terminal	
  del	
  archivo	
  pdb	
  Brn3a	
  la	
  cual	
  muestra	
  un	
  incremento	
  de	
  
la	
  energía	
  por	
  un	
  arreglo	
  termodinámicamente	
  desfavorable	
  de	
  
los	
  aminoácidos.	
  
10	
  
	
  
Gráfico	
   que	
   muestra	
   el	
   puntaje	
   DOPE	
   de	
   cada	
   aminoácido	
  
comparado	
  con	
  el	
  archivo	
  pbb	
  2XSD	
  como	
  control	
  presentado	
  en	
  
verde,	
  en	
  rojo	
  se	
  muestra	
  el	
  modelo	
  Brn3a.BL00040001.pdb	
  de	
  
Brn3a	
   en	
   interacción	
   con	
   el	
   ADN	
   denominado	
   Brn3a-­‐looprefine	
  
(rojo),	
  en	
  azul	
  se	
  muestra	
  el	
  archivo	
  pdb	
  que	
  contiene	
  el	
  modelo	
  
previo	
  Brn3a.B99990001	
  sin	
  el	
  proceso	
  de	
  refinamiento	
  de	
  bucle	
  
denominado	
  Brn3aligand.	
  
	
  
22	
  
11	
  
	
  
A	
   la	
   derecha	
   se	
   presenta	
   la	
   estructura	
   tridimensional	
   de	
   Brn3a	
  
unida	
   a	
   DNA,	
   se	
   muestra	
   en	
   gradiente	
   de	
   color	
   de	
   azul	
   (mas	
  
preciso)	
   a	
   rojo	
   (menos	
   preciso)	
   los	
   Å	
   de	
   error	
   la	
   región	
   del	
  
enlazador	
  (en	
  rojo)	
  la	
  cual	
  presenta	
  mas	
  de	
  3.5	
  Å	
  de	
  error,	
  a	
  la	
  
izquierda	
   se	
   muestran	
   los	
   valores	
   de	
   torsión,	
   solvatación,	
  
interacción	
  de	
  átomos	
  y	
  Cβ,	
  relación	
  SSE,	
  relación	
  ACC,	
  donde	
  al	
  
final	
   de	
   la	
   barra	
   se	
   observa	
   el	
   valor	
   de	
   cada	
   uno	
   de	
   estos	
  
criterios,	
  la	
  barra	
  negra	
  indica	
  que	
  tan	
  beneficioso	
  o	
  perjudicial	
  es	
  
cada	
  valor	
  para	
  la	
  estabilidad	
  de	
  la	
  proteína.	
  	
  	
  
23	
  
12	
  
	
  
Se	
  presentan	
  los	
  gráficos	
  de	
  Ramachandran	
  de	
  la	
  estructura	
  de	
  
interacción	
   Brn3a-­‐ADN,	
   de	
   izquierda	
   a	
   derecha	
   en	
   orden	
   de	
  
aparición	
  se	
  muestra	
  el	
  gráfico	
  general	
  de	
  la	
  estructura	
  donde	
  se	
  
presenta	
  en	
  el	
  limite	
  del	
  gráfico	
  el	
  residuo	
  No	
  49	
  correspondiente	
  
a	
   cisteína,	
   este	
   residuo	
   no	
   se	
   no	
   se	
   tomo	
   en	
   cuenta	
   en	
   la	
  
validación	
  final	
  	
  debido	
  a	
  que	
  se	
  encuentra	
  en	
  región	
  límite	
  del	
  
gráfico	
  y	
  en	
  otros	
  gráficos	
  aparece	
  como	
  favorecido,	
  el	
  segundo	
  
gráfico	
   presenta	
   los	
   residuos	
   de	
   Valina	
   e	
   Isoleucina,	
   el	
   tercer	
  
gráfico	
   se	
   muestran	
   los	
   residuos	
   de	
   pre	
   Prolina,	
   el	
   cuarto	
   los	
  
residuos	
   aminoacídicos	
   de	
   Glicina,	
   en	
   el	
   quinto	
   los	
   residuos	
   de	
  
trans	
  Prolina	
  en	
  la	
  cual	
  se	
  muestra	
  el	
  residuo	
  No.	
  38	
  con	
  un	
  valor	
  
atípico	
  por	
  lo	
  cual	
  se	
  deberá	
  modificar	
  su	
  posición	
  espacial	
  mas	
  
adelante	
   con	
   dinámica	
   molecular,	
   el	
   sexto	
   y	
   último	
   gráfico	
  
presenta	
  solamente	
  los	
  residuos	
  de	
  la	
  Prolina	
  en	
  posición	
  Cis.	
  
25	
  
13	
  
	
  
A:	
  Secuencia	
  nucleotídica	
  que	
  se	
  encuentra	
  en	
  la	
  estructura	
  pdb	
  
OCT-­‐6	
   (2XSD)	
   indicándose	
   a	
   la	
   izquierda	
   la	
   cadena	
   a	
   la	
   cual	
  
pertenecen	
  en	
  el	
  archivo	
  pdb.	
  La	
  secuencia	
  nucleotídica	
  se	
  mutó	
  
con	
  el	
  programa	
  X3DNA.	
  	
  V1:	
  Secuencia	
  nucleotídica	
  de	
  la	
  región	
  
URR	
   de	
   VPH-­‐16	
   subtipo	
   1	
   del	
   archivo	
   pdb	
   V1.	
   V2:	
   Secuencia	
  
nucleotídica	
   de	
   la	
   región	
   URR	
   de	
   VPH-­‐16	
   subtipo	
   2	
   del	
   archivo	
  
pdb	
  V2.	
  V5:	
  Secuencia	
  nucleotídica	
  de	
  la	
  región	
  URR	
  de	
  VPH-­‐16	
  
subtipo	
   5	
   del	
   archivo	
   pdb	
   V5.	
   Las	
   letras	
   en	
   negrita	
   indican	
   las	
  
26	
  
  XIII	
  
bases	
   nucleotídicas	
   que	
   se	
   mutaron.	
   B:	
   Representación	
  
esquemática	
  del	
  modelo	
  de	
  Brn3a-­‐ADN	
  donde	
  se	
  representa	
  el	
  
ADN	
  	
  en	
  forma	
  de	
  palos	
  y	
  la	
  proteína	
  en	
  	
  forma	
  de	
  lazos.	
  
14	
  
Figura	
  14.	
  Se	
  muestran	
  en	
  orden	
  ascendente	
  a	
  descendente	
  los	
  
resultados	
   de	
   la	
   minimización	
   energética	
   donde	
   se	
   equilibró	
   la	
  
energía	
  potencial	
  	
  y	
  energía	
  total	
  de	
  cada	
  molécula	
  de	
  cada	
  uno	
  
de	
  los	
  complejos	
  Bn3a	
  en	
  unión	
  al	
  ADN	
  de	
  la	
  región	
  URR	
  de	
  cada	
  
subtipo	
   de	
   VPH-­‐16.	
   Las	
   	
   figuras	
   mostradas	
   a	
   	
   la	
   derecha	
  
presentan	
   la	
   energía	
   total	
   	
   de	
   cada	
   molécula	
   contra	
   el	
   tiempo	
  
total	
   que	
   fue	
   de	
   5	
   picosegundos,	
   los	
   gráficos	
   mostrados	
   a	
   la	
  
izquierda	
   	
   presentan	
   la	
   energía	
   potencial	
   	
   de	
   cada	
   molécula	
  
contra	
  el	
  tiempo	
  total	
  que	
  fue	
  de	
  5	
  picosegundos.	
  Figura	
   14	
   A:	
  
Subtipo	
  1.	
  Figura	
  14	
  B:	
  Subtipo	
  2.	
  Figura	
  14	
  C:	
  Subtipo	
  5.	
  
27,28	
  
15	
  
	
  
Se	
  muestran	
  en	
  orden	
  ascendente	
  a	
  descendente	
  los	
  resultados	
  
de	
  la	
  simulación	
  de	
  la	
  dinámica	
  molecular.	
  Se	
  presentan	
  en	
  forma	
  
de	
  gráfica	
  la	
  energía	
  potencial	
  	
  y	
  energía	
  total	
  de	
  cada	
  molécula	
  
de	
  cada	
  uno	
  de	
  los	
  complejos	
  Bn3a	
  en	
  unión	
  al	
  ADN	
  de	
  la	
  región	
  
URR	
   de	
   cada	
   subtipo	
   de	
   VPH-­‐16.	
   Las	
   	
   figuras	
   mostradas	
   a	
   	
   la	
  
derecha	
   presentan	
   la	
   energía	
   total	
   	
   de	
   cada	
   molécula.	
   Los	
  
gráficos	
  mostrados	
  a	
  la	
  izquierda	
  	
  presentan	
  la	
  energía	
  potencial	
  	
  
de	
  cada	
  molécula.	
  Figura	
  14	
  A:	
  Subtipo	
  1.	
  Figura	
  14	
  B:	
  Subtipo	
  2.	
  
Figura	
  14	
  C:	
  Subtipo	
  5.	
  
30	
  
16	
  
Se	
  muestran	
  en	
  orden	
  descendente	
  las	
  gráficas	
  del	
  RMSD	
  de	
  los	
  	
  
Cα	
  de	
  las	
  estructuras	
  pdb	
  obtenidas	
  del	
  proceso	
  de	
  simulación	
  de	
  
dinámica	
   molecular	
   contra	
   	
   los	
   1000	
   picosegundos	
   de	
   la	
  
simulación.	
  Se	
  presenta	
  en	
  orden	
  descendente	
  subtipo	
  1	
  	
  como	
  
figura	
  15	
  A,	
  subtipo	
  2	
  como	
  figura	
  16	
  B	
  	
  y	
  subtipo	
  5	
  como	
  figura	
  
16	
  C.	
  LS:	
  limite	
  superior.	
  M:	
  media.	
  LI:	
  limite	
  inferior.	
  
31,32	
  
17	
  
	
  
A:	
   Densidad	
   	
   del	
   complejo	
   Brn3a-­‐VPH16	
   subtipo	
   1.	
   B:	
  
Temperatura	
  del	
  complejo	
  Brn3a-­‐VPH16	
  subtipo	
  1.	
  
33	
  
18	
  
	
  
A:	
   Energía	
  potencial	
  	
  	
  	
  del	
  complejo	
  Brn3a-­‐VPH16	
  subtipo	
  1.	
  B:	
  
RMSD	
  del	
  complejo	
  Brn3a-­‐VPH16	
  subtipo	
  1.	
  
34	
  
19	
  
A:	
   Densidad	
   	
   del	
   complejo	
   Brn3a-­‐VPH16	
   subtipo	
   1.	
   B:	
  
Temperatura	
   del	
   complejo	
   Brn3a-­‐VPH16	
   subtipo	
   1.	
   C:	
   Energía	
  
total	
  del	
  complejo	
  Brn3a-­‐VPH16	
  subtipo	
  1.	
  D:	
  RMSD	
  del	
  complejo	
  
Brn3a-­‐VPH16	
  subtipo	
  1.	
  
35	
  
20	
  
	
  
Figura	
  20.	
  Secuencia	
  nucleotídica	
  consenso	
  de	
  la	
  región	
  URR	
  de	
  
VPH-­‐16	
  .	
  
	
  
36	
  
	
   	
  
  XIV	
  
RESUMEN	
  
	
  
	
  
Javier	
  Alejandro	
  Rendón	
  Carrillo	
  	
  	
  	
  	
  	
  	
  	
   	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  Fecha	
  de	
  graduación:	
  Mayo	
  de	
  2014	
  
	
  
Universidad	
  Autónoma	
  de	
  Nuevo	
  León	
  
	
  
Facultad	
  de	
  Ciencias	
  Biológicas	
  
	
  
Instituto	
  de	
  Biotecnología	
  
	
  
Titulo	
  de	
  Estudio:	
  CONSTRUCCIÓN	
  DE	
  UN	
  MODELO	
  IN	
  SILICO	
  DE	
  LA	
  INTERACCIÓN	
  ENTRE	
  EL	
  
FACTOR	
  DE	
  TRASCRIPCIÓN	
  BRN3A	
  Y	
  LA	
  REGIÓN	
  PROMOTORA	
  URR	
  DE	
  LA	
  VARIANTE	
  16	
  DEL	
  
VIRUS	
  DEL	
  PAPILOMA	
  HUMANO	
  EN	
  UN	
  CONTEXTO	
  DE	
  TERAPIA	
  GÉNICA	
  CONTRA	
  EL	
  CÁNCER	
  
DE	
  CÉRVIX.	
  
	
  
Candidato	
  para	
  obtener	
  el	
  título	
  profesional	
  de	
  Licenciado	
  en	
  Biotecnología	
  Genómica	
  
	
  
Área	
  de	
  estudio:	
  Biotecnología.	
  
	
  
Propósito	
   y	
   método	
   de	
   estudio:	
   Se	
  estableció	
  un	
  modelo	
  tridimensional	
  de	
  interacción	
  del	
  
factor	
  de	
  transcripción	
  humano	
  Brn3a	
  con	
  la	
  región	
  URR	
  de	
  tres	
  subtipos	
  de	
  VPH-­‐16	
  para	
  el	
  
diseño	
   de	
   una	
   vacuna	
   génica	
   contra	
   el	
   CaCu.	
   Para	
   ello	
   se	
   construyó	
   y	
   validó	
   un	
   modelo	
  
tridimensional	
   de	
   la	
   proteína	
   Brn3a	
   utilizando	
   modelaje	
   por	
   homología	
   con	
   Modeller,	
   se	
  
validaron	
  los	
  modelos	
  construidos	
  con	
  MolProbity	
  y	
  QMEAN.	
  Posteriormente	
  se	
  construyó	
  el	
  
modelo	
  tridimensional	
  de	
  la	
  interacción	
  de	
  la	
  proteína	
  Brn3a	
  con	
  una	
  secuencia	
  nucleotídica	
  
similar	
  a	
  la	
  región	
  URR	
  de	
  VPH-­‐16	
  empleando	
  el	
  programa	
  Modeller,	
  el	
  modelo	
  tridimensional	
  
de	
  la	
  proteína	
  Brn3a	
  y	
  la	
  estructura	
  tridimensional	
  de	
  la	
  secuencia	
  nucleotídica	
  contenida	
  en	
  el	
  
archivo	
  PDB	
  de	
  clave	
  2XSD.	
  Con	
  el	
  programa	
  X3DNA,	
  se	
  mutaron	
  las	
  secuencias	
  nucleotídicas	
  
de	
  los	
  archivos	
  pdb	
  que	
  contienen	
  los	
  modelos	
  tridimensional	
  de	
  interacción	
  proteína-­‐ADN	
  en	
  
unión	
  a	
  la	
  secuencia	
  nucleotídica	
  de	
  la	
  región	
  URR	
  de	
  tres	
  subtipos	
  de	
  VPH-­‐16,	
  de	
  esta	
  manera	
  
se	
  obtuvieron	
  tres	
  modelos	
  tridimensionales	
  de	
  interacción	
  de	
  la	
  proteína	
  Brn3a	
  con	
  la	
  región	
  
URR	
  de	
  los	
  tres	
  subtipos	
  de	
  VPH-­‐16	
  subtipo	
  1,	
  subtipo	
  2,	
  y	
  subtipo	
  5,	
  los	
  cuales	
  se	
  validaron	
  
con	
  MolProbity	
  y	
  QMEAN.	
  Se	
  mejoraron	
  los	
  tres	
  modelos	
  tridimensionales	
  de	
  interacción	
  de	
  la	
  
proteína	
   Brn3a	
   con	
   la	
   región	
   URR	
   de	
   VPH-­‐16	
   empleando	
   un	
   proceso	
   de	
   minimización	
   de	
  
energía	
  con	
  el	
  programa	
  Amber	
  12.	
  Por	
  último,	
  se	
  optimizaron	
  los	
  modelos	
  tridimensionales	
  
de	
  interacción	
  de	
  Brn3a	
  con	
  cada	
  uno	
  de	
  los	
  tres	
  subtipos	
  de	
  VPH-­‐16	
  empleando	
  el	
  programa	
  
Amber	
  y	
  se	
  calcularon	
  las	
  energías	
  de	
  interacción	
  del	
  complejo	
  proteína-­‐ADN.	
  
	
  
Contribuciones	
   y	
   conclusiones:	
   Se	
   generó	
   información	
   sobre	
   la	
   energía	
   de	
   interacción	
   de	
  
Brn3a	
  con	
  las	
  secuencias	
  de	
  VPH-­‐16	
  y	
  en	
  base	
  a	
  los	
  resultados	
  obtenidos	
  se	
  concluye	
  que	
  la	
  
secuencia	
  nucleotídica	
  de	
  VPH-­‐16	
  subtipo	
  1	
  presenta	
  la	
  mayor	
  afinidad	
  a	
  Brn3a,	
  con	
  la	
  cual	
  se	
  
abre	
  la	
  posibilidad	
  de	
  crear	
  una	
  vacuna	
  génica	
  contra	
  el	
  VPH-­‐16.	
  
	
  
	
  
	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  DIRECTOR	
  DE	
  TESIS	
   	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  CO-­‐DIRECTOR	
  DE	
  TESIS	
   	
  
	
  
__________________________	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
   ____________________________	
  
	
  
DR.	
  JOSÉ	
  MARÍA	
  VIADER	
  SALVADÓ	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  M.C.	
  JOSÉ	
  CLAUDIO	
  MORENO	
  ROCHA	
  
  1	
  
1. Introducción	
  
	
  
La	
  transcripción	
  es	
  el	
  proceso	
  en	
  que	
  la	
  información	
  codificada	
  en	
  el	
  ADN	
  se	
  transcribe	
  a	
  
ARN	
   mensajero.	
   La	
   síntesis	
   del	
   ARN	
   la	
   realiza	
   la	
   ARN	
   polimerasa,	
   pero	
   para	
   la	
   iniciación	
   y	
  
progresión	
  del	
  proceso	
  se	
  necesita	
  la	
  participación	
  de	
  un	
  gran	
  número	
  de	
  proteínas	
  (factores	
  
de	
  transcripción)	
  que	
  posibilitan	
  el	
  acoplamiento	
  de	
  la	
  ARN	
  polimerasa	
  al	
  promotor	
  del	
  gen	
  en	
  
concreto	
  y	
  la	
  síntesis	
  del	
  mensajero	
  en	
  una	
  cantidad	
  precisa.	
  La	
  regulación	
  de	
  forma	
  específica	
  
de	
  la	
  síntesis	
  de	
  cada	
  proteína	
  depende	
  de	
  los	
  factores	
  de	
  transcripción.	
  
	
  
Los	
  factores	
  de	
  transcripción	
  son	
  proteínas	
  que	
  coordinan	
  y	
  regulan	
  la	
  expresión	
  de	
  un	
  gen	
  o	
  
de	
  un	
  grupo	
  de	
  genes.	
  En	
  muchos	
  casos	
  regulan	
  su	
  propia	
  expresión	
  y	
  también	
  es	
  frecuente	
  
que	
   regulen	
   a	
   otros	
   factores	
   de	
   transcripción.	
   Estos	
   factores	
   interaccionan	
   con	
   regiones	
  
específicas	
   del	
   ADN,	
   con	
   elementos	
   de	
   la	
   maquinaria	
   de	
   transcripción	
   y	
   con	
   moléculas	
   que	
  
activan	
  o	
  inhiben	
  su	
  actividad.	
  Su	
  función	
  es	
  conectar	
  los	
  estímulos	
  externos	
  e	
  internos	
  de	
  la	
  
célula	
  actuando	
  como	
  transductores	
  de	
  señales.	
  El	
  conjunto	
  de	
  los	
  factores	
  de	
  transcripción	
  de	
  
una	
  célula	
  dibuja	
  una	
  red	
  transcripcional	
  cuyas	
  conexiones	
  determinan	
  el	
  conjunto	
  de	
  genes	
  
que	
  se	
  expresan	
  en	
  un	
  determinado	
  momento	
  (transcriptoma).	
  
	
  
La	
  diferenciación	
  celular	
  depende	
  de	
  la	
  expresión	
  de	
  un	
  patrón	
  específico	
  de	
  genes,	
  lo	
  que	
  está	
  
en	
  gran	
  medida	
  determinado	
  por	
  el	
  perfil	
  de	
  factores	
  de	
  transcripción	
  expresados	
  en	
  cada	
  tipo	
  
celular.	
   Dentro	
   de	
   este	
   perfil	
   hay	
   factores	
   de	
   transcripción	
   cuya	
   expresión	
   está	
  
constantemente	
  activa	
  los	
  cuales	
  son	
  responsables	
  de	
  la	
  expresión	
  de	
  los	
  genes	
  constitutivos,	
  
y	
  hay	
  otros	
  que	
  cuya	
  expresión	
  se	
  activa	
  o	
  inhibe	
  en	
  respuesta	
  a	
  estímulos	
  externos.	
  	
  
	
  
Los	
  factores	
  de	
  transcripción	
  se	
  clasifican	
  en	
  familias	
  según	
  su	
  estructura	
  tridimensional.	
  Para	
  
pertenecer	
  a	
  la	
  misma	
  familia	
  las	
  proteínas	
  deben	
  poseer	
  al	
  menos	
  un	
  25%	
  de	
  identidad	
  entre	
  
ellas,	
  además	
  de	
  estar	
  relacionadas	
  evolutivamente.	
  La	
  familia	
  de	
  los	
  factores	
  de	
  transcripción	
  
POU	
  (Pit-­‐1,	
  Oct-­‐1,	
  Unc-­‐86)	
  poseen	
  un	
  papel	
  determinante	
  en	
  el	
  desarrollo	
  estructural	
  de	
  los	
  
organismos,	
  esta	
  familia	
  contiene	
  un	
  dominio	
  estructural	
  bipartito	
  denominado	
  dominio	
  POU.	
  
El	
   dominio	
   POU	
   es	
   un	
   dominio	
   proteico	
   el	
   cual	
   se	
   une	
   a	
   ADN	
   o	
   ARN	
   y	
   está	
   altamente	
  
conservado	
  en	
  la	
  mayoría	
  de	
  los	
  eucariotas.	
  Un	
  dominio	
  proteínico	
  se	
  define	
  como	
  una	
  unidad	
  
compacta,	
  de	
  características	
  globulares,	
  que	
  suele	
  comprender	
  entre	
  30	
  a	
  150	
  aminoácidos	
  y	
  
se	
   considera	
   que	
   su	
   conformación	
   tridimensional	
   está	
   determinada	
   por	
   su	
   secuencia	
   de	
  
aminoácidos,	
  los	
  cuales	
  se	
  pliegan	
  de	
  forma	
  independiente	
  al	
  resto	
  de	
  la	
  proteína,	
  por	
  lo	
  que	
  
poseen	
  una	
  estructura	
  y	
  función	
  distinguible	
  de	
  otras	
  regiones	
  de	
  la	
  proteína.	
  	
  
	
  
La	
   familia	
   de	
   factores	
   de	
   transcripción	
   POU	
   contiene	
   por	
   lo	
   regular	
   dos	
   subdominios	
   uno	
  
denominado	
   homeodominio	
   y	
   otro	
   denominado	
   POU,	
   este	
   último	
   subdominio	
   está	
   más	
  
conservado	
  en	
  eucariotas	
  que	
  el	
  homeodominio.	
  Estos	
  subdominios	
  trabajan	
  en	
  sinergia	
  para	
  
activar	
  la	
  transcripción	
  de	
  varios	
  genes.	
  Cabe	
  destacar	
  a	
  la	
  sub-­‐familia	
  de	
  proteínas	
  POU	
  IV	
  por	
  
su	
  importancia	
  en	
  el	
  desarrollo	
  del	
  sistema	
  nervioso	
  del	
  embrión	
  humano,	
  específicamente	
  a	
  
los	
   factores	
   de	
   transcripción	
   Brn3a	
   y	
   Brn-­‐3b.	
   Estos	
   factores	
   poseen	
   papeles	
   antagónicos,	
   el	
  
factor	
  de	
  transcripción	
  Brn3a	
  está	
  implicado	
  en	
  el	
  desarrollo	
  del	
  tubo	
  neural,	
  mientras	
  que	
  el	
  
factor	
   de	
   transcripción	
   Brn-­‐3b	
   inhibe	
   a	
   Brn3a;	
   estos	
   factores	
   pertenecen	
   a	
   la	
   familia	
   POU	
  
debido	
  que	
  comparten	
  un	
  dominio	
  estructural	
  de	
  150	
  a	
  160	
  aminoácidos	
  el	
  cual	
  está	
  presente	
  
en	
  las	
  proteínas	
  Pit-­‐1,	
  Oct-­‐1	
  y	
  Unc-­‐86	
  que	
  tienen	
  función	
  regulatoria.	
  El	
  dominio	
  POU	
  deriva	
  su	
  
nombre	
   de	
   la	
   identificación	
   original	
   en	
   los	
   loci	
   homeóticos	
   de	
   Drosophila.	
   Este	
   dominio	
   se	
  
caracteriza	
  por	
  un	
  dominio	
  de	
  unión	
  a	
  ADN	
  separado	
  por	
  una	
  región	
  de	
  15	
  a	
  20	
  aminoácidos	
  
unida	
  a	
  un	
  homeodominio	
  el	
  cual	
  está	
  relacionado	
  con	
  las	
  proteínas	
  homeobox.	
  
	
  
  2	
  
El	
  dominio	
  de	
  unión	
  a	
  ADN	
  de	
  la	
  proteína	
  Brn3a	
  ha	
  sido	
  estudiado	
  con	
  antelación	
  donde	
  se	
  
logró	
   determinar	
   la	
   secuencia	
   de	
   unión	
   al	
   ADN.	
   Estos	
   estudios	
   se	
   basaron	
   en	
   los	
   sitios	
  
homólogos	
  de	
  otras	
  proteínas	
  tales	
  como	
  Oct-­‐1	
  (el	
  octámero	
  TAATGARAT	
  se	
  ha	
  descrito	
  como	
  
un	
  sitio	
  de	
  unión	
  específico	
  para	
  dicha	
  proteína).	
  Cabe	
  destacar	
  que	
  en	
  diversos	
  estudios	
  se	
  ha	
  
correlacionado	
  el	
  papel	
  de	
  activación	
  de	
  estos	
  factores	
  en	
  los	
  genes	
  virales,	
  puesto	
  que	
  los	
  
virus	
  poseen	
  secuencias	
  de	
  unión	
  a	
  estos	
  factores	
  de	
  transcripción.	
  	
  
	
  
En	
  el	
  presente	
  estudio	
  se	
  decidió	
  construir	
  tres	
  modelos	
  tridimensionales	
  de	
  la	
  interacción	
  del	
  
sitio	
  de	
  unión	
  del	
  factor	
  de	
  transcripción	
  Brn3a	
  con	
  la	
  secuencia	
  nucleotídica	
  de	
  la	
  región	
  URR	
  
correspondiente	
   a	
   tres	
   subtipos	
   del	
   virus	
   del	
   papiloma	
   humano	
   variante	
   16	
   (VPH-­‐16),	
  
mediante	
  herramientas	
  bioinformáticas	
  para	
  el	
  posterior	
  diseño	
  de	
  una	
  vacuna	
  génica.	
  	
  
	
  
El	
   genoma	
   del	
   VPH	
   consiste	
   de	
   una	
   molécula	
   de	
   ADN	
   circular	
   de	
   doble	
   cadena,	
  
aproximadamente	
  de	
  8	
  kb.	
  Se	
  divide	
  en	
  tres	
  regiones:	
  la	
  región	
  larga	
  de	
  control,	
  LCR	
  o	
  URR,	
  
que	
  no	
  contiene	
  regiones	
  codificantes;	
  las	
  regiones	
  E1	
  a	
  E8	
  que	
  codifican	
  para	
  las	
  proteínas	
  de	
  
expresión	
  temprana;	
  y	
  las	
  regiones	
  L1	
  y	
  L2	
  que	
  codifican	
  para	
  las	
  proteínas	
  de	
  expresión	
  tardía	
  
en	
   el	
   ciclo	
   de	
   vida	
   del	
   virus.	
   La	
   importancia	
   del	
   presente	
   trabajo	
   reside	
   en	
   que	
   en	
   el	
  
experimento	
   de	
   Turner	
   et	
   al.,	
   1997	
   se	
   encontraron	
   ocho	
   sitios	
   de	
   unión	
   de	
   factores	
   de	
  
transcripción	
  en	
  el	
  genoma	
  del	
  VPH-­‐16	
  con	
  la	
  secuencia	
  nucleotídica	
  ta/taatnanta/t	
  los	
  cuales	
  
están	
  distribuidos	
  en	
  el	
  20%	
  del	
  genoma	
  del	
  virus.	
  Estos	
  sitios	
  no	
  están	
  ligados	
  a	
  la	
  activación	
  
de	
  la	
  expresión	
  de	
  los	
  factores	
  de	
  transcripción	
  del	
  genoma	
  viral	
  ni	
  de	
  los	
  oncogenes,	
  puesto	
  
que	
  no	
  son	
  regiones	
  codificantes	
  y	
  se	
  encuentran	
  frecuentemente	
  cerca	
  de	
  los	
  extremos	
  3’	
  de	
  
los	
  genes	
  tardíos	
  del	
  VPH.	
  A	
  pesar	
  de	
  ello	
  estudios	
  de	
  afinidad	
  demostraron	
  que	
  los	
  factores	
  de	
  
transcripción	
  humanos	
  que	
  contienen	
  el	
  dominio	
  POU	
  interaccionan	
  con	
  estos	
  sitios	
  y	
  activan	
  
la	
  expresión	
  cinco	
  genes	
  virales	
  denominados	
  E6,	
  E7,	
  E5,	
  E4,	
  y	
  E2.	
  	
  
	
  
Es	
  necesario	
  contar	
  con	
  un	
  modelo	
  de	
  interacción	
  molecular	
  de	
  la	
  proteína	
  Brn3a	
  y	
  la	
  región	
  
URR	
   del	
   VPH-­‐16	
   debido	
   a	
   que	
   la	
   activación	
   de	
   la	
   expresión	
   de	
   genes	
   virales	
   se	
   encuentra	
  
correlacionada	
  con	
  el	
  desarrollo	
  de	
  Cáncer	
  cérvicouterino	
  (CaCu).	
  
	
  
Una	
  vacuna	
  génica	
  del	
  CaCu	
  podría	
  ser	
  un	
  vector	
  con	
  una	
  secuencia	
  nucleotídica	
  que	
  presente	
  
una	
   mayor	
   afinidad	
  por	
   Brn3a	
   que	
   la	
   URR	
   silvestre.	
   Una	
   consecuencia	
   directa	
   de	
   tal	
   vector	
  
sería	
   la	
   disminución	
   de	
   la	
   transcripción	
   de	
   proteínas	
   oncogénicas	
   del	
   VPH.	
   En	
   el	
   presente	
  
proyecto,	
   por	
   medio	
   de	
   técnicas	
   computacionales	
   avanzadas	
   se	
   construirán	
   modelos	
   de	
  
interacción	
  entre	
  Brn3a	
  y	
  las	
  secuencias	
  de	
  la	
  región	
  promotora	
  URR	
  de	
  los	
  suptipos	
  1,	
  2	
  y	
  5	
  
del	
  VPH-­‐16	
  que	
  permitirán	
  predecir	
  la	
  especificidad	
  de	
  unión	
  de	
  Brn3a	
  por	
  dichas	
  secuencias.	
  
Esto	
  permitirá	
  a	
  futuro	
  la	
  elección	
  de	
  secuencias	
  nucleotídicas	
  específicas	
  dentro	
  de	
  cientos	
  de	
  
posibilidades	
  para	
  el	
  desarrollo	
  de	
  una	
  vacuna	
  génica.	
  
	
  
2. Importancia	
  
	
  
El	
   cáncer	
   de	
   cérvix	
   o	
   cérvicouterino	
   (CaCu)	
   es	
   la	
   segunda	
   causa	
   de	
   muerte	
   por	
   cáncer	
   en	
  
mujeres	
  tanto	
  en	
  México	
  como	
  a	
  nivel	
  mundial	
  (Rapose,	
  2009),	
  afectando	
  principalmente	
  a	
  
mujeres	
  en	
  edad	
  productiva	
  (Parkin	
  et	
  al.,	
  2006;	
  Agosti	
  et	
  al.,	
  2007).	
  La	
  infección	
  genital	
  con	
  el	
  
VPH	
  es	
  un	
  factor	
  necesario	
  para	
  el	
  desarrollo	
  del	
  cáncer	
  de	
  cérvix	
  (Walboomers	
  et	
  al.,	
  1999).	
  El	
  
VPH	
  se	
  destaca	
  por	
  ser	
  el	
  virus	
  de	
  transmisión	
  sexual	
  más	
  frecuente	
  a	
  nivel	
  mundial	
  (Rapose,	
  
2009).	
  Por	
  esto	
  es	
  necesario	
  construir	
  un	
  modelo	
  in	
  silico	
  que	
  analice	
  la	
  especificidad	
  de	
  la	
  
unión	
  entre	
  el	
  factor	
  de	
  transcripción	
  Brn3a	
  y	
  un	
  fragmento	
  de	
  ADN	
  de	
  la	
  región	
  promotora	
  
URR	
  de	
  VPH-­‐16,	
  el	
  cual	
  permitirá	
  diseñar	
  sitios	
  específicos	
  de	
  unión	
  a	
  Brn3a	
  para	
  el	
  desarrollo	
  
y	
  construcción	
  de	
  vectores	
  virales	
  terapéuticos	
  dirigidos	
  contra	
  el	
  CaCu.	
  	
  
  3	
  
	
  
3. Hipótesis	
  
	
  
Mediante	
  herramientas	
  bioinformáticas	
  se	
  podrá	
  confeccionar	
  un	
  modelo	
  tridimensional	
  de	
  la	
  
interacción	
   entre	
   el	
   factor	
   de	
   transcripción	
   Brn3a	
   y	
   la	
   secuencia	
   nucleotídica	
   de	
   la	
   región	
  
promotora	
  URR	
  de	
  tres	
  subtipos	
  del	
  VPH-­‐16.	
  
	
  
4. Objetivos	
  
4.1 Objetivo	
  general:	
  
	
  
Establecer	
   un	
   modelo	
   tridimensional	
   de	
   interacción	
   del	
   factor	
   de	
   transcripción	
  
humano	
  Brn3a	
  con	
  la	
  región	
  URR	
  de	
  tres	
  subtipos	
  de	
  VPH-­‐16	
  para	
  el	
  diseño	
  de	
  una	
  
vacuna	
  génica	
  contra	
  el	
  CaCu.	
  
	
  
4.2 Objetivos	
  específicos:	
  
	
  
• Construir	
  y	
  validar	
  un	
  modelo	
  tridimensional	
  de	
  la	
  proteína	
  Brn3a.	
  
	
  
	
  
• Construir	
  y	
  validar	
  el	
  modelo	
  tridimensional	
  de	
  interacción	
  de	
  la	
  proteína	
  Brn3a	
  con	
  la	
  
región	
  URR	
  de	
  tres	
  subtipos	
  de	
  VPH-­‐16.	
  
	
  
• Optimizar	
  los	
  modelos	
  tridimensionales	
  de	
  interacción	
  de	
  Brn3a	
  con	
  cada	
  uno	
  de	
  los	
  
tres	
  subtipos	
  de	
  VPH-­‐16	
  y	
  calcular	
  las	
  energías	
  de	
  interacción	
  del	
  complejo	
  proteína-­‐
ADN.	
  
5. Antecedentes	
  
	
  
5.1 Epidemiología	
  y	
  etiología	
  del	
  cáncer	
  cérvicouterino	
  
	
  
El	
   cáncer	
   de	
   cérvix	
   o	
   cérvicouterino	
   (CaCu)	
   es	
   la	
   segunda	
   causa	
   de	
   muerte	
   por	
   cáncer	
   en	
  	
  
mujeres	
  tanto	
  en	
  México	
  como	
  a	
  nivel	
  mundial	
  (Rapose,	
  2009),	
  afectando	
  principalmente	
  a	
  
mujeres	
  en	
  edad	
  productiva	
  (Parkin	
  et	
  al.,	
  2006;	
  Agosti	
  et	
  al.,	
  2007).	
  La	
  infección	
  genital	
  con	
  el	
  
virus	
  del	
  papiloma	
  humano	
  (VPH)	
  es	
  un	
  factor	
  necesario	
  para	
  el	
  desarrollo	
  del	
  cáncer	
  de	
  cérvix	
  
(Walboomers	
   et	
   al.,	
   1999).	
   El	
   VPH	
   se	
   destaca	
   por	
   ser	
   el	
   virus	
   de	
   transmisión	
   sexual	
   más	
  
frecuente	
  a	
  nivel	
  mundial	
  (Rapose,	
  2009).	
  En	
  la	
  tabla	
  1	
  se	
  muestra	
  la	
  relación	
  entre	
  el	
  VPH	
  y	
  las	
  
principales	
  patologías	
  infecciosas	
  que	
  origina	
  de	
  las	
  cuales	
  algunas	
  pueden	
  progresar	
  a	
  cáncer	
  
debido	
  a	
  su	
  potencial	
  oncogénico.	
  
El	
   Sistema	
   Nacional	
   de	
   Salud	
   Mexicano	
   brinda	
   atención	
   médica	
   aproximadamente	
   a	
   9,000	
  
casos	
  de	
  CaCu	
  invasor	
  y	
  se	
  registran	
  4,000	
  muertes	
  anualmente	
  (Walboomers	
  et	
  al.;	
  1999).	
  En	
  
el	
  año	
  2001,	
  se	
  reportaron	
  4,051	
  muertes	
  en	
  mujeres	
  por	
  CaCu,	
  con	
  una	
  tasa	
  de	
  mortalidad	
  de	
  
  4	
  
8.8	
  por	
  cada	
  100,000	
  mujeres.	
  Para	
  el	
  año	
  2002	
  se	
  registraron	
  4,323	
  casos	
  con	
  una	
  tasa	
  de	
  8.6	
  
por	
  100,000	
  mujeres	
  (Estadísticas	
  de	
  la	
  Secretaria	
  de	
  Salud;	
  2002).	
  	
  
	
  
Sin	
   embargo,	
   este	
   tipo	
   de	
   cáncer	
   es	
   absolutamente	
   prevenible	
   y	
   su	
   tratamiento	
   es	
  
relativamente	
   fácil,	
   cuando	
   el	
   diagnóstico	
   es	
   oportuno.	
   El	
   CaCu	
   es	
   de	
   etiología	
   infecciosa	
   y	
  
desde	
  la	
  perspectiva	
  de	
  la	
  salud	
  pública	
  se	
  está	
  consciente	
  que	
  los	
  programas	
  de	
  control	
  no	
  
han	
   funcionado	
   como	
   se	
   esperaba.	
   La	
   experiencia	
   de	
   países	
   desarrollados	
   ha	
   permitido	
  
demostrar	
   que	
   la	
   mejor	
   opción	
   para	
   disminuir	
   la	
   mortalidad	
   por	
   CaCu	
   es	
   la	
   detección	
   y	
   el	
  
tratamiento	
  oportuno	
  de	
  lesiones	
  precursoras	
  y	
  lesiones	
  malignas	
  por	
  medio	
  de	
  programas	
  de	
  
detección	
  oportuna	
  del	
  CaCu	
  y	
  del	
  VPH	
  (World	
  Health	
  Organization,	
  1995).	
  	
  
	
  
El	
   genoma	
   de	
   VPH	
   tiene	
   una	
   longitud	
   aproximada	
   de	
   8	
   kb	
   y	
   su	
   organización	
   se	
   encuentra	
  
prácticamente	
   establecida.	
   Este	
   virus	
   contiene	
   nueve	
   genes,	
   los	
   cuales	
   dependiendo	
   del	
  
momento	
  de	
  su	
  transcripción	
  durante	
  la	
  infección	
  viral,	
  se	
  dividen	
  en	
  genes	
  tempranos	
  (E1,	
  E2,	
  
E3,	
  E4,	
  E5,	
  E6,	
  E7	
  y	
  E8)	
  y	
  genes	
  tardíos	
  (L1	
  y	
  L2).	
  La	
  expresión	
  de	
  estos	
  genes	
  está	
  controlada	
  
por	
   una	
   región	
   promotora	
   río	
   arriba	
   del	
   gen	
   E6	
   (Gloss	
   et	
   al.,	
   1987),	
   denominada	
   unidad	
  
reguladora	
   no	
   codificada	
   (URR)	
   o	
   también	
   unidad	
   larga	
   de	
   control	
   (LCR),	
   de	
   0.4	
   a	
   1	
   kb	
   de	
  
longitud,	
  esencial	
  para	
  funciones	
  reguladoras	
  del	
  genoma	
  durante	
  la	
  replicación,	
  así	
  como	
  para	
  
servir	
   de	
   origen	
   de	
   replicación	
   del	
   ADN	
   y	
   actuar	
   como	
   una	
   región	
   potenciadora	
   de	
   la	
  
transcripción	
  viral	
  por	
  promotores	
  de	
  síntesis	
  del	
  ARN.	
  
	
  
	
  
Tabla	
  1:	
  VPH	
  y	
  su	
  asociación	
  con	
  las	
  principales	
  enfermedades	
  que	
  origina	
  obtenida	
  del	
  
reporte	
  anual	
  de	
  la	
  Secretaria	
  de	
  Salud.	
  
	
  
  5	
  
	
  
Los	
  genes	
  de	
  expresión	
  tempranos	
  codifican	
  para	
  proteínas	
  responsables	
  de	
  las	
  funciones	
  de	
  
transformación	
  celular,	
  replicación	
  y	
  de	
  la	
  persistencia	
  del	
  ADN	
  integrado	
  en	
  las	
  células	
  a	
  las	
  
que	
   infecta.	
   De	
   este	
   grupo	
   destacan	
   las	
   proteínas	
   codificadas	
   por	
   los	
   genes	
   E1	
   y	
   E2	
   que	
  
intervienen	
  en	
  la	
  replicación	
  viral,	
  las	
  proteínas	
  codificadas	
  por	
  los	
  genes	
  E2	
  en	
  sinergia	
  con	
  E4	
  
para	
  facilitar	
  la	
  amplificación	
  del	
  genoma	
  viral	
  y	
  la	
  expresión	
  de	
  proteínas	
  tempranas	
  y	
  sobre	
  
todo,	
  las	
  que	
  intervienen	
  en	
  los	
  procesos	
  de	
  transformación	
  celular	
  codificadas	
  por	
  los	
  genes	
  
E5,	
  E6	
  y	
  E7.	
  
	
  
Las	
   regiones	
   E6/E7	
   tienen	
   un	
   especial	
   interés	
   ya	
   que	
   poseen	
   un	
   importante	
   papel	
   en	
   los	
  
mecanismos	
  de	
  transformación	
  celular.	
  Estas	
  regiones	
  están	
  siempre	
  virtualmente	
  expresadas	
  
en	
  los	
  cánceres	
  asociados	
  al	
  VPH.	
  Las	
  proteínas	
  codificadas	
  por	
  estos	
  genes	
  virales	
  se	
  unen	
  y	
  
ubiquitinan	
   a	
   las	
   proteínas	
   supresoras	
   de	
   tumores	
   p53,	
   pRB	
   y	
   Rb105,	
   induciendo	
   su	
  
degradación,	
  desregulando	
  el	
  ciclo	
  celular	
  y	
  provocando	
  el	
  bloqueo	
  de	
  la	
  apoptosis.	
  
	
  
Existen	
  vacunas	
  eficientes	
  en	
  la	
  prevención	
  de	
  neoplasias	
  cervicales	
  intraepiteliales	
  de	
  grado	
  2	
  
y	
  3	
  causadas	
  por	
  los	
  VPH-­‐16	
  y	
  18,	
  aunque	
  todavía	
  no	
  se	
  conoce	
  el	
  grado	
  de	
  protección	
  contra	
  
otro	
  tipo	
  de	
  VPH	
  como	
  VPH-­‐31,	
  33,	
  35,	
  45,	
  52,	
  y	
  58.	
  El	
  alto	
  costo	
  es	
  también	
  un	
  factor	
  limitante	
  
para	
  su	
  aplicación	
  en	
  países	
  en	
  vías	
  de	
  desarrollo	
  (Lowy,	
  2006;	
  Agosti	
  et	
  al.,	
  2007).	
  
	
  
	
  
5.2 Brn3a	
  y	
  el	
  desarrollo	
  del	
  CaCu	
  mediante	
  la	
  regulación	
  del	
  VPH	
  
	
  
Uno	
  de	
  los	
  factores	
  de	
  transcripción	
  que	
  se	
  une	
  al	
  sitio	
  URR	
  del	
  VPH	
  es	
  Brn3a.	
  Esta	
  proteína	
  
pertenece	
  a	
  la	
  subfamilia	
  4	
  de	
  las	
  proteínas	
  POU,	
  identificada	
  en	
  el	
  GenBank	
  del	
  NCBI	
  como	
  
POU4F1	
  y	
  está	
  conformada	
  por	
  3	
  miembros	
  homólogos:	
  Brn3a,	
  Brn-­‐3b,	
  Brn-­‐3c	
  (Guerrero	
  et	
  al.,	
  
1993).	
  Brn3a	
  juega	
  un	
  papel	
  importante	
  en	
  el	
  proceso	
  del	
  desarrollo	
  del	
  tubo	
  neural	
  durante	
  la	
  
embriogénesis	
   regulando	
   el	
   balance	
   entre	
   proliferación	
   y	
   diferenciación	
   celular,	
   por	
   lo	
   que	
  
ejerce	
  una	
  gran	
  influencia	
  en	
  el	
  destino	
  celular	
  neuronal.	
  Sin	
  embargo,	
  su	
  abundancia	
  declina	
  
llegando	
   a	
   ser	
   ausente	
   en	
   neuronas	
   maduras.	
   Por	
   otra	
   parte,	
   se	
   ha	
   detectado	
   la	
  
sobreexpresión	
   de	
   este	
   factor	
   en	
   diversos	
   tipos	
   de	
   cáncer	
   como	
   el	
   cáncer	
   de	
   próstata,	
  
neuroblastoma,	
  neuroendocrino	
  y	
  CaCu.	
  Respecto	
  al	
  CaCu,	
  diversos	
  estudios	
  en	
  pacientes	
  han	
  
demostrado	
   la	
   sobreexpresión	
   del	
   ARNm	
   de	
   Brn3a	
   en	
   tejido	
   tumoral	
   de	
   hasta	
   300	
   veces	
  
comparada	
  con	
  el	
  tejido	
  circundante	
  (Ndisang	
  et	
  al.,	
  1998).	
  
	
  
La	
  sobreexpresión	
  de	
  este	
  factor	
  transcripcional	
  se	
  ha	
  visto	
  correlacionada	
  con	
  la	
  activación	
  de	
  
la	
  expresión	
  génica	
  del	
  VPH,	
  principalmente	
  de	
  los	
  oncogenes	
  E6	
  y	
  E7,	
  los	
  cuales	
  alteran	
  la	
  tasa	
  
de	
  crecimiento	
  celular	
  tanto	
  in	
  vivo	
  como	
  in	
  vitro.	
  Se	
  han	
  detectado	
  alteraciones	
  específicas	
  en	
  
las	
  secuencias	
  del	
  URR	
  de	
  los	
  subtipos	
  1,	
  2	
  y	
  5	
  del	
  VPH-­‐16	
  las	
  cuales	
  están	
  correlacionadas	
  con	
  
el	
   aumento	
   en	
   la	
   tasa	
   de	
   transcripción	
   de	
   los	
   oncogenes	
   virales.	
   De	
   manera	
   similar	
   se	
   han	
  
identificado	
  variantes	
  en	
  las	
  secuencias	
  de	
  la	
  región	
  E5	
  de	
  VPH-­‐16,	
  que	
  están	
  asociadas	
  con	
  
diferencias	
   en	
   los	
   niveles	
   de	
   transcripción	
   viral	
   de	
   los	
   oncogenes	
   virales,	
   ocasionando	
   la	
  
inducción	
  de	
  la	
  neoplasia,	
  encontrando	
  al	
  subtipo	
  2	
  asociado	
  positivamente	
  al	
  desarrollo	
  de	
  
CaCu.	
  Aunado	
  a	
  esto	
  se	
  ha	
  reportado	
  que	
  el	
  subtipo	
  2	
  presenta	
  mayores	
  niveles	
  de	
  expresión	
  
de	
  los	
  oncogenes	
  E6	
  y	
  E7,	
  estos	
  oncogenes	
  son	
  activados	
  por	
  el	
  factor	
  de	
  transcripción	
  Brn3a.	
  
	
  
Se	
  ha	
  demostrado	
  experimentalmente	
  que	
  la	
  región	
  URR	
  de	
  variantes	
  de	
  VPH	
  presentan	
  una	
  
afinidad	
   a	
   los	
   factores	
   de	
   transcripción	
   Brn3a	
   y	
   Brn-­‐3b,	
   sin	
   embargo	
   ambas	
   proteínas	
   se	
  
antagonizan.	
  En	
  el	
  subtipo	
  2	
  del	
  VPH-­‐16,	
  el	
  factor	
  de	
  transcripción	
  Brn3a	
  es	
  más	
  afín	
  a	
  dicha	
  
secuencia	
  que	
  Brn-­‐3b	
  promoviendo	
  la	
  activación	
  de	
  la	
  región	
  URR	
  y	
  con	
  ello	
  la	
  expresión	
  de	
  los	
  
  6	
  
oncogenes	
   E6	
   y	
   E7,	
   contrario	
   a	
   la	
   función	
   de	
   la	
   proteína	
   Brn-­‐3b,	
   la	
   cual	
   en	
   ensayos	
   de	
  
silenciamiento	
  de	
  Brn3a	
  ha	
  regulado	
  negativamente	
  la	
  expresión	
  de	
  dichos	
  genes	
  (Ndisang	
  et	
  
al.,	
  2001).	
  Se	
  ha	
  identificado	
  la	
  presencia	
  de	
  Brn3a	
  en	
  las	
  líneas	
  celulares	
  cervicales	
  C33	
  y	
  SiHa	
  
(Ndisang	
   et	
   al.,	
   1999).	
   Experimentos	
   de	
   sobreexpresión	
   de	
   Brn3a	
   en	
   células	
   SiHa	
   con	
   el	
  
genoma	
   de	
   VPH-­‐16	
   han	
   demostrado	
   que	
   la	
   concentración	
   de	
   Brn3a	
   inherente	
   en	
   este	
   tipo	
  
celular	
   se	
   encuentra	
   en	
   cantidades	
   saturantes	
   para	
   la	
   expresión	
   de	
   E6,	
   ya	
   que	
   presenta	
   el	
  
mismo	
  efecto	
  que	
  el	
  mostrado	
  por	
  los	
  tratamientos	
  exógenos	
  con	
  dicha	
  proteína.	
  
	
  
La	
  reducción	
  de	
  los	
  niveles	
  de	
  expresión	
  de	
  Brn3a	
  in	
  vivo	
  reduce	
  los	
  niveles	
  de	
  expresión	
  del	
  
gen	
  E6	
  y	
  del	
  gen	
  antiapoptótico	
  Bcl-­‐2,	
  así	
  como	
  la	
  inducción	
  de	
  la	
  tumorogénesis	
  (Ndisang	
  et	
  
al.,	
  1999,	
  2001).	
  Por	
  el	
  contrario	
  la	
  sobreexpresión	
  de	
  Brn-­‐3b	
  resulta	
  en	
  la	
  disminución	
  de	
  la	
  
transcripción	
  de	
  los	
  genes	
  del	
  VPH	
  (Ndisang	
  et	
  al.,	
  1999),	
  mientras	
  que	
  una	
  disminución	
  de	
  
Brn-­‐3b	
   presenta	
   efectos	
   similares	
   a	
   la	
   sobreexpresión	
   de	
   Brn3a	
   (Ndisang	
   et	
   al.,	
   2001).	
   La	
  
sobreexpresión	
   de	
   Brn-­‐3b	
   in	
   vivo	
   presenta	
   un	
   efecto	
   inhibitorio	
   de	
   la	
   expresión	
   de	
   los	
  
oncogenes	
  E6	
  (Ndisang	
  et	
  al.,	
  2001).	
  
	
  
Con	
  base	
  en	
  el	
  papel	
  que	
  juega	
  Brn3a	
  en	
  la	
  interacción	
  y	
  activación	
  de	
  la	
  URR	
  del	
  VPH	
  se	
  han	
  
sugerido	
  varias	
  vías	
  terapéuticas	
  posibles	
  contra	
  el	
  CaCu.	
  Algunas	
  alternativas	
  son	
  la	
  alteración	
  
de	
  la	
  actividad	
  de	
  Brn3a	
  por	
  medios	
  farmacológicos,	
  o	
  bien	
  una	
  reducción	
  de	
  la	
  actividad	
  del	
  
promotor	
  Brn3a	
  (Ndisang	
  et	
  al.,	
  1999,	
  2001).	
  
	
  
La	
   terapia	
   genética	
   abre	
   el	
   camino	
   hacia	
   el	
   diseño	
   de	
   vectores	
   plasmídicos	
   o	
   adenovirales	
  
como	
  tratamiento.	
  	
  
	
  
5.3 Sitios	
  de	
  unión	
  de	
  los	
  homeodominios	
  
	
  
La	
  homeocaja	
  es	
  una	
  secuencia	
  nucleotídica	
  que	
  codifica	
  para	
  un	
  dominio	
  de	
  alrededor	
  de	
  60	
  
aminoácidos	
   (figura	
   1),	
   que	
   se	
   encuentra	
   en	
   muchos	
   organismos	
   eucariotas,	
   cuyo	
   nombre	
  
deriva	
   de	
   su	
   identificación	
   en	
   los	
   loci	
   homeóticos	
   de	
   la	
   mosca	
   de	
   la	
   fruta	
   (Drosophila	
  
melanogaster).	
  En	
  los	
  genes	
  homeóticos	
  de	
  D.	
  melanogaster	
  a	
  menudo	
  el	
  homeodominio	
  está	
  
cerca	
  del	
  extremo	
  C-­‐terminal	
  de	
  las	
  proteínas	
  producto	
  de	
  estos	
  genes.	
  
	
  
	
  
	
  
	
  
Figura	
  1.	
  Estructura	
  de	
  un	
  factor	
  de	
  transcripción	
  el	
  cual	
  contiene	
  un	
  homeodominio.	
  
	
  
  7	
  
El	
   homeodominio	
   puesto	
   que	
   es	
   un	
   subdominio	
   suele	
   combinarse	
   con	
   otros	
   segmentos	
   o	
  
dominios	
   en	
   los	
   factores	
   de	
   transcripción,	
   como	
   pasa	
   con	
   las	
   proteínas	
   Oct	
   (de	
   unión	
   de	
  
octámero),	
  donde	
  una	
  cadena	
  conservada	
  de	
  75	
  aminoácidos,	
  llamada	
  región	
  POU,	
  se	
  localiza	
  
cerca	
  de	
  una	
  región	
  que	
  simula	
  el	
  homeodominio,	
  tal	
  y	
  como	
  sucede	
  con	
  Brn3a.	
  
	
  
El	
  homeodominio	
  se	
  encarga	
  de	
  la	
  unión	
  con	
  el	
  ADN	
  (figura	
  2),	
  este	
  posee	
  la	
  capacidad	
  de	
  
reconocimiento,	
   donde	
   la	
   región	
   C-­‐terminal	
   del	
   homeodominio	
   es	
   idéntico	
   en	
   secuencia	
   al	
  
segmento	
   hélice-­‐giro-­‐hélice	
   de	
   los	
   represores	
   procarióticos.	
   La	
   diferencia	
   entre	
   ambas	
  
estructuras	
  radica	
  en	
  la	
  longitud	
  de	
  la	
  hélice	
  que	
  reconoce	
  al	
  ADN,	
  la	
  hélice-­‐3	
  la	
  cual	
  contiene	
  
17	
   aminoácidos	
   de	
   longitud	
   que	
   son	
   parte	
   del	
   homeodominio	
   en	
   comparación	
   a	
   los	
   9	
  
aminoácidos	
  del	
  represor	
  λ.	
  
	
  
	
  
Figura	
   2.	
   Interacciones	
   del	
   motivo	
   hélice-­‐giro-­‐hélice	
   de	
   la	
   proteína	
   Antennapedia	
   de	
   D.	
  
melanogaster	
  (código	
  PDB:	
  1AHD)	
  con	
  los	
  surcos	
  mayores	
  y	
  menores	
  del	
  ADN,	
  obtenido	
  de	
  la	
  
base	
  de	
  datos	
  Protein	
  Data	
  Bank	
  (www.rcsb.org).	
  
	
  
	
  
La	
  hélice-­‐3	
  se	
  une	
  con	
  el	
  surco	
  mayor	
  del	
  ADN	
  y	
  establece	
  el	
  mayor	
  número	
  de	
  contactos	
  entre	
  
la	
  proteína	
  y	
  el	
  ácido	
  nucleico,	
  de	
  los	
  cuales,	
  muchos	
  de	
  los	
  que	
  orientan	
  la	
  hélice	
  en	
  el	
  surco	
  
mayor	
  son	
  con	
  la	
  columna	
  de	
  fosfatos,	
  de	
  manera	
  que	
  no	
  son	
  específicos	
  para	
  la	
  secuencia	
  del	
  
ADN,	
  sino	
  que	
  se	
  encuentran	
  sobre	
  todo	
  en	
  una	
  cara	
  de	
  la	
  doble	
  hélice	
  y	
  flanquean	
  las	
  bases	
  
con	
  las	
  que	
  se	
  hacen	
  contactos	
  específicos.	
  Los	
  contactos	
  restantes	
  son	
  del	
  brazo	
  N-­‐terminal	
  
del	
   homeodominio,	
   secuencia	
   inmediata	
   a	
   la	
   primera	
   hélice,	
   y	
   se	
   proyecta	
   hacia	
   el	
   surco	
  
menor.	
   Así	
   las	
   regiones	
   N-­‐terminal	
   y	
   C-­‐terminal	
   del	
   homeodominio	
   son	
   las	
   principales	
  
encargadas	
  de	
  hacer	
  contacto	
  con	
  el	
  ADN.	
  
	
  
	
  
5.4 Reconocimiento	
  específico	
  de	
  una	
  secuencia	
  de	
  ADN	
  por	
  los	
  dominios	
  POU	
  	
  
	
  
Pit,	
   Unc,	
   Oct	
   son	
   proteínas	
   de	
   la	
   familia	
   POU	
   que	
   se	
   encuentra	
   muy	
   conservada	
  
evolutivamente	
   entre	
   especies.	
   Además	
   de	
   la	
   proteína	
   Brn3a	
   incluye	
   a	
   gran	
   variedad	
   de	
  
miembros	
   tales	
   como	
   Pit-­‐1,	
   Oct-­‐1,	
   Oct-­‐2,	
   Unc-­‐86,	
   Brn-­‐5,	
   Brn-­‐3b	
   (Herr	
   &	
   Cleary,	
   1995).	
   El	
  
dominio	
  POU	
  de	
  unión	
  a	
  ADN	
  característico	
  de	
  dicha	
  familia	
  se	
  compone	
  de	
  dos	
  subdominios:	
  
POUS	
   y	
   POUH.	
   El	
   subdominio	
   amino-­‐terminal	
   específico	
   (POUS)	
   contiene	
   alrededor	
   de	
   75	
  
aminoácidos	
  	
  y	
  el	
  subdominio	
  homeo	
  carboxi-­‐terminal	
  POUH	
  contiene	
  60	
  aminoácidos.	
  Los	
  dos	
  
subdominios	
  se	
  encuentran	
  unidos	
  por	
  una	
  región	
  flexible	
  híper	
  variable	
  que	
  contiene	
  de	
  15	
  a	
  
56	
  aminoácidos	
  llamada	
  linker	
  o	
  enlazador.	
  Los	
  subdominios	
  POUS	
  y	
  POUH	
  tienen	
  estructuras	
  
independientes,	
   sin	
   embargo	
   la	
   flexibilidad	
   del	
   linker	
   permite	
   su	
   interacción	
   mutua	
   y	
   en	
  
puntos	
  específicos	
  con	
  el	
  ADN	
  (Herr	
  &	
  Cleary,	
  1995),	
  (figura	
  3).	
  
	
  
  8	
  
Estudios	
  cristalográficos	
  recientes	
  elucidaron	
  la	
  estructura	
  del	
  complejo	
  proteína	
  Brn-­‐5	
  unida	
  a	
  
ADN,	
   determinándose	
   que	
   los	
   dominios	
   POUS	
   y	
   POUH	
   se	
   unen	
   al	
   surco	
   mayor	
   del	
   ADN	
   en	
  
posición	
  opuesta	
  (Pereira	
  &	
  Kim,	
  2009).	
  El	
  subdominio	
  POUS	
  se	
  une	
  a	
  la	
  secuencia	
  nucleotídica	
  
atgc	
  en	
  sentido	
  5’,	
  mientras	
  que	
  el	
  subdominio	
  POUH	
  se	
  une	
  a	
  la	
  secuencia	
  aaat	
  en	
  sentido	
  3’,	
  
ambos	
  subdominios	
  se	
  unen	
  en	
  la	
  misma	
  cadena	
  de	
  ADN.	
  Las	
  subunidades	
  POUS	
  y	
  POUH	
  no	
  
interaccionan	
   directamente.	
   Los	
   dos	
   subdominios	
   contienen	
   un	
   motivo	
   hélice-­‐giro-­‐hélice	
  
(HTH)	
  formado	
  por	
  las	
  hélices	
  alfa-­‐2	
  y	
  alfa-­‐3	
  distribuidas	
  perpendicularmente,	
  de	
  las	
  cuales	
  la	
  
hélice	
  alfa-­‐3	
  permite	
  la	
  unión	
  con	
  el	
  ADN.	
  La	
  estructura	
  HTH	
  de	
  POUS	
  está	
  estabilizada	
  por	
  las	
  
hélices	
  alfa-­‐1	
  y	
  alfa-­‐4,	
  mientras	
  que	
  la	
  estructura	
  HTH	
  de	
  POUH	
  está	
  estabilizada	
  por	
  la	
  hélice	
  
alfa-­‐1.	
  	
  
	
  
La	
   capacidad	
   de	
   las	
   proteínas	
   de	
   la	
   familia	
   POU	
   para	
   activar	
   a	
   sus	
   promotores	
   blanco	
   está	
  
influenciada	
  por	
  varios	
  factores.	
  Uno	
  de	
  ellos	
  es	
  atribuido	
  a	
  la	
  variabilidad	
  del	
  linker	
  entre	
  los	
  
subdominios,	
   proporcionando	
   una	
   gran	
   diversidad	
   de	
   sitios	
   de	
   reconocimiento	
   en	
   el	
   ADN	
  
blanco	
   por	
   parte	
   de	
   las	
   proteínas	
   POU.	
   El	
   fragmento	
   peptídico	
   linker	
   entre	
   los	
   dominios	
  se	
  
comporta	
  como	
  un	
  estabilizador	
  de	
  los	
  subdominios	
  POUS	
  y	
  POUH	
  de	
  Brn-­‐5	
  (Pereira	
  &	
  Kim,	
  
2009).	
  Además	
  la	
  estructura	
  cristalizada	
  de	
  Oct-­‐1	
  sugiere	
  que	
  Oct-­‐1	
  no	
  tiene	
  una	
  estructura	
  
rígida,	
  ya	
  que	
  en	
  los	
  experimentos	
  realizados	
  no	
  se	
  logró	
  localizar	
  la	
  presencia	
  del	
  linker	
  en	
  el	
  
mapa	
  de	
  densidad	
  electrónica.	
  
	
  
	
  
Por	
  otro	
  lado	
  las	
  proteínas	
  de	
  la	
  familia	
  POU	
  pueden	
  compartir	
  sitios	
  de	
  unión	
  preferenciales	
  
Figura	
  3.	
  a)	
  Alineamiento	
  de	
  secuencias	
  de	
  aminoácidos	
  de	
  los	
  dominios	
  POU	
  de	
  las	
  proteínas	
  
humanas	
  Brn-­‐5,	
  Oct-­‐1	
  y	
  Pit-­‐1.	
  Los	
  residuos	
  conservados	
  están	
  resaltados	
  en	
  letra	
  negrita.	
  Los	
  
residuos	
  de	
  POUS	
  y	
  POUH	
  implicados	
  en	
  los	
  enlaces	
  de	
  puentes	
  de	
  hidrógeno	
  con	
  el	
  ADN	
  están	
  
resaltados.	
   b)	
   Representación	
   esquemática	
   de	
   la	
   estructura	
   del	
   dominio	
   POU	
   de	
   Brn-­‐5.	
   El	
  
dominio	
  POUS	
  se	
  muestra	
  en	
  color	
  rosa,	
  el	
  enlazador	
  en	
  amarillo	
  y	
  POUH	
  en	
  verde.	
  Las	
  hélices	
  
de	
   los	
   dominios	
   POU	
   están	
   numeradas	
   como	
   se	
   muestra	
   en	
   el	
   alineamiento	
   de	
   la	
   parte	
  
superior.	
  (N)	
  extremo	
  amino-­‐terminal,	
  (C)	
  extremo	
  carboxilo-­‐terminal.	
  
Subdominio	
  específico	
  -­‐	
  POU	
  
Subdominio	
  homeo	
  -­‐	
  POU	
  
  9	
  
que	
   se	
   traslapan	
   y	
   que	
   son	
   capaces	
   de	
   unirse	
   a	
   secuencias	
   nucleotídicas	
   con	
   afinidades	
  
diversas.	
  Por	
  ejemplo,	
  los	
  factores	
  Oct-­‐1	
  y	
  Oct-­‐2	
  reconocen	
  exactamente	
  la	
  misma	
  secuencia	
  
nucleotídica	
  encontrada	
  en	
  varios	
  promotores,	
  y	
  a	
  su	
  vez	
  el	
  factor	
  Pit-­‐1	
  se	
  une	
  in	
  vitro	
  e	
  in	
  vivo	
  
a	
  esta	
  secuencia	
  común	
  aunque	
  en	
  menor	
  afinidad	
  (Li	
  et	
  al.,	
  1993).	
  
	
  
Los	
  factores	
  Oct-­‐1,	
  Brn3a	
  y	
  Brn-­‐3b	
  se	
  unen	
  a	
  la	
  secuencia	
  del	
  promotor	
  viral	
  URR	
  en	
  VPH-­‐16,	
  
en	
  la	
  secuencia	
  nucleotídica	
  atgcaatt.	
  El	
  factor	
  ubicuo	
  Oct-­‐1	
  se	
  expresa	
  en	
  células	
  cervicales	
  lo	
  
que	
  contribuye	
  normalmente	
  a	
  inhibir	
  la	
  actividad	
  del	
  promotor	
  viral	
  URR	
  en	
  VPH-­‐16,	
  contrario	
  
al	
   efecto	
   de	
   Brn3a	
   (Morris	
   et	
   al.,	
   1993).	
   Esta	
   última	
   proteína	
   activa	
   también	
   al	
   promotor	
  
inmediato-­‐temprano	
   (Immediate-­‐Early)	
   del	
   virus	
   herpes	
   simplex	
   	
   (VHS-­‐IE3)	
   por	
   medio	
   de	
   la	
  
secuencia	
  nucleotídica	
  tatgarat	
  (Dawson	
  et	
  al.,	
  1996).	
  
	
  
Las	
  modificaciones	
  al	
  contexto	
  del	
  sitio	
  de	
  unión	
  a	
  ADN	
  también	
  tienen	
  efectos	
  variables.	
  En	
  el	
  
caso	
  del	
  factor	
  de	
  transcripción	
  Brn3a	
  en	
  unión	
  con	
  el	
  promotor	
  viral	
  en	
  VHS-­‐IE3,	
  únicamente	
  
es	
  necesario	
  que	
  se	
  conserve	
  el	
  espacio	
  entre	
  los	
  sitios	
  de	
  unión	
  a	
  ADN,	
  efecto	
  contrario	
  al	
  
causado	
  por	
  Brn-­‐3b	
  (Dawson	
  et	
  al.,	
  1996).	
  A	
  diferencia	
  de	
  esto	
  la	
  represión	
  de	
  dicho	
  promotor	
  
por	
  Oct-­‐2.4	
  y	
  Oct-­‐2.5	
  depende	
  del	
  contexto	
  nucleotídico	
  además	
  del	
  espacio	
  entre	
  los	
  sitos	
  de	
  
unión	
  (Dawson	
  et	
  al.,	
  1996).	
  
	
  
El	
  dominio	
  POU	
  puede	
  influenciar	
  su	
  propia	
  asociación	
  con	
  una	
  proteína	
  co-­‐reguladora	
  en	
  un	
  
sitio	
  diferente.	
  Un	
  buen	
  ejemplo	
  es	
  el	
  complejo	
  VP16-­‐inducido	
  que	
  sirve	
  como	
  activador	
  al	
  
promotor	
  IE	
  del	
  virus	
  del	
  herpes	
  simplex	
  (Herr	
  &	
  Cleary,	
  1995).	
  Aunque	
  el	
  dominio	
  POU	
  se	
  
encuentra	
  altamente	
  conservado,	
  la	
  región	
  linker	
  le	
  confiere	
  a	
  estas	
  proteínas	
  la	
  capacidad	
  de	
  
adoptar	
   varias	
   conformaciones	
   para	
   su	
   unión	
   con	
   el	
   ADN	
   que	
   se	
   traducen	
   en	
   cambios	
  
posicionales	
   y	
   direccionales	
   entre	
   POUS	
   y	
   POUH	
   	
   (Li	
   et	
   al.,	
   1993).	
   Ensayos	
   in	
   vitro	
   han	
  
demostrado	
   que	
   los	
   efectos	
   antagonistas	
   de	
   las	
   proteínas	
   Brn3a	
   y	
   Brn-­‐3b	
   son	
   invertidos	
   al	
  
intercambiar	
  la	
  isoleucina	
  de	
  Brn-­‐3b	
  por	
  la	
  valina	
  de	
  Brn3a	
  en	
  la	
  posición	
  22	
  de	
  la	
  región	
  POU	
  
(Morris	
  et	
  al.,	
  1994,	
  1997).	
  
	
  
Debido	
  al	
  complejo	
  proceso	
  de	
  reconocimiento	
  entre	
  ADN	
  y	
  proteínas,	
  es	
  importante	
  realizar	
  
estudios	
  que	
  permitan	
  elucidar	
  secuencias	
  exactas	
  de	
  interacción	
  de	
  Brn3a	
  con	
  la	
  secuencia	
  
URR	
  de	
  VPH-­‐16	
  con	
  el	
  fin	
  de	
  diseñar	
  nuevas	
  estrategias	
  terapéuticas	
  en	
  el	
  combate	
  contra	
  el	
  
CaCU.	
  
	
  
	
  
5.5 Predicción	
  de	
  la	
  estructura	
  tridimensional	
  de	
  una	
  proteína	
  	
  
	
  
Aunque	
   la	
   estructura	
   de	
   Brn3a	
   no	
   se	
   conoce	
   experimentalmente,	
   existe	
   la	
   posibilidad	
   de	
  
inferirla	
   in	
   silico	
   utilizando	
   modelos	
   de	
   predicción.	
   Existen	
   varios	
   métodos	
   que	
   permiten	
  
predecir	
  una	
  estructura	
  tridimensional	
  protéica.	
  De	
  forma	
  general,	
  se	
  distinguen	
  tres	
  métodos:	
  
	
  
1. Modelaje	
  por	
  comparación	
  o	
  modelaje	
  por	
  homología.	
  	
  
2. Modelaje	
  por	
  reconocimiento	
  de	
  plegamientos.	
  	
  
3. Modelaje	
  por	
  predicción	
  Ab-­‐initio.	
  
	
  
La	
   estrategia	
   utilizada	
   para	
   predecir	
   la	
   estructura	
   tridimensional	
   de	
   una	
   proteína	
   es	
  
determinante	
  para	
  obtener	
  un	
  buen	
  modelo	
  tridimensional,	
  lo	
  cual	
  requiere	
  generalmente	
  la	
  
integración	
  de	
  varios	
  de	
  los	
  métodos	
  conocidos	
  (Ding	
  et	
  al.,	
  2008).	
  
	
  
El	
   estado	
   de	
   los	
   avances	
   de	
   los	
   métodos	
   de	
   predicción	
   de	
   estructuras	
   tridimensionales	
   de	
  
  10	
  
proteínas	
  se	
  puede	
  valorar	
  con	
  los	
  experimentos	
  CASPs	
  (Critical	
  Assessment	
  of	
  Techniques	
  for	
  
Protein	
  Structure	
  Prediction	
  o	
  Evaluación	
  crítica	
  de	
  las	
  técnicas	
  de	
  predicción	
  de	
  la	
  estructura	
  
de	
  proteínas)	
  que	
  son	
  rondas	
  donde	
  se	
  predice	
  la	
  estructura	
  tridimensional	
  de	
  proteínas	
  y	
  se	
  
comparan	
  con	
  estructuras	
  tridimensionales	
  dilucidadas	
  por	
  cristalografía	
  (Jauch	
  et	
  al.,	
  2007;	
  
Ben-­‐David	
  et	
  al.,	
  2009).	
  
	
  
Actualmente	
  existen	
  dos	
  limitantes	
  en	
  los	
  procesos	
  de	
  predicción	
  y	
  validación	
  de	
  estructuras	
  
tridimensionales,	
  lo	
  que	
  requiere	
  una	
  mejora	
  o	
  implementación	
  de	
  nuevos	
  métodos.	
  Primero,	
  
no	
  se	
  puede	
  predecir	
  cualquier	
  estructura	
  in	
  silico:	
  durante	
  la	
  ronda	
  experimental	
  de	
  2008,	
  de	
  
las	
   13	
   estructuras	
   tridimensionales	
   a	
   predecir,	
   4	
   predicciones	
   no	
   fueron	
   aceptables	
   para	
  
ninguno	
   de	
   los	
   grupos	
   participantes	
   (Ben-­‐David	
   et	
   al.,	
   2009).	
   Segundo,	
   los	
   criterios	
   de	
  
evaluación	
  de	
  la	
  similitud	
  entre	
  la	
  predicción	
  y	
  la	
  estructura	
  experimental	
  aún	
  no	
  están	
  bien	
  
definidos	
  (Jauch	
  et	
  al.,	
  2007;	
  Ben-­‐David	
  et	
  al.,	
  2009).	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
5.5.1 Modelaje	
  por	
  homología	
  
	
  
El	
  modelaje	
  por	
  homología	
  permite	
  predecir	
  una	
  estructura	
  tridimensional	
  desconocida	
  de	
  una	
  
proteína	
  blanco	
  por	
  medio	
  de	
  la	
  comparación	
  de	
  su	
  secuencia	
  con	
  secuencias	
  de	
  proteínas	
  
templado	
  cuyas	
  estructuras	
  tridimensionales	
  son	
  conocidas	
  (figura	
  4).	
  Las	
  principales	
  etapas	
  
son:	
  
	
  
a. La	
  selección	
  de	
  templados.	
  
b. El	
  alineamiento	
  con	
  la	
  secuencia	
  blanco.	
  
Figura	
  4.	
  Procedimiento	
  del	
  modelaje	
  por	
  homología.	
  
  11	
  
c. El	
  refinamiento	
  para	
  resolver	
  las	
  regiones	
  de	
  baja	
  similitud.	
  
	
  
El	
   modelaje	
   por	
   homología	
   se	
   utiliza	
   frecuentemente	
   con	
   el	
   fin	
   de	
   descubrir	
   nuevos	
  
medicamentos	
  o	
  para	
  guiar	
  experimentos	
  de	
  mutagénesis	
  (Costanzi,	
  2008).	
  También	
  se	
  utiliza	
  
para	
   estudios	
   de	
   relación	
   de	
   estructura	
   –	
   actividad	
   (QSAR),	
   los	
   cuales	
   buscan	
   relaciones	
  
cuantitativas	
  entre	
  actividad	
  y	
  estructura	
  de	
  una	
  biomolécula	
  (Costanzi,	
  2008).	
  
	
  
El	
  proceso	
  de	
  alineamiento	
  de	
  secuencias	
  es	
  crítico.	
  Rost	
  determinó	
  que	
  si	
  la	
  identidad	
  de	
  las	
  
secuencias	
  en	
  los	
  alineamientos	
  es	
  del	
  30%,	
  el	
  90%	
  de	
  los	
  modelos	
  que	
  sean	
  predichos	
  por	
  
homología	
   serán	
   acertados,	
   mientras	
   que	
   si	
   esta	
   identidad	
   es	
   del	
   20%	
   sólo	
   el	
   10%	
   de	
   los	
  
modelos	
   serán	
   acertados,	
   a	
   esta	
   característica	
   Rost	
   la	
   denominó	
   la	
   zona	
   de	
   incertidumbre	
  
(Rost	
   1999).	
   Si	
   se	
   obtienen	
   valores	
   mayores	
   al	
   50%	
   de	
   identidad	
   entre	
   la	
   secuencia	
   de	
   las	
  
proteínas	
  blanco	
  y	
  de	
  las	
  proteínas	
  templado	
  se	
  producen	
  predicciones	
  de	
  alta	
  calidad	
  (hasta	
  
3Å	
  de	
  resolución).	
  Por	
  el	
  contrario,	
  valores	
  de	
  25	
  a	
  30%	
  de	
  identidad	
  producen	
  predicciones	
  
propensas	
  a	
  presentar	
  errores	
  (Floudas	
  et	
  al.,	
  2006).	
  
	
  
El	
   programa	
   3D-­‐Coffe	
   (O’Sullivan	
   et	
   al.,	
   2004)	
   permite	
   un	
   mejor	
   alineamiento	
   secuencia-­‐
estructura	
  en	
  comparación	
  con	
  otros	
  programas,	
  particularmente	
  para	
  identidades	
  por	
  debajo	
  
del	
   50%	
   (Dalton	
   &	
   Jackson,	
   2007).	
   En	
   las	
   estructuras	
   complejas	
   los	
   pasos	
   de	
   refinamiento	
  
permiten	
  mejorar	
  la	
  predicción	
  hasta	
  0.5	
  Å.	
  
	
  
En	
  comparación	
  con	
  SWISS-­‐MODEL	
  (Schewede	
  et	
  al.,	
  2003)	
  o	
  Builder	
  (Koehl	
  &	
  Delarue,	
  1994),	
  
Modeller	
  (Sali	
  &	
  Blundell,	
  1993),	
  SegMod/ENCAD	
  (Levitt,	
  1992)	
  y	
  Nest	
  (Petrey	
  et	
  al.,	
  2003)	
  son	
  
los	
  programas	
  que	
  presentan	
  mejores	
  resultados	
  en	
  cuanto	
  a	
  resolución	
  y	
  predicción	
  de	
  los	
  
modelos	
  tridimensionales	
  (Wallner	
  &	
  Elofsson,	
  2005),	
  siendo	
  éste	
  último	
  el	
  que	
  mejor	
  resuelve	
  
las	
  estructuras	
  tipo	
  bucle	
  (Dalton	
  &	
  Jackson,	
  2007).	
  
	
  
	
  
5.5.2 Modelaje	
  por	
  reconocimiento	
  de	
  plegamientos	
  
	
  
El	
  método	
  de	
  reconocimiento	
  de	
  plegamientos	
  asume	
  que	
  las	
  estructuras	
  tridimensionales	
  de	
  
las	
  proteínas	
  están	
  más	
  conservadas	
  que	
  las	
  secuencias.	
  Existen	
  diversas	
  técnicas	
  para	
  llevar	
  a	
  
cabo	
   dicho	
   reconocimiento,	
   tales	
   como	
   la	
   predicción	
   de	
   estructuras	
   secundarias	
   y	
  
comparaciones	
  avanzadas	
  de	
  secuencias	
  o	
  pruebas	
  de	
  compatibilidad	
  de	
  secuencias	
  con	
  un	
  
plegamiento	
  tridimensional	
  conocido	
  (Floudas	
  et	
  al.,	
  2006).	
  Estos	
  métodos	
  han	
  tenido	
  éxito	
  en	
  
los	
  experimentos	
  CASPs	
  (Jauch	
  et	
  al.,	
  2007;	
  Ben	
  –David	
  et	
  al.,	
  2009).	
  
	
  
Este	
  método	
  asegura	
  que	
  la	
  secuencia	
  es	
  compatible	
  con	
  cualquiera	
  de	
  los	
  miembros	
  de	
  un	
  
conjunto	
   de	
   estructuras	
   proteicas	
   conocidas.	
   Esto	
   se	
   produce	
   al	
   colocar	
   los	
   residuos	
  
“desconocidos”	
   de	
   la	
   proteína	
   a	
   lo	
   largo	
   de	
   la	
   cadena	
   principal	
   de	
   una	
   estructura	
  
tridimensional	
  de	
  una	
  proteína	
  conocida,	
  para	
  luego	
  determinar	
  la	
  estabilidad	
  de	
  las	
  cadenas	
  
laterales	
  de	
  la	
  estructura	
  tridimensional	
  de	
  la	
  proteína	
  desconocida	
  en	
  esa	
  disposición	
  y	
  luego	
  
deslizar	
  la	
  secuencia	
  de	
  la	
  proteína	
  que	
  no	
  se	
  conoce	
  su	
  estructura	
  a	
  lo	
  largo	
  de	
  la	
  proteína	
  
que	
  sí	
  se	
  conoce	
  su	
  estructura	
  tridimensional,	
  esto	
  se	
  realiza	
  residuo	
  por	
  residuo	
  repitiendo	
  el	
  
cálculo	
  (Voet,	
  2006).	
  
	
  
	
  
5.5.3 Modelaje	
  por	
  predicción	
  Ab-­‐initio	
  
	
  
El	
  modelaje	
  por	
  predicción	
  Ab-­‐initio	
  consiste	
  en	
  encontrar	
  la	
  estructura	
  tridimensional	
  proteica	
  
  12	
  
más	
  estable	
  que	
  corresponde	
  a	
  la	
  conformación	
  que	
  posee	
  la	
  menor	
  energía	
  libre	
  según	
  la	
  
hipótesis	
   de	
   Anfinsen	
   (Anfinsen,	
   1973).	
   Este	
   método	
   se	
   utiliza	
   con	
   cualquier	
   secuencia,	
  
independientemente	
  al	
  conocimiento	
  previo	
  de	
  la	
  estructura,	
  permitiendo	
  así	
  predicciones	
  de	
  
novo.	
   En	
   este	
   método	
   se	
   utilizan	
   primero	
   campos	
   de	
   fuerza	
   simplificados	
   en	
   los	
   cuales	
   se	
  
mueven	
  los	
  residuos,	
  seguido	
  por	
  un	
  refinamiento	
  con	
  un	
  potencial	
  de	
  átomos	
  totales	
  (Fluodas	
  
et	
  al.,	
  2006;	
  Jamal	
  Rahi	
  et	
  al.,	
  2008;	
  Shaeffer	
  et	
  al.,	
  2008;	
  Rohs	
  et	
  al.,	
  2009).	
  
	
  
Estos	
   modelos	
   tratan	
   de	
   predecir	
   la	
   estructura	
   tridimensional	
   desconocida	
   de	
   una	
   proteína	
  
comenzando	
   desde	
   cero,	
   y	
   se	
   basan	
   en	
   principios	
   físicos	
   con	
   los	
   cuales	
   se	
   construyen	
  
algoritmos	
  que	
  intentar	
  imitar	
  el	
  plegado	
  de	
  las	
  proteínas,	
  o	
  bien	
  pueden	
  aplicar	
  un	
  método	
  
estocástico	
   para	
   buscar	
   la	
   conformación	
   más	
   estable	
   termodinámicamente.	
   Este	
   método	
  
requiere	
   de	
   vastos	
   recursos	
   computacionales,	
   como	
   las	
   supercomputadoras,	
   puesto	
   que	
   la	
  
cantidad	
  de	
  información	
  a	
  procesar	
  es	
  enorme,	
  esto	
  además	
  los	
  vuelve	
  muy	
  costosos	
  
6. Metodología	
  
	
  
6.1 Materiales	
  y	
  equipo	
  
	
  
	
  
Se	
  utilizaron	
  dos	
  sistemas	
  operativos	
  diferentes,	
  el	
  primer	
  sistema	
  operativo	
  fue	
  Mac	
  OS	
  	
  X	
  
Mavericks	
  10.9.2	
  ejecutado	
  en	
  una	
  Apple	
  Mac	
  Book	
  Pro	
  con	
  un	
  procesador	
  	
  Intel	
  Core	
  i5	
  de	
  
2.5	
  GHz	
  con	
  8	
  Gb	
  de	
  RAM,	
  el	
  segundo	
  sistema	
  operativo	
  fue	
  Red	
  Hat	
  Enterprise	
  Linux	
  Server	
  
release	
  6.2	
  ejecutado	
  remotamente	
  en	
  el	
  clúster	
  de	
  Supercómputo	
  del	
  IPN	
  en	
  el	
  equipo	
  IBM	
  
iDataPlex	
   	
   denominado	
   Thubat	
   Kaal	
   con	
   los	
   siguientes	
   procesadores:	
   Intel	
   Xeon	
   8-­‐core	
   E5-­‐
2680	
  a	
  2.7	
  GHz,	
  Intel	
  Xeon	
  8-­‐core	
  a	
  2.7	
  GHz,	
  2	
  CPU's	
  Intel	
  Xeon	
  8-­‐core	
  a	
  2.7	
  GHz	
  y	
  2	
  CPU's	
  Intel	
  
Xeon	
  8-­‐core	
  a	
  2.7	
  GHz	
  con	
  288	
  Gb	
  de	
  RAM.	
  
6.2 Estrategia	
  General	
  
	
  
En	
  primer	
  lugar	
  se	
  construyo	
  y	
  valido	
  un	
  modelo	
  tridimensional	
  de	
  la	
  proteína	
  Brn3a	
  utilizando	
  
modelaje	
   por	
   homología	
   con	
   el	
   programa	
   Modeller	
   y	
   validado	
   por	
   MolProbity	
   y	
   QMEAN.	
  
Posteriormente	
  se	
  construirá	
  el	
  modelo	
  tridimensional	
  de	
  la	
  interacción	
  de	
  la	
  proteína	
  Brn3a	
  
con	
   una	
   secuencia	
   nucleotídica	
   similar	
   a	
   la	
   región	
   URR	
   de	
   VPH-­‐16	
   empleando	
   el	
   programa	
  
Modeller	
  se	
  construyo	
  el	
  modelo	
  tridimensional	
  de	
  la	
  proteína	
  Brn3a	
  en	
  formato	
  PDB	
  unida	
  a	
  
la	
  secuencia	
  nucleotídica	
  descrita	
  en	
  el	
  archivo	
  PDB	
  de	
  clave	
  1AU7.	
  Con	
  el	
  programa	
  X3DNA,	
  se	
  
mutaron	
  las	
  secuencias	
  nucleotídicas	
  del	
  modelo	
  tridimensional	
  de	
  interacción	
  proteína-­‐ADN,	
  
las	
   mutaciones	
   fueron	
   con	
   el	
   objeto	
   de	
   que	
   hacer	
   coincidir	
   a	
   la	
   secuencia	
   con	
   la	
   secuencia	
  
nucleotídica	
  de	
  la	
  región	
  URR	
  de	
  los	
  tres	
  subtipos	
  de	
  VPH-­‐16.	
  De	
  esta	
  manera	
  se	
  obtuvieron	
  
tres	
  modelos	
  tridimensionales	
  de	
  interacción	
  de	
  la	
  proteína	
  Brn3a	
  con	
  la	
  región	
  URR	
  de	
  	
  los	
  
tres	
   subtipos	
   de	
   VPH-­‐16	
   subtipo	
   1,	
   subtipo	
   2	
   y	
   subtipo	
   3	
   los	
   cuales	
   se	
   validaron	
   con	
   los	
  
programas	
   MolProbity	
   y	
   QMEAN.	
   Se	
   optimizaron	
   los	
   tres	
   modelos	
   tridimensionales	
   de	
  
interacción	
   de	
   la	
   proteína	
   Brn3a	
   con	
   la	
   región	
   URR	
   de	
   VPH-­‐16	
   empleando	
   un	
   proceso	
   de	
  
minimización	
  de	
  energía	
  con	
  el	
  programa	
  Amber	
  12.	
  Por	
  último	
  se	
  calcularon	
  las	
  energías	
  de	
  
interacción	
  del	
  complejo	
  proteína-­‐ADN.	
  
  13	
  
6.3 Construcción	
  y	
  validación	
  de	
  la	
  estructura	
  tridimensional	
  	
  de	
  la	
  proteína	
  
Brn3a	
  
	
  
La	
  estructura	
  terciaria	
  de	
  Brn3a	
  fue	
  elucidada	
  in	
  silico	
  mediante	
  un	
  modelo	
  de	
  homología.	
  Se	
  
determinó	
   una	
   estructura	
   tridimensional	
   templado	
   mediante	
   la	
   herramienta	
   Blastp	
   del	
  
National	
  Center	
  for	
  Biotechnology	
  Information	
  (NCBI)	
  empleando	
  la	
  secuencia	
  aminoácidica	
  de	
  
Brn3a	
   (clave	
   GenBank	
   NP_006228)	
   contra	
   la	
   base	
   de	
   datos	
   de	
   estructuras	
   tridimensionales	
  
PDB	
   del	
   Protein	
   Data	
   Bank.	
   Se	
   descartaron	
   las	
   estructuras	
   tridimensionales	
   cuya	
   secuencia	
  
aminoácidica	
   presenten	
   una	
   identidad	
   menor	
   al	
   30%	
   con	
   la	
   secuencia	
   de	
   Brn3a.	
   De	
   las	
  
estructuras	
   tridimensionales,	
   se	
   eligió	
   a	
   la	
   plantilla	
   que	
   presento	
   la	
   mayor	
   identidad	
   en	
  
secuencia	
  con	
  Brn3a	
  y	
  que	
  a	
  su	
  vez	
  presento	
  la	
  mejor	
  estructura	
  experimental	
  en	
  cuanto	
  a	
  
resolución	
   cristalográfica,	
   y	
   su	
   secuencia	
   se	
   alineo	
   con	
   la	
   secuencia	
   de	
   Brn3a.	
   Se	
   calculo	
   o	
  
predijo	
  el	
  modelo	
  tridimensional	
  de	
  Brn3a	
  con	
  el	
  programa	
  Modeller.	
  El	
  modelo	
  fue	
  evaluado	
  
utilizando	
  los	
  programas	
  MolProbity	
  y	
  QMEAN	
  (Benkert	
  et	
  al.,	
  2009).	
  
	
  
Se	
  ejecutaron	
  todos	
  los	
  comandos	
  desde	
  la	
  terminal	
  del	
  equipo	
  de	
  cómputo,	
  en	
  este	
  caso	
  se	
  
utilizó	
  el	
  sistema	
  operativo	
  de	
  Unix	
  con	
  la	
  versión	
  de	
  Ubuntu	
  10.4,	
  así	
  como	
  Mac	
  OS	
  X	
  versión	
  
10.8.2	
  Lion.	
  En	
  ambos	
  sistemas	
  se	
  realizaron	
  todos	
  los	
  comandos	
  del	
  programa	
  Modeller	
  con	
  la	
  
misma	
  versión	
  del	
  programa,	
  la	
  versión	
  9.11.	
  
	
  
Todos	
   los	
   comandos	
   del	
   programa	
   Modeller	
   ejecutan	
   programas	
   específicos	
   los	
   cuales	
   se	
  
escribieron	
   en	
   el	
   lenguaje	
   de	
   programación	
   Python.	
   Este	
   lenguaje	
   de	
   alto	
   nivel	
   posee	
   una	
  
sintaxis	
  muy	
  limpia	
  que	
  favorece	
  a	
  que	
  el	
  código	
  sea	
  legible.	
  Además	
  tiene	
  licencia	
  de	
  código	
  
abierto	
  la	
  cual	
  es	
  compatible	
  con	
  la	
  licencia	
  pública	
  general	
  de	
  GNU	
  en	
  que	
  basan	
  los	
  sistemas	
  
Unix.	
  
	
  
Se	
  ejecutaron	
  los	
  comandos	
  de	
  modelado	
  básico	
  del	
  programa	
  Modeller.	
  Una	
  vez	
  obtenido	
  el	
  
modelo,	
   se	
   utilizó	
   el	
   programa	
   Loop-­‐refine	
   para	
   corregir	
   los	
   bucles	
   en	
   la	
   estructura	
  
tridimensional	
  de	
  la	
  proteína	
  y	
  se	
  validó	
  el	
  modelo	
  construido	
  con	
  los	
  programas	
  Molprobity	
  y	
  
QMEAN.	
   El	
   modelo	
   fue	
   aceptable	
   según	
   los	
   criterios	
   de	
   validación	
   obtenidos	
   en	
   dichos	
  
programas	
  	
  y	
  se	
  procedió	
  al	
  próximo	
  paso.	
  
6.4 Construcción	
   y	
   validación	
   del	
   modelo	
   tridimensional	
   de	
   interacción	
   de	
   la	
  
estructura	
   tridimensional	
   de	
   Brn3a	
   con	
   la	
   región	
   URR	
   de	
   tres	
   subtipos	
   de	
  
VPH-­‐16	
  
	
  
6.4.1 Construcción	
   del	
   modelo	
   tridimensional	
   de	
   interacción	
   Brn3a	
   con	
   la	
  
región	
  URR	
  de	
  VPH-­‐16	
  
	
  
Se	
   utilizó	
   la	
   conformación	
   estructural	
   tridimensional	
   de	
   la	
   proteína	
   Brn3a	
   determinada	
  
previamente	
  y	
  se	
  estableció	
  la	
  estructura	
  de	
  Brn3a	
  en	
  interacción	
  con	
  la	
  secuencia	
  de	
  unión	
  a	
  
la	
  variante	
  1	
  del	
  VPH-­‐16	
  con	
  el	
  software	
  Modeller.	
  Se	
  usó	
  el	
  programa	
  Ligand	
  el	
  cual	
  genero	
  un	
  
modelo	
  tridimensional	
  de	
  la	
  proteína	
  Brn3a	
  unida	
  a	
  la	
  secuencia	
  nucleotídica	
  extraída	
  de	
  un	
  
archivo	
   PDB	
   de	
   clave	
   1AU7.	
   Esta	
   clave	
   corresponde	
   a	
   la	
   estructura	
   tridimensional	
   de	
   la	
  
proteína	
   con	
   mayor	
   identidad	
   a	
   Brn3a	
   por	
   ello	
   sirvió	
   como	
   modelo	
   base.	
   Con	
   el	
   programa	
  
X3DNA	
   se	
   mutó	
   la	
   secuencia	
   nucleotídica	
   del	
   modelo	
   de	
   interacción	
   ADN-­‐proteína	
   (Brn3a-­‐
ADN)	
  para	
  obtener	
  la	
  secuencia	
  nucleotídica	
  de	
  la	
  región	
  URR	
  VPH-­‐16.	
  El	
  programa	
  X3DNA	
  se	
  
ejecutó	
   desde	
   la	
   terminal	
   del	
   equipo	
   de	
   cómputo	
   y	
   se	
   usó	
   el	
   comando	
   mutate	
   bases	
   de	
  
X3DNA.	
   En	
   el	
   comando	
   a	
   ejecutar	
   se	
   especifico	
   en	
   primer	
   lugar	
   la	
   cadena	
   del	
   modelo	
  
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1
tesis Brn3a v1

Más contenido relacionado

Similar a tesis Brn3a v1

Manualbioseguridad1
Manualbioseguridad1Manualbioseguridad1
Manualbioseguridad1Jc Vergara
 
Gc bioseguridad
Gc bioseguridadGc bioseguridad
Gc bioseguridaddelcid58
 
Bioseguridad
BioseguridadBioseguridad
BioseguridadHAROLDECH
 
Analisis de amenazas_y_vulnerabilidad_final 30 mayo 2012
Analisis de amenazas_y_vulnerabilidad_final 30 mayo 2012Analisis de amenazas_y_vulnerabilidad_final 30 mayo 2012
Analisis de amenazas_y_vulnerabilidad_final 30 mayo 2012Luis Enrique Olivares Yañez
 
MA-01 MANUAL DE BIOSEGURIDAD Y PLAN DE EVACUACION.pdf
MA-01 MANUAL DE BIOSEGURIDAD Y PLAN DE EVACUACION.pdfMA-01 MANUAL DE BIOSEGURIDAD Y PLAN DE EVACUACION.pdf
MA-01 MANUAL DE BIOSEGURIDAD Y PLAN DE EVACUACION.pdfLeidyMoreno91
 
Conferencia nacional de consenso sobre ulceras de la extremidad inferior
Conferencia nacional de consenso sobre ulceras de la extremidad inferiorConferencia nacional de consenso sobre ulceras de la extremidad inferior
Conferencia nacional de consenso sobre ulceras de la extremidad inferiorGNEAUPP.
 
Airepi - OEPM Patent - P202030970 - Sept 25, 2020
Airepi - OEPM Patent - P202030970 - Sept 25, 2020Airepi - OEPM Patent - P202030970 - Sept 25, 2020
Airepi - OEPM Patent - P202030970 - Sept 25, 2020Javier Ferrer Alós
 
comunicacion de riesgo radiologia pediatrica.pdf
comunicacion de riesgo radiologia pediatrica.pdfcomunicacion de riesgo radiologia pediatrica.pdf
comunicacion de riesgo radiologia pediatrica.pdfVirgilioHidalgo4
 
Guias Clinicas Valencia
Guias Clinicas ValenciaGuias Clinicas Valencia
Guias Clinicas ValenciaSERGIO BLANCO
 
APLICACION DE LAS MEDIDAS DE BIOSEGURIDAD.docx
  APLICACION  DE LAS MEDIDAS DE  BIOSEGURIDAD.docx  APLICACION  DE LAS MEDIDAS DE  BIOSEGURIDAD.docx
APLICACION DE LAS MEDIDAS DE BIOSEGURIDAD.docxLIZBETHNICIDAPACHECO
 
Libro de ponencias X Encuentro (Albacete 2006)
Libro de ponencias X Encuentro (Albacete 2006)Libro de ponencias X Encuentro (Albacete 2006)
Libro de ponencias X Encuentro (Albacete 2006)investenisciii
 
¿Cuál es el riesgo de contagio de la nueva variante Ómicron en el personal qu...
¿Cuál es el riesgo de contagio de la nueva variante Ómicron en el personal qu...¿Cuál es el riesgo de contagio de la nueva variante Ómicron en el personal qu...
¿Cuál es el riesgo de contagio de la nueva variante Ómicron en el personal qu...Unidad de Emprendimiento ambulante
 
PROTOCOLO SONDAJE VESICAL.pdf
PROTOCOLO SONDAJE VESICAL.pdfPROTOCOLO SONDAJE VESICAL.pdf
PROTOCOLO SONDAJE VESICAL.pdfhgt
 
2 rotavirus and rotavirus vaccines spanishweb
2 rotavirus and rotavirus vaccines spanishweb2 rotavirus and rotavirus vaccines spanishweb
2 rotavirus and rotavirus vaccines spanishwebRuth Vargas Gonzales
 
Aetsa 2011 2-3_virus_oncoliticos
Aetsa 2011 2-3_virus_oncoliticosAetsa 2011 2-3_virus_oncoliticos
Aetsa 2011 2-3_virus_oncoliticosVictor Alvarado
 

Similar a tesis Brn3a v1 (20)

Manualbioseguridad1
Manualbioseguridad1Manualbioseguridad1
Manualbioseguridad1
 
Gc bioseguridad
Gc bioseguridadGc bioseguridad
Gc bioseguridad
 
Bioseguridad
BioseguridadBioseguridad
Bioseguridad
 
Bioseguridad
BioseguridadBioseguridad
Bioseguridad
 
Analisis de amenazas_y_vulnerabilidad_final 30 mayo 2012
Analisis de amenazas_y_vulnerabilidad_final 30 mayo 2012Analisis de amenazas_y_vulnerabilidad_final 30 mayo 2012
Analisis de amenazas_y_vulnerabilidad_final 30 mayo 2012
 
MA-01 MANUAL DE BIOSEGURIDAD Y PLAN DE EVACUACION.pdf
MA-01 MANUAL DE BIOSEGURIDAD Y PLAN DE EVACUACION.pdfMA-01 MANUAL DE BIOSEGURIDAD Y PLAN DE EVACUACION.pdf
MA-01 MANUAL DE BIOSEGURIDAD Y PLAN DE EVACUACION.pdf
 
Conferencia nacional de consenso sobre ulceras de la extremidad inferior
Conferencia nacional de consenso sobre ulceras de la extremidad inferiorConferencia nacional de consenso sobre ulceras de la extremidad inferior
Conferencia nacional de consenso sobre ulceras de la extremidad inferior
 
Airepi - OEPM Patent - P202030970 - Sept 25, 2020
Airepi - OEPM Patent - P202030970 - Sept 25, 2020Airepi - OEPM Patent - P202030970 - Sept 25, 2020
Airepi - OEPM Patent - P202030970 - Sept 25, 2020
 
comunicacion de riesgo radiologia pediatrica.pdf
comunicacion de riesgo radiologia pediatrica.pdfcomunicacion de riesgo radiologia pediatrica.pdf
comunicacion de riesgo radiologia pediatrica.pdf
 
Guias Clinicas Valencia
Guias Clinicas ValenciaGuias Clinicas Valencia
Guias Clinicas Valencia
 
Registro de cancer
Registro de cancerRegistro de cancer
Registro de cancer
 
APLICACION DE LAS MEDIDAS DE BIOSEGURIDAD.docx
  APLICACION  DE LAS MEDIDAS DE  BIOSEGURIDAD.docx  APLICACION  DE LAS MEDIDAS DE  BIOSEGURIDAD.docx
APLICACION DE LAS MEDIDAS DE BIOSEGURIDAD.docx
 
Virus
VirusVirus
Virus
 
Libro de ponencias X Encuentro (Albacete 2006)
Libro de ponencias X Encuentro (Albacete 2006)Libro de ponencias X Encuentro (Albacete 2006)
Libro de ponencias X Encuentro (Albacete 2006)
 
¿Cuál es el riesgo de contagio de la nueva variante Ómicron en el personal qu...
¿Cuál es el riesgo de contagio de la nueva variante Ómicron en el personal qu...¿Cuál es el riesgo de contagio de la nueva variante Ómicron en el personal qu...
¿Cuál es el riesgo de contagio de la nueva variante Ómicron en el personal qu...
 
PROTOCOLO SONDAJE VESICAL.pdf
PROTOCOLO SONDAJE VESICAL.pdfPROTOCOLO SONDAJE VESICAL.pdf
PROTOCOLO SONDAJE VESICAL.pdf
 
2 rotavirus and rotavirus vaccines spanishweb
2 rotavirus and rotavirus vaccines spanishweb2 rotavirus and rotavirus vaccines spanishweb
2 rotavirus and rotavirus vaccines spanishweb
 
T.g. completo
T.g. completoT.g. completo
T.g. completo
 
TESIS.pptx
TESIS.pptxTESIS.pptx
TESIS.pptx
 
Aetsa 2011 2-3_virus_oncoliticos
Aetsa 2011 2-3_virus_oncoliticosAetsa 2011 2-3_virus_oncoliticos
Aetsa 2011 2-3_virus_oncoliticos
 

tesis Brn3a v1

  • 1. UNIVERSIDAD  AUTÓNOMA  DE  NUEVO  LEÓN   FACULTAD  DE  CIENCIAS  BIOLÓGICAS   INSTITUTO  DE  BIOTECNOLOGÍA                     Construcción  de  un  modelo  in  silico  de  la  interacción  entre  el  factor  de  trascripción  Brn3a  y  la   región  promotora  URR  de  la  variante  16  del  Virus  del  papiloma  humano  en  un  contexto  de   terapia  génica  contra  el  Cáncer  de  Cérvix         TESIS  QUE  PRESENTA         JAVIER  ALEJANDRO  RENDÓN  CARRILLO         TESIS  COMO  REQUISITO    PARA  OBTENER  EL    TÍTULO  PROFESIONAL    DE:       LICENCIADO  EN  BIOTECNOLOGÍA  GENÓMICA                                       San  Nicolás  de  los  Garza,  N.L.                                                  2  de  Junio  del  2014   RC-­‐07-­‐026   REV.00-­‐09/06    
  • 2.   II   CONSTRUCCIÓN  DE  UN  MODELO  IN  SILICO  DE  LA  INTERACCIÓN  ENTRE  EL  FACTOR  DE   TRASCRIPCIÓN  BRN3A  Y  LA  REGIÓN  PROMOTORA  URR  DE  LA  VARIANTE  16  DEL  VIRUS  DEL   PAPILOMA  HUMANO  EN  UN  CONTEXTO  DE  TERAPIA  GÉNICA  CONTRA  EL  CÁNCER  DE  CÉRVIX                       TESIS     PRESENTADA  COMO  REQUISITO    PARA  OBTENER  EL    TÍTULO  PROFESIONAL    DE:     LICENCIADO  EN  BIOTECNOLOGÍA  GENÓMICA       JAVIER  ALEJANDRO  RENDÓN  CARRILLO       APROBADA:       COMISIÓN  DE  EXAMEN:           DR.  JOSÉ  MARÍA  VIADER  SALVADÓ       ________________________________          PRESIDENTE       M.C.  JOSÉ  CLAUDIO  MORENO  ROCHA       ________________________________            SECRETARIO       DRA.  MARTHA  GUERRERO  OLAZARÁN       ________________________________                      VOCAL       DR.  JUAN  ANTONIO  GALLEGOS  LÓPEZ   ________________________________            SUPLENTE           RC-­‐07-­‐026   REV.00-­‐09/06    
  • 3.   III   CONSTRUCCIÓN  DE  UN  MODELO  IN  SILICO  DE  LA  INTERACCIÓN  ENTRE  EL  FACTOR  DE   TRASCRIPCIÓN  BRN3A  Y  LA  REGIÓN  PROMOTORA  URR  DE  LA  VARIANTE  16  DEL  VIRUS  DEL   PAPILOMA  HUMANO  EN  UN  CONTEXTO  DE  TERAPIA  GÉNICA  CONTRA  EL  CÁNCER  DE  CÉRVIX                       TESIS     PRESENTADA  COMO  REQUISITO    PARA  OBTENER  EL    TÍTULO  PROFESIONAL    DE:     LICENCIADO  EN  BIOTECNOLOGÍA  GENÓMICA       JAVIER  ALEJANDRO  RENDÓN  CARRILLO       APROBADA:       COMISIÓN  DE  TESIS:           DR.  JOSÉ  MARÍA  VIADER  SALVADÓ       ________________________________            DIRECTOR       M.C.  JOSÉ  CLAUDIO  MORENO  ROCHA       ________________________________          CO-­‐DIRECTOR       DRA.  MARTHA  GUERRERO  OLAZARÁN       ________________________________              SECRETARIO       DR.  JUAN  ANTONIO  GALLEGOS  LÓPEZ   ________________________________            SUPLENTE           RC-­‐07-­‐026   REV.00-­‐09/06    
  • 4.   IV   CONSTRUCCIÓN  DE  UN  MODELO  IN  SILICO  DE  LA  INTERACCIÓN  ENTRE  EL  FACTOR  DE   TRASCRIPCIÓN  BRN3A  Y  LA  REGIÓN  PROMOTORA  URR  DE  LA  VARIANTE  16  DEL  VIRUS  DEL   PAPILOMA  HUMANO  EN  UN  CONTEXTO  DE  TERAPIA  GÉNICA  CONTRA  EL  CÁNCER  DE  CÉRVIX                       TESIS     PRESENTADA  COMO  REQUISITO    PARA  OBTENER  EL    TÍTULO  PROFESIONAL    DE:     LICENCIADO  EN  BIOTECNOLOGÍA  GENÓMICA       JAVIER  ALEJANDRO  RENDÓN  CARRILLO       APROBADA:       COMISIÓN  DE  TESIS:           DR.  JOSÉ  MARÍA  VIADER  SALVADÓ       ________________________________            DIRECTOR       M.C.  JOSÉ  CLAUDIO  MORENO  ROCHA       ________________________________          CO-­‐DIRECTOR                             RC-­‐07-­‐026   REV.00-­‐09/06    
  • 5.   V     ÍNDICE     V.     Dedicatoria    ..................................................................................................................  VII   VI.        Agradecimientos  .........................................................................................................  VIII   VII.      Lista  de  abreviaturas  .....................................................................................................  IX   VIII.    Lista  de  tablas  ................................................................................................................  X   IX.          Lista  de  figuras  ............................................................................................................  XII   X.            Resumen  ...................................................................................................................  XIV   1.   Introducción  ...................................................................................................................  1   2.   Importancia  ....................................................................................................................  2   3.   Hipótesis  ........................................................................................................................  3   4.   Objetivos  ........................................................................................................................  3   4.1   Objetivo  general:  ................................................................................................................  3   4.2   Objetivos  específicos:  .........................................................................................................  3   5.   Antecedentes  .................................................................................................................  3   5.1   Epidemiología  y  etiología  del  cáncer  cérvicouterino  ..........................................................  3   5.2   Brn3a  y  el  desarrollo  del  CaCu  mediante  la  regulación  del  VPH  ........................................  5   5.3   Sitios  de  unión  de  los  homeodominios  ...............................................................................  6   5.4   Reconocimiento  específico  de  una  secuencia  de  ADN  por  los  dominios  POU  ...................  7   5.5   Predicción  de  la  estructura  tridimensional  de  una  proteína  ..............................................  9   5.5.1   Modelaje  por  homología  ...........................................................................................  10   5.5.2   Modelaje  por  reconocimiento  de  plegamientos  ........................................................  11   5.5.3   Modelaje  por  predicción  Ab-­‐initio  .............................................................................  11   6.   Metodología  ................................................................................................................  12   6.1   Materiales  y  equipo  ..........................................................................................................  12   6.2   Estrategia  General  ............................................................................................................  12   6.3   Construcción  y  validación  de  la  estructura  tridimensional    de  la  proteína  Brn3a  ............  13   6.4   Construcción  y  validación  del  modelo  tridimensional  de  interacción  de  la  estructura   tridimensional  de  Brn3a  con  la  región  URR  de  tres  subtipos  de  VPH-­‐16  ..........................  13   6.4.1    Construcción  del  modelo  tridimensional  de  interacción  Brn3a  con  la  región  URR  de     VPH-­‐16  ..........................................................................................................................  13   6.4.2  Determinación  de  la  energía  del  complejo  proteína-­‐ADN  ............................................  14     6.5   Optimización  y  cálculo  de  la  energía  de  interacción  de  los  modelos  tridimensionales  de   interacción  de  Brn3a  con  los  tres  subtipos  de  VPH-­‐16  .....................................................  14   7.   Resultados  ...................................................................................................................  15   7.1   Construcción  y  validación  de  la  estructura  tridimensional    de  la  proteína  Brn3a.  ...........  15   7.2   Construcción  y  validación  del  modelo  tridimensional  de  interacción  de  la  estructura   tridimensional  de  Brn3a  con  la  región  URR  de  tres  subtipos  de  VPH-­‐16  ..........................  19   7.2.1     Construcción  del  modelo  tridimensional  de  interacción  Brn3a  con  la  región  URR  de   VPH-­‐16  .......................................................................................................................  19   7.2.2   Determinación  de  la  energía  del  complejo  proteína-­‐ADN  .........................................  27   7.2.3    Optimización  y  cálculo  de  la  energía  de  interacción  de  los  modelos  tridimensionales   de  interacción  de  Brn-­‐3a  con  los  tres  subtipos  de  VPH-­‐16  en  forma  de  logo.  ............  33  
  • 6.   VI   8.   Discusión  ......................................................................................................................  36   9.   Literatura  citada  ...........................................................................................................  40    
  • 7.   VII   DEDICATORIA                                                                                           Con todo mi cariño y mi amor para las personas que hicieron todo en la vida para que yo pudiera lograr mis sueños, por motivarme y darme la mano cuando sentía que el camino se terminaba, a ustedes por siempre mi corazón y mi agradecimiento. A mi madre y padre. Sapere aude.
  • 8.   VIII     AGRADECIMIENTOS     Agradezco  por  este  trabajo  en  primer  lugar:  a  mis  padres  por  todo  su  apoyo  para  finalizar  la   licenciatura,   asimismo   al   Doctor   José   Ma.   Viader   Salvadó   por   permitirme   terminar   este   proyecto  &  al  M.C.  José  Claudio  Rocha  Moreno.     Un   agradecimiento   muy   especial   a   la   Dra.   Elisa   Shaefer   Satu   por   su   asesoría   personal   en   programación,   instalación   y   ejecución   del   software   necesario   para   la   implementación   del   trabajo.     Se  agradece  al  Centro  Nacional  de  Supercómputo  (CNS)  del  IPICYT,  A.C.  por  los  recursos  de   Supercómputo  proporcionados  asignados,  los  cuales  se  enlistan  a  continuación:  Thubat  Kaal.     Agradezco  por  igual  a  mis  amigos  Marco,  Aracely  y  muy  especialmente  a  Laura  por  todo  el   apoyo   para   poder   continuar   con   el   presente   proyecto   y   concluirlo   a   pesar   de   todos   los   inconvenientes  y  retos  técnicos  que  presento.                                                                
  • 9.   IX     LISTA  DE  ABREVIATURAS         ARN       Ácido  ribonucleico   °C       Grados  Celsius   CaCu     Cáncer  Cérvicouterino     ADN       Ácido  desoxirribonucleico   et  al.     Et  alii  (y  colaboradores)   g       Gramos   h       Horas   K     Grados  Kelvin   kb       Kilobase=mil  pares  de  bases   kDa       Kilodaltones   M       Concentración  Molar   mA       Miliamperes   mg       Miligramos   min       Minutos   μg     Microgramo   μL     Microlitro   μM     Micromolar   mL           Mililitros   mM     Concentración  Milimolar   N°   Número   NaCl     Cloruro  de  sodio   NaOH     Hidróxido  de  sodio   NCBI     National  Center  for  Biotechnology  Information   ng     Nangramos   nm     Nanómetros   ns   Nanosegundos   LCR   Región  larga  de  control   pb     Pares  de  bases   ps   picosegundos   P     Fósforo   RMSD   Raíz  cuadrada  media  de  la  desviación  de  posiciones  atómicas       s     Segundos   SD     Desviación  estándar   t     Tiempo   to     Tiempo  inicial   URR   Región  reguladora  río  arriba   V     Volts   VPH-­‐16   Virus  del  papiloma  humano  variante  16   %     Porcentaje   3D   Tridimensional              
  • 10.   X   LISTA  DE  TABLAS       TABLA     DESCRIPCIÓN     PÁGINA     1   VPH  y  su  asociación  con  las  principales  enfermedades  que  origina   obtenida  del  reporte  anual  de  la  Secretaria  de  Salud.   4   2     Lista  de  las  20  proteínas  con  mayor  identidad  y  valor  E  mas  alto,   listadas   por   su   clave   pdb   generado   por   el   archivo   ejecutable   build_profile.py  obtenidas  de  Modeller.   16   3     Matriz   de   distancias   de   identidad   de   secuencia,   se   presenta   la   clave   del   archivos   pdb   que   presentaron   mayor   identidad   en   secuencia  a  Brn3a.   16   4     Criterios   para   seleccionar   el   archivo   pdb   que   servirá   como   modelo  para  construir  la  estructura  tridimensional  de  Brn3a.   17   5     Evaluación  mediante  los  3  criterios  de  inclusión  para  escoger  la   mejor   estructura   tridimensional   para   construir   el   modelo   de   Brn3a.   17   6     Puntuaciones   de   energía   de   acuerdo   a   los   3   algoritmos   de   evaluación   usados   por   Modeller   que   corresponden   a   las   estructuras  tridimensionales  (PDB)  generados  por  Modeller.   18   7     Puntuaciones   de   energía   de   acuerdo   a   los   3   algoritmos   de   evaluación   usados   por   Modeller   que   corresponden   a   las   estructuras   tridimensionales   (PDB)   generados   por   el   archivo   ejecutable  ligand.py.   19   8     Puntuaciones   de   energía   de   acuerdo   a   los   3   algoritmos   de   evaluación   usados   por   Modeller   que   corresponden   a   las   estructuras   tridimensionales   (PDB)   generados   por   el   archivo   ejecutable  loop-­‐refine.py.     20   9     Puntuaciones   de   energía   de   acuerdo   a   los   3   algoritmos   de   evaluación   usados   por   Modeller   que   corresponden   a   las   estructuras   tridimensionales   (PDB)   generados   por   el   archivo   ejecutable  loop-­‐refine.py.     22     10     Cantidad   de   ángulos   diédricos   Ψ   (psi)   y     Φ   (phi)     favorables   permitidos   y   atípicos   que   del   total   de   aminoácidos   de   la   estructura  tridimensional  Brn3a-­‐ADN.     24     11   11  A:  Energía  total  previa  a  la  simulación  molecular   11  B:  Energía  total  al  final  de  la  simulación  molecular   29   12   Resultados  de  la  dinámica  molecular  por    MMPBSA.   36  
  • 11.   XI   LISTA  DE  FIGURAS     FIGURA     DESCRIPCIÓN     PÁGINA     1   Estructura   de   un   factor   de   transcripción   el   cual   contiene   un   homeodominio.   6   2     Interacciones   del   motivo   hélice-­‐giro-­‐hélice   de   la   proteína   Antennapedia   de   D.   melanogaster   (código   PDB:   1AHD)   con   los   surcos  mayores  y  menores  del  ADN,  obtenido  de  la  base  de  datos   Protein  Data  Bank  (www.rcsb.org).   7   3     a)   Alineamiento   de   secuencias   de   aminoácidos   de   los   dominios   POU  de  las  proteínas  humanas  Brn-­‐5,  Oct-­‐1  y  Pit-­‐1.  Los  residuos   conservados   están   resaltados   en   letra   negrita.   Los   residuos   de   POUS  y  POUH  implicados  en  los  enlaces  de  puentes  de  hidrógeno   con  el  ADN  están  resaltados.  b)  Representación  esquemática  de   la   estructura   del   dominio   POU   de   Brn-­‐5.   El   dominio   POUS   se   muestra  en  color  rosa,  el  enlazador  en  amarillo  y  POUH  en  verde.   Las   hélices   de   los   dominios   POU   están   numeradas   como   se   muestra   en   el   alineamiento   de   la   parte   superior.   (N)   extremo   amino-­‐terminal,  (C)  extremo  carboxilo-­‐terminal.       8   4   Procedimiento  del  modelaje  por  homología.   10   5     Esquema  que  presenta  en  forma  de  jerarquía  las  rutas  de  acceso   a  los  archivos  ejecutables  del  presente  trabajo,  de  esta  manera  se   ordenaron   las   carpetas   contenidas   dentro   del   directorio   Modelaje_básico.     15   6   Dominios     y   familias   de   proteínas   relacionadas   a   los   dominios   presentes  en  la  secuencia  de  Brn3a,  la  familia  POU  a  la  izquierda   y  la  familia  de  los  homeodominios  a  la  derecha,  descritos  en  la   base   de   datos   "Conserved   Domains"   del   NCBI   y   localizados   mediante  la  herramienta  BLASTp.   15   7     Gráfico   que   muestra   el   puntaje   DOPE   de   cada   aminoácido   comparado   con   la   estructura   PDB   2XSD   usada   como   modelo   base.   La   región   enmarcada   por   el   rectángulo   corresponde   al   bucle   de   la   región   interdominios   donde   se   presenta   un   incremento  de  energía.   18   8     Gráfico  que  muestra  el  puntaje  DOPE  de  cada  aminoácido  de  la   nueva  estructura  PDB  Brn3a.B99990001    la  cual  se  encuentra  en   interacción  con  el  ADN  (azul)  obtenido  de  el  archivo  pdb  2XSD,   comparado   con   la   estructura   PDB   2XSD   (verde)   usada   como   modelo   comparativo,   la   región   enmarcada   por   el   rectángulo   corresponde   a   la   región   interdominio   donde   presenta   un   incremento  de  energía.   20     9     Gráfico  que  muestra  el  puntaje  DOPE  de  cada  aminoácido  de  la     21  
  • 12.   XII   nueva   estructura   PDB   Brn3a.BL0006001   el   cual     fue   el   mejor   modelo  de  Brn3a  en  interacción  con  el  ADN  denominado  Brn3a-­‐ looprefine  (rojo),  comparado  con  la  estructura  PDB  2XSD  (verde)   usada  como  control  o  modelo  comparativo,  en  azul  se  muestra  el   modelo  previo  sin  el  proceso  de  refinamiento  de  bucle,  la  región   enmarcada  por  el  rectángulo  corresponde  al  bucle  en  la  región  C   terminal  del  archivo  pdb  Brn3a  la  cual  muestra  un  incremento  de   la  energía  por  un  arreglo  termodinámicamente  desfavorable  de   los  aminoácidos.   10     Gráfico   que   muestra   el   puntaje   DOPE   de   cada   aminoácido   comparado  con  el  archivo  pbb  2XSD  como  control  presentado  en   verde,  en  rojo  se  muestra  el  modelo  Brn3a.BL00040001.pdb  de   Brn3a   en   interacción   con   el   ADN   denominado   Brn3a-­‐looprefine   (rojo),  en  azul  se  muestra  el  archivo  pdb  que  contiene  el  modelo   previo  Brn3a.B99990001  sin  el  proceso  de  refinamiento  de  bucle   denominado  Brn3aligand.     22   11     A   la   derecha   se   presenta   la   estructura   tridimensional   de   Brn3a   unida   a   DNA,   se   muestra   en   gradiente   de   color   de   azul   (mas   preciso)   a   rojo   (menos   preciso)   los   Å   de   error   la   región   del   enlazador  (en  rojo)  la  cual  presenta  mas  de  3.5  Å  de  error,  a  la   izquierda   se   muestran   los   valores   de   torsión,   solvatación,   interacción  de  átomos  y  Cβ,  relación  SSE,  relación  ACC,  donde  al   final   de   la   barra   se   observa   el   valor   de   cada   uno   de   estos   criterios,  la  barra  negra  indica  que  tan  beneficioso  o  perjudicial  es   cada  valor  para  la  estabilidad  de  la  proteína.       23   12     Se  presentan  los  gráficos  de  Ramachandran  de  la  estructura  de   interacción   Brn3a-­‐ADN,   de   izquierda   a   derecha   en   orden   de   aparición  se  muestra  el  gráfico  general  de  la  estructura  donde  se   presenta  en  el  limite  del  gráfico  el  residuo  No  49  correspondiente   a   cisteína,   este   residuo   no   se   no   se   tomo   en   cuenta   en   la   validación  final    debido  a  que  se  encuentra  en  región  límite  del   gráfico  y  en  otros  gráficos  aparece  como  favorecido,  el  segundo   gráfico   presenta   los   residuos   de   Valina   e   Isoleucina,   el   tercer   gráfico   se   muestran   los   residuos   de   pre   Prolina,   el   cuarto   los   residuos   aminoacídicos   de   Glicina,   en   el   quinto   los   residuos   de   trans  Prolina  en  la  cual  se  muestra  el  residuo  No.  38  con  un  valor   atípico  por  lo  cual  se  deberá  modificar  su  posición  espacial  mas   adelante   con   dinámica   molecular,   el   sexto   y   último   gráfico   presenta  solamente  los  residuos  de  la  Prolina  en  posición  Cis.   25   13     A:  Secuencia  nucleotídica  que  se  encuentra  en  la  estructura  pdb   OCT-­‐6   (2XSD)   indicándose   a   la   izquierda   la   cadena   a   la   cual   pertenecen  en  el  archivo  pdb.  La  secuencia  nucleotídica  se  mutó   con  el  programa  X3DNA.    V1:  Secuencia  nucleotídica  de  la  región   URR   de   VPH-­‐16   subtipo   1   del   archivo   pdb   V1.   V2:   Secuencia   nucleotídica   de   la   región   URR   de   VPH-­‐16   subtipo   2   del   archivo   pdb  V2.  V5:  Secuencia  nucleotídica  de  la  región  URR  de  VPH-­‐16   subtipo   5   del   archivo   pdb   V5.   Las   letras   en   negrita   indican   las   26  
  • 13.   XIII   bases   nucleotídicas   que   se   mutaron.   B:   Representación   esquemática  del  modelo  de  Brn3a-­‐ADN  donde  se  representa  el   ADN    en  forma  de  palos  y  la  proteína  en    forma  de  lazos.   14   Figura  14.  Se  muestran  en  orden  ascendente  a  descendente  los   resultados   de   la   minimización   energética   donde   se   equilibró   la   energía  potencial    y  energía  total  de  cada  molécula  de  cada  uno   de  los  complejos  Bn3a  en  unión  al  ADN  de  la  región  URR  de  cada   subtipo   de   VPH-­‐16.   Las     figuras   mostradas   a     la   derecha   presentan   la   energía   total     de   cada   molécula   contra   el   tiempo   total   que   fue   de   5   picosegundos,   los   gráficos   mostrados   a   la   izquierda     presentan   la   energía   potencial     de   cada   molécula   contra  el  tiempo  total  que  fue  de  5  picosegundos.  Figura   14   A:   Subtipo  1.  Figura  14  B:  Subtipo  2.  Figura  14  C:  Subtipo  5.   27,28   15     Se  muestran  en  orden  ascendente  a  descendente  los  resultados   de  la  simulación  de  la  dinámica  molecular.  Se  presentan  en  forma   de  gráfica  la  energía  potencial    y  energía  total  de  cada  molécula   de  cada  uno  de  los  complejos  Bn3a  en  unión  al  ADN  de  la  región   URR   de   cada   subtipo   de   VPH-­‐16.   Las     figuras   mostradas   a     la   derecha   presentan   la   energía   total     de   cada   molécula.   Los   gráficos  mostrados  a  la  izquierda    presentan  la  energía  potencial     de  cada  molécula.  Figura  14  A:  Subtipo  1.  Figura  14  B:  Subtipo  2.   Figura  14  C:  Subtipo  5.   30   16   Se  muestran  en  orden  descendente  las  gráficas  del  RMSD  de  los     Cα  de  las  estructuras  pdb  obtenidas  del  proceso  de  simulación  de   dinámica   molecular   contra     los   1000   picosegundos   de   la   simulación.  Se  presenta  en  orden  descendente  subtipo  1    como   figura  15  A,  subtipo  2  como  figura  16  B    y  subtipo  5  como  figura   16  C.  LS:  limite  superior.  M:  media.  LI:  limite  inferior.   31,32   17     A:   Densidad     del   complejo   Brn3a-­‐VPH16   subtipo   1.   B:   Temperatura  del  complejo  Brn3a-­‐VPH16  subtipo  1.   33   18     A:   Energía  potencial        del  complejo  Brn3a-­‐VPH16  subtipo  1.  B:   RMSD  del  complejo  Brn3a-­‐VPH16  subtipo  1.   34   19   A:   Densidad     del   complejo   Brn3a-­‐VPH16   subtipo   1.   B:   Temperatura   del   complejo   Brn3a-­‐VPH16   subtipo   1.   C:   Energía   total  del  complejo  Brn3a-­‐VPH16  subtipo  1.  D:  RMSD  del  complejo   Brn3a-­‐VPH16  subtipo  1.   35   20     Figura  20.  Secuencia  nucleotídica  consenso  de  la  región  URR  de   VPH-­‐16  .     36      
  • 14.   XIV   RESUMEN       Javier  Alejandro  Rendón  Carrillo                                        Fecha  de  graduación:  Mayo  de  2014     Universidad  Autónoma  de  Nuevo  León     Facultad  de  Ciencias  Biológicas     Instituto  de  Biotecnología     Titulo  de  Estudio:  CONSTRUCCIÓN  DE  UN  MODELO  IN  SILICO  DE  LA  INTERACCIÓN  ENTRE  EL   FACTOR  DE  TRASCRIPCIÓN  BRN3A  Y  LA  REGIÓN  PROMOTORA  URR  DE  LA  VARIANTE  16  DEL   VIRUS  DEL  PAPILOMA  HUMANO  EN  UN  CONTEXTO  DE  TERAPIA  GÉNICA  CONTRA  EL  CÁNCER   DE  CÉRVIX.     Candidato  para  obtener  el  título  profesional  de  Licenciado  en  Biotecnología  Genómica     Área  de  estudio:  Biotecnología.     Propósito   y   método   de   estudio:   Se  estableció  un  modelo  tridimensional  de  interacción  del   factor  de  transcripción  humano  Brn3a  con  la  región  URR  de  tres  subtipos  de  VPH-­‐16  para  el   diseño   de   una   vacuna   génica   contra   el   CaCu.   Para   ello   se   construyó   y   validó   un   modelo   tridimensional   de   la   proteína   Brn3a   utilizando   modelaje   por   homología   con   Modeller,   se   validaron  los  modelos  construidos  con  MolProbity  y  QMEAN.  Posteriormente  se  construyó  el   modelo  tridimensional  de  la  interacción  de  la  proteína  Brn3a  con  una  secuencia  nucleotídica   similar  a  la  región  URR  de  VPH-­‐16  empleando  el  programa  Modeller,  el  modelo  tridimensional   de  la  proteína  Brn3a  y  la  estructura  tridimensional  de  la  secuencia  nucleotídica  contenida  en  el   archivo  PDB  de  clave  2XSD.  Con  el  programa  X3DNA,  se  mutaron  las  secuencias  nucleotídicas   de  los  archivos  pdb  que  contienen  los  modelos  tridimensional  de  interacción  proteína-­‐ADN  en   unión  a  la  secuencia  nucleotídica  de  la  región  URR  de  tres  subtipos  de  VPH-­‐16,  de  esta  manera   se  obtuvieron  tres  modelos  tridimensionales  de  interacción  de  la  proteína  Brn3a  con  la  región   URR  de  los  tres  subtipos  de  VPH-­‐16  subtipo  1,  subtipo  2,  y  subtipo  5,  los  cuales  se  validaron   con  MolProbity  y  QMEAN.  Se  mejoraron  los  tres  modelos  tridimensionales  de  interacción  de  la   proteína   Brn3a   con   la   región   URR   de   VPH-­‐16   empleando   un   proceso   de   minimización   de   energía  con  el  programa  Amber  12.  Por  último,  se  optimizaron  los  modelos  tridimensionales   de  interacción  de  Brn3a  con  cada  uno  de  los  tres  subtipos  de  VPH-­‐16  empleando  el  programa   Amber  y  se  calcularon  las  energías  de  interacción  del  complejo  proteína-­‐ADN.     Contribuciones   y   conclusiones:   Se   generó   información   sobre   la   energía   de   interacción   de   Brn3a  con  las  secuencias  de  VPH-­‐16  y  en  base  a  los  resultados  obtenidos  se  concluye  que  la   secuencia  nucleotídica  de  VPH-­‐16  subtipo  1  presenta  la  mayor  afinidad  a  Brn3a,  con  la  cual  se   abre  la  posibilidad  de  crear  una  vacuna  génica  contra  el  VPH-­‐16.                                DIRECTOR  DE  TESIS                            CO-­‐DIRECTOR  DE  TESIS       __________________________                                           ____________________________     DR.  JOSÉ  MARÍA  VIADER  SALVADÓ                                                                                  M.C.  JOSÉ  CLAUDIO  MORENO  ROCHA  
  • 15.   1   1. Introducción     La  transcripción  es  el  proceso  en  que  la  información  codificada  en  el  ADN  se  transcribe  a   ARN   mensajero.   La   síntesis   del   ARN   la   realiza   la   ARN   polimerasa,   pero   para   la   iniciación   y   progresión  del  proceso  se  necesita  la  participación  de  un  gran  número  de  proteínas  (factores   de  transcripción)  que  posibilitan  el  acoplamiento  de  la  ARN  polimerasa  al  promotor  del  gen  en   concreto  y  la  síntesis  del  mensajero  en  una  cantidad  precisa.  La  regulación  de  forma  específica   de  la  síntesis  de  cada  proteína  depende  de  los  factores  de  transcripción.     Los  factores  de  transcripción  son  proteínas  que  coordinan  y  regulan  la  expresión  de  un  gen  o   de  un  grupo  de  genes.  En  muchos  casos  regulan  su  propia  expresión  y  también  es  frecuente   que   regulen   a   otros   factores   de   transcripción.   Estos   factores   interaccionan   con   regiones   específicas   del   ADN,   con   elementos   de   la   maquinaria   de   transcripción   y   con   moléculas   que   activan  o  inhiben  su  actividad.  Su  función  es  conectar  los  estímulos  externos  e  internos  de  la   célula  actuando  como  transductores  de  señales.  El  conjunto  de  los  factores  de  transcripción  de   una  célula  dibuja  una  red  transcripcional  cuyas  conexiones  determinan  el  conjunto  de  genes   que  se  expresan  en  un  determinado  momento  (transcriptoma).     La  diferenciación  celular  depende  de  la  expresión  de  un  patrón  específico  de  genes,  lo  que  está   en  gran  medida  determinado  por  el  perfil  de  factores  de  transcripción  expresados  en  cada  tipo   celular.   Dentro   de   este   perfil   hay   factores   de   transcripción   cuya   expresión   está   constantemente  activa  los  cuales  son  responsables  de  la  expresión  de  los  genes  constitutivos,   y  hay  otros  que  cuya  expresión  se  activa  o  inhibe  en  respuesta  a  estímulos  externos.       Los  factores  de  transcripción  se  clasifican  en  familias  según  su  estructura  tridimensional.  Para   pertenecer  a  la  misma  familia  las  proteínas  deben  poseer  al  menos  un  25%  de  identidad  entre   ellas,  además  de  estar  relacionadas  evolutivamente.  La  familia  de  los  factores  de  transcripción   POU  (Pit-­‐1,  Oct-­‐1,  Unc-­‐86)  poseen  un  papel  determinante  en  el  desarrollo  estructural  de  los   organismos,  esta  familia  contiene  un  dominio  estructural  bipartito  denominado  dominio  POU.   El   dominio   POU   es   un   dominio   proteico   el   cual   se   une   a   ADN   o   ARN   y   está   altamente   conservado  en  la  mayoría  de  los  eucariotas.  Un  dominio  proteínico  se  define  como  una  unidad   compacta,  de  características  globulares,  que  suele  comprender  entre  30  a  150  aminoácidos  y   se   considera   que   su   conformación   tridimensional   está   determinada   por   su   secuencia   de   aminoácidos,  los  cuales  se  pliegan  de  forma  independiente  al  resto  de  la  proteína,  por  lo  que   poseen  una  estructura  y  función  distinguible  de  otras  regiones  de  la  proteína.       La   familia   de   factores   de   transcripción   POU   contiene   por   lo   regular   dos   subdominios   uno   denominado   homeodominio   y   otro   denominado   POU,   este   último   subdominio   está   más   conservado  en  eucariotas  que  el  homeodominio.  Estos  subdominios  trabajan  en  sinergia  para   activar  la  transcripción  de  varios  genes.  Cabe  destacar  a  la  sub-­‐familia  de  proteínas  POU  IV  por   su  importancia  en  el  desarrollo  del  sistema  nervioso  del  embrión  humano,  específicamente  a   los   factores   de   transcripción   Brn3a   y   Brn-­‐3b.   Estos   factores   poseen   papeles   antagónicos,   el   factor  de  transcripción  Brn3a  está  implicado  en  el  desarrollo  del  tubo  neural,  mientras  que  el   factor   de   transcripción   Brn-­‐3b   inhibe   a   Brn3a;   estos   factores   pertenecen   a   la   familia   POU   debido  que  comparten  un  dominio  estructural  de  150  a  160  aminoácidos  el  cual  está  presente   en  las  proteínas  Pit-­‐1,  Oct-­‐1  y  Unc-­‐86  que  tienen  función  regulatoria.  El  dominio  POU  deriva  su   nombre   de   la   identificación   original   en   los   loci   homeóticos   de   Drosophila.   Este   dominio   se   caracteriza  por  un  dominio  de  unión  a  ADN  separado  por  una  región  de  15  a  20  aminoácidos   unida  a  un  homeodominio  el  cual  está  relacionado  con  las  proteínas  homeobox.    
  • 16.   2   El  dominio  de  unión  a  ADN  de  la  proteína  Brn3a  ha  sido  estudiado  con  antelación  donde  se   logró   determinar   la   secuencia   de   unión   al   ADN.   Estos   estudios   se   basaron   en   los   sitios   homólogos  de  otras  proteínas  tales  como  Oct-­‐1  (el  octámero  TAATGARAT  se  ha  descrito  como   un  sitio  de  unión  específico  para  dicha  proteína).  Cabe  destacar  que  en  diversos  estudios  se  ha   correlacionado  el  papel  de  activación  de  estos  factores  en  los  genes  virales,  puesto  que  los   virus  poseen  secuencias  de  unión  a  estos  factores  de  transcripción.       En  el  presente  estudio  se  decidió  construir  tres  modelos  tridimensionales  de  la  interacción  del   sitio  de  unión  del  factor  de  transcripción  Brn3a  con  la  secuencia  nucleotídica  de  la  región  URR   correspondiente   a   tres   subtipos   del   virus   del   papiloma   humano   variante   16   (VPH-­‐16),   mediante  herramientas  bioinformáticas  para  el  posterior  diseño  de  una  vacuna  génica.       El   genoma   del   VPH   consiste   de   una   molécula   de   ADN   circular   de   doble   cadena,   aproximadamente  de  8  kb.  Se  divide  en  tres  regiones:  la  región  larga  de  control,  LCR  o  URR,   que  no  contiene  regiones  codificantes;  las  regiones  E1  a  E8  que  codifican  para  las  proteínas  de   expresión  temprana;  y  las  regiones  L1  y  L2  que  codifican  para  las  proteínas  de  expresión  tardía   en   el   ciclo   de   vida   del   virus.   La   importancia   del   presente   trabajo   reside   en   que   en   el   experimento   de   Turner   et   al.,   1997   se   encontraron   ocho   sitios   de   unión   de   factores   de   transcripción  en  el  genoma  del  VPH-­‐16  con  la  secuencia  nucleotídica  ta/taatnanta/t  los  cuales   están  distribuidos  en  el  20%  del  genoma  del  virus.  Estos  sitios  no  están  ligados  a  la  activación   de  la  expresión  de  los  factores  de  transcripción  del  genoma  viral  ni  de  los  oncogenes,  puesto   que  no  son  regiones  codificantes  y  se  encuentran  frecuentemente  cerca  de  los  extremos  3’  de   los  genes  tardíos  del  VPH.  A  pesar  de  ello  estudios  de  afinidad  demostraron  que  los  factores  de   transcripción  humanos  que  contienen  el  dominio  POU  interaccionan  con  estos  sitios  y  activan   la  expresión  cinco  genes  virales  denominados  E6,  E7,  E5,  E4,  y  E2.       Es  necesario  contar  con  un  modelo  de  interacción  molecular  de  la  proteína  Brn3a  y  la  región   URR   del   VPH-­‐16   debido   a   que   la   activación   de   la   expresión   de   genes   virales   se   encuentra   correlacionada  con  el  desarrollo  de  Cáncer  cérvicouterino  (CaCu).     Una  vacuna  génica  del  CaCu  podría  ser  un  vector  con  una  secuencia  nucleotídica  que  presente   una   mayor   afinidad  por   Brn3a   que   la   URR   silvestre.   Una   consecuencia   directa   de   tal   vector   sería   la   disminución   de   la   transcripción   de   proteínas   oncogénicas   del   VPH.   En   el   presente   proyecto,   por   medio   de   técnicas   computacionales   avanzadas   se   construirán   modelos   de   interacción  entre  Brn3a  y  las  secuencias  de  la  región  promotora  URR  de  los  suptipos  1,  2  y  5   del  VPH-­‐16  que  permitirán  predecir  la  especificidad  de  unión  de  Brn3a  por  dichas  secuencias.   Esto  permitirá  a  futuro  la  elección  de  secuencias  nucleotídicas  específicas  dentro  de  cientos  de   posibilidades  para  el  desarrollo  de  una  vacuna  génica.     2. Importancia     El   cáncer   de   cérvix   o   cérvicouterino   (CaCu)   es   la   segunda   causa   de   muerte   por   cáncer   en   mujeres  tanto  en  México  como  a  nivel  mundial  (Rapose,  2009),  afectando  principalmente  a   mujeres  en  edad  productiva  (Parkin  et  al.,  2006;  Agosti  et  al.,  2007).  La  infección  genital  con  el   VPH  es  un  factor  necesario  para  el  desarrollo  del  cáncer  de  cérvix  (Walboomers  et  al.,  1999).  El   VPH  se  destaca  por  ser  el  virus  de  transmisión  sexual  más  frecuente  a  nivel  mundial  (Rapose,   2009).  Por  esto  es  necesario  construir  un  modelo  in  silico  que  analice  la  especificidad  de  la   unión  entre  el  factor  de  transcripción  Brn3a  y  un  fragmento  de  ADN  de  la  región  promotora   URR  de  VPH-­‐16,  el  cual  permitirá  diseñar  sitios  específicos  de  unión  a  Brn3a  para  el  desarrollo   y  construcción  de  vectores  virales  terapéuticos  dirigidos  contra  el  CaCu.    
  • 17.   3     3. Hipótesis     Mediante  herramientas  bioinformáticas  se  podrá  confeccionar  un  modelo  tridimensional  de  la   interacción   entre   el   factor   de   transcripción   Brn3a   y   la   secuencia   nucleotídica   de   la   región   promotora  URR  de  tres  subtipos  del  VPH-­‐16.     4. Objetivos   4.1 Objetivo  general:     Establecer   un   modelo   tridimensional   de   interacción   del   factor   de   transcripción   humano  Brn3a  con  la  región  URR  de  tres  subtipos  de  VPH-­‐16  para  el  diseño  de  una   vacuna  génica  contra  el  CaCu.     4.2 Objetivos  específicos:     • Construir  y  validar  un  modelo  tridimensional  de  la  proteína  Brn3a.       • Construir  y  validar  el  modelo  tridimensional  de  interacción  de  la  proteína  Brn3a  con  la   región  URR  de  tres  subtipos  de  VPH-­‐16.     • Optimizar  los  modelos  tridimensionales  de  interacción  de  Brn3a  con  cada  uno  de  los   tres  subtipos  de  VPH-­‐16  y  calcular  las  energías  de  interacción  del  complejo  proteína-­‐ ADN.   5. Antecedentes     5.1 Epidemiología  y  etiología  del  cáncer  cérvicouterino     El   cáncer   de   cérvix   o   cérvicouterino   (CaCu)   es   la   segunda   causa   de   muerte   por   cáncer   en     mujeres  tanto  en  México  como  a  nivel  mundial  (Rapose,  2009),  afectando  principalmente  a   mujeres  en  edad  productiva  (Parkin  et  al.,  2006;  Agosti  et  al.,  2007).  La  infección  genital  con  el   virus  del  papiloma  humano  (VPH)  es  un  factor  necesario  para  el  desarrollo  del  cáncer  de  cérvix   (Walboomers   et   al.,   1999).   El   VPH   se   destaca   por   ser   el   virus   de   transmisión   sexual   más   frecuente  a  nivel  mundial  (Rapose,  2009).  En  la  tabla  1  se  muestra  la  relación  entre  el  VPH  y  las   principales  patologías  infecciosas  que  origina  de  las  cuales  algunas  pueden  progresar  a  cáncer   debido  a  su  potencial  oncogénico.   El   Sistema   Nacional   de   Salud   Mexicano   brinda   atención   médica   aproximadamente   a   9,000   casos  de  CaCu  invasor  y  se  registran  4,000  muertes  anualmente  (Walboomers  et  al.;  1999).  En   el  año  2001,  se  reportaron  4,051  muertes  en  mujeres  por  CaCu,  con  una  tasa  de  mortalidad  de  
  • 18.   4   8.8  por  cada  100,000  mujeres.  Para  el  año  2002  se  registraron  4,323  casos  con  una  tasa  de  8.6   por  100,000  mujeres  (Estadísticas  de  la  Secretaria  de  Salud;  2002).       Sin   embargo,   este   tipo   de   cáncer   es   absolutamente   prevenible   y   su   tratamiento   es   relativamente   fácil,   cuando   el   diagnóstico   es   oportuno.   El   CaCu   es   de   etiología   infecciosa   y   desde  la  perspectiva  de  la  salud  pública  se  está  consciente  que  los  programas  de  control  no   han   funcionado   como   se   esperaba.   La   experiencia   de   países   desarrollados   ha   permitido   demostrar   que   la   mejor   opción   para   disminuir   la   mortalidad   por   CaCu   es   la   detección   y   el   tratamiento  oportuno  de  lesiones  precursoras  y  lesiones  malignas  por  medio  de  programas  de   detección  oportuna  del  CaCu  y  del  VPH  (World  Health  Organization,  1995).       El   genoma   de   VPH   tiene   una   longitud   aproximada   de   8   kb   y   su   organización   se   encuentra   prácticamente   establecida.   Este   virus   contiene   nueve   genes,   los   cuales   dependiendo   del   momento  de  su  transcripción  durante  la  infección  viral,  se  dividen  en  genes  tempranos  (E1,  E2,   E3,  E4,  E5,  E6,  E7  y  E8)  y  genes  tardíos  (L1  y  L2).  La  expresión  de  estos  genes  está  controlada   por   una   región   promotora   río   arriba   del   gen   E6   (Gloss   et   al.,   1987),   denominada   unidad   reguladora   no   codificada   (URR)   o   también   unidad   larga   de   control   (LCR),   de   0.4   a   1   kb   de   longitud,  esencial  para  funciones  reguladoras  del  genoma  durante  la  replicación,  así  como  para   servir   de   origen   de   replicación   del   ADN   y   actuar   como   una   región   potenciadora   de   la   transcripción  viral  por  promotores  de  síntesis  del  ARN.       Tabla  1:  VPH  y  su  asociación  con  las  principales  enfermedades  que  origina  obtenida  del   reporte  anual  de  la  Secretaria  de  Salud.    
  • 19.   5     Los  genes  de  expresión  tempranos  codifican  para  proteínas  responsables  de  las  funciones  de   transformación  celular,  replicación  y  de  la  persistencia  del  ADN  integrado  en  las  células  a  las   que   infecta.   De   este   grupo   destacan   las   proteínas   codificadas   por   los   genes   E1   y   E2   que   intervienen  en  la  replicación  viral,  las  proteínas  codificadas  por  los  genes  E2  en  sinergia  con  E4   para  facilitar  la  amplificación  del  genoma  viral  y  la  expresión  de  proteínas  tempranas  y  sobre   todo,  las  que  intervienen  en  los  procesos  de  transformación  celular  codificadas  por  los  genes   E5,  E6  y  E7.     Las   regiones   E6/E7   tienen   un   especial   interés   ya   que   poseen   un   importante   papel   en   los   mecanismos  de  transformación  celular.  Estas  regiones  están  siempre  virtualmente  expresadas   en  los  cánceres  asociados  al  VPH.  Las  proteínas  codificadas  por  estos  genes  virales  se  unen  y   ubiquitinan   a   las   proteínas   supresoras   de   tumores   p53,   pRB   y   Rb105,   induciendo   su   degradación,  desregulando  el  ciclo  celular  y  provocando  el  bloqueo  de  la  apoptosis.     Existen  vacunas  eficientes  en  la  prevención  de  neoplasias  cervicales  intraepiteliales  de  grado  2   y  3  causadas  por  los  VPH-­‐16  y  18,  aunque  todavía  no  se  conoce  el  grado  de  protección  contra   otro  tipo  de  VPH  como  VPH-­‐31,  33,  35,  45,  52,  y  58.  El  alto  costo  es  también  un  factor  limitante   para  su  aplicación  en  países  en  vías  de  desarrollo  (Lowy,  2006;  Agosti  et  al.,  2007).       5.2 Brn3a  y  el  desarrollo  del  CaCu  mediante  la  regulación  del  VPH     Uno  de  los  factores  de  transcripción  que  se  une  al  sitio  URR  del  VPH  es  Brn3a.  Esta  proteína   pertenece  a  la  subfamilia  4  de  las  proteínas  POU,  identificada  en  el  GenBank  del  NCBI  como   POU4F1  y  está  conformada  por  3  miembros  homólogos:  Brn3a,  Brn-­‐3b,  Brn-­‐3c  (Guerrero  et  al.,   1993).  Brn3a  juega  un  papel  importante  en  el  proceso  del  desarrollo  del  tubo  neural  durante  la   embriogénesis   regulando   el   balance   entre   proliferación   y   diferenciación   celular,   por   lo   que   ejerce  una  gran  influencia  en  el  destino  celular  neuronal.  Sin  embargo,  su  abundancia  declina   llegando   a   ser   ausente   en   neuronas   maduras.   Por   otra   parte,   se   ha   detectado   la   sobreexpresión   de   este   factor   en   diversos   tipos   de   cáncer   como   el   cáncer   de   próstata,   neuroblastoma,  neuroendocrino  y  CaCu.  Respecto  al  CaCu,  diversos  estudios  en  pacientes  han   demostrado   la   sobreexpresión   del   ARNm   de   Brn3a   en   tejido   tumoral   de   hasta   300   veces   comparada  con  el  tejido  circundante  (Ndisang  et  al.,  1998).     La  sobreexpresión  de  este  factor  transcripcional  se  ha  visto  correlacionada  con  la  activación  de   la  expresión  génica  del  VPH,  principalmente  de  los  oncogenes  E6  y  E7,  los  cuales  alteran  la  tasa   de  crecimiento  celular  tanto  in  vivo  como  in  vitro.  Se  han  detectado  alteraciones  específicas  en   las  secuencias  del  URR  de  los  subtipos  1,  2  y  5  del  VPH-­‐16  las  cuales  están  correlacionadas  con   el   aumento   en   la   tasa   de   transcripción   de   los   oncogenes   virales.   De   manera   similar   se   han   identificado  variantes  en  las  secuencias  de  la  región  E5  de  VPH-­‐16,  que  están  asociadas  con   diferencias   en   los   niveles   de   transcripción   viral   de   los   oncogenes   virales,   ocasionando   la   inducción  de  la  neoplasia,  encontrando  al  subtipo  2  asociado  positivamente  al  desarrollo  de   CaCu.  Aunado  a  esto  se  ha  reportado  que  el  subtipo  2  presenta  mayores  niveles  de  expresión   de  los  oncogenes  E6  y  E7,  estos  oncogenes  son  activados  por  el  factor  de  transcripción  Brn3a.     Se  ha  demostrado  experimentalmente  que  la  región  URR  de  variantes  de  VPH  presentan  una   afinidad   a   los   factores   de   transcripción   Brn3a   y   Brn-­‐3b,   sin   embargo   ambas   proteínas   se   antagonizan.  En  el  subtipo  2  del  VPH-­‐16,  el  factor  de  transcripción  Brn3a  es  más  afín  a  dicha   secuencia  que  Brn-­‐3b  promoviendo  la  activación  de  la  región  URR  y  con  ello  la  expresión  de  los  
  • 20.   6   oncogenes   E6   y   E7,   contrario   a   la   función   de   la   proteína   Brn-­‐3b,   la   cual   en   ensayos   de   silenciamiento  de  Brn3a  ha  regulado  negativamente  la  expresión  de  dichos  genes  (Ndisang  et   al.,  2001).  Se  ha  identificado  la  presencia  de  Brn3a  en  las  líneas  celulares  cervicales  C33  y  SiHa   (Ndisang   et   al.,   1999).   Experimentos   de   sobreexpresión   de   Brn3a   en   células   SiHa   con   el   genoma   de   VPH-­‐16   han   demostrado   que   la   concentración   de   Brn3a   inherente   en   este   tipo   celular   se   encuentra   en   cantidades   saturantes   para   la   expresión   de   E6,   ya   que   presenta   el   mismo  efecto  que  el  mostrado  por  los  tratamientos  exógenos  con  dicha  proteína.     La  reducción  de  los  niveles  de  expresión  de  Brn3a  in  vivo  reduce  los  niveles  de  expresión  del   gen  E6  y  del  gen  antiapoptótico  Bcl-­‐2,  así  como  la  inducción  de  la  tumorogénesis  (Ndisang  et   al.,  1999,  2001).  Por  el  contrario  la  sobreexpresión  de  Brn-­‐3b  resulta  en  la  disminución  de  la   transcripción  de  los  genes  del  VPH  (Ndisang  et  al.,  1999),  mientras  que  una  disminución  de   Brn-­‐3b   presenta   efectos   similares   a   la   sobreexpresión   de   Brn3a   (Ndisang   et   al.,   2001).   La   sobreexpresión   de   Brn-­‐3b   in   vivo   presenta   un   efecto   inhibitorio   de   la   expresión   de   los   oncogenes  E6  (Ndisang  et  al.,  2001).     Con  base  en  el  papel  que  juega  Brn3a  en  la  interacción  y  activación  de  la  URR  del  VPH  se  han   sugerido  varias  vías  terapéuticas  posibles  contra  el  CaCu.  Algunas  alternativas  son  la  alteración   de  la  actividad  de  Brn3a  por  medios  farmacológicos,  o  bien  una  reducción  de  la  actividad  del   promotor  Brn3a  (Ndisang  et  al.,  1999,  2001).     La   terapia   genética   abre   el   camino   hacia   el   diseño   de   vectores   plasmídicos   o   adenovirales   como  tratamiento.       5.3 Sitios  de  unión  de  los  homeodominios     La  homeocaja  es  una  secuencia  nucleotídica  que  codifica  para  un  dominio  de  alrededor  de  60   aminoácidos   (figura   1),   que   se   encuentra   en   muchos   organismos   eucariotas,   cuyo   nombre   deriva   de   su   identificación   en   los   loci   homeóticos   de   la   mosca   de   la   fruta   (Drosophila   melanogaster).  En  los  genes  homeóticos  de  D.  melanogaster  a  menudo  el  homeodominio  está   cerca  del  extremo  C-­‐terminal  de  las  proteínas  producto  de  estos  genes.           Figura  1.  Estructura  de  un  factor  de  transcripción  el  cual  contiene  un  homeodominio.    
  • 21.   7   El   homeodominio   puesto   que   es   un   subdominio   suele   combinarse   con   otros   segmentos   o   dominios   en   los   factores   de   transcripción,   como   pasa   con   las   proteínas   Oct   (de   unión   de   octámero),  donde  una  cadena  conservada  de  75  aminoácidos,  llamada  región  POU,  se  localiza   cerca  de  una  región  que  simula  el  homeodominio,  tal  y  como  sucede  con  Brn3a.     El  homeodominio  se  encarga  de  la  unión  con  el  ADN  (figura  2),  este  posee  la  capacidad  de   reconocimiento,   donde   la   región   C-­‐terminal   del   homeodominio   es   idéntico   en   secuencia   al   segmento   hélice-­‐giro-­‐hélice   de   los   represores   procarióticos.   La   diferencia   entre   ambas   estructuras  radica  en  la  longitud  de  la  hélice  que  reconoce  al  ADN,  la  hélice-­‐3  la  cual  contiene   17   aminoácidos   de   longitud   que   son   parte   del   homeodominio   en   comparación   a   los   9   aminoácidos  del  represor  λ.       Figura   2.   Interacciones   del   motivo   hélice-­‐giro-­‐hélice   de   la   proteína   Antennapedia   de   D.   melanogaster  (código  PDB:  1AHD)  con  los  surcos  mayores  y  menores  del  ADN,  obtenido  de  la   base  de  datos  Protein  Data  Bank  (www.rcsb.org).       La  hélice-­‐3  se  une  con  el  surco  mayor  del  ADN  y  establece  el  mayor  número  de  contactos  entre   la  proteína  y  el  ácido  nucleico,  de  los  cuales,  muchos  de  los  que  orientan  la  hélice  en  el  surco   mayor  son  con  la  columna  de  fosfatos,  de  manera  que  no  son  específicos  para  la  secuencia  del   ADN,  sino  que  se  encuentran  sobre  todo  en  una  cara  de  la  doble  hélice  y  flanquean  las  bases   con  las  que  se  hacen  contactos  específicos.  Los  contactos  restantes  son  del  brazo  N-­‐terminal   del   homeodominio,   secuencia   inmediata   a   la   primera   hélice,   y   se   proyecta   hacia   el   surco   menor.   Así   las   regiones   N-­‐terminal   y   C-­‐terminal   del   homeodominio   son   las   principales   encargadas  de  hacer  contacto  con  el  ADN.       5.4 Reconocimiento  específico  de  una  secuencia  de  ADN  por  los  dominios  POU       Pit,   Unc,   Oct   son   proteínas   de   la   familia   POU   que   se   encuentra   muy   conservada   evolutivamente   entre   especies.   Además   de   la   proteína   Brn3a   incluye   a   gran   variedad   de   miembros   tales   como   Pit-­‐1,   Oct-­‐1,   Oct-­‐2,   Unc-­‐86,   Brn-­‐5,   Brn-­‐3b   (Herr   &   Cleary,   1995).   El   dominio  POU  de  unión  a  ADN  característico  de  dicha  familia  se  compone  de  dos  subdominios:   POUS   y   POUH.   El   subdominio   amino-­‐terminal   específico   (POUS)   contiene   alrededor   de   75   aminoácidos    y  el  subdominio  homeo  carboxi-­‐terminal  POUH  contiene  60  aminoácidos.  Los  dos   subdominios  se  encuentran  unidos  por  una  región  flexible  híper  variable  que  contiene  de  15  a   56  aminoácidos  llamada  linker  o  enlazador.  Los  subdominios  POUS  y  POUH  tienen  estructuras   independientes,   sin   embargo   la   flexibilidad   del   linker   permite   su   interacción   mutua   y   en   puntos  específicos  con  el  ADN  (Herr  &  Cleary,  1995),  (figura  3).    
  • 22.   8   Estudios  cristalográficos  recientes  elucidaron  la  estructura  del  complejo  proteína  Brn-­‐5  unida  a   ADN,   determinándose   que   los   dominios   POUS   y   POUH   se   unen   al   surco   mayor   del   ADN   en   posición  opuesta  (Pereira  &  Kim,  2009).  El  subdominio  POUS  se  une  a  la  secuencia  nucleotídica   atgc  en  sentido  5’,  mientras  que  el  subdominio  POUH  se  une  a  la  secuencia  aaat  en  sentido  3’,   ambos  subdominios  se  unen  en  la  misma  cadena  de  ADN.  Las  subunidades  POUS  y  POUH  no   interaccionan   directamente.   Los   dos   subdominios   contienen   un   motivo   hélice-­‐giro-­‐hélice   (HTH)  formado  por  las  hélices  alfa-­‐2  y  alfa-­‐3  distribuidas  perpendicularmente,  de  las  cuales  la   hélice  alfa-­‐3  permite  la  unión  con  el  ADN.  La  estructura  HTH  de  POUS  está  estabilizada  por  las   hélices  alfa-­‐1  y  alfa-­‐4,  mientras  que  la  estructura  HTH  de  POUH  está  estabilizada  por  la  hélice   alfa-­‐1.       La   capacidad   de   las   proteínas   de   la   familia   POU   para   activar   a   sus   promotores   blanco   está   influenciada  por  varios  factores.  Uno  de  ellos  es  atribuido  a  la  variabilidad  del  linker  entre  los   subdominios,   proporcionando   una   gran   diversidad   de   sitios   de   reconocimiento   en   el   ADN   blanco   por   parte   de   las   proteínas   POU.   El   fragmento   peptídico   linker   entre   los   dominios  se   comporta  como  un  estabilizador  de  los  subdominios  POUS  y  POUH  de  Brn-­‐5  (Pereira  &  Kim,   2009).  Además  la  estructura  cristalizada  de  Oct-­‐1  sugiere  que  Oct-­‐1  no  tiene  una  estructura   rígida,  ya  que  en  los  experimentos  realizados  no  se  logró  localizar  la  presencia  del  linker  en  el   mapa  de  densidad  electrónica.       Por  otro  lado  las  proteínas  de  la  familia  POU  pueden  compartir  sitios  de  unión  preferenciales   Figura  3.  a)  Alineamiento  de  secuencias  de  aminoácidos  de  los  dominios  POU  de  las  proteínas   humanas  Brn-­‐5,  Oct-­‐1  y  Pit-­‐1.  Los  residuos  conservados  están  resaltados  en  letra  negrita.  Los   residuos  de  POUS  y  POUH  implicados  en  los  enlaces  de  puentes  de  hidrógeno  con  el  ADN  están   resaltados.   b)   Representación   esquemática   de   la   estructura   del   dominio   POU   de   Brn-­‐5.   El   dominio  POUS  se  muestra  en  color  rosa,  el  enlazador  en  amarillo  y  POUH  en  verde.  Las  hélices   de   los   dominios   POU   están   numeradas   como   se   muestra   en   el   alineamiento   de   la   parte   superior.  (N)  extremo  amino-­‐terminal,  (C)  extremo  carboxilo-­‐terminal.   Subdominio  específico  -­‐  POU   Subdominio  homeo  -­‐  POU  
  • 23.   9   que   se   traslapan   y   que   son   capaces   de   unirse   a   secuencias   nucleotídicas   con   afinidades   diversas.  Por  ejemplo,  los  factores  Oct-­‐1  y  Oct-­‐2  reconocen  exactamente  la  misma  secuencia   nucleotídica  encontrada  en  varios  promotores,  y  a  su  vez  el  factor  Pit-­‐1  se  une  in  vitro  e  in  vivo   a  esta  secuencia  común  aunque  en  menor  afinidad  (Li  et  al.,  1993).     Los  factores  Oct-­‐1,  Brn3a  y  Brn-­‐3b  se  unen  a  la  secuencia  del  promotor  viral  URR  en  VPH-­‐16,   en  la  secuencia  nucleotídica  atgcaatt.  El  factor  ubicuo  Oct-­‐1  se  expresa  en  células  cervicales  lo   que  contribuye  normalmente  a  inhibir  la  actividad  del  promotor  viral  URR  en  VPH-­‐16,  contrario   al   efecto   de   Brn3a   (Morris   et   al.,   1993).   Esta   última   proteína   activa   también   al   promotor   inmediato-­‐temprano   (Immediate-­‐Early)   del   virus   herpes   simplex     (VHS-­‐IE3)   por   medio   de   la   secuencia  nucleotídica  tatgarat  (Dawson  et  al.,  1996).     Las  modificaciones  al  contexto  del  sitio  de  unión  a  ADN  también  tienen  efectos  variables.  En  el   caso  del  factor  de  transcripción  Brn3a  en  unión  con  el  promotor  viral  en  VHS-­‐IE3,  únicamente   es  necesario  que  se  conserve  el  espacio  entre  los  sitios  de  unión  a  ADN,  efecto  contrario  al   causado  por  Brn-­‐3b  (Dawson  et  al.,  1996).  A  diferencia  de  esto  la  represión  de  dicho  promotor   por  Oct-­‐2.4  y  Oct-­‐2.5  depende  del  contexto  nucleotídico  además  del  espacio  entre  los  sitos  de   unión  (Dawson  et  al.,  1996).     El  dominio  POU  puede  influenciar  su  propia  asociación  con  una  proteína  co-­‐reguladora  en  un   sitio  diferente.  Un  buen  ejemplo  es  el  complejo  VP16-­‐inducido  que  sirve  como  activador  al   promotor  IE  del  virus  del  herpes  simplex  (Herr  &  Cleary,  1995).  Aunque  el  dominio  POU  se   encuentra  altamente  conservado,  la  región  linker  le  confiere  a  estas  proteínas  la  capacidad  de   adoptar   varias   conformaciones   para   su   unión   con   el   ADN   que   se   traducen   en   cambios   posicionales   y   direccionales   entre   POUS   y   POUH     (Li   et   al.,   1993).   Ensayos   in   vitro   han   demostrado   que   los   efectos   antagonistas   de   las   proteínas   Brn3a   y   Brn-­‐3b   son   invertidos   al   intercambiar  la  isoleucina  de  Brn-­‐3b  por  la  valina  de  Brn3a  en  la  posición  22  de  la  región  POU   (Morris  et  al.,  1994,  1997).     Debido  al  complejo  proceso  de  reconocimiento  entre  ADN  y  proteínas,  es  importante  realizar   estudios  que  permitan  elucidar  secuencias  exactas  de  interacción  de  Brn3a  con  la  secuencia   URR  de  VPH-­‐16  con  el  fin  de  diseñar  nuevas  estrategias  terapéuticas  en  el  combate  contra  el   CaCU.       5.5 Predicción  de  la  estructura  tridimensional  de  una  proteína       Aunque   la   estructura   de   Brn3a   no   se   conoce   experimentalmente,   existe   la   posibilidad   de   inferirla   in   silico   utilizando   modelos   de   predicción.   Existen   varios   métodos   que   permiten   predecir  una  estructura  tridimensional  protéica.  De  forma  general,  se  distinguen  tres  métodos:     1. Modelaje  por  comparación  o  modelaje  por  homología.     2. Modelaje  por  reconocimiento  de  plegamientos.     3. Modelaje  por  predicción  Ab-­‐initio.     La   estrategia   utilizada   para   predecir   la   estructura   tridimensional   de   una   proteína   es   determinante  para  obtener  un  buen  modelo  tridimensional,  lo  cual  requiere  generalmente  la   integración  de  varios  de  los  métodos  conocidos  (Ding  et  al.,  2008).     El   estado   de   los   avances   de   los   métodos   de   predicción   de   estructuras   tridimensionales   de  
  • 24.   10   proteínas  se  puede  valorar  con  los  experimentos  CASPs  (Critical  Assessment  of  Techniques  for   Protein  Structure  Prediction  o  Evaluación  crítica  de  las  técnicas  de  predicción  de  la  estructura   de  proteínas)  que  son  rondas  donde  se  predice  la  estructura  tridimensional  de  proteínas  y  se   comparan  con  estructuras  tridimensionales  dilucidadas  por  cristalografía  (Jauch  et  al.,  2007;   Ben-­‐David  et  al.,  2009).     Actualmente  existen  dos  limitantes  en  los  procesos  de  predicción  y  validación  de  estructuras   tridimensionales,  lo  que  requiere  una  mejora  o  implementación  de  nuevos  métodos.  Primero,   no  se  puede  predecir  cualquier  estructura  in  silico:  durante  la  ronda  experimental  de  2008,  de   las   13   estructuras   tridimensionales   a   predecir,   4   predicciones   no   fueron   aceptables   para   ninguno   de   los   grupos   participantes   (Ben-­‐David   et   al.,   2009).   Segundo,   los   criterios   de   evaluación  de  la  similitud  entre  la  predicción  y  la  estructura  experimental  aún  no  están  bien   definidos  (Jauch  et  al.,  2007;  Ben-­‐David  et  al.,  2009).                 5.5.1 Modelaje  por  homología     El  modelaje  por  homología  permite  predecir  una  estructura  tridimensional  desconocida  de  una   proteína  blanco  por  medio  de  la  comparación  de  su  secuencia  con  secuencias  de  proteínas   templado  cuyas  estructuras  tridimensionales  son  conocidas  (figura  4).  Las  principales  etapas   son:     a. La  selección  de  templados.   b. El  alineamiento  con  la  secuencia  blanco.   Figura  4.  Procedimiento  del  modelaje  por  homología.  
  • 25.   11   c. El  refinamiento  para  resolver  las  regiones  de  baja  similitud.     El   modelaje   por   homología   se   utiliza   frecuentemente   con   el   fin   de   descubrir   nuevos   medicamentos  o  para  guiar  experimentos  de  mutagénesis  (Costanzi,  2008).  También  se  utiliza   para   estudios   de   relación   de   estructura   –   actividad   (QSAR),   los   cuales   buscan   relaciones   cuantitativas  entre  actividad  y  estructura  de  una  biomolécula  (Costanzi,  2008).     El  proceso  de  alineamiento  de  secuencias  es  crítico.  Rost  determinó  que  si  la  identidad  de  las   secuencias  en  los  alineamientos  es  del  30%,  el  90%  de  los  modelos  que  sean  predichos  por   homología   serán   acertados,   mientras   que   si   esta   identidad   es   del   20%   sólo   el   10%   de   los   modelos   serán   acertados,   a   esta   característica   Rost   la   denominó   la   zona   de   incertidumbre   (Rost   1999).   Si   se   obtienen   valores   mayores   al   50%   de   identidad   entre   la   secuencia   de   las   proteínas  blanco  y  de  las  proteínas  templado  se  producen  predicciones  de  alta  calidad  (hasta   3Å  de  resolución).  Por  el  contrario,  valores  de  25  a  30%  de  identidad  producen  predicciones   propensas  a  presentar  errores  (Floudas  et  al.,  2006).     El   programa   3D-­‐Coffe   (O’Sullivan   et   al.,   2004)   permite   un   mejor   alineamiento   secuencia-­‐ estructura  en  comparación  con  otros  programas,  particularmente  para  identidades  por  debajo   del   50%   (Dalton   &   Jackson,   2007).   En   las   estructuras   complejas   los   pasos   de   refinamiento   permiten  mejorar  la  predicción  hasta  0.5  Å.     En  comparación  con  SWISS-­‐MODEL  (Schewede  et  al.,  2003)  o  Builder  (Koehl  &  Delarue,  1994),   Modeller  (Sali  &  Blundell,  1993),  SegMod/ENCAD  (Levitt,  1992)  y  Nest  (Petrey  et  al.,  2003)  son   los  programas  que  presentan  mejores  resultados  en  cuanto  a  resolución  y  predicción  de  los   modelos  tridimensionales  (Wallner  &  Elofsson,  2005),  siendo  éste  último  el  que  mejor  resuelve   las  estructuras  tipo  bucle  (Dalton  &  Jackson,  2007).       5.5.2 Modelaje  por  reconocimiento  de  plegamientos     El  método  de  reconocimiento  de  plegamientos  asume  que  las  estructuras  tridimensionales  de   las  proteínas  están  más  conservadas  que  las  secuencias.  Existen  diversas  técnicas  para  llevar  a   cabo   dicho   reconocimiento,   tales   como   la   predicción   de   estructuras   secundarias   y   comparaciones  avanzadas  de  secuencias  o  pruebas  de  compatibilidad  de  secuencias  con  un   plegamiento  tridimensional  conocido  (Floudas  et  al.,  2006).  Estos  métodos  han  tenido  éxito  en   los  experimentos  CASPs  (Jauch  et  al.,  2007;  Ben  –David  et  al.,  2009).     Este  método  asegura  que  la  secuencia  es  compatible  con  cualquiera  de  los  miembros  de  un   conjunto   de   estructuras   proteicas   conocidas.   Esto   se   produce   al   colocar   los   residuos   “desconocidos”   de   la   proteína   a   lo   largo   de   la   cadena   principal   de   una   estructura   tridimensional  de  una  proteína  conocida,  para  luego  determinar  la  estabilidad  de  las  cadenas   laterales  de  la  estructura  tridimensional  de  la  proteína  desconocida  en  esa  disposición  y  luego   deslizar  la  secuencia  de  la  proteína  que  no  se  conoce  su  estructura  a  lo  largo  de  la  proteína   que  sí  se  conoce  su  estructura  tridimensional,  esto  se  realiza  residuo  por  residuo  repitiendo  el   cálculo  (Voet,  2006).       5.5.3 Modelaje  por  predicción  Ab-­‐initio     El  modelaje  por  predicción  Ab-­‐initio  consiste  en  encontrar  la  estructura  tridimensional  proteica  
  • 26.   12   más  estable  que  corresponde  a  la  conformación  que  posee  la  menor  energía  libre  según  la   hipótesis   de   Anfinsen   (Anfinsen,   1973).   Este   método   se   utiliza   con   cualquier   secuencia,   independientemente  al  conocimiento  previo  de  la  estructura,  permitiendo  así  predicciones  de   novo.   En   este   método   se   utilizan   primero   campos   de   fuerza   simplificados   en   los   cuales   se   mueven  los  residuos,  seguido  por  un  refinamiento  con  un  potencial  de  átomos  totales  (Fluodas   et  al.,  2006;  Jamal  Rahi  et  al.,  2008;  Shaeffer  et  al.,  2008;  Rohs  et  al.,  2009).     Estos   modelos   tratan   de   predecir   la   estructura   tridimensional   desconocida   de   una   proteína   comenzando   desde   cero,   y   se   basan   en   principios   físicos   con   los   cuales   se   construyen   algoritmos  que  intentar  imitar  el  plegado  de  las  proteínas,  o  bien  pueden  aplicar  un  método   estocástico   para   buscar   la   conformación   más   estable   termodinámicamente.   Este   método   requiere   de   vastos   recursos   computacionales,   como   las   supercomputadoras,   puesto   que   la   cantidad  de  información  a  procesar  es  enorme,  esto  además  los  vuelve  muy  costosos   6. Metodología     6.1 Materiales  y  equipo       Se  utilizaron  dos  sistemas  operativos  diferentes,  el  primer  sistema  operativo  fue  Mac  OS    X   Mavericks  10.9.2  ejecutado  en  una  Apple  Mac  Book  Pro  con  un  procesador    Intel  Core  i5  de   2.5  GHz  con  8  Gb  de  RAM,  el  segundo  sistema  operativo  fue  Red  Hat  Enterprise  Linux  Server   release  6.2  ejecutado  remotamente  en  el  clúster  de  Supercómputo  del  IPN  en  el  equipo  IBM   iDataPlex     denominado   Thubat   Kaal   con   los   siguientes   procesadores:   Intel   Xeon   8-­‐core   E5-­‐ 2680  a  2.7  GHz,  Intel  Xeon  8-­‐core  a  2.7  GHz,  2  CPU's  Intel  Xeon  8-­‐core  a  2.7  GHz  y  2  CPU's  Intel   Xeon  8-­‐core  a  2.7  GHz  con  288  Gb  de  RAM.   6.2 Estrategia  General     En  primer  lugar  se  construyo  y  valido  un  modelo  tridimensional  de  la  proteína  Brn3a  utilizando   modelaje   por   homología   con   el   programa   Modeller   y   validado   por   MolProbity   y   QMEAN.   Posteriormente  se  construirá  el  modelo  tridimensional  de  la  interacción  de  la  proteína  Brn3a   con   una   secuencia   nucleotídica   similar   a   la   región   URR   de   VPH-­‐16   empleando   el   programa   Modeller  se  construyo  el  modelo  tridimensional  de  la  proteína  Brn3a  en  formato  PDB  unida  a   la  secuencia  nucleotídica  descrita  en  el  archivo  PDB  de  clave  1AU7.  Con  el  programa  X3DNA,  se   mutaron  las  secuencias  nucleotídicas  del  modelo  tridimensional  de  interacción  proteína-­‐ADN,   las   mutaciones   fueron   con   el   objeto   de   que   hacer   coincidir   a   la   secuencia   con   la   secuencia   nucleotídica  de  la  región  URR  de  los  tres  subtipos  de  VPH-­‐16.  De  esta  manera  se  obtuvieron   tres  modelos  tridimensionales  de  interacción  de  la  proteína  Brn3a  con  la  región  URR  de    los   tres   subtipos   de   VPH-­‐16   subtipo   1,   subtipo   2   y   subtipo   3   los   cuales   se   validaron   con   los   programas   MolProbity   y   QMEAN.   Se   optimizaron   los   tres   modelos   tridimensionales   de   interacción   de   la   proteína   Brn3a   con   la   región   URR   de   VPH-­‐16   empleando   un   proceso   de   minimización  de  energía  con  el  programa  Amber  12.  Por  último  se  calcularon  las  energías  de   interacción  del  complejo  proteína-­‐ADN.  
  • 27.   13   6.3 Construcción  y  validación  de  la  estructura  tridimensional    de  la  proteína   Brn3a     La  estructura  terciaria  de  Brn3a  fue  elucidada  in  silico  mediante  un  modelo  de  homología.  Se   determinó   una   estructura   tridimensional   templado   mediante   la   herramienta   Blastp   del   National  Center  for  Biotechnology  Information  (NCBI)  empleando  la  secuencia  aminoácidica  de   Brn3a   (clave   GenBank   NP_006228)   contra   la   base   de   datos   de   estructuras   tridimensionales   PDB   del   Protein   Data   Bank.   Se   descartaron   las   estructuras   tridimensionales   cuya   secuencia   aminoácidica   presenten   una   identidad   menor   al   30%   con   la   secuencia   de   Brn3a.   De   las   estructuras   tridimensionales,   se   eligió   a   la   plantilla   que   presento   la   mayor   identidad   en   secuencia  con  Brn3a  y  que  a  su  vez  presento  la  mejor  estructura  experimental  en  cuanto  a   resolución   cristalográfica,   y   su   secuencia   se   alineo   con   la   secuencia   de   Brn3a.   Se   calculo   o   predijo  el  modelo  tridimensional  de  Brn3a  con  el  programa  Modeller.  El  modelo  fue  evaluado   utilizando  los  programas  MolProbity  y  QMEAN  (Benkert  et  al.,  2009).     Se  ejecutaron  todos  los  comandos  desde  la  terminal  del  equipo  de  cómputo,  en  este  caso  se   utilizó  el  sistema  operativo  de  Unix  con  la  versión  de  Ubuntu  10.4,  así  como  Mac  OS  X  versión   10.8.2  Lion.  En  ambos  sistemas  se  realizaron  todos  los  comandos  del  programa  Modeller  con  la   misma  versión  del  programa,  la  versión  9.11.     Todos   los   comandos   del   programa   Modeller   ejecutan   programas   específicos   los   cuales   se   escribieron   en   el   lenguaje   de   programación   Python.   Este   lenguaje   de   alto   nivel   posee   una   sintaxis  muy  limpia  que  favorece  a  que  el  código  sea  legible.  Además  tiene  licencia  de  código   abierto  la  cual  es  compatible  con  la  licencia  pública  general  de  GNU  en  que  basan  los  sistemas   Unix.     Se  ejecutaron  los  comandos  de  modelado  básico  del  programa  Modeller.  Una  vez  obtenido  el   modelo,   se   utilizó   el   programa   Loop-­‐refine   para   corregir   los   bucles   en   la   estructura   tridimensional  de  la  proteína  y  se  validó  el  modelo  construido  con  los  programas  Molprobity  y   QMEAN.   El   modelo   fue   aceptable   según   los   criterios   de   validación   obtenidos   en   dichos   programas    y  se  procedió  al  próximo  paso.   6.4 Construcción   y   validación   del   modelo   tridimensional   de   interacción   de   la   estructura   tridimensional   de   Brn3a   con   la   región   URR   de   tres   subtipos   de   VPH-­‐16     6.4.1 Construcción   del   modelo   tridimensional   de   interacción   Brn3a   con   la   región  URR  de  VPH-­‐16     Se   utilizó   la   conformación   estructural   tridimensional   de   la   proteína   Brn3a   determinada   previamente  y  se  estableció  la  estructura  de  Brn3a  en  interacción  con  la  secuencia  de  unión  a   la  variante  1  del  VPH-­‐16  con  el  software  Modeller.  Se  usó  el  programa  Ligand  el  cual  genero  un   modelo  tridimensional  de  la  proteína  Brn3a  unida  a  la  secuencia  nucleotídica  extraída  de  un   archivo   PDB   de   clave   1AU7.   Esta   clave   corresponde   a   la   estructura   tridimensional   de   la   proteína   con   mayor   identidad   a   Brn3a   por   ello   sirvió   como   modelo   base.   Con   el   programa   X3DNA   se   mutó   la   secuencia   nucleotídica   del   modelo   de   interacción   ADN-­‐proteína   (Brn3a-­‐ ADN)  para  obtener  la  secuencia  nucleotídica  de  la  región  URR  VPH-­‐16.  El  programa  X3DNA  se   ejecutó   desde   la   terminal   del   equipo   de   cómputo   y   se   usó   el   comando   mutate   bases   de   X3DNA.   En   el   comando   a   ejecutar   se   especifico   en   primer   lugar   la   cadena   del   modelo