Variables de la  
investigación
UNIDAD II: Los procesos metodológicos de la 
Investigación
Elaborado por Mgtr.  Luis Casaverde
Definición
Una variable es una forma de expresar las características o atributos 
que  tienen  en  común  los  sujetos  que  participan  en 
una investigación o  experimento  y  pueden  presentarse  en 
modalidades  diferentes  o  por  grados.  Por ejemplo el  peso  de  una 
persona, su estatura, el número de aciertos de un examen, el género, 
etc.
Uno de los pasos más importantes en la investigación científica es la definición 
de las variables. Esto sucede porque no es posible hacer una investigación sin 
precisar y definir de una forma estricta las variables que se van a estudiar.
• Algunos ejemplos de definición de variables:
• -Edad:  tiempo  en  años  transcurrido  desde  el  nacimiento 
hasta la fecha de la entrevista.
• –Procedencia:  lugar  donde  reside  el  entrevistado  o 
paciente.
• –Fiebre: hallazgo de temperatura corporal (axilar), mayor 
o igual a 38 grados centígrados (ºC).
• -Grado de deshidratación de un individuo: se refiere a 
la pérdida de líquidos, la cual según la escala clínica puede 
ser leve, moderada o severa.
Clasificación de variables
• Al  igual  que  la  definición  del  concepto,  en  la  literatura  se 
encuentran diferentes clasificaciones de variable, lo que en 
muchos casos crea confusión en los investigadores.
• clasificaciones,  a  partir  del  estudio  realizado  en  fuentes 
escritas  de  un  sinnúmero  de  autores,  atendiendo  a  los 
criterios que se exponen:
• Según su naturaleza.
• Según su complejidad.
• Según su función o relación.
• Según el nivel de medición.
Ejemplos de variables investigativas:
• Pertenencia a un género, grupo social o grupo étnico.
• Actitud ante el aprendizaje.
• Aprovechamiento académico.
• Coeficiente de desarrollo intelectual.
• Motivación profesional.
• Edad.
• Sexo.
Según su naturaleza
Atendiendo a este criterio de clasificación las variables pueden ser cuantitativas o 
cualitativas.
Cuantitativas: aquellas propiedades del individuo u objeto que son susceptibles de 
medida o conteo.
Cualitativas:aquellas que representan una cualidad o atributo del individuo o el 
objeto en cuestión. Su representación no es numérica.
A la vez las variables cuantitativas se pueden clasificar en:
Variables continuas: aquellas que pueden tomar infinitos valores dentro de un 
rango determinado en dependencia del instrumento de medida que se considere. 
Son aquellas que se pueden medir.
Variables discretas: aquellas que solo pueden tomar determinados valores enteros 
en el rango que se considere por el investigador. Son aquellas que se cuentan. A 
continuación se exponen algunos ejemplos:
• Esta clasificación es de gran importancia desde el punto de vista 
teórico y metodológico ya que deviene en elemento clave para 
la  determinación  del  camino  metodológico  a  seguir  en  las 
investigaciones que se realizan en el campo de la educación.
• Según el punto de vista de las autoras del presente artículo esta 
clasificación  determina  en  primera  instancia  la  modelación 
teórica que permite la operacionalización empírica y por tanto la 
estrategia  para  la  selección  y  utilización  de  los  métodos 
empíricos y estadísticos en el desarrollo de la investigación.
• Por  ejemplo,  las  variables  cuantitativas  se  clasifican 
en continuas y discretas.
• La medición de las variables continuas como peso corporal, talla, altura 
de  una  planta,  rendimiento  de  un  cultivo,  es  directa,  a  partir  de  un 
instrumento  de  medición  que  utiliza  el  investigador,  ya  sea  una 
balanza,  una  cinta  métrica,  una  regla  ordinaria,  por  lo  que  en 
dependencia  del  nivel  de  precisión  del  instrumento,  la  misma  podrá 
tomar infinitos valores dentro de un rango determinado.
• Si el número de observaciones (N) es lo suficientemente grande, para 
la  mayoría  de  los  autores  <50,  estas  mediciones  originan  una 
distribución  de  probabilidades  que  se  ajusta  a  una  curva  normal. 
Mientras < es N el ajuste es mayor.
• Esto  hace  que  en  el  procesamiento  de  los  datos  obtenidos  de  la 
medición  de  estas  variables,  se  pueda  utilizar  la  mayoría  de  las 
pruebas  estadísticas  desarrolladas  en  la  estadística  paramétrica,  que 
tienen como supuesto básico la distribución normal de probabilidades.
• La  medición  de  variables  discretas  como  número  de  pacientes 
afectados por una determinada enfermedad, número de flores de 
una planta, número de niños de una familia, número de alumnos 
en  un  aula  de  clases,  se  hace  por  conteo  y  por  tanto  sus 
resultados  son  solo  determinados  valores  dentro  de  un  rango 
determinado.
• Aunque  el  número  de  observaciones  sea  lo  suficientemente 
grande  los  resultados  de  esta  medición  no  originan  una 
distribución normal, sino una distribución binomial o de Poisson, 
por  lo  que  incumplen  el  supuesto  de  normalidad  que  es 
indispensable para la utilización de la mayoría de las pruebas de 
la estadística paramétrica. No obstante, desde el punto de vista 
estadístico, existen algunos métodos matemáticos que permiten 
la  transformación  de  los  datos  sobre  todo  de  la  distribución 
binomial a la normal, lo que permite la utilización de algunas de 
estas pruebas.
• En  el  caso  de  las  variables  cualitativas,  por  definición  son  aquellas  que 
representan una cualidad o atributo del individuo o el objeto en cuestión. Su 
representación  no  es  numérica. Esta  consideración  tiene  gran  importancia 
pues  tanto  su  definición  como  su  procesamiento  estadístico  tienen 
particularidades sobre las que vale la pena reflexionar.
• Las  variables  cualitativas  por  su  propio  origen  tienen  características 
diferenciales.  Por  ejemplo,  cuando  se  habla  de  sexo  solo  existen  dos 
posibilidades  de  que  los  individuos  se  clasifiquen  en  una  u  otra  cualidad, 
femenino o masculino.
• Pero cuando se habla de aprendizaje, la situación es diferente porque existen 
innumerables factores que inciden en el mismo y que por la propia naturaleza 
y  complejidad  del  concepto,  es  necesario  estudiar  con  profundidad  para 
determinar cuáles son los aspectos que se van a considerar y esta decisión es 
altamente subjetiva, influenciada por el dominio de la temática por parte del 
investigador, su experiencia, vivencias y las influencias en el orden filosófico, 
psicológico y pedagógico.
Según su complejidad
Atendiendo a este criterio las variables pueden ser:
• Simples:  se  manifiestan  directamente  a  través  de  un 
indicador  o  unidad  de  medida.  No  se  descomponen  en 
dimensiones. Ejemplos: precio de un producto, edad, sexo.
• Complejas: se pueden descomponer en dos dimensiones 
como mínimo y luego se determinan los indicadores para 
cada  dimensión.  Ejemplo:  actitud  del  estudiante.  (Puede 
ser  descompuesta  en  dimensiones  como  actitud  ante  el 
trabajo,  actitud  ante  la  defensa,  actitud  ante  el  estudio, 
entre otras.)
Según el nivel de medición
En correspondencia con este criterio de clasificación las variables pueden ser:
• Ordinales: aquellas en las que hay un orden entre las categorías. Ejemplos: estado de 
salud, calificaciones, preferencias, nivel de educación.
• Nominales: valores que se agrupan en categorías disjuntas y exhaustivas. Pueden ser: 
a) Dicotómicas (se presentan en solo 2 categorías. Ej. Sexo: masculino o femenino) b) 
Politómicas  (se  manifiestan  en  más  de  dos  categorías.  Ejemplos:  marcas  de 
computadoras, clases sociales, orientación sexual)
• De  intervalo:  los  elementos  son  clasificados  en  categorías  que  tienen  un  orden  o 
jerarquía,  como  son  numéricas  se  pueden  realizar  operaciones  aritméticas.  La 
diferencia  entre  dos  valores  consecutivos  es  de  tamaño  constante  y  no  existe  el  0 
absoluto natural sino convencional. Ejemplos: coeficiente intelectual
• De razón: aquellas con un punto cero inicialmente inherente. Las diferencias y razones 
(cocientes) son significativas. Ejemplos: edad, producción, ingresos.
Según su función o relación
De acuerdo con este criterio de clasificación las variables pueden ser:
• Independientes: aquellas que se manipulan por el investigador para explicar, 
describir o transformar el objeto de estudio a lo largo de la investigación. Son 
las que generan y explican los cambios en la variable dependiente. Ejemplo: 
la dieta a que es sometido un grupo de pacientes obesos.
• Dependientes:  aquellas  que  se  modifican  por  la  acción  de  la  variable 
independiente. Constituyen los efectos o consecuencias que dan origen a los 
resultados de la investigación. Ejemplo: El peso corporal de los integrantes del 
grupo.
• Intervinientes:  aquellas  que  pueden  influir  directamente  sobre  la  variable 
dependiente  y  en  los  estudios  experimentales  son  manipuladas  por  el 
investigador. Ejemplo: los ejercicios físicos practicados por el grupo.
• Confusoras,  extrañas  o  ajenas:  aquellas  que  pueden  afectar  tanto  a  las 
variables  dependientes  como  a  las  independientes.  Comúnmente  llevan  a 
errores, sesgos, dudas. Ejemplo: factores hereditarios que pudieran incidir en 
el peso de una persona, algún medicamento no orientado por el investigador.
Operacionalización de las 
variables
UNIDAD II: Los procesos metodológicos de la 
Investigación
Elaborado por Mgtr.  Luis Casaverde
Operacionalización
está constituida por una serie de procedimientos o indicaciones 
para  realizar  la  medición  de  una variable definida 
conceptualmente.  En  esta  se  intenta  obtener  la  mayor 
información  posible  de  la variable seleccionada,  a  modo  de 
captar su sentido y adecuación al contexto.
¿Qué es la Operacionalización de 
variables?
Es un proceso metodológico que consiste en descomponer “deductivamente” 
las variables, partiendo desde lo más general a lo más específico... (Carrasco 
(2009) 
Otro: La operacionalización de variables es un proceso lógico de desagregación 
de los elementos más abstractos –los conceptos teóricos–, hasta llegar al nivel 
más concreto, los hechos producidos en la realidad y que representan indicios 
del  concepto,  pero  que  podemos  observar,  recoger,  valorar,  es  decir,  sus 
indicadores.  Según  Latorre,  del  Rincón  y  Arnal,  este  proceso  “consiste  en 
sustituir unas variables por otras más concretas que sean representativas de 
aquellas” (2005: 73). 
la operacionalización de variables es el proceso 
metodológico mediante el cual el investigador “trae” desde el plano teórico al plano practico, explicando en 
detalle la definición y cómo se miden las variables que se han seleccionado.
Paso previo
Ya  cuando  el  investigador  formula  su  problema  o  concreta  el  tema  de 
investigación, es decir, ya cuenta con el título de su trabajo de investigación, 
surge/n  el/los  conceptos/s  más  relevantes  sobre  el  que  se  va  a  “centrar” 
durante el desarrollo de su trabajo de investigación, estos son sus “variables” 
de estudio. Por tanto, debe recurrir a contar con un amplio marco teórico, el 
cual  consiste  en  la  recopilación  de  antecedentes,  investigaciones  previas  y 
consideraciones teóricas en las que se sustenta su proyecto de investigación, 
se dice que el marco teórico es la base que va a fundamentar el trabajo de 
tesis, en la que se asienta este.
El “clásico” cuadro de la 
operacionalización de variables
Todo lo que se describa en la matriz de la operacionalización de la variable, debe estar descrito en el 
“marco teórico”, a excepción solo de la escala de medición, si no, no tendremos opción de respuesta ante 
la interrogante ¿de dónde salió todo esto?, ¿cómo armaste este cuadro?, entre otros
La operacionalización de las variables en la
investigación
El  proceso  de  operacionalización  de  variables  en  la 
investigación educativa reviste importancia ya que es necesario 
modelar a partir de la teoría y en dependencia de la naturaleza 
del  objeto  de  estudio,  los  componentes  básicos  del  diseño 
teórico  metodológico  y  sus  relaciones,  realizar  la  evaluación 
efectiva de las mismas, en otras palabras, continuar el proceso 
de  problematización  que  debe  haberse  iniciado  desde  los 
primeros  momentos  de  la  investigación  y  que  en  estos 
momentos  debe  orientarse  hacia  la  modelación  de  la/s 
variables a partir de los componentes básicos del diseño teórico 
metodológico, lo que se refleja en la figura
• La  operacionalización  de  variables es  un  proceso  metodológico  que 
consiste  en  descomponer  deductivamente  las  variables  que  componen  el 
problema de investigación, partiendo desde lo más general a lo más específico; 
es decir que estas variables se dividen (si son complejas) en dimensiones, sub 
dimensiones,  indicadores,  índices,  valor  final  y  tipo  de  variables.  Entonces,  el 
conjunto de estos datos relacionados formaran el Cuadro de Operacionalización 
de Variables.
• El término variable se define como las características o atributos que admiten 
diferentes  valores  (D´Ary,  Jacobs  y  Razavieh,  1982)  como  por  ejemplo,  la 
estatura, la edad, el cociente intelectual, la temperatura, el clima, etc; por lo que, 
una variable es una propiedad que puede variar y cuya variación es susceptible 
de medirse u observarse.
Hipótesis de la 
investigación
UNIDAD II: Los procesos metodológicos de la 
Investigación
Elaborado por Mgtr.  Luis Casaverde
La hipótesis es un enunciado presumible de la relación entre dos o 
más variables. Son pautas para una investigación, pues muestran 
lo que estamos buscando o tratando de probar y se definen como 
explicaciones  tentativas  del  fenómeno  investigado,  formuladas  a 
manera de proposiciones.
¿Qué es Hipótesis?
Una hipótesis es la suposición de algo que podría, o no, ser posible. En este 
sentido,  la  hipótesis  es  una  idea  o  un  supuesto  a  partir  del  cual  nos 
preguntamos el porqué de una cosa, bien sea un fenómeno, un hecho o un 
proceso.
Como  tal,  las  hipótesis  permiten  dar  inicio  al  proceso  de  pensamiento, 
mediante el cual se accederá a determinados conocimientos.
La  hipótesis  es  una  herramienta  fundamental  del  pensamiento  científico  y 
filosófico, que sirve de base para los modelos y proposiciones teóricas, y que 
funciona como piedra angular para la búsqueda y construcción de respuestas 
en la generación de conocimiento.
Hipótesis de la investigación
La hipótesis de una investigación es aquella afirmación que funciona como 
base de un proceso de investigación. El trabajo de investigación, en este 
sentido, mediante un proceso de riguroso estudio, análisis y examen de los 
resultados  obtenidos,  debe  servir  de  comprobación  o  refutación  de  la 
validez de la hipótesis planteada inicialmente.
• Como  tal,  la  hipótesis  es  la  parte  fundamental  de  todo  trabajo  de 
investigación,  bien  sea  que  este  se  circunscriba  al  campo  científico, 
humanístico, social o tecnológico.
Tipos de hipótesis
¿Cuáles son los tipos de hipótesis?
• Una  hipótesis  es  una  respuesta  probable,  objetiva  y  específica  a  una  pregunta 
científica, la cual debe comprobarse.
• Hay diferentes tipos de hipótesis: la hipótesis de investigación o trabajo, la hipótesis 
alternativa, la hipótesis nula o la hipótesis estadística.
• Sin embargo,  es posible que una investigación  tenga más de una hipótesis.  Esto 
significa que los diferentes tipos de hipótesis también se relacionan entre sí. Por 
ejemplo,  una  hipótesis  de  investigación  puede  actuar  como  la  principal  en  un 
trabajo,  pero  a  su  vez  las  hipótesis  nula,  alternativa  y  estadística  contribuyen  a 
despejar la hipótesis central.
Hipótesis de la investigación o de 
trabajo
La hipótesis de investigación pretende responder cuál es la relación que se establece 
entre diversas variables. Se conoce también como hipótesis de trabajo. Constituye el 
punto de partida de toda investigación científica.
De  acuerdo  a  su  enfoque,  se  divide  en  hipótesis  descriptivas,  hipótesis  causales, 
hipótesis correlacionales o de diferencia de grupos.
Hipótesis descriptivas
Se limitan a describir cuál es la relación entre las variables en estudio, pero no explican 
sus causas. Anticipan el tipo de variable esperada, el valor y las cualidades.
Por ejemplo, «La criminalidad en la ciudad de Caracas ha aumentado el 50% en relación 
con el año 2019».
Hipótesis causales: Hipótesis causales o hipótesis de causalidad son aquellas que 
proponen explicar la relación de causa-efecto entre dos o más variables. Pueden ser 
explicativas o predictivas.
Hipótesis explicativas. Ofrecen una explicación posible sobre la causa que relaciona las 
variables. Por ejemplo, «El consumo excesivo de alcohol causa daño neuronal».
Hipótesis predictivas. Predicen cómo se comportará una variable como respuesta a otra. 
Por ejemplo, «El calentamiento global causará inundaciones en los próximos años».
Tanto las hipótesis explicativas como predictivas pueden formularse de manera 
inductiva o deductiva. Veamos.
Hipótesis deductivas: a partir de una teoría, el investigador formula una hipótesis para 
explicar un caso específico. Es decir, las hipótesis deductivas se formulan de lo general a 
lo particular. Por ejemplo, «Todos los seres vivos tienen ADN. Las bacterias son seres 
vivos. Por lo tanto, las bacterias tienen ADN».
Hipótesis  inductivas: a  partir  de  la  observación  de  un  caso  o  fenómeno 
específico, el investigador formula una generalización o principio general. Es 
decir,  las  hipótesis  inductivas  se  formulan  de  lo  particular  a  lo  general.
Por ejemplo, Newton observó que, aunque la Luna y la manzana son dos 
cuerpos  esféricos,  solo  la  manzana  cae  al  suelo.  Captar  esta  diferencia 
específica le permitió inducir la existencia de una ley que explicara dicho 
comportamiento.  Así,  formuló  la  hipótesis  de  que  existe  una  fuerza  de 
atracción (gravedad) entre los cuerpos.
• Hipótesis correlacionales
Hipótesis correlacionales o de variación conjunta son las que establecen el 
grado de relación mutua entre las variables, es decir, cómo y en qué grado 
una afecta a la otra (y viceversa). En este tipo de hipótesis, el orden de las 
variables es indiferente.
• Por ejemplo, la teoría de la gravedad de Newton es una hipótesis correlacional, ya 
que  su  enunciado  dicta:  «A  mayor  masa,  mayor  fuerza  de  atracción». 
Correlacionalmente,  se  desprende  que:  «A  mayor  fuerza  de  atracción,  mayor 
masa».
• Las hipótesis correlacionales pueden ser negativas, positivas o mixtas.
• Por ejemplo,
• Positiva: «A mayor impunidad, mayor criminalidad».
• Negativa: «A menor consumo de grasas, menor riesgo de padecer enfermedades 
coronarias».
• Mixta: «A mayor altitud, menor temperatura».
Hipótesis de diferencia de grupos
Las hipótesis de diferencia de grupos son las que anticipan la diferencia en el comportamiento de diversos 
grupos. Se basa en la comparación estadística. Las hipótesis de diferencia de grupo se expresan en dos 
variantes:
Aquellas que establecen una diferencia entre dos grupos, sin determinar sobre cuál grupo recae. Por 
ejemplo, «Existe una diferencia en los índices de mortalidad por covid19 entre personas de sexo femenino y 
del sexo masculino».
Aquellas que determinan sobre cuál de los grupos recae la diferencia. Por ejemplo, «El índice de mortalidad 
por covid19 es mayor en personas de sexo masculino que personas de sexo femenino».
Hipótesis nula
La hipótesis nula es aquella que niega la relación entre dos o más variables en función de un parámetro de 
muestra. Su enunciado es negativo, lo que quiere decir que incluye un «no». Se representa con el símbolo 
H0. La hipótesis nula no se acepta, sino que se rechaza o no se rechaza.
La formulación de la hipótesis nula normalmente es acompañada por la formulación de una hipótesis 
alternativa que procura demostrar su falsedad.
Por ejemplo, «El índice de masa muscular no se asocia con el sexo de las personas».
• Hipótesis alternativa
• Toda hipótesis nula genera una hipótesis alternativa, es decir, una respuesta 
alternativa  a  la  hipótesis  nula  que  pretende  demostrar  su  falsedad.  Se 
representa  con  el  símbolo H1.  Este  tipo  de  hipótesis  se  acepta  o  no  se 
acepta.
• Por ejemplo,
• H0: «El índice de masa muscular no se asocia con el sexo de las personas»
• H1: «El índice de masa muscular difiere entre hombres y mujeres».
• Hipótesis estadística
• Las  hipótesis  estadísticas  son  aquellas  que  traducen  las  hipótesis  en  símbolos 
estadísticos. Buscar afirmar o definir los parámetros de una o más poblaciones. Por ende, 
se  formulan  siempre  que  se  espera  recolectar  datos  en  números,  porcentajes  o 
promedios.
• Se subdividen en:
• hipótesis de estimación, que se ocupan de las hipótesis descriptivas de una sola variable. 
Esta es analizada en un contexto. El investigador formula una estimación estadística del 
resultado.
• hipótesis estadísticas de correlación, que se ocupan de las hipótesis de correlación, que 
son aquellas que estudian la relación entre dos o más variables.
• hipótesis  estadísticas  de  diferencias  de  medias,  que  se  ocupan  de  la  diferencia  de 
grupos. Compara las estimaciones numéricas entre dos o más grupos en análisis.
Tipos de hipótesis
Los  investigadores  se  interesan  en  dos  tipos  de  hipótesis:  de 
investigación  y  estadísticas.  La  primera  es  una  conjetura  (como  los 
ejemplos  anteriores)  que  motivó  la  investigación  y  la  segunda  son 
establecidas o enunciadas de tal manera que puedan ser contrastadas 
por  medio  de  pruebas  estadísticas  adecuadas.  Una  hipótesis 
estadística  es  una  proposición  o  supuesto  sobre  los  parámetros  de 
una o más poblaciones.
Las hipótesis de investigación son formuladas como resultado de la 
ocurrencia de eventos que hacen pensar que éstos tienen influencia 
sobre alguna variable de interés que se ha estudiado ya sea a corto o 
incluso a largo plazo. Ejemplo, una enfermera, puede haber notado 
que  ciertos  pacientes  respondieron  más  rápidamente  a  un  tipo 
particular de programa de educación sanitaria. Un médico recordara 
numerosos  casos en los cuales  ciertas  combinaciones  de medidas 
terapéuticas  fueron  más  efectivas  que  cualquiera  de  ellas  por 
separado. Las investigaciones a menudo se llevan a cabo gracias al 
deseo  de  tales  profesionales  para  determinar  si  sus  teorías, 
supuestos o sospechas se pueden sostener o no al ser sometidas a 
los  rigores  de  la  investigación  científica.  Las  hipótesis  de 
investigación conducen directamente a las hipótesis estadísticas.
Las hipótesis de tipo estadístico tienen el propósito de ayudar al 
profesional  de  la  salud  o  investigador  a  tomar  una  decisión 
acerca de una población a partir de una muestra extraída de ella. 
Y  el  tipo  de  inferencia  que  se  aplica  son  las  pruebas  de 
hipótesis, que determinan si tales proposiciones son compatibles 
o  no  con  los  datos  disponibles.  Pero,  ¿qué  es  una  prueba  de 
hipótesis? pues es un procedimiento basado en la evidencia de 
la muestra, es la probabilidad para determinar si la hipótesis que 
se contrasta es una afirmación razonable.
• La hipótesis es el enunciado que presenta un problema, hecho o fenómeno 
que, a través de la experimentación, debe ser explicado y verificado para 
asegurar su veracidad o no.
• En  algunos  tipos  de  investigaciones  científicas,  tras  delimitar  el 
planteamiento  del  problema  y  el  marco  teórico,  el  investigador  debe 
formular una hipótesis, ya que sirve de puente para relacionar la teoría con 
los hechos empíricos. Esto contribuye al mejoramiento y actualización de 
los conocimientos existentes.
•  Ejemplo de hipótesis en Educación
• Hipótesis: Los estudiantes de secundaria víctimas del bullying son más propensos a dejar 
sus estudios que aquellos no se ven amenazados por estos ataques.
• Tema de investigación: Efectos del bullying en la educación.
• 2. Ejemplo de hipótesis en Salud
• Hipótesis: Abstenerse a consumir grandes cantidades de alcohol por el periodo de un año, 
puede revertir hasta el 50% de los daños cognitivos sufridos.
• Tema de investigación: El consumo de alcohol y sus efectos en el sistema nervioso central.
• 3. Ejemplo de hipótesis en Ciencias
• Hipótesis: La aplicación de procesos biotecnológicos hace posible crear y producir plantas 
medicinales en masa con mejor material genético, más rápido y a menor costo.
• Tema de investigación: Aplicación de la biotecnología en la actividad agropecuaria.
La pruebas  de  hipótesis evalúan  la  probabilidad  asociada  a 
la hipótesis nula (H0) de que no hay efecto o diferencia. El valor de 
p obtenido  refleja  la  probabilidad  de  rechazar  la  H0 siendo  esta 
verdadera;  en  ningún  caso prueba que  la hipótesis alternativa,  de 
que si hay efecto o diferencia, sea verdadera.
¿Cuáles son los tipos de pruebas de hipótesis?
Los contrastes de hipótesis pueden ser de dos tipos:
• Bilateral: En la hipótesis alternativa aparece el signo distinto.
• Unilateral: En la hipótesis alternativa aparece o el signo > o el signo <.
La pruebas de hipótesis evalúan la probabilidad asociada a la hipótesis nula (H0) de que no 
hay  efecto  o  diferencia.  El  valor  de  p  obtenido  refleja  la  probabilidad  de  rechazar  la  H0 
siendo esta verdadera;  en ningún caso prueba que la hipótesis alternativa, de que si hay 
efecto o diferencia, sea verdadera.
• Ejemplos de la hipótesis nula
H1: las plantas de tomate exhiben una mayor tasa de crecimiento 
cuando se plantan en compost en lugar del suelo. Y una hipótesis 
nula: H0: las plantas de tomate no presentan una mayor tasa de 
crecimiento cuando se plantan en el compost en lugar del suelo.
• Por ejemplo, si estudiamos como hipótesis alternativa que la 
estatura media de la población de un pueblo de 20.000 habitantes 
es de 1,70 y tomamos como muestra a 50 habitantes, ha hipótesis 
nula sería la contraria: que la estatura media no es de 1.70; si de 
esos cincuenta habitantes la estatura media es de 1.70 ...
Pasos para la prueba de hipótesis
Es  un  proceso  en  cinco  pasos  que  siguen  una  secuencia  lógica  de 
acciones y decisiones.
1. Plantear la hipótesis.
La  prueba  de  hipótesis  formula  dos  hipótesis  estadísticas  que  deben 
anunciarse  explícitamente:  hipótesis  nula  y  alternativa.  La  primera,  se 
designa  por  el  símbolo  H0. Esta  hipótesis  se  conoce  también  como  la 
hipótesis  de  no  diferencia,  ya  que  es  una  proposición  de  conformidad 
con (o sin diferencia respecto a) Características que se suponen ciertas 
en la población de interés. Esta hipótesis siempre se opone a la hipótesis 
del investigador.
• La segunda, identificada mediante el símbolo H1, es una proposición 
que se creerá cierta si los datos de la muestra siguieren que llevan al 
rechazo  de  la  H0 es  falsa.  Por  lo  general,  la  H1  y  la  hipótesis  de 
investigación son la misma y, de hecho; se utilizan los dos términos 
indistintamente.
• En  general  H0,  esta  se  establece  con  el  propósito  expreso  de  ser 
rechazada. Si no se rechaza, esto no necesariamente significa que es 
verdadera, se dirá que los datos sobre los cuales se basa la prueba 
no  proporcionan  evidencia  suficiente  que  cause  el  rechazo.  Por  el 
contrario, si se rechaza se concluye que los datos disponibles no son 
compatibles  con  la  H0,  pero  sirven  como  apoyo  a  alguna  otra 
hipótesis.  Rechazarla  entonces,  sugiere  que  la  hipótesis  alternativa 
puede ser verdadera.
• Aspectos importantes sobre H0 y H1
• H0 y H1 son mutuamente  exclusivas y colectivamente  exhaustivas, 
es decir; son complementarias.
• H0 siempre se presume ser cierta y es la que debe ser comprobada.
• H1 es  la  conclusión  a  la  que  se  desea  o  espera  llegar  como 
resultado de la En consecuencia, el complemento de la conclusión 
se convierte en el enunciado de la H0.
• Se utiliza una muestra aleatoria (n) para “rechazar H0”.
• Siempre, la igualdad es parte de H0 (“=”, “≥”, “≤”).
• Mientras que “≠” “<” y “>” siempre es parte de H1.
2. Establecer un nivel de significancia 
Se  ha  señalado  que  la  clave  para  la  inferencia  estadística  es  la 
distribución muestral. Es necesario recordar esto, en los casos en que 
sea  necesario  especificar  la  distribución  de  probabilidad  de  la 
estadística de prueba. Por ejemplo, la distribución de la estadística de 
prueba  por  lo  general;  sigue  una  distribución  normal  estándar  si  la 
H0 es  verdadera  y  si  satisface  las  suposiciones.  Todos  los  valores 
posibles que la estadística de prueba puede asumir son puntos sobre el 
eje horizontal de la gráfica de la distribución para esta estadística y se 
dividen en dos grupos: uno de ellos constituye lo que se conoce como 
región de rechazo y el otro, forma la región de no rechazo (figura).
• Los  valores  de  la  estadística  de  prueba  que  forman  la  región  de  rechazo  son 
aquellos  que  tienen  la  menor  probabilidad  de  ocurrir,  mientras  que  los  que 
forman la región de no rechazo tienen la mayor probabilidad de ocurrencia, si la 
H0 es verdadera para ambas regiones.
• La decisión en cuanto a que valores van hacia qué región se toma con base en 
el nivel de significancia deseado, designado por α. El nivel de significancia α, 
designa  el  área  bajo  la  curva  de  la  distribución  de  la  de  prueba  que  está  por 
encima  de  los  valores,  sobre  el  eje  horizontal;  que  constituyen  la  región  de 
rechazo. Y un valor calculado para la estadística de prueba que cae dentro de la 
región de rechazo se dice que es significativo.
• Ejemplo, si tuviéramos un nivel o grado de confianza del 95% (0.95) entonces el 
nivel de significancia sería del 5% (0.05) donde:
• Nivel de confianza = (1- α)
• Análogamente  si  se  tiene  un  nivel  de  confianza  del  90%  entonces  el  nivel  de 
significancia sería del 10%.
Dado que rechazar una H0 verdadera sería un error, parece razonable 
que se deba hacer pequeña la probabilidad de cometerlo y, de hecho; 
esto es lo que se hace. Se elige un valor pequeño de α para hacer 
que la probabilidad de rechazo para una H0 sea pequeña. Los valores 
que  se  encuentran  con  más  frecuencia  son:  0.01,  0.05  y  0.10.  La 
probabilidad  de  equivocarse  al  no  rechazar  un  H0 verdadera 
generalmente es de 95%, puede ser 90 y 99%, esto se conoce como 
el nivel de confianza.
Por lo tanto, la probabilidad de no equivocarse al rechazar 
una H0 falsa generalmente es de 80%, esto es el valor o 
grado predictivo cuyo valor de β más comúnmente usado 
es 0.2. 
Tipos de errores 
• El error que se comete cuando se rechaza una H0 verdadera se conoce como error del tipo 
I (α). EI error del tipo II (β) se comete cuando no se rechaza una H0 falsa. Siempre que se 
rechaza  una  H0 se  tiene  el  riesgo  de  cometer  un  error  del  tipo  I,  al  rechazar  una 
H0 verdadera; y siempre que no se rechaza, existe el riesgo de no rechazar una H0 falsa. 
En general, aunque se dé un valor pequeño a α no se ejerce control sobre β, aunque se 
sabe que en la mayoría de las situaciones practicas es mayor que α. Es decir:
• El error tipo I (error alfa) se comete cuando:
• Se concluye que hay diferencias cuando realmente no las hay.
• Se  detecta  significancia  estadística  p<  0.05  y  se  rechaza  la  H0 cuando  en  realidad  es 
verdadera.
• La probabilidad de cometer este error es lo que mide el valor de p (P-Value)
• El error tipo II (error beta) se comete cuando:
• Los  resultados  NO  son  significativos  (p>0.05)  y  se  concluye  que  no  hay  diferencias, 
cuando realmente SI las hay y se acepta la H0 cuando en realidad es falsa.
Nunca se sabe si se ha cometido o no uno de estos errores cuando se rechaza o 
no  una  H0,  ya  que  se  desconoce  el  verdadero  estado  de  las  cosas.  Si  el 
procedimiento de prueba conduce al rechazo de la H0, puede ser un consuelo 
el hecho de que al dar un valor pequeño a α la probabilidad de cometer un 
error del tipo I también lo es. Si no se rechaza la H0, no se conoce el riesgo 
concurrente  de  cometer  un  error  del  tipo  II,  ya  que  por  lo  común  se 
desconoce; pero como se ha señalado, en la mayoría de situaciones prácticas 
se sabe que es mayor que α.
El cuadro muestra las posibles acciones que el investigador puede emprender 
para varias condiciones de una prueba de hipótesis, así como las condiciones 
en las que se produce cada uno de los dos tipos de error.
En resumen:
• Error  Tipo  I:  es  el  nivel  de  significancia,  denotado  por  la  letra  griega  “a”,  se  define  como  la 
probabilidad de “rechazar” la H0 cuando esta es
• Error Tipo II: es el valor predictivo, denotado por la letra griega “β”, se define como probabilidad 
de “aceptar” la H0 cuando ésta es falsa. El procedimiento busca fijar la probabilidad de cometer 
error Tipo I, α, y minimizar la probabilidad de cometer error Tipo II, β.
Recomendaciones para disminuir el error tipo I, α:
• Disponer de una teoría que guíe la investigación, evitando el “salir de pesca” con la computadora 
buscando asociaciones entre variables.
• Disminuir el número de pruebas estadísticas llevados a cabo en el estudio.
• Depurar la base de datos para evitar errores de valores extremos que puedan producir hallazgos 
signicativos.
• Utilizar valores de alfa más reducidos (0.01 o 0.001).
• Reproducir el estudio. Si al reproducir el estudio se obtienen resultados similares, estaremos más 
seguros de no estar cometiendo el error de tipo I.
• Recomendaciones para disminuir el error tipo II, β:
• Incrementar el tamaño de la muestra.
• Estimar el poder estadístico del estudio (1 – β).
• Incrementar el tamaño del efecto a detectar.
• Incrementar el valor de alfa.
• Utilizar pruebas paramétricas (más potentes) en lugar de pruebas no 
paramétricas en la medida de lo posible.
3. Seleccionar el estadístico de prueba a 
aplicar
Es necesario comprender la naturaleza de los datos que forman la base de 
los procedimientos de prueba, ya que esto determina la prueba particular que 
se ha de utilizar. Se debe determinar, por ejemplo, si los datos constan de 
conteos o medidas. A partir de los datos contenidos en la muestra, se calcula 
un valor de la estadística de prueba y se compara contra las regiones de no 
rechazo y rechazo que ya fueron especificadas. Luego entonces, aplicar el 
estadístico  de  prueba,  previa  comprobación  los  supuestos  (restricciones) 
estas  incluyen,  entre  otras;  suposiciones  respecto  a  la  normalidad  de  la 
distribución de la población, igualdad de varianzas e independencia de las 
muestras. Esto  es  importante  ya  que  determina  si  se  usan  pruebas 
paramétricas  (para  datos  que  siguen  la  distribución  normal)  o  pruebas  no 
paramétricas (para datos cuya distribución es diferente a la normal). Hay que 
tener  en  cuenta  que  un  procedimiento  general  se  modifica  según  las 
suposiciones.  Los  estadísticos  de  prueba  más  comunes  los  veremos  más 
adelante.
4. Establecer una regla de decisión
Esta  señala  que  se  debe  ser  rechazada  H0 si  el  valor  de  la  estadística  de 
prueba que se calcula a partir de la muestra es uno de los valores de la región 
de rechazo, y que no se debe rechazar si el valor calculado es uno de los 
valores de la región de no rechazo.
• Valor de p en pruebas de hipótesis
Un  aspecto,  aquí  importante  es  el  valor  de p (P-Value)  que  es  el  valor  del 
estadístico  de  prueba  que  se  aplique.  Indica  que  tan  significante  son  los 
resultados de la muestra, considerando que la H0 sea verdadera.
Los valores de p son comúnmente utilizados para probar (y descartar) una H0, 
que por lo general indica que no existe una diferencia entre dos grupos, o que 
no hay ninguna correlación entre un par de características; por lo tanto, ofrece 
la justificación para dudar de la certeza de la H0, si esta es verdadera.
• Cuanto menor sea el valor de p, menor es la probabilidad de que un conjunto de 
valores observados ocurra por casualidad. Un valor p de 0.05 o menos suele 
entenderse en el sentido de que las observaciones son estadísticamente 
significativas y justifica los resultados de un estudio. Pero eso no es 
necesariamente cierto, la distancia entre la significación estadística y la 
relevancia clínica se debe analizar con cuidado por parte de los investigadores 
por lo que hay que evitar sacar conclusiones científicas o tomar decisiones 
basadas solo en los valores de p.
• Un valor p de 0.05, no significa que hay una posibilidad del 95% que una 
determinada hipótesis es correcta. Más bien, significa que, si la H0 es 
verdadera, y todas las demás suposiciones hechas son válidas, hay una 
probabilidad del 5 % de obtener un resultado al menos tan extremo como el 
observado. Y un valor de p no puede indicar la importancia de un hallazgo; por 
ejemplo, un medicamento puede tener un efecto estadísticamente significativo 
en los niveles de glucosa en la sangre del paciente sin tener un efecto 
terapéutico, en este caso hay relevancia estadística pero el hallazgo clínico 
también es importante dado que dicho medicamento no es eficaz en el 
tratamiento de la diabetes, por ejemplo.
• Por  lo  tanto,  el  valor  de  p  es  la  probabilidad  de  observar  un  valor 
muestral  tan  extremo  como,  o  más  extremo  que,  el  valor  observado, 
dado que la H0 es verdadera.
• En prueba de hipótesis, podemos también comparar el valor de p con el 
nivel de significancia α. Si el valor de p < α, H0 se rechaza, de otro modo 
H0 no  se  rechaza.  Pero  ¿qué  significa  esto?  veamos  lo  que  puede 
ocurrir, si:
• p  =  0.10,  tenemos  alguna  evidencia  que  H0 no  es  verdadera.
p  =  0.05,  tenemos  fuerte  evidencia  que  H0 no  es  verdadera.
p  =  0.01,  tenemos  muy  fuerte  evidencia  que  H0 no  es  verdadera.
p = 0.001, tenemos una extremadamente fuerte evidencia que H0 no es 
verdadera.
5. Tomar una decisión o conclusión
• Esto  no  es  otra  cosa  que  decidir  si  H0 se  rechaza,  entonces  se 
concluye que H1 es verdadera. Si H0 no se rechaza, se concluye que 
H0 puede ser verdadera. Es importante aclarar que cuando la H0 no 
es rechazada, tampoco se puede decir que se acepta. Se debe decir 
que «no se rechaza«. Se evita el uso de la palabra «aceptar» en este 
caso porque pudiera haberse cometido el error de tipo II. Dado que, 
frecuentemente; la probabilidad de cometer un error de tipo II puede 
ser realmente alta, no se pretende cometerlo al aceptar la H0.
• Finalmente,  la  interpretación  está  en  función  de  la  pregunta  de 
investigación  y  tiene  relación  con  la  H1,  pero  la  interpretación  no 
necesariamente es igual a dicha hipótesis.
Propósito de la prueba de hipótesis
• Uno de los propósitos de la prueba de hipótesis es ayudar en la toma de 
decisiones. En general, la decisión práctica (la razón por la cual se hizo la 
prueba) depende de la decisión estadística. Si se rechaza H0, la decisión 
práctica  generalmente  refleja  el  hecho  de  que  la  H1 es  compatible.  Se 
cumple lo opuesto si no se rechaza la H0. Sin embargo, en la práctica esto 
puede tener otras alternativas, como la decisión de reunir más datos.
• Sin embargo, en este punto es necesario destacar que el resultado de la 
estadística de prueba sólo es una parte de la evidencia que influye sobre la 
decisión final, es decir; la decisión práctica. La decisión estadística no debe 
interpretarse  como  definitiva,  sino  considerarse  junto  con  toda  la  demás 
información importante de que disponga el experimentador. Con base en 
estos  comentarios  se  estudian  a  continuación  pruebas  de  hipótesis 
especificas más comunes.
Prueba de hipótesis para una media
• A este respecto, pueden darse 3 casos a saber:
1.Cuando  el muestreo  se  realiza  a  partir  de  una  población  de  valores  que 
siguen una distribución normal con varianza conocida;
2.Cuando el muestreo se realiza a partir de una población con distribución 
normal y con varianza desconocida, y
3.Cuando el muestreo se realiza a partir de una población que no presenta 
una distribución normal (no la veremos, por ahora).
• Aunque la teoría para las condiciones 1 y 2 depende de poblaciones con 
distribución  normal,  es  una  práctica  común  aplicar  la  teoría  cuando  las 
poblaciones importantes solo están distribuidas en forma aproximadamente 
normal. Esto es satisfactorio siempre que la desviación de la normalidad es 
moderada.
Cuando la desviación estándar (σ) es desconocida, se utiliza la desviación estándar muestral 
(s) en su lugar. Y la distribución de t de Student se utiliza como estadístico de prueba.
La dirección de la prueba involucra proposiciones que comprenden las 
palabras “ha mejorado”, “es mejor que”, y el cómo dependerá sobre la 
variable que esté siendo medida. Por ejemplo, si la variable involucra 
tiempo  para  que  un  cierto  medicamento  haga  efecto,  las  palabras 
“mejor” “mejore” “o más efectivo” se traducen como “<” (menos que, 
i.e. alivio menos rápido). Por otro lado, si la variable se refiere a un 
resultado de una prueba, entonces las palabras “mejor” “se mejora” o 
“más efectiva” se traducen como “>” (más grande que, i.e. resultados 
del examen más altos).
 Prueba para una Media de una Población 
con una Desviación Estándar
Ejemplo:
Los servicios coordinados de salud de un municipio de alta marginación 
reportan  en  la  época  de  verano  (cuando  hace  más  calor),  un  número 
promedio  de  200  niños,  menores  de  cinco  años,  con  problemas  de 
deshidratación  por  diarrea.  Supongamos  que  la  incidencia  de  niños 
deshidratados  sigue  la  distribución  de  probabilidad  normal  con  una 
media  de  200  y  una  desviación  estándar  de  16.  Recientemente,  se 
realizó una campaña de información sobre hábitos de higiene, que duró 
50  semanas.  Se  quiere  investigar si  ha  habido  un  cambio en  la 
incidencia de casos de deshidratación infantil semanal en el municipio de 
alta marginación.
                        
                      
Paso 1: Establezca la hipótesis nula y la hipótesis alternativa.
Paso 2: Seleccione el nivel de 
significancia.
α = 0.01 en este caso
Paso 3: Seleccione el estadístico de 
prueba.
Use la distribución de Z en virtud de que σ es conocida 
(recuerde que en la unidad anterior esta la tabla de z en 
anexos, úsela para este ejemplo).
Paso 4: Formule la regla de decisión.
Rechace H0 si |Z| > Zα/2
Debido a que 1.98 no cae en la región de rechazo, H0: μ = 200 no se rechaza.
Concluimos  que  la  media  poblacional  no  es  diferente  de  200.  Así  que  reportaríamos  que  la 
incidencia de deshidratación por diarrea, en niños menores de cinco años, en el municipio de alta 
marginación no ha cambiado con una campaña de salud e higiene en las últimas 50 semanas.
Población y muestra de la 
investigación
UNIDAD II: Los procesos metodológicos de la 
Investigación
Elaborado por Mgtr.  Luis Casaverde
Población y muestra
Las estadísticas de por sí no tienen sentido si no se consideran o se relacionan 
dentro del contexto con que se trabajan. Por lo tanto es necesario entender 
los  conceptos  de  población  y de  muestra  para lograr comprender  mejor  su 
significado en la investigación educativa o social que se lleva a cabo.
POBLACIÓN - es el conjunto total de individuos, objetos o medidas 
que  poseen  algunas  características  comunes  observables  en  un 
lugar y en un momento determinado. Cuando se vaya a llevar a cabo 
alguna  investigación  debe  de  tenerse  en  cuenta  algunas 
características esenciales al seleccionarse la población bajo estudio. 
Entre éstas tenemos:
Homogeneidad - que todos los miembros de la población tengan las mismas 
características según las variables que se vayan a considerar en el estudio o 
investigación.
Tiempo - se refiere al período de tiempo donde se ubicaría la población de 
interés. Determinar si el estudio es del momento presente o si se va a estudiar 
a una población de cinco años atrás o si se van a entrevistar personas de 
diferentes generaciones. 
1.Espacio - se refiere al lugar donde se ubica la población de interés. 
Un  estudio  no  puede  ser  muy  abarcador  y  por  falta  de  tiempo  y 
recursos hay que limitarlo a un área o comunidad en específico.
2.Cantidad - se refiere al tamaño de la población. El tamaño de la 
población es sumamente importante porque ello determina o afecta 
al tamaño de la muestra que se vaya a seleccionar, además que la 
falta  de  recursos  y  tiempo  también  nos  limita  la  extensión  de  la 
población que se vaya a investigar.
• MUESTRA - la muestra es un subconjunto fielmente representativo de la 
población.
Hay diferentes tipos de muestreo. El tipo de muestra que se seleccione 
dependerá de la calidad y cuán representativo se quiera sea el estudio 
de la población.
1.ALEATORIA - cuando se selecciona al azar y cada miembro tiene igual 
oportunidad de ser incluido.
2.ESTRATIFICADA - cuando se subdivide en estratos o subgrupos según 
las variables o características que se pretenden investigar. Cada estrato 
debe corresponder proporcionalmente a la población.
3.SISTEMÁTICA - cuando se establece un patrón o criterio al seleccionar 
la  muestra.  Ejemplo:  se  entrevistará  una  familia  por  cada  diez  que  se 
detecten.
El muestreo 
• Es  indispensable  para  el  investigador  ya  que  es  imposible  entrevistar  a 
todos  los  miembros  de  una  población  debido  a  problemas  de  tiempo, 
recursos y esfuerzo. Al seleccionar una muestra lo que se hace es estudiar 
una  parte  o  un  subconjunto  de  la  población,  pero  que  la  misma  sea  lo 
suficientemente representativa de ésta para que luego pueda generalizarse 
con seguridad de ellas a la población.
• El tamaño de la muestra depende de la precisión con que el investigador 
desea llevar a cabo su estudio, pero por regla general se debe usar una 
muestra tan grande como sea posible de acuerdo a los recursos que haya 
disponibles. Entre más grande la muestra mayor posibilidad de ser más 
representativa de la población.
• En la investigación experimental, por su naturaleza y por 
la necesidad de tener control sobre las variables, se recomienda 
muestras pequeñas que suelen ser de por lo menos 30 sujetos. 
• En  la  investigación  descriptiva se  emplean  muestras 
grandes y algunas veces se recomienda seleccionar de un 10 a un 
20 por ciento de la población accesible.
• Las  razones  para  estudiar  muestras  en  lugar  de  poblaciones  son 
diversas y entre ellas podemos señalar 
a.Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo.
b.Como consecuencia del punto anterior ahorraremos costes.
c.Estudiar  la  totalidad  de  los  pacientes  o  personas  con  una  característica 
determinada en muchas ocasiones puede ser una tarea inaccesible o imposible de 
realizar.
d.Aumentar  la  calidad  del  estudio.  Al  disponer  de  más  tiempo  y  recursos,  las 
observaciones  y  mediciones  realizadas  a  un  reducido  número  de  individuos 
pueden  ser  más  exactas  y  plurales  que  si  las  tuviésemos  que  realizar  a  una 
población.
e.La selección de muestras específicas nos permitirá reducir la heterogeneidad de 
una población al indicar los criterios de inclusión y/o exclusión.
POBLACIÓN
La POBLACIÓN de  una  investigación está compuesta 
por    todos  los  elementos  (personas,  objetos, 
organismos,    historias  clínicas)  que  participan  del 
fenómeno que fue  definido y delimitado en el análisis 
del problema de  investigación.
La  POBLACIÓN  tiene  la  característica  de  ser 
estudiada,
medida y cuantificada.
También se conoce como UNIVERSO.
La población debe delimitarse claramente en torno a 
sus  
características de contenido, lugar y tiempo.
TIPOS DE 
POBLACIÓN
POBLACION
INFINITA
FINITA ACCESIBLE
MUESTRA
Una muestra es una parte de la población.
La muestra puede ser definida como un SUBGRUPO DE LA 
POBLACIÓN o  
universo.
Para seleccionar la muestra, primero deben delimitarse las características 
de
la población.
MUESTRAS REPRESENTATIVAS
Una muestra representativa debe contener todas las características de la
población o universo, para que los resultados sean generalizables.
La muestra debe ser proporcional al tamaño de la población.  
Preferentemente seleccionada por procedimientos 
aleatoreos/probabilísticos.
La Muestra es una parte o subconjunto de la población
Muestreo es la selección de algunas unidades de estudio entre 
una  
población definida en una investigación.
MARCO MUESTRAL Es una lista 
detallada y  
actualizada de las unidades 
de muestreo.
MARCOS 
MUESTRALE
S
Archivos  
Mapas  
Volúmene
s
Horas de 
transmisión  
Períodos registrados
UNIDAD DE ANÁLISIS / 
UNIDAD DE MUESTREO
La unidad de análisis es cada uno 
de los  elementos que constituyen 
la población y por  
lo tanto la 
muestra.
Ejemplos de unidad de análisis son 
alumnos,  
maestros, directivos, 
expertos, padres de  familia,
empleadores, etc.
Cada unidad de análisis 
cumple con los  
parámetros 
muestrales.
s1 s2
s4
s3
Cuando se seleccionan muestras aleatoriamente los 
resultados  
SIEMPRE son variables. Esta variación en los 
estadísticos se  denomina error aleatorio y es causada por la 
selección al azar.
ERROR
ALEATORIO
Sí
¿Debo tomar una muestra?
Se requiere conocer cómo se  
presenta cierta característica en un 
Universo particular
¿El Universo 
está bien  
definido?
Definir  
el Universo
¿Es posible  
observar todo el 
Universo?
Observar  
una Muestra
Hacer
un Censo
NO
NO
Sí
Tomar  
una Muestra
No representativa
Tomar  
una Muestra
Representativa
¿Se quiere  
inferir la medición
al Universo?
NO
Sí
Las observaciones  
pueden atribuirse a 
los miembros del  
Universo
Las observaciones 
sólo pueden  
atribuirse a la  
muestra, NO a los 
miembros del  
Universo
Las observaciones  
pueden atribuirse a 
los miembros del  
Universo
Selección de una Muestra NO  
Representativa
Se quiere  medir  
una variable en 
una  
Muestra No  
Representativa
¿Se quiere  
inferir la medición
al Universo?
Sí El  procedimiento  
está contraindicado.
Revise su planteamiento.
Precise los 
atributos  
esenciales que  
CARACTERIZAN al
subgrupo
Exprese estos 
atributos  
como 
CRITERIOS DE
INCLUSIÓN  en 
la  
muestra
Los sujetos que cumplan los 
criterios  
de inclusión son 
representativos del  UNIVERSO
Defina por 
CONVENIENCIA  
los 
criterios de SELECCIÓN
La observación de este  
UNIVERSO sólo es 
APLICABLE a
sus integrantes
La utilidad de las Muestras No Representativas depende de su
representatividad cualitativa y no de su tamaño
Sí
NO
Selección de una Muestra  
Representativa
Se quiere estimar un  
Parámetro del Universo  
partiendo de una Muestra 
Representativa
¿De qué naturaleza 
es el Parámetro a  
estimar?
Variable
Cuantitativa
Muestreo  
Representativo  
para estimar una 
Media
Variable
Cualitativa
Muestreo  
Representativo  
para estimar una 
Proporción
D E C I S I O N E S D E M U E S T R E O
Hace
r  un 
Censo
Tomar 
una  Muestra  
representativ
a
Tomar 
una  Muestra 
No  
representativa
a
Las observaciones  
pueden atribuirse a  
TODOS los 
miembros  
del 
Universo
Observar todos 
y  
cada uno de 
los  elementos 
del  universo
No hay Error 
Aleatorio
Puede haber 
Error  
Sistemático
Las 
observaciones  
sólo pueden  
atribuirse a la  
muestra, NO a los 
miembros del  
Universo
Observar 
sujetos  
elegidos 
por  
conveniencia
Siempre hay 
Error  
Aleatorio
Siempre hay 
Error  
Sistemático
Las observaciones 
pueden atribuirse 
a  
los miembros del 
Universo
Observar 
sujetos  
elegidos 
por  
conveniencia
Siempre hay 
Error  
Aleatorio
Puede haber 
Error  
Sistemático
Definición del Tamaño
Muestral
La definición del tamaño muestral depende de los siguientes
factores
Los objetivos del estudio
Los conocimientos previos sobre el  
comportamiento de la
característica en la población.
Los recursos técnicos y financieros 
para  
obtener la información
El error máximo que se 
permitirá  
el analista
La confiabilidad de la 
inferencia  
esperada por el 
analista
1
2
3
4
5
TÉCNICAS ALEATORIAS Y NO ALEATOREAS  
(PROBABILÍSTICAS / NO PROBABILÍSTICAS)
En las técnicas aleatoreas todos los  
elementos de la población tienen la 
misma  
probabilidad de ser 
seleccionados.
En las muestras no aleatorias la elección de 
los sujetos depende de la decisión del  
investigador, ya que requiere para formar 
este  
tipo de muestra, de una cuidadosa y  
controlada elección de sujetos con ciertas  
características específicas.
MUESTREO 
PROBABILÍSTICO
Para que la inferencia 
estadística  
sea válida el 
muestreo debe ser  aleatorio o 
probabilístico.
Aleatoriedad de la selección
Condición que refiere que cada  
elemento del universo debe tener 
la  
misma probabilidad de ser 
elegido  en la muestra y que dicha 
probabilidad puede ser medida.
TIPOS DE MUESTREO 
PROBABILÍSTICO
1. Muestreo aleatorio simple
2. Muestreo aleatorio Sistemático
3. Muestreo aleatorio Estratificado
4. Muestreo aleatorio por 
Conglomerados
5. Muestreo aleatorio Polietápico
1. MUESTREO ALEATORIO 
SIMPLE
Escoge al azar los miembros del 
universo  
hasta completar el tamaño 
muestral  previsto.
En  teoría  se  enumeran  previamente 
todos  los elementos y de acuerdo con 
una tabla  de números aleatorios se van 
escogiendo .
El procedimiento puede darse con o 
sin  
reemplazos y esta condición 
afectará  posteriormente el análisis.
2. MUESTREO ALEATORIO 
SISTEMÁTICO
1 - En el universo (N) se elige el primer elemento al azar.
2- Luego los demás se escogen cada cierto intervalo (k), 
hasta  
completar el tamaño muestral (n).
El tamaño del intervalo (k) se calcula:k = N/n
Se divide población entre muestra.
Ejemplo: 500/100  =  5
El intervalo será de  5
3. MUESTREO ESTRATIFICADO
Considera que al interior del universo existen 
estratos  (subgrupos internamente homogéneos pero 
cualitativa  
y cuantitativamente diferentes entre sí), y 
que no se  cumple la condición de selección 
aleatoria pues los  miembros del grupo mayoritario 
tienen una mayor  probabilidad de ser seleccionados 
en la muestra.
Esto garantiza que la muestra 
contenga  
elementos de todos los 
estratos.
El muestreo estratificado puede ser proporcional 
o  
no proporcional.
ESTRAT
OS
Homogéneos en su interior; diferentes entre sí en  
propiedades y tamaño
Comuna A
Comuna B
Comuna C
Comuna D
Los estratos más grandes
Tienen  mayor probabilidad de ser 
seleccionados
¿Cómo garantizar la aleatoriedad en  
universos estratificados?
Puede usarse alguna de las siguientes 
técnicas:
1. Muestreo Estratificado Proporcional
2. Muestreo Estratificado No Proporcional
3. Alocación óptima de los estratos.
Muestreo Estratificado Proporcional
Supone que los estratos contienen diferente 
número de elementos, unos más grandes y  
otros más pequeños, por lo tanto la cantidad 
de elementos de cada estrato será diferente 
y  
proporcional a su tamaño.
Así, se eligen aleatoriamente los elementos 
al  interior de cada estrato muestral hasta 
ajustar  
su tamaño.
Es mejor que el Muestreo Aleatorio Simple 
pues  
disminuye el error estándar de la 
medición  muestral.
Muestreo Estratificado NO 
Proporcional  
(Fracción variable de 
muestreo)
Para aplicar el muestreo estratificado no proporcional, simplemente 
se
divide el tamaño de la muestra entre el número de estratos.
Cada estrato aporta el mismo número de sujetos, 
independientemente  
de su tamaño.
Ajusta convencionalmente los tamaños de los estratos 
muestrales  
para aumentar la eficiencia de la selección de los 
grupos más  pequeños.
MUESTREO POR ALOCACIÓN 
ÓPTIMA DE  
LOS ESTRATOS
Selecciona el tamaño de los estratos en función de la  
desviación estándar de cada uno 
de ellos, de tal  manera que los estratos más heterogéneos (mayores  
varianzas) aporten 
más casos a la muestra total.
MUESTREO 
RAMIFICADO
Es una continuación del muestreo estratificado. Esta técnica se emplea  cuando el universo o 
población es muy grande y se divide en estratos que a  
su vez contienen otros subestratos.
CONGLOMERADOS
Grupo 2A
Grupo 3B
Heterogéneos en su interior; diferentes entre sí en propiedades y 
tamaño
En este procedimiento la muestra se elige no individualmente sino por grupos
o conglomerados.
Grupo 1A
Grupo 5C
MUESTREO  ALEATORIO POR 
CONGLOMERADOS
• Los miembros del grupo mayoritario tienen una mayor probabilidad 
de ser  seleccionados en la muestra.
• Las unidades de observación se elijen aleatoriamente al interior de 
los  conglomerados
• El error de la medición (error muestral) no se de al interior del 
conglomerado  sino entre los conglomerados
Muestreo
Aleatorio por Conglomerados
Requisitos del Procedimiento 
:
• Los 
conglomerados  
deben estar bien  
definidos de modo 
que cada 
elemento  
pertenezca a uno 
y  
sólo a un  
conglomerado.
• El tamaño de cada  
conglomerado debe  
ser bien conocido 
(por  
lo menos bien  
estimado)
TIPOS DE MUESTREO NO 
PROBABILÍSTICO
1. Muestreo por Cuotas
2. Muestreo intencional
3. Muestreo accidental
4. Muestreo casual
5. Muestreo Bola de 
Nieve
6. Informantes clave
7. Muestra reductiva
8. Procedimientos mixtos
MUESTREO POR 
CUOTAS
Una vez establecido el tamaño de la muestra, se define la unidad de 
análisis  
típica o representativa, y se eligen los elementos que tengan las  
características descritas hasta completar la cuota o número indicado para 
la  
muestra.
MUESTREO INTENCIONAL
El investigador selecciona intencionalmente los elementos que constituirán la  
muestra.
Este procedimiento puede dar muestras altamente representativas o bien  
poco 
representativas, esto dependerá de las habilidades del investigador.
MUESTREO 
ACCIDENTAL
La muestra es seleccionada de manera accidental sin que haya de por 
medio  
criterios específicos.
No hay nada que nos asegure que los elementos seleccionados sean 
típicos.
MUESTREO CASUAL
También se le llama muestreo voluntario.
Se pide voluntarios para conformar la muestra.
No hay nada que asegure que la muestra sea 
representativa.
MUESTREO BOLA DE 
NIEVE
Para seleccionar este tipo de muestra se recurre a ciertas 
personas
que a su vez conocen a otras.
Se emplea cuando no se conoce o no es fácil identificar a 
los  
sujetos típicos.
Entre ellos se conocen.
INFORMANTES 
CLAVES
Dependiendo del tema de investigación, hay elementos de la población 
que  
poseen información veraz y confiable.
Estos elementos se conocen como informantes claves y es importante 
recurrir  
a ellos.
Esta muestra aunque no es representativa suele ser muy confiable.
MUESTRA REDUCTIVA
Cuando la población es demasiado grande y muy homogénea con 
respecto a  
la característica que queremos medir, podemos aplicar esta 
técnica que  consiste en elaborar un muestreo de otra muestra mayor y así 
simplificar el  estudio.
PROCEDIMIENTOS 
MIXTOS
Pueden combinarse técnicas
aleatoreas con no aleatoreas.
Si en una investigación se tienen  
varias muestras (alumnos, 
docentes,  expertos, padres de 
familia) cada una  
de las muestras 
pueden ser  conformadas con 
técnicas distintas y  combinarse 
entre sí.
BIBLIOGRAFÍA
POPPER, Karl (1995). La lógica de la investigación científica. Editorial Barcelona.
POPPER, Karl(1983). Realismo y el objetivo de la ciencia. Editorial 
Tecnos.  POPPER, Karl(1991). La sociedad abierta y sus enemigos: 
Editorial Paidos.
CALERO JL (2000). Investigación cualitativa y cuantitativa. Problemas no resueltos en los debates 
actuales.  
Rev. Cubana Endocrinol.
SABINO, C.(1986). El proceso de investigación. 2.ED. Buenos Aires: Humanitas.
TAYLOR, S. J.; BOGDAN, R (1990). Introducción a los métodos cualitativos de investigación. Buenos Aires: 
Paidós.  MARRERO, A (1997). Formulación y puesta en práctica de diseños de investigación. Montevideo: 
Fundación de Cultura
Universitaria: Universidad de la República.
WILSON, T (1990). Métodos cuantitativos “versus” cualitativos en investigación social. Montevideo: Fundación de 
Cultura
Universitaria: Servicio de Documentación en Ciencias Sociales
COOK, T. D.; REICHARDT, CH (1986). Métodos cualitativos y cuantitativos en investigación evaluativa. Madrid: 
Morata.  
LORENZO, E (1987). Paradigmas de la investigación. Editorial Nexo sport.
CARR, W.; KEMMIS, S (1988). Teoría crítica de la enseñanza. Madrid: Martínez 
Tamaño de muestra de la 
investigación
UNIDAD II: Los procesos metodológicos de la 
Investigación
Elaborado por Mgtr.  Luis Casaverde
¿Qué es el tamaño de la muestra?
• Una muestra es una selección de los encuestados elegidos y que 
representan a la población total. El tamaño de la muestra es una 
porción significativa de la población que cumple con las 
características de la investigación reduciendo los costos y el tiempo.
• Saber cómo determinar el tamaño de la muestra antes de comenzar 
una investigación es un principio estadístico que nos ayuda a evitar el 
sesgo en la interpretación de los resultados obtenidos.
¿Cómo calcular el tamaño de la muestra?
• El tamaño de la muestra de una encuesta es muy importante para poder 
realizar una investigación de manera correcta, por lo que hay que tener en 
cuenta los objetivos y las circunstancias en que se desarrolle la investigación.
• Recuerda que la finalidad es que las personas completen la encuesta y te 
otorguen los datos que estás buscando.
• Una  muestra  demasiado  grande  dará  lugar  a  la  pérdida  de  valiosos  recursos  como 
tiempo  y  dinero,  mientras  que  una  muestra  pequeña  puede  no  proporcionar 
información confiable.
• ¿Entonces de qué tamaño debe ser una muestra? Esto sin duda depende de qué tan 
exactos  necesites  que  sean  los  datos  obtenidos  en  tu  encuesta,  que  tan  cercanos 
quieres que sean a los de la población total.
• El tamaño de la muestra puede ser:
• Representativa: Hace referencia a que todos los miembros de un grupo de personas 
tengan las mismas oportunidades de participar en la investigación.
• Adecuada: Se refiere a que el tamaño de la muestra debe de ser obtenido mediante 
un análisis que permite resultados como disminuir el margen de error.
• Ejemplo:
• Si  quieres  realizar  una  investigación  dentro  de  una  universidad  que  ofrece  10 
carreras  diferentes  y  cada  una  tiene  700  alumnos,  no  querrás  hacer  7000  mil 
encuestas,  bastará  con  determinar  el  tamaño  de  la  muestra.  Sin  embargo, 
debemos considerar el margen de error.
•
Ejemplo de cómo calcular el tamaño de muestra finita
• Es hora de aprender a determinar el tamaño de la muestra mediante un cálculo 
de la misma.
•
• Tu nivel de confianza corresponde a una puntuación Z. Este es un valor constante 
necesario para esta ecuación. Aquí están las puntuaciones Z para los niveles de confianza 
más comunes:
• 90% - Puntuación Z = 1,645
• 95% - Puntuación Z = 1.96
• 99% - Puntuación Z = 2.576
• Supongamos que nos piden calcular el tamaño para una población de 543.098 
consumidores de una marca de bebidas energéticas, donde el investigador asigna un nivel 
de confianza de 95% y un margen de error de 3%. Donde se desconoce la probabilidad “p” 
del evento.
• Basándonos en este ejemplo, y en nuestra fórmula, el "N" será 543.098, nuestro Z será 
1.96 (recuerda que el investigador asignó un nivel de confianza de 95%) y “e” será de 3%. 
Y como nuestro ejemplo dice que se desconoce la probabilidad de que ocurra el evento, 
se asigna un 50% a "p" y un 50% a "q".
El resultado de nuestro tamaño de muestra sería: 1065.2, y tendría que ser 
redondeado pues estamos hablando de personas.
•
Ejemplo de cómo calcular el tamaño de muestra infinita
Si necesitas calcular el tamaño de muestra de una población desconocida, 
donde el investigador necesite un nivel de confianza del 95%, un margen de 
error  del  3%  y  se  desconoce  la  probabilidad  “p”  del  evento  que  se  está 
estudiando, sigue la siguiente fórmula:
Donde "Z" es el intervalo de confianza al cuadrado, en este caso se pide que 
sea del 95%, lo que indica que sería 1,96 al cuadrado, y cómo no sabemos la 
probabilidad de que ocurra el evento, "p" y "q" sería 50%. Entre el margen 
de error al solicitado al cuadrado. El resultado sería 1067,11, que también lo 
debemos redondear.

VARIABLES DE INVESTIGACION.pdf