SlideShare una empresa de Scribd logo
1 de 256
DISEÑOS DE INVESTIGACIÓN Y
     ANÁLISIS DE DATOS


          TEMA 2
Contrastes de hipótesis en los
  diseños de una muestra
Introducción
• En las investigaciones que parten del
  conocimiento proporcionado por los
  datos recogidos de una muestra, el
  objetivo es inferir las características de la
  población de la cual los datos
  recolectados constituyen una muestra
  representativa.
En este tipo de investigaciones la hipótesis a
  contrastar especifica una característica de la
  población, por ejemplo:
• Si un determinado parámetro poblacional puede tomar un
  valor concreto.
• Si las variables medidas en la muestra son independientes en
  la población.
• La forma de la distribución de la variable, X, en la población.
• Si los datos observados en la muestra son independientes
  entre sí.
• Los dos primeros casos se incluyen dentro de
  los contrastes paramétricos ya que se
  relacionan con el estudio de un parámetro
  poblacional (media, varianza, proporción,
  correlación, etc.) y siempre que la variable de
  estudio provenga de una población con una
  función de densidad de probabilidad (fdp)
  conocida o supuesta.
• Por su parte, los dos siguientes contrastes se
  englobarían dentro de los contrastes no
  paramétricos que o bien no se relacionan con
  parámetros poblacionales o se encuentran
  referidas a datos que provienen de una
  población con una función de densidad de
  probabilidad desconocida.
Contrastes paramétricos vs no
           paramétricos
• Resulta difícil proporcionar una definición
  precisa del concepto de “técnicas no
  paramétricas” ya que no existe un consenso
  absoluto al respecto.
• La literatura técnica diferencia estas técnicas
  de formas muy diversas.
• Así, por ejemplo, Ross (2004) las define como
  aquellas pruebas que se aplican cuando los
  datos proceden de una distribución de
  probabilidad cuya forma no viene
  especificada, es decir, cuando no podemos
  asumir una forma concreta de la distribución
  poblacional para los datos (normal,
  exponencial, binomial, etc.).
• Es por ello que muchos autores denominan a
  estas pruebas como “pruebas sin supuesto
  distribucional” (distribution-free) en vez de
  “no paramétricas”.
• No obstante, sería equivocado afirmar que los
  contrastes no paramétricos no realizan ningún
  tipo de supuestos (lo que en estadística se
  conoce como assumption-free) aunque sí es
  cierto que los supuestos realizados por los
  contrastes no paramétricos son menos rígidos
  que los realizados por los contrastes
  paramétricos.
• Contrariamente a lo que se suele afirmar, los
  contrastes no paramétricos sí realizan
  supuestos aunque estos no están referidos a
  la forma específica de la distribución
  poblacional.
• Por ejemplo, un supuesto muy utilizado en
  pruebas no paramétricas es el supuesto de
  distribución simétrica de la variable
  dependiente en la población. Debido a que
  existen otras muchas distribuciones distintas
  de la normal que también son simétricas, este
  supuesto no nos obliga a trabajar
  necesariamente con una distribución normal
  (que es simétrica).
• No obstante, sí nos elimina del área de búsqueda
  todas las distribuciones asimétricas (v.g., la F, la
  chi-cuadrado, la Gamma). Esta es una de las
  razones por las que algunos autores han
  introducido otros términos que pretenden
  establecer matizaciones a medio camino entre las
  técnicas paramétricas y las no paramétricas (v.g.,
  técnicas semiparamétricas).
• En relación a las distinciones anteriores, el
  estudiante debe diferenciar entre los supuestos
  realizados por el método de inferencia de las
  pruebas (criterio que diferencia las técnicas
  paramétricas de las no paramétricas) de las
  distribuciones muestrales utilizadas en los
  cálculos para el contraste de hipótesis en
  cualquiera de estas técnicas (tanto paramétricas
  como no paramétricas).
• Aunque la estadística no paramétrica no
  incluya entre sus supuestos a una f.d.p.
  (función de densidad de probabilidad)
  concreta como la distribución poblacional de
  la variable dependiente, no obstante, los
  estadísticos que se calculan en la estadística
  no paramétrica sí se distribuirán según una u
  otra distribución paramétrica concreta.
• Por ejemplo, cuando veamos la prueba de los
  signos comprobaremos que no se hace ningún
  supuesto sobre cómo se distribuyen los datos
  observados en la población de la cual se ha
  extraído la muestra de estudio (en este
  sentido es un contraste no paramétrico) pero,
  sin embargo, utilizará la distribución binomial
  como distribución muestral del estadístico
  para realizar los cálculos de los niveles de
  probabilidad asociados a la hipótesis nula.
• La distribución binomial es una distribución
  paramétrica pero la prueba de los signos no la
  utiliza como un supuesto necesario para
  aplicarla, sino como una herramienta para
  calcular niveles de probabilidad.
• Otros autores hacen hincapié simplemente en
  que, de forma genérica, estas últimas realizan
  supuestos menos restrictivos o rígidos que las
  técnicas paramétricas (Daniel, 1990). Desde
  esta perspectiva, la distinción entre
  paramétrico vs. no paramétrico no es una
  distinción cualitativa sino cuantitativa
• Hay procedimientos que se acercan más al
  extremo paramétrico y otros al extremo no
  paramétrico, existiendo otros en puntos
  intermedios del continuo. Aunque esta
  clasificación cuantitativa de los contrastes es
  una definición más vaga que las anteriores,
  resulta muy útil ya que hay técnicas
  estadísticas entre cuyos objetivos iniciales
  explícitos se encuentra el realizar los menos
  supuestos posibles sobre la procedencia de los
  datos.
• Una tercera opinión insiste en que lo que
  caracteriza a las técnicas no paramétricas es el
  nivel de medida de los datos. Las técnicas no
  paramétricas se suelen utilizar cuando las
  escalas utilizadas para medir la variable
  dependiente, es decir, los datos recogidos en
  la muestra, son de tipo nominal u ordinal o
  bien cuando las escalas sean de tipo de
  intervalo/razón pero han sido recodificadas
  en variables de tipo nominal u ordinal
• Estamos de acuerdo con Wasserman (2006)
  cuando subraya que el punto esencial de las
  técnicas no paramétricas consiste en que los
  métodos estadísticos desarrollados en este
  área tratan de mantener los supuestos lo
  menos restrictivos o rígidos posibles.
• Hemos de señalar que cuanto menos
  restrictivos sean los supuestos que se realicen
  a la hora de seleccionar la prueba que se
  aplicará para el contraste de hipótesis, más
  amplias serán las posibilidades que tendremos
  que contemplar (más amplio el espacio de
  búsqueda).
• Este espacio de búsqueda puede llegar a ser
  infinito por lo que también se conoce a las
  técnicas no paramétricas como “técnicas
  paramétricas de dimensionalidad infinita”.

• El concepto de “no paramétrico” no tiene una
  definición precisa y universalmente aceptada.
Diagrama de flujo
Contraste sobre la media
            poblacional.
• Conocida la varianza poblacional.
Aunque esta situación no es frecuente, si por
  trabajos o información previa podemos
  asumir un determinado valor para la varianza
  poblacional, entonces la distribución muestral
  de la media es una distribución normal, y el
  estadístico de contraste para la media
  poblacional es:
• El estadístico Z cuantifica la distancia entre la
  media de la muestra


  a la media poblacional asumida en H0



  en unidades de error típico de la distribución
  muestral.
• Es una regla de tres

       1 SX      --------------------------




        Z= ¿?    --------------------------
Ejemplo 2.2
• Por estudios previos conocemos que la
  población masculina de la tercera edad de
  una determinada Comunidad Autónoma tiene
  un gasto medio en medicamentos de 215
  euros/año con una desviación típica de 36
  euros y queremos saber si la población
  femenina tiene el mismo gasto.
Ejemplo 2.2
• Con tal finalidad analizamos el gasto medio de
  una muestra de 324 mujeres de la tercera
  edad de esa misma comunidad observando
  que la media es de 220 euros/año. Asumimos
  que esta variable se distribuye normalmente
  en la población. Fijando un nivel de confianza
  del 95%, contraste si el gasto de las mujeres es
  significativamente distinto de 215 euros/año.
No hay dos muestras, solo una: la de
             mujeres
                              DM de la media
               Gasto
Variable X     farmacéutico
=              en mujeres
 gasto
farmacéutico




                MUESTRA
POBLACIÓN
¡Supuesto! -> Paramétrico
                                   DM de la media
                    Gasto
Variable X          farmacéutico
=                   en mujeres
 gasto
farmacéutico




                     MUESTRA
POBLACIÓN
Condiciones y supuestos
• El estudio utiliza un diseño de una muestra de
  mujeres en la que la variable “gasto medio” se
  mide en una escala de razón (variable
  cuantitativa) y sabemos que se distribuye
  normalmente en la población.
• Adicionalmente conocemos la desviación
  típica poblacional que es de 36 euros.
Condiciones y supuestos
• Se trata de un contraste paramétrico bilateral
  ya que, a priori, no sabemos si el gasto de las
  mujeres es mayor o menor de 220 euros/año,
  solo queremos contrastar que el gasto de las
  mujeres es diferente a esa cantidad, pero sin
  señalar el sentido de esa diferencia.
Formulación de las hipótesis
• La hipótesis de investigación es que “las
  mujeres tienen un gasto distinto a los 215
  euros/año” (H1).
• La hipótesis nula (H0) dice que el gasto de las
  mujeres es de 215 euros/año y la hipótesis
  alternativa que el gasto medio de las mujeres
  es un valor distinto.
• Partimos de que, provisionalmente, la
  hipótesis nula es verdadera, es decir, que las
  mujeres tienen un gasto de 215 euros/año y
  se trata de encontrar evidencia contra esta
  hipótesis a partir de la información
  proporcionada por una muestra
  representativa.
• ¿La diferencia de 5 euros entre el valor
  observado en la muestra y el que planteamos
  en la hipótesis nula significa realmente un
  gasto distinto o esta diferencia puede deberse
  a fluctuaciones aleatorias?. El rechazo de la
  hipótesis nula y la consiguiente aceptación de
  la hipótesis alternativa significará que la
  diferencia observada es “estadísticamente
  significativa” confirmando una diferencia real
  que no puede atribuirse al azar o a
  fluctuaciones aleatorias debidas al muestreo.
Estadístico de contraste
• Para contrastar nuestra hipótesis se calcula la
  discrepancia entre la evidencia observada de
  que el gasto medio es de 220 euros en la
  muestra de mujeres con el valor
  hipotéticamente establecido para la población
  general de que el gasto medio es de 215
  euros.
Regla de decisión
• Los valores críticos representan la máxima
  diferencia atribuible al azar en la distribución
  muestral que puede existir entre los datos
  empíricos observados en la muestra y los
  datos teóricos que planteamos en la hipótesis
  nula.
Regla de decisión
• En la muestra el valor observado es 220
  euros/año y el valor hipotético planteado es
  de 215 euros/año. Esta diferencia corresponde
  a 2,5 desviaciones típicas de la distribución
  muestral lo cual es poco probable si H0 es
  cierta
• Poco probable significa menos probabilidad
  que el nivel alpha.
Conclusión
• El valor de este estadístico de contraste
  obtenido en el paso anterior, sobrepasa el
  valor máximo de 1,96 por lo que debemos
  rechazar la hipótesis nula con un nivel de
  confianza del 95%.
• De otra forma, al valor del estadístico de
  contraste obtenido de Z=2,5 le corresponde
  un nivel p-crítico de 0,0124. Esta probabilidad
  indica que suponiendo verdadera la hipótesis
  de que las mujeres tienen un gasto medio de
  215 euros/año, la probabilidad de observar un
  gasto de 220 euros/año se obtiene buscando
  en la tabla de la distribución normal, la
  probabilidad de P(Z≤-2,5) que es 0,0062.
• 1-0.9938 =0.0062
• Como el contraste es bilateral
  0.0062 * 2 = 0.0124
• Este valor es el nivel p-crítico y resulta ser
  inferior al nivel alpha.
  En consecuencia, rechazamos H0
Interpretación
• A la vista de los cálculos podemos decir que,
  con un nivel de confianza del 95%, el gasto de
  las mujeres difiere significativamente de 215
  euros/año, que es el que realizan los hombres.
Interpretación
• Si hubiéramos utilizado un nivel de confianza
  del 99% no habría evidencia suficiente para
  rechazar la hipótesis nula ya que en este caso
  el nivel p-crítico de p=0,0124 es mayor que el
  nivel de significación “alfa” de 0,01. Es decir
  que la diferencia encontrada es significativa
  con “alfa”=0,05 pero no lo es con un nivel de
  significación de 0,01.
• Estas conclusiones ponen de manifiesto:

  a) la importancia de la replicación de la
  investigación para añadir más evidencia a
  favor o en contra de la hipótesis

  b) la exigencia de informar del valor del
  estadístico de contraste y el nivel p-crítico
Contraste sobre la media
             poblacional.
• Desconocida la varianza poblacional.
Si se desconoce la varianza poblacional y la
   forma de la distribución de la variable en la
   población entonces la distribución muestral
   de la media es la distribución t de “Student”,
   que se aproxima a la normal cuando se
   utilizan muestras grandes (con más de 30
   elementos).
• En estas circunstancias el estadístico de
  contraste es:




• El acento circunflejo representa “estimador”.
es el estimador de la desviación típica
poblacional que se puede realizar bien a partir
de la varianza o de la cuasi-varianza de la
muestra (aunque el mejor estimador es este
último).
• El estimador insesgado de la varianza
  poblacional es la cuasi-varianza muestral por
  lo que el estadístico de contraste obtenido
  utilizando la cuasi-varianza muestral es:
Ejemplo 2.1
• En un experimento sobre atención, un
  psicólogo presenta durante 300 mseg un
  grupo de 16 letras del alfabeto (con una
  disposición de 4 filas y 4 columnas). Cada uno
  de los 12 sujetos que participan en el
  experimento debe verbalizar tantas letras
  como recuerde. El promedio obtenido de
  letras bien recordadas es de 7 y la desviación
  típica insesgada (cuasi-desviación típica) de la
  muestra es de 1,3.
Ejemplo 2.1
• Sabiendo que el recuerdo es una variable que
  se distribuye normalmente en la población,
  ¿Puede ser la media de letras recordadas de
  8? Trabaje con una probabilidad de 0,95.
¡Supuesto! -> Paramétrico
                                   DM de la media
                    Nº de letras
Variable X          bien
=                   recordadas
nº de letras
bien recordadas




                     MUESTRA
POBLACIÓN
Condiciones y supuestos
• El estudio utiliza un diseño de una muestra de
  participantes en la que la variable “número
  medio de letras recordadas” se mide en una
  escala de razón (variable cuantitativa) y
  sabemos que se distribuye normalmente en la
  población (paramétrico).
• No conocemos la desviación típica
  poblacional.
• Conocemos la cuasidesviación típica muestral
  (1.3).
Calculamos el resto de
estadísticos muestrales
que podemos necesitar
Calculamos el resto de
estadísticos muestrales
que podemos necesitar
Calculamos el resto de
estadísticos muestrales
que podemos necesitar
¡Supuesto! -> Paramétrico
                    MUESTRA
                                   DM de la media
                    Nº de letras
Variable X          bien
=                   recordadas
nº de letras
bien recordadas




POBLACIÓN
Formulación de las hipótesis

• Se plantea un contraste bilateral debido a que
  no han dado información acerca de una
  posible unilateralidad.
Formulación de las hipótesis

• Partimos de que la H0 es verdadera, es decir,
  que el número de palabras recordadas en este
  tipo de pruebas es de 8, y se trata de evaluar
  si los datos recogidos en una investigación
  bien diseñada y utilizando una muestra
  aleatoria arrojan evidencia a favor o en contra
  de la hipótesis nula.
Estadístico de contraste
• La discrepancia entre el estimador (media de
  la muestra) y el valor del parámetro
  formulado en la hipótesis nula, es:
Regla de decisión

•    Con un nivel de confianza del
    95% en un contraste bilateral, la
    máxima discrepancia que cabe
    esperar por simple azar entre el
    estimador y el valor planteado en
    la hipótesis nula es 2,201 (valores
    críticos).
Valores críticos
Regla de decisión
• El valor del estadístico de contraste obtenido,
  supera este valor máximo lo que nos lleva a
  rechazar la hipótesis nula. El nivel p-crítico
  asociado a este estadístico de contraste es
  p=0,022 que resulta menor que el nivel de
  significación fijado en 0,05.
Valor p-crítico = 0.011*2 =
                                              0.022




Área en azul = valor p-crítico = probabilidad de obtener
una t empírica igual o más extrema que la obtenida (2.66)
=
Interpretación
• Interpretación: A partir de la evidencia que
  muestran los datos de la investigación,
  debemos rechazar la hipótesis nula de que el
  número medio de palabras recordadas es de
  8. Por tanto y a falta de más evidencia, nada
  se opone a rechazar la hipótesis nula con un
  nivel de confianza del 95%.
Contrastes no paramétricos
• La prueba de los signos
• Es una prueba no paramétrica equivalente a la
  prueba t de una muestra que se aplica cuando
  no se cumplen los supuestos que ésta exige.
• El conjunto de observaciones (Xi) procederá de
  una población de puntuaciones que siguen
  una función de distribución continua y
  desconocida a la que denominaremos D.
Prueba de los signos
• Pero si no conocemos ni podemos asumir la
  forma concreta de D no podemos utilizar la
  prueba paramétrica (t o z). Tendremos que
  utilizar, por consiguiente, pruebas no
  paramétricas. Esto quiere decir que debemos
  admitir que D puede adoptar cualquier forma
  (normal, exponencial, gamma, Pareto, ex-
  gaussiana, etc.).
• Supongamos que estamos interesados en
  poner a prueba la hipótesis de que la mediana
  de D, a la que llamaremos (eta)


es igual a un valor específico al que llamaremos
  m0. Es decir, estamos poniendo a prueba el
  siguiente contraste de hipótesis para la
  mediana poblacional:
• Asumiendo que H0 es cierta, esto significa que
  en el valor m0 aproximadamente la mitad de
  los datos de la muestra deben quedar por
  debajo del mismo y la mitad restante por
  encima, excepto variaciones debidas al azar.
• En otras palabras, estamos planteando en H0
  que m0 es el percentil 50 de la distribución (la
  mediana).
• ¡Y esto sin importar el tipo de distribución
  concreta que pueda adoptar D en la realidad!
• Si H0 es cierta, entonces cada observación será
  menor que m0 con probabilidad 0.5 (o
  superior a m0 con probabilidad 1- 0.5 = 0.5).
  Es decir, que si H0 es cierta la probabilidad de
  que cada observación sea superior o inferior a
  m0 será similar al experimento aleatorio
  consistente en arrojar una moneda insesgada
  (no trucada) y determinar si cae cara o cruz.
• El modelo estadístico que subyace a un
  proceso dicotómico del tipo cara-cruz,
  repetido varias veces (n ensayos), se modela
  mediante una variable aleatoria de Bernouilli
  con parámetro p (probabilidad de éxito).
• En nuestro caso, el valor de p deberá ser 0.5
  siempre y cuando H0 sea cierta.
• En consecuencia, partiendo de los valores de
  Xi obtenidos empíricamente en el
  experimento u observación, podemos calcular
  otra variable aleatoria, a la que llamaremos I,
  que se distribuirá según Bernouilli, es decir,
  según la fórmula:
• Esto significa que cada valor concreto de Xi se
  transforma en un 1 si es menor que m0 (el
  valor propuesto para la mediana en H0) o en
  un 0 si es igual o superior a m0. En
  consecuencia Ii se puede considerar una
  función indicatriz (nos señala si ese valor se
  encuentra por encima o por debajo del valor
  m0 propuesto en H0).
• Si H0 es cierta, entonces la nueva variable
  aleatoria Ii será una variable aleatoria de
  Bernouilli con p = 0.5.
• Ahora podemos sumar los valores de Ii (a esta
  suma solo aportarán valor efectivo los Ii que
  valgan 1 ya que el resto vale 0 y se pierden en
  la suma) para toda la muestra.
• Llamemos S al estadístico resultante de sumar
  todos los valores de Ii:
• Este valor S (que es igual al número de unos
  de Ii) se distribuye según la binominal con
  parámetros p y n (en donde p valdrá 0.5 si H0
  es cierta y n será el número de datos de la
  muestra). En un contraste bilateral, para
  calcular la probabilidad de obtener un valor
  tan extremo o más que el obtenido en la
  muestra para el valor S, asumiendo que H0 es
  cierta, aplicaremos la binomial según la
  fórmula:
• El nombre de “prueba de los signos” proviene
  de que en muchas ocasiones se utiliza como
  estadístico el número de signos positivos o
  negativos (en lugar de unos y ceros) que se
  obtienen realizando la diferencia entre cada
  puntuación original y la mediana planteada en
  H0, es decir
• Los valores que resultan de este
  cálculo (número de signos positivos o
  negativos) son conceptualmente
  idénticos al cálculo de la variable
  aleatoria Ii ya que si Xi es inferior a
  m0 entonces el signo es negativo y si
  Xi es superior a m0, entonces el signo
  es positivo.
Supuestos
• Asumimos que la variable de interés es continua.
  Esto significa que teóricamente no deberían
  producirse diferencias nulas cuando calculamos (es
  decir, que no deberíamos encontrarnos con valores
  de Xi y m0 idénticos, en cuyo caso la diferencia sería
  0).
• No obstante, como en la práctica se producen debido
  a la precisión limitada de nuestros instrumentos de
  medida, el procedimiento usual es descartar aquellas
  observaciones que generen estas diferencias nulas y
  reducir n en consecuencia.
Supuestos
• La variable de interés viene medida, como
  mínimo, en una escala ordinal.
• Obsérvese que estamos diferenciando entre la
  “variable de interés” real (que asumimos
  continua) y la forma en que la medimos
  (mediante una escala ordinal como mínimo).
Supuestos
• Así, por ejemplo, teóricamente podríamos
  considerar la “belleza” de una obra de arte
  como una variable continua pero cuando la
  medimos podemos utilizar simplemente una
  escala que distinga únicamente tres valores
  ordenados: 0 (“me parece fea”), 1 (“normal”)
  y 2 (“me parece bella”), aunque obviamente
  podríamos utilizar escalas ordinales con un
  mayor número de categorías.
Supuestos
• La muestra se ha extraído aleatoriamente de
  una población con mediana desconocida.
Ejemplo 2.3
• Sabiendo que la distribución de los tiempos de
  reacción (TR) tiene una distribución asimétrica
  negativa, un investigador decide aplicar un
  contraste no paramétrico para contrastar la
  hipótesis de que la mediana en un
  experimento de TR simple es de 450 ms.
Ejemplo 2.3
• Ha sometido a 10 participantes a un
  experimento de TR simple, calculando para
  cada uno de ellos la media de TR en 100
  ensayos. Los datos obtenidos han sido
  {X1= 430 , X2= 480 , X3= 510 , X4= 500, X5= 390 ,
  X6= 455, X7= 440 , X8= 470, X9= 475, X10= 465}.
  El investigador publicará sus resultados en una
  revista científica que exige un nivel de
  confianza del 95%.
Condiciones y supuestos
• El investigador utiliza un diseño de una
  muestra y decide aplicar una prueba no
  paramétrica debido a la asimetría de la
  distribución de los TR y no debido al nivel de
  medida de la variable dependiente, que en
  este caso sería de razón.
Formulación de las hipótesis
• La hipótesis de investigación es que la
  mediana de los TR en la población es de 450
  ms, por lo que la hipótesis alternativa dirá que
  no es de 450 ms. Se trata, por tanto, de un
  contraste bilateral:
Estadístico de contraste
• Para contrastar la hipótesis, transformamos
  los datos observados en unos y ceros, o en
  signos positivos y negativos:
Los subíndices son una forma de
   identificar a la puntuación
Calculamos la diferencia entre cada
        puntuación y m0
Las diferencias con signo negativo son
  1 y las diferencias positivas son 0
Calculamos la suma de valores (S o S-)
• Con el valor S nos preguntamos por la
  probabilidad asociada al mismo bajo el
  supuesto de que H0 es cierta ¿cuál es la
  probabilidad de obtener 3 valores negativos
  (o 7 negativos) si m0 = 450?
• Veamos la función de probabilidad binomial
  con n=10 (el número de participantes) y
  p = 0.5 (la probabilidad de éxito si H0 es
  cierta).
• La probabilidad de obtener un valor del
  estadístico de contraste S menor o igual al
  obtenido en nuestra muestra (recordemos
  que S = 3) viene dado por la suma de los
  niveles de probabilidad para n entre 0 y 3, es
  decir
• Ahora bien, como estamos trabajando con
  una H0 bilateral estamos asumiendo a priori
  que el estadístico S puede ser superior o
  inferior a la mediana. En el cálculo anterior
  sólo hemos contemplado las probabilidades
  de obtener valores de S iguales o inferiores a
  3, pero tenemos que contemplar también que
  S pueda ser igual o superior a n-S, es decir,
  igual o superior a 10-3=7.
• Considerando que la distribución binomial,
  para p=0.5, es simétrica es fácil ver que para
  calcular el nivel de probabilidad asociado con
  el estadístico S = 3 sólo tenemos que
  multiplicar la p unilateral obtenida por 2.
Regla de decisión
• La decisión a tomar respecto a la H0 la
  hacemos comparando este valor de
  probabilidad calculado (nivel p-crítico porque
  representa la probabilidad de obtener el S
  empírico obtenido) con el nivel de
  significación, o error tipo I, que estemos
  dispuestos a cometer (0.05 en este ejemplo).
                   0.34 > 0.05
Conclusión
• Si utilizamos un alpha de 0.05 podemos
  observar que 0.05 < 0.34. Esto nos conduce a
  no rechazar H0. Como ya sabemos, sólo en el
  caso de que alpha fuese mayor que la
  probabilidad de obtener un estadístico S igual
  o más extremo que el calculado (el nivel p-
  crítico) rechazaríamos H0.
Interpretación
• Ambos procedimientos conducen a no
  rechazar H0: no existe evidencia para
  sospechar que la mediana de los TR sea
  diferente de 450 ms.
• En el caso anterior hemos puesto a
  prueba el contraste bilateral lo cual
  se representa gráficamente mediante
  un conjunto de valores del
  estadístico S (o el número de signos)
  compatibles con H0 y otros valores a
  derecha e izquierda (más extremos)
  poco probables si H0 es cierta.
• Si deseamos hacer un contraste unilateral
  izquierdo el procedimiento cambia
  ligeramente en función del cambio de H0 pero
  es fácil razonar de forma similar a como lo
  hicimos anteriormente. De esta forma, si
  planteamos la H0 unilateral izquierda
• Estamos proponiendo en H0 (a priori la
  asumimos cierta) que la mediana poblacional
  es igual o superior a un valor concreto m0. Por
  consiguiente, si H0 es cierta esto implica que el
  grueso de datos, Xi, serán superiores a m0 y la
  diferencia


será mayoritariamente positiva.
A su vez, esto implica que se espera un valor
  muy bajo de signos negativos (muy pocos
  unos, es decir, una S muy baja si H0 es cierta) :
En el ejemplo anterior calcularíamos la probabilidad
  asociada con una S igual o inferior a la obtenida
    (como es unilateral, sin multiplicar por dos)
• Por el contrario, si tenemos información que
  nos conduzca a realizar un contraste unilateral
  derecho:
• Debido a la simetría de la distribución
  binomial, daría igual calcular una probabilidad
  u otra.
• Ya se vio en cursos anteriores que la binomial
  se aproxima a la normal conforme n aumenta.
  Por ello cuando el número de elementos
  muestrales es lo suficientemente elevado,
  puede utilizarse el estadístico Z como
  aproximación a la binomial:
• No obstante, no hay acuerdo preciso acerca
  del tamaño muestral que garantiza o
  recomienda la utilización de Z. Así, Daniel
  (1990) defiende que n debería ser igual o
  superior a 12. Sin embargo Siegel y Castellan
  (1988) recomiendan que la aproximación se
  utilice cuando n sea mayor que 25.
La prueba de Wilcoxon para una
               muestra
• Hemos visto que la prueba de los signos solo
  hace uso de la información presente en la
  muestra acerca de si cada valor muestral
  observado, Xi, es superior o inferior a la
  mediana (m0). Esto se podía reflejar ya fuese
  en los signos de las diferencias o utilizando
  una función indicatriz. En cualquier caso, la
  prueba de los signos no utiliza la magnitud de
  esta diferencia entre Xi y m0 en sus cálculos
• Ante este problema de falta de sensibilidad
  del test de los signos, Frank Wilcoxon (1945,
  1949) desarrolló un procedimiento que utiliza
  ambas informaciones: la dirección o signo de
  la diferencia y la magnitud de esta diferencia,
  permitiendo poner a prueba hipótesis sobre la
  mediana.
• Además, pone a prueba la hipótesis de que la
  distribución sea simétrica (que el conjunto de
  datos superior a m0 es igual al conjunto de
  datos inferior a m0).
Supuestos
• La muestra se ha seleccionado al azar de la
  población que representa.
• La variable dependiente medida es de intervalo o
  de razón.
• La distribución poblacional subyacente es simétrica.
• El test de Wilcoxon se recomienda
  especialmente como sustituto de la prueba t
  cuando se sospeche que el supuesto de
  normalidad se incumple de forma obvia.
• La hipótesis nula bilateral es similar a la
  formulada para la prueba de los signos:
• Si H0 es cierta y recordando que la mediana
  deja por debajo de sí a la mitad de los datos
  muestrales, esto se traduce en que la suma de
  los órdenes de las puntuaciones por encima
  de la mediana deberá ser aproximadamente
  igual a la suma de los órdenes de las
  puntuaciones por debajo de la mediana, es
  decir, ΣR+ ≈ ΣR-. El incumplimiento de esta
  desigualdad conducirá al rechazo de H0.
Cálculo de los rangos promediados
• El rango R (u orden) de una observación Xi se
  obtiene disponiendo todas las observaciones
  en orden de la más pequeña a la mayor. A
  cada observación directa se le asocia su orden,
  es decir, a la observación más pequeña se le
  asocia el rango 1, a la siguiente observación el
  2 y así sucesivamente. A la mayor observación
  se le proporciona el rango n.
Cálculo de los rangos promediados
• Este procedimiento para asignar rangos a las
  observaciones directas asume que no hay
  empates, es decir, que no ha dos medidas
  exactamente iguales.
• Esto sólo podría suceder si las mediciones
  originales se realizasen con una precisión
  infinita, lo cual no es el caso en las situaciones
  reales. Las observaciones reales tienen una
  precisión finita y, por consiguiente, se pueden
  producir empates.
• Podemos pensar en dos estudiantes, Juan y
  Pedro, a los que se les ha sometido a un
  experimento de TR y podrían tener un TR
  medio de 453.5432…ms. y 453.5382…ms.
  respectivamente. Pero si el cronómetro que se
  utilice para su medición sólo puede precisar
  hasta el milisegundo significa que obtendrá
  para ambos el mismo valor de 453 ms.,
  aunque en realidad tienen diferente
  puntuación siempre y cuando pudiéramos
  medirla con una precisión inferior al
  milisegundo.
• Este argumento puede ampliarse a cualquier
  nivel de precisión que podamos alcanzar con
  un instrumento de medida real. Es por ello
  que en la realidad y debido a la precisión finita
  de nuestros instrumentos de medida
  tendremos empates. En estos casos los rangos
  iniciales (1, 2, 3, …, n) se reemplazan por los
  rangos promediados.
• Supongamos que disponemos de las
  siguientes observaciones de TR:
  {450, 500, 732, 322, 450}
• Si disponemos estas puntuaciones en orden y
  les asignamos a cada una el número de orden
  tendríamos
• Pero como no tiene sentido proporcionar a
  una única puntuación directa (450) dos rangos
  distintos (el 2 y el 3), se les proporciona un
  único rango (2.5) que es la media entre los
  rangos otorgados inicialmente.
• Y si tuviéramos tres puntuaciones empatadas,
  el procedimiento sería similar. Por ejemplo,
  asumamos que las puntuaciones originales
  hubiesen sido {322, 450, 450, 500, 450}
• Los rangos apropiados serían:
• El procedimiento que seguimos para calcular
  el test de Wilcoxon calcula primero la
  diferencia entre cada puntuación directa Xi y
  la mediana postulada en H0. De esta forma
  obtendremos un conjunto de n puntuaciones
  diferencia

El signo de Yi dependerá de que Xi sea mayor
  (signo positivo) o menor (signo negativo) que
  m0.
Para cada puntuación Yi registraremos también
  su orden o rango utilizando los siguientes
  criterios:
• Ordenamos los valores absolutos de los Yi, es
  decir, sin considerar el signo de Yi. Eliminamos
  cualquier Yi que valga 0 porque coincide con la
  m0 lo que debería ser imposible según el
  supuesto de distribución continua subyacente.
Para cada puntuación Yi registraremos también
  su orden o rango utilizando los siguientes
  criterios:
• Cuando hayan valores de Yi que en valor
  absoluto

 se encuentren empatados se proporcionará a
 cada valor empatado el promedio de los
 órdenes. Se asigna el orden 1 a la puntuación
 con el valor absoluto más bajo y el rango
 mayor (n) a la puntuación diferencia con el
 valor absoluto más alto.
• A continuación se suman los valores absolutos
  de las puntuaciones diferencia que tienen
  signos positivos para producir una puntuación
  que denotaremos por ΣR+ (sumatorio de los
  rangos positivos) y los valores absolutos de las
  puntuaciones diferencia que tienen signos
  negativos para producir ΣR- (sumatorio de los
  rangos negativos).
• Si H0 es cierta, es de esperar que los valores
  ΣR+ y ΣR- sean similares entre sí.
• Bajo el supuesto anterior entonces la media y
  varianza de esta variable son
• Ejemplo:
• Si disponemos del conjunto de datos
            {3, 5, 7, 9.5, 12, 15, 22}
  representados por un diagrama de puntos
  sobre el eje X.
• Si quisiéramos poner a prueba la hipótesis de
  que la mediana vale 8 en la población de la
  que se han extraído estos datos (la mediana
  viene representada por la línea vertical en la
  situada en X = 8)
• Rangos incorrectos
• Rangos correctos: al calcular la distancia en
  valor absoluto (es decir, sin considerar el
  signo) observemos como los rangos se van
  alternando a derecha e izquierda.
• Rangos correctos:
• Al calcular la distancia en valor absoluto (es
  decir, sin considerar el signo) observemos
  como los rangos se van alternando a derecha
  e izquierda. Estas distancias en valor absoluto
  vienen representadas por la longitud de las
  flechas horizontales. Ahora sí es razonable
  esperar que la suma de los rangos inferiores a
  m0 sea aproximadamente igual a la suma de
  rangos superiores a m0 (siempre y cuando H0
  sea cierta).
• Observamos que los datos han cambiado .
  Aunque la situación es cualitativamente
  similar a la Figura anterior (3 datos a izquierda
  de m0 y 4 a la derecha) ahora los rangos
  correctos han cambiado totalmente porque al
  utilizar la distancia en valor absoluto de cada
  puntuación a m0 ahora los rangos inferiores
  quedan todos a mano izquierda de m0 y los
  rangos superiores a mano derecha.
• La pregunta a responder es si la diferencia
  entre ΣR+ y ΣR- es lo suficientemente grande
  como para sospechar que H0 no es cierta. Si el
  valor de ΣR+ es significativamente mayor que
  el valor de ΣR- nos señala que existe una alta
  probabilidad de que la muestra se derive de
  una población con una mediana mayor que el
  valor planteado en la H0 para la población
• Y a la inversa si ΣR+ es significativamente
  menor que el valor de ΣR-.
• Cuando estos valores sean equivalentes
  ambos tendrán un valor de n(n+1)/4 excepto
  por desviaciones debidas al azar.
• ¿De dónde viene esta media? Anécdota sobre
  Gauss, el príncipe de los matemáticos
• La Tabla del estadístico W de Wilcoxon se
  encuentra tabulada en función de los valores
  inferiores que pueda adoptar cualquiera de las
  sumas de rangos.
• Por ello, como estadístico de contraste o
  discrepancia entre los rangos observados y los
  que cabría esperar si la H0 fuese verdadera, se
  adoptará el valor más pequeño de las dos
  sumas de rangos (ΣR+ y ΣR-) obtenidas en
  nuestra muestra
• A este estadístico (de Wilcoxon) lo
  representaremos por W. Para poder
  interpretar este valor es necesario calcular la
  probabilidad de obtener un valor igual o tan
  extremo como el obtenido. Si esta
  probabilidad (nivel p-crítico) es inferior al nivel
  de significación alpha, rechazaremos H0.
Ejemplo 2.4
• Una muestra aleatoria de estudiantes fueron
  entrevistados para determinar el número real
  de horas que dedicaban al estudio del examen
  final de una asignatura concreta. Los
  resultados fueron

     {25, 12, 10, 15, 20, 17, 30, 125, 3}
• Si estudios anteriores han mostrado que la
  mediana del número de horas que se estudia
  es de 15 horas ¿apoya la evidencia esta
  observación? Trabaje a un alpha de 0.05.
Condiciones y supuestos
• El investigador utiliza una muestra para
  realizar un contraste sobre la mediana que no
  representa un parámetro de una distribución
  poblacional y aún tratándose de una variable
  medida, al menos con escala de intervalo,
  desconoce la distribución de la variable en la
  población
Condiciones y supuestos
• Por otra parte, puede verse un aspecto muy
  interesante an la gráfica de los datos: tenemos
  un dato muy alejado del resto de datos (un
  outlier). Esta puede ser otra de las razones por
  las que se ha adoptado por una técnica no
  paramétrica (si hubiéramos utilizado un
  contraste de la media, este valor extremo
  habría desplazado hacia la derecha la
  estimación de la media).
Formulación de las hipótesis
• La hipótesis de investigación es que la
  mediana de las horas de estudio es de 15
  horas. Se trata, por tanto, de un contraste
  bilateral
Estadístico de contraste
• Para contrastar la hipótesis, calculamos la
  diferencia entre cada puntuación y la
  mediana, sin tener en cuenta el signo (valor
  absoluto).
• Posteriormente ordenamos estas diferencias
  asignándoles un rango de menor a mayor y de
  n=1 hasta n=6.
Estadístico de contraste
• Observemos que tenemos un dato que
  coincide con la mediana (m0=15) por lo que
  debemos eliminarlo pasando de tener 9 datos
  a 8 (n = 8). Además, tenemos dos datos que
  están a la misma distancia de m0 (10 y 20) por
  lo que tendremos que utilizar el cálculo de los
  rangos ponderados para este par de datos.
Estadístico de contraste
• Además, tenemos solo 3 datos a la izquierda
  de m0 y 5 a la derecha con los rangos
  alternando a derecha e izquierda.
  Intuitivamente no tenemos una base firme
  para sospechar que H0 sea cierta o falsa. En
  otros casos, la simple gráfica nos puede dar
  indicaciones muy útiles.
• Los estadísticos valen ΣR- = 11.5 y ΣR+= 24.5.
  Utilizaremos como estadístico W el valor de
  ΣR- ya que es el más pequeño de ambos.
  Luego W = 11.5.
• Obsérvese que el signo negativo de ΣR- se ha
  utilizado simplemente como señal para sumar
  estos valores pero con signo positivo, es decir,
  en vez de sumar (-6)+(-3.5)+(-2) sumamos
  6+3.5+2 ya que el signo negativo solo es un
  indicador de que estos rangos van juntos en
  un único sumatorio.
Regla de decisión
• Ahora debemos acudir a las tablas de
  Wilcoxon para un contraste bilateral con para
  extraer los valores críticos. Para n = 8 en un
  contraste bilateral el valor crítico es Wc = 3.
Conclusión
• Debido a que la H0 solo puede rechazarse si
                 W≤3
  y hemos obtenido una W de 11.5, concluimos
  que a partir de los datos observados en la
  muestra, no hay evidencia para rechazar la H0.
Interpretación
• No hay evidencia para rechazar la hipótesis de
  que el número real de horas semanales que
  los estudiantes emplean para repasar el
  examen final es de 15.
Contraste sobre la proporción
            poblacional
• La proporción P, o frecuencia relativa de
  aparición de una observación en un conjunto
  de datos, es el cociente entre el número de
  veces que aparece esa observación y el
  número total de observaciones.
Contraste sobre la proporción
            poblacional
• En el tema anterior se ha visto que la
  distribución muestral de la proporción es una
  distribución binomial.
• Sabemos que la distribución binomial se
  aproxima a la normal cuando el tamaño de la
  muestra es grande (n > 25 o n x p > 5 ).
Contraste sobre la proporción
            poblacional
• En esta distribución muestral, la media y
  desviación típica (o error típico de la
  proporción) valen:
DM de la proporción
             Variable
Variable X   dicotómica
=
Variable
dicotómica




              MUESTRA
POBLACIÓN
Contraste sobre la proporción
          poblacional (Pi)
• El intervalo de confianza para la proporción
  poblacional a partir de la proporción
  observada en una muestra se obtiene
  sumando a la proporción observada en la
  muestra el error muestral o error máximo de
  estimación, que vale



O
Intervalos de confianza
• Igual que razonábamos en el caso de la media,
  para contrastar una hipótesis referida a un
  valor hipotéticamente establecido como
  proporción poblacional, podemos determinar
  este intervalo con un determinado nivel de
  confianza y comprobar si el valor planteado en
  la hipótesis nula se encuentra incluido o no en
  el intervalo.
• De forma similar se puede determinar el
  estadístico de contraste para cuantificar la
  discrepancia entre el valor observado en la
  muestra y el planteado en la hipótesis nula.
  Para el caso de la proporción y sabiendo que
  la distribución muestral del estadístico, p, se
  aproxima a la normal cuando las muestras son
  grandes (n>25 o > 5), este estadístico es:
• Si la hipótesis nula es falsa esta discrepancia
  debe superar el valor crítico de la distribución
  muestral Z (la distribución normal tipificada).
  De igual forma, el nivel p-crítico asociado a
  esta discrepancia debe ser menor que el nivel
  de significación, alpha , para poder rechazar la
  H0.
Ejemplo 2.5
• Un investigador de estudios de mercado cree
  que más del 20% de los adolescentes cambian
  de móvil cada año. Con esta finalidad realiza
  una encuesta sobre una muestra de 150
  adolescentes observando que 39 de ellos
  afirman haber cambiado de móvil en el último
  año.
• Con un nivel de confianza del 99%, ¿podemos
  admitir la hipótesis del investigador?
Condiciones y supuestos
• El estudio utiliza un diseño de una muestra de
  150 adolescentes en la que la variable
  “cambiar de móvil” es cualitativa dicotómica
  sí/no a nivel de la unidad de observación (en
  este caso, el participante).
Contraste de la proporción
                                  DM de la proporción
                     Variable
Cambiar de           dicotómica
móvil                (Si/No)
=                    N = 150
Variable             Si =39
dicotómica




                      MUESTRA
POBLACIÓN
Condiciones y supuestos
• Cuando contabilizamos en cada muestra el
  número de participantes que contestan sí o
  no, entonces esta variable tiene una
  distribución binomial que, en este caso, se
  aproxima a la normal por tratarse de una
  muestra grande. El investigador quiere
  demostrar que el porcentaje de adolescentes
  que cambia de móvil cada año es superior al
  20%.
Planteamiento de las hipótesis
• Se trata de un contraste unilateral ya que si la
  hipótesis alternativa dice que “la proporción
  supera el 0,20”, la hipótesis nula dice que “la
  proporción es igual o no supera el 0,20”.
• A partir de los datos de la muestra la
  proporción de adolescentes que cambian de
  móvil es del 26% (0,26).
Estadístico de contraste
Regla de decisión
• Con un nivel de confianza del 99% y en un
  contraste unilateral, el valor crítico para
  rechazar la hipótesis nula es 2,33.
• El nivel p-crítico asociado al estadístico de
  contraste obtenido es 0,0329 que es una
  probabilidad mayor que el nivel de
  significación establecido a priori.
• Debe buscarse en las tablas de la distribución
  normal la probabilidad de obtener
  puntuaciones Z mayores que 1, 84.

  P(Z≥1,84)=1-P(Z≤1,84)= 1-0,9671=0,0329
Conclusión
• Como el estadístico de contraste (discrepancia
  entre datos observados y datos teóricos) no
  supera la máxima diferencia que puede
  esperarse por simple azar (el valor crítico), no
  tenemos evidencia suficiente para rechazar la
  hipótesis nula.
• De otra forma, el nivel p-crítico= 0,0329 es
  mayor que el nivel de significación por lo que
  no podemos rechazar la hipótesis nula.
Interpretación
• A la luz de los datos obtenidos por el
  investigador no hay evidencia suficiente para
  asumir que más del 20% de los adolescentes
  cambian de móvil cada año.
Contraste de hipótesis sobre la
        varianza poblacional
• En el tema anterior vimos que si de una
  población donde la variable X se distribuye
  normalmente con media mu y varianza sigma

  se extraen todas las posibles muestras del
 mismo tipo y tamaño en las que podemos
 calcular sus varianzas, entonces se puede
 demostrar que la variable aleatoria:
sigue una distribución chi-cuadrado con n-1
  grados de libertad.
• Si en vez de utilizar la varianza utilizamos la
  cuasi-varianza muestral:




• que también se distribuye según chi-cuadrado
  con n-1 grados de libertad.
• También vimos que el intervalo de confianza
  para la varianza poblacional delimita los
  valores entre los que se encontrará la varianza
  poblacional, con una probabilidad de 1-alpha.
Estadístico de contraste
• Adopta la siguiente expresión:




       Utilizando la               Utilizando la
     varianza muestral        cuasivarianza muestral
Contraste bilateral
Unilateral derecho
Unilateral izquierdo
Ejemplo 2.6
• El manual de un test para detectar niños con
  problemas de aprendizaje afirma que la
  varianza de las puntuaciones del test
  disminuye con la edad, tomando el valor de
  18,1 para los niños promedio de 5 años.
Ejemplo 2.6
• Un psicólogo infantil considera que
  actualmente esta variabilidad ha aumentado y
  para probarlo, utiliza una muestra de 25 niños
  de 5 años a los que aplica el test obteniendo
  una desviación típica sesgada de 4,9 puntos.
  Trabajando con un nivel de significación de
  0,01, contraste la hipótesis del investigador.
Contraste de la varianza
                                  DM de la varianza
                    X
X=
Puntuaciones en
el test             N = 25




                        MUESTRA
POBLACIÓN
Contraste de la varianza
                                  DM de la varianza
                    X
X=                  N = 25
Puntuaciones en
el test




                        MUESTRA
POBLACIÓN
Condiciones y supuestos
• El estudio utiliza un diseño de una muestra
  aleatoria de 25 niños a los que se les pasa un
  test. Asumimos que estas puntuaciones se
  miden, al menos con escala de intervalo y se
  distribuyen normalmente en la población con
  varianza 18,1.
• En la muestra se obtiene una desviación típica
  sesgada de 4,9.
Contraste de la varianza
                                  DM de la varianza
                    X
X=                  N = 25
Puntuaciones en
el test




                        MUESTRA
POBLACIÓN
Formulación de hipótesis
• El investigador quiere probar que la varianza del
  test en los niños de 5 años es ahora mayor de
  18,1 como afirma el manual. Esta es la hipótesis
  alternativa.
• Se trata por tanto de un contraste unilateral
  derecho.
Estadístico de contraste
• Conociendo la cuasi-varianza de la muestra, el
  estadístico de contraste es:
• El nivel p-crítico de 33.16 hay que buscarlo en
  la tabla de la distribución chi-cuadrado con 24
  gl, y por aproximación es: p = 0,10
La puntuación Chi-cuadrado = 33.16 deja por
    encima de sí el 0.90 de la distribución
El valor crítico para alpha = 0.01 vale 42.97
Regla de decisión
• En la distribución chi-cuadrado con 24 grados
  de libertad y un nivel de confianza del 99%, el
  valor crítico para rechazar la hipótesis nula es
  aproximadamente 43.
• Rechazaremos la hipótesis nula si el
  estadístico de contraste es mayor que el valor
  crítico de 43 o si el nivel p-crítico es menor
  que el nivel de significación de 0,01.
Interpretación
• No tenemos evidencia suficiente para afirmar
  que la variabilidad de las puntuaciones
  obtenidas por los niños de 5 años en el test es
  ahora mayor de lo que afirma el manual del
  test para detectar problemas de aprendizaje.
Conclusión
• Como el estadístico de contraste obtenido no
  supera el valor crítico, debemos concluir que
  no tenemos evidencia suficiente para rechazar
  la hipótesis nula.
• Igualmente, como el nivel p-crítico (p=0.10) es
  mayor que el nivel de significación (0.01),
  debemos informar que no tenemos evidencia
  suficiente para rechazar la hipótesis nula.
Cálculo de la Potencia del
              contraste
• Recordemos los tipos de error:
Rechazar una hipótesis nula que es verdadera
  (error tipo I) y no rechazar una hipótesis nula
  que es falsa (error tipo II).
• Vamos a ver, apoyándonos en el desarrollo de
  un ejemplo, el procedimiento para calcular la
  potencia de un contraste paramétrico referido
  a la media poblacional en el diseño de una
  muestra.
Ejemplo 2.7
• Supongamos que la duración media de una
  lámpara de bajo consumo de una
  determinada marca es de 1000 horas con un
  desviación estándar de 220 horas. La empresa
  que las fabrica introduce un nuevo proceso de
  fabricación y afirma que la vida media de las
  nuevas es superior a las antiguas.
Ejemplo 2.7
• Vamos a suponer que como hipótesis
  alternativa única se plantea un promedio de
  duración de 1060 horas. Tomando un nivel de
  significación del 5%, determinar el error tipo II
  y la potencia de la prueba, si el estudio se
  realizara con un muestra de 100 lámparas.
Contraste de la media
                                      DM de la media
                        X
                        N = 100
X = Duración de
lás lámparas




                            MUESTRA
POBLACIÓN
Ejemplo 2.7
Ejemplo 2.7
• Una vez establecido el error tipo I (0,05) y que
  se corresponde con una puntuación
  estandarizada de 1,64, se trata de determinar
  a qué valor corresponde esta puntuación Z en
  la distribución muestral de las duraciones
  medias de las lámparas.
Ejemplo 2.7
Ejemplo 2.7
• Luego sabemos que una duración de 1036
  horas deja por encima de sí el 0.05 de todos
  los valores posibles si H0 es cierta.
• Para determinar el error tipo II primero es
  preciso saber a puntuación estandarizada se
  corresponde este valor (1036) respecto del
  valor planteado como hipótesis alternativa, es
  decir, desde
• La probabilidad de obtener un valor de Z igual
  o menor de -1,09 es 0,1379, que es la
  probabilidad de cometer un error tipo II.
• Si se rechazara la hipótesis nula de que el
  promedio de duración es de 1000 horas pero
  en realidad esta hipótesis fuera verdadera (es
  decir, el nuevo proceso de fabricación no
  alarga la duración) entonces estaríamos
  cometiendo un error (tipo I). Esto se producirá
  el 5 % de las veces en que realizáramos este
  experimento y H0 fuese cierta.
• Por el contrario, si se acepta la hipótesis nula,
  pero la alternativa es la verdadera, estaríamos
  cometiendo un error tipo II. Siendo H0, la
  probabilidad de cometer este error (tipo II) es
  del 13,79%.
• Por tanto, la potencia de la prueba es del
  86,21% (1 – 0,1379 = 0,8621).
• En este ejemplo hemos visto que para calcular
  la potencia de un contraste se necesita que la
  hipótesis nula y la alternativa sean simples, es
  decir, que establezcan un único valor como
  parámetro poblacional.
• Cuando la hipótesis alternativa es compuesta,
  es decir, plantea más de un valor como media
  poblacional, v.g.,
Entonces, la potencia del contraste, o
  probabilidad de rechazar una hipótesis nula
  que en realidad es falsa, varía en función de
  dos factores:
• la distancia entre el valor de la hipótesis nula y
  la hipótesis alternativa y
• el tamaño muestral (n).
• De este modo y para un concreto valor del
  error tipo I, se pueden confeccionar lo que se
  denomina curvas de potencia, las cuales
  permiten fácilmente localizar la potencia de
  un contraste según sea el valor que puede
  tomar H1 y el tamaño de la muestra.
Nivel p-crítico y errores en los
            contrastes
• En la prueba clásica de contraste que hemos
  explicado, tanto en los paramétricos como no
  paramétricos, es preciso establecer el error
  tipo I (nivel de “alfa”) antes de realizar el
  contraste, de modo que este valor no influya
  en la decisión final que se toma..
Nivel p-crítico y errores en los
            contrastes
• Este error es, pues, el máximo riesgo que
  estamos dispuestos a admitir al tomar una
  decisión. No obstante, establecer previamente
  un nivel de error tipo I, presenta algún
  inconveniente que puede ser decisivo en la
  decisión que se tome.
Nivel p-crítico y errores en los
            contrastes
• La decisión que se tome sobre H0 puede
  depender del nivel de significación que se
  establezca, y se puede dar la circunstancia de
  que sea rechazada con un nivel del 5% y
  aceptada con uno del 1%.
Nivel p-crítico y errores en los
            contrastes
• Aunque hay un acuerdo en el ámbito científico
  acerca de que debe ser un valor pequeño,
  es más difícil determinar cuán pequeño debe
  ser, ya que en parte dependerá de algunos
  factores como las creencias previas sobre los
  procesos de toma de decisión que se han
  realizado anteriormente sobre la misma o
  parecida cuestión, y también sobre las
  consecuencias que se deriven al tomar una
  decisión errónea (errores tipo I y II).
Nivel p-crítico y errores en los
            contrastes
• Debido a estos inconvenientes, en el análisis
  de datos se introdujo el denominado nivel p-
  crítico (que se designa como p) y que se
  define como el nivel de significación más
  pequeño al que una hipótesis puede ser
  rechazada con la medida de discrepancia
  obtenida.
• Es decir, el nivel p-crítico es la probabilidad
  asociada a la medida de discrepancia.
• Al utilizar como criterio para la decisión el
  nivel crítico no hay que establecer necesaria y
  previamente un nivel de significación, y ésta
  se toma en función del valor de p. Si p es
  pequeño se rechazará H0, y si es grande se
  aceptará H0
• Obviamente, persiste el problema de
  determinar qué es grande y qué pequeño.
  Entonces para tomar una decisión hay que
  recurrir al criterio del grado de cercanía o
  alejamiento de p a, por ejemplo, el valor 0,05.
  Si es claramente inferior, se rechaza H0, si es
  claramente superior se acepta H0, y si está en
  torno a ese valor, se vuelve a tomar nueva
  evidencia muestral y se repite el contraste.
• No obstante, el empleo del nivel crítico como
  criterio de decisión no está exento de
  problemas, ya que, al igual que las medidas de
  discrepancia observada entre H0 y la evidencia
  muestral, depende del tamaño de la muestra
  utilizada, y es por ello que, desde la década de
  los ochenta del siglo pasado se han explorado
  nuevas medidas independientes del tamaño
  muestral, que explicamos más adelante.
• What do you call a tea
party with more than 30
        people?

     • A Z party!!!
• Why did the statistician take
              Viagra?
• Since his sample was large, he
did not want to be rejected with
 a small p-value and be declared
    practically nonsignificant!!
• What is a triple-blinded, completely
  randomized case-control clinical drug trial?
• One in which the patients do not know which
  drug treatment they are receiving, the nurses
  do not know which drug treatment they are
  administering, and the physicians conducting
  the study do not know what they are doing!!!
La holografía
Man3

Más contenido relacionado

La actualidad más candente

Trabajo de estadistica
Trabajo de estadistica Trabajo de estadistica
Trabajo de estadistica luce0218
 
trabajo de estadistica
 trabajo de estadistica trabajo de estadistica
trabajo de estadisticaluce0218
 
Planteamiento de Hipótesis para dos poblaciones (WORD)
Planteamiento de Hipótesis para dos poblaciones (WORD)Planteamiento de Hipótesis para dos poblaciones (WORD)
Planteamiento de Hipótesis para dos poblaciones (WORD)HOTELES2
 
Pruebas parametricas y no parametricas
Pruebas parametricas y no parametricasPruebas parametricas y no parametricas
Pruebas parametricas y no parametricasLuisais Pire
 
Prueba estadística paramétrica
Prueba estadística paramétricaPrueba estadística paramétrica
Prueba estadística paramétricajuanchojuancho
 
estadisticas-no-parametricas
estadisticas-no-parametricasestadisticas-no-parametricas
estadisticas-no-parametricasjeannyramirez102
 
Prueba t varianzas combinadas
Prueba t varianzas combinadasPrueba t varianzas combinadas
Prueba t varianzas combinadasjagi100
 
Estadistica no parametrica
Estadistica no parametricaEstadistica no parametrica
Estadistica no parametricafretar26
 
Distribuciones de Probabilidad
Distribuciones de ProbabilidadDistribuciones de Probabilidad
Distribuciones de ProbabilidadViri_TPerales
 
Estadisticas Inferenciales
Estadisticas InferencialesEstadisticas Inferenciales
Estadisticas InferencialesSandra Zapata
 
Planteamiento de hipotesis -f fisher
Planteamiento de hipotesis -f fisherPlanteamiento de hipotesis -f fisher
Planteamiento de hipotesis -f fisherlaura ochoa
 
Pruebas no paramétricas
Pruebas no paramétricasPruebas no paramétricas
Pruebas no paramétricasmatildepeguero
 
F:\planteamiento de hipótesis en mas de dos poblaciones
F:\planteamiento de hipótesis en mas de dos poblacionesF:\planteamiento de hipótesis en mas de dos poblaciones
F:\planteamiento de hipótesis en mas de dos poblacionesLizeth
 
Teoría elemental del muestreo, teoría de la decisión
Teoría elemental del muestreo, teoría de la decisiónTeoría elemental del muestreo, teoría de la decisión
Teoría elemental del muestreo, teoría de la decisiónKeynner Alvarez Torres
 

La actualidad más candente (20)

Trabajo de estadistica
Trabajo de estadistica Trabajo de estadistica
Trabajo de estadistica
 
trabajo de estadistica
 trabajo de estadistica trabajo de estadistica
trabajo de estadistica
 
Planteamiento de Hipótesis para dos poblaciones (WORD)
Planteamiento de Hipótesis para dos poblaciones (WORD)Planteamiento de Hipótesis para dos poblaciones (WORD)
Planteamiento de Hipótesis para dos poblaciones (WORD)
 
BioestadíStica Y EpidemiologíA
BioestadíStica Y EpidemiologíABioestadíStica Y EpidemiologíA
BioestadíStica Y EpidemiologíA
 
Analisis parametricos-y-no-parametricos
Analisis parametricos-y-no-parametricosAnalisis parametricos-y-no-parametricos
Analisis parametricos-y-no-parametricos
 
Pruebas parametricas y no parametricas
Pruebas parametricas y no parametricasPruebas parametricas y no parametricas
Pruebas parametricas y no parametricas
 
Estadistica no parametrica ii
Estadistica no parametrica iiEstadistica no parametrica ii
Estadistica no parametrica ii
 
Prueba estadística paramétrica
Prueba estadística paramétricaPrueba estadística paramétrica
Prueba estadística paramétrica
 
Pruebas no parametricas
Pruebas no parametricasPruebas no parametricas
Pruebas no parametricas
 
estadisticas-no-parametricas
estadisticas-no-parametricasestadisticas-no-parametricas
estadisticas-no-parametricas
 
Prueba de hipotesis
Prueba de hipotesisPrueba de hipotesis
Prueba de hipotesis
 
Prueba t varianzas combinadas
Prueba t varianzas combinadasPrueba t varianzas combinadas
Prueba t varianzas combinadas
 
Estadistica no parametrica
Estadistica no parametricaEstadistica no parametrica
Estadistica no parametrica
 
Distribuciones de Probabilidad
Distribuciones de ProbabilidadDistribuciones de Probabilidad
Distribuciones de Probabilidad
 
Estadisticas Inferenciales
Estadisticas InferencialesEstadisticas Inferenciales
Estadisticas Inferenciales
 
Unidad 5 Inferencia estadística
Unidad 5 Inferencia estadísticaUnidad 5 Inferencia estadística
Unidad 5 Inferencia estadística
 
Planteamiento de hipotesis -f fisher
Planteamiento de hipotesis -f fisherPlanteamiento de hipotesis -f fisher
Planteamiento de hipotesis -f fisher
 
Pruebas no paramétricas
Pruebas no paramétricasPruebas no paramétricas
Pruebas no paramétricas
 
F:\planteamiento de hipótesis en mas de dos poblaciones
F:\planteamiento de hipótesis en mas de dos poblacionesF:\planteamiento de hipótesis en mas de dos poblaciones
F:\planteamiento de hipótesis en mas de dos poblaciones
 
Teoría elemental del muestreo, teoría de la decisión
Teoría elemental del muestreo, teoría de la decisiónTeoría elemental del muestreo, teoría de la decisión
Teoría elemental del muestreo, teoría de la decisión
 

Similar a Man3

PRUEBA DE LA MEDIA.pptx
PRUEBA DE LA MEDIA.pptxPRUEBA DE LA MEDIA.pptx
PRUEBA DE LA MEDIA.pptxMelany272333
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptivajennypao39
 
Estadistica descriptiva 2
Estadistica descriptiva 2 Estadistica descriptiva 2
Estadistica descriptiva 2 Paula Diaz
 
Distribución muéstrales y estimación
Distribución muéstrales y estimaciónDistribución muéstrales y estimación
Distribución muéstrales y estimaciónJesus Plaza Aguilera
 
5 Semana Analisis Multivariante Parte II
5 Semana Analisis Multivariante Parte II5 Semana Analisis Multivariante Parte II
5 Semana Analisis Multivariante Parte IIjpgv84
 
Clase 2 estadistica
Clase 2 estadisticaClase 2 estadistica
Clase 2 estadisticasariuxtur
 
MODULO DE ESTADISTICA
MODULO DE ESTADISTICAMODULO DE ESTADISTICA
MODULO DE ESTADISTICAverofernandez
 
Distribuciones muestrales y estimación de los parámetros poblacionales
Distribuciones muestrales y estimación de los parámetros poblacionalesDistribuciones muestrales y estimación de los parámetros poblacionales
Distribuciones muestrales y estimación de los parámetros poblacionalesRacertutosxplod
 
Estadistica parametrica y no parametrica
Estadistica parametrica y no parametricaEstadistica parametrica y no parametrica
Estadistica parametrica y no parametricajimialaponte
 
Distribución muestral y de estimación.
Distribución muestral y de estimación.Distribución muestral y de estimación.
Distribución muestral y de estimación.LeonardoOtamendy
 

Similar a Man3 (20)

Man4
Man4Man4
Man4
 
Man4
Man4Man4
Man4
 
PRUEBA DE LA MEDIA.pptx
PRUEBA DE LA MEDIA.pptxPRUEBA DE LA MEDIA.pptx
PRUEBA DE LA MEDIA.pptx
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptiva
 
Estadistica descriptiva 2
Estadistica descriptiva 2 Estadistica descriptiva 2
Estadistica descriptiva 2
 
Doc 20170503-wa0008
Doc 20170503-wa0008Doc 20170503-wa0008
Doc 20170503-wa0008
 
Man2
Man2Man2
Man2
 
Distribución muéstrales y estimación
Distribución muéstrales y estimaciónDistribución muéstrales y estimación
Distribución muéstrales y estimación
 
Medidas de Dispersión
Medidas de DispersiónMedidas de Dispersión
Medidas de Dispersión
 
5 Semana Analisis Multivariante Parte II
5 Semana Analisis Multivariante Parte II5 Semana Analisis Multivariante Parte II
5 Semana Analisis Multivariante Parte II
 
N3_clase 8_Pruebas F - T - Z.pdf
N3_clase 8_Pruebas F - T - Z.pdfN3_clase 8_Pruebas F - T - Z.pdf
N3_clase 8_Pruebas F - T - Z.pdf
 
Metodo parametrico y no parametrico
Metodo parametrico y no parametricoMetodo parametrico y no parametrico
Metodo parametrico y no parametrico
 
Clase 2 estadistica
Clase 2 estadisticaClase 2 estadistica
Clase 2 estadistica
 
MODULO DE ESTADISTICA
MODULO DE ESTADISTICAMODULO DE ESTADISTICA
MODULO DE ESTADISTICA
 
Distribuciones muestrales y estimación de los parámetros poblacionales
Distribuciones muestrales y estimación de los parámetros poblacionalesDistribuciones muestrales y estimación de los parámetros poblacionales
Distribuciones muestrales y estimación de los parámetros poblacionales
 
medidas de dispercion
medidas de dispercion medidas de dispercion
medidas de dispercion
 
Estadistica parametrica y no parametrica
Estadistica parametrica y no parametricaEstadistica parametrica y no parametrica
Estadistica parametrica y no parametrica
 
Distribución muestral y de estimación.
Distribución muestral y de estimación.Distribución muestral y de estimación.
Distribución muestral y de estimación.
 
Estadistica 8
Estadistica 8Estadistica 8
Estadistica 8
 
Tarea estadistica
Tarea estadisticaTarea estadistica
Tarea estadistica
 

Último

PREDICA la lengua como controlarla 223.pdf
PREDICA  la lengua como controlarla 223.pdfPREDICA  la lengua como controlarla 223.pdf
PREDICA la lengua como controlarla 223.pdfRamiroJacome
 
Presentacion de el libro habitos atomicos
Presentacion de el libro habitos atomicosPresentacion de el libro habitos atomicos
Presentacion de el libro habitos atomicosVera832809
 
Tarea 4 etica y filosofia politica bentham
Tarea 4 etica y filosofia politica benthamTarea 4 etica y filosofia politica bentham
Tarea 4 etica y filosofia politica benthammatiasrojasa1
 
LA CENA DEL SEÑOR UN ESTUDIO BIBLICO PARA LA IGLESIA DE CRISTO
LA CENA DEL SEÑOR UN ESTUDIO BIBLICO PARA LA IGLESIA DE CRISTOLA CENA DEL SEÑOR UN ESTUDIO BIBLICO PARA LA IGLESIA DE CRISTO
LA CENA DEL SEÑOR UN ESTUDIO BIBLICO PARA LA IGLESIA DE CRISTOManuelLopez134892
 
Walter-Riso.pdf Pensar bien, sentirse bien
Walter-Riso.pdf Pensar bien, sentirse bienWalter-Riso.pdf Pensar bien, sentirse bien
Walter-Riso.pdf Pensar bien, sentirse bienlasmaslistas24
 
Catálogo de Oriflame Costa Rica Mayo 2024
Catálogo de Oriflame Costa Rica Mayo 2024Catálogo de Oriflame Costa Rica Mayo 2024
Catálogo de Oriflame Costa Rica Mayo 2024Karol Vargas
 
Novena [nueve días] A San Benito de Nurcia .pdf
Novena [nueve días] A San Benito de Nurcia .pdfNovena [nueve días] A San Benito de Nurcia .pdf
Novena [nueve días] A San Benito de Nurcia .pdfpatitapetit
 
Catálogo de Oriflame Costa Rica Junio 2024
Catálogo de Oriflame Costa Rica Junio 2024Catálogo de Oriflame Costa Rica Junio 2024
Catálogo de Oriflame Costa Rica Junio 2024Karol Vargas
 

Último (10)

PREDICA la lengua como controlarla 223.pdf
PREDICA  la lengua como controlarla 223.pdfPREDICA  la lengua como controlarla 223.pdf
PREDICA la lengua como controlarla 223.pdf
 
FESTIVAL DE TURISMO Y BIENESTAR - IMPERDIBLE24 - CALACEITE 16 DE JUNIO.pdf
FESTIVAL DE TURISMO Y BIENESTAR - IMPERDIBLE24 - CALACEITE 16 DE JUNIO.pdfFESTIVAL DE TURISMO Y BIENESTAR - IMPERDIBLE24 - CALACEITE 16 DE JUNIO.pdf
FESTIVAL DE TURISMO Y BIENESTAR - IMPERDIBLE24 - CALACEITE 16 DE JUNIO.pdf
 
Presentacion de el libro habitos atomicos
Presentacion de el libro habitos atomicosPresentacion de el libro habitos atomicos
Presentacion de el libro habitos atomicos
 
Tarea 4 etica y filosofia politica bentham
Tarea 4 etica y filosofia politica benthamTarea 4 etica y filosofia politica bentham
Tarea 4 etica y filosofia politica bentham
 
LA CENA DEL SEÑOR UN ESTUDIO BIBLICO PARA LA IGLESIA DE CRISTO
LA CENA DEL SEÑOR UN ESTUDIO BIBLICO PARA LA IGLESIA DE CRISTOLA CENA DEL SEÑOR UN ESTUDIO BIBLICO PARA LA IGLESIA DE CRISTO
LA CENA DEL SEÑOR UN ESTUDIO BIBLICO PARA LA IGLESIA DE CRISTO
 
Walter-Riso.pdf Pensar bien, sentirse bien
Walter-Riso.pdf Pensar bien, sentirse bienWalter-Riso.pdf Pensar bien, sentirse bien
Walter-Riso.pdf Pensar bien, sentirse bien
 
Catálogo de Oriflame Costa Rica Mayo 2024
Catálogo de Oriflame Costa Rica Mayo 2024Catálogo de Oriflame Costa Rica Mayo 2024
Catálogo de Oriflame Costa Rica Mayo 2024
 
Novena [nueve días] A San Benito de Nurcia .pdf
Novena [nueve días] A San Benito de Nurcia .pdfNovena [nueve días] A San Benito de Nurcia .pdf
Novena [nueve días] A San Benito de Nurcia .pdf
 
FESTIVAL IMPERDIBLE24 - Calaceite -15-16 junio.pdf
FESTIVAL IMPERDIBLE24 - Calaceite -15-16 junio.pdfFESTIVAL IMPERDIBLE24 - Calaceite -15-16 junio.pdf
FESTIVAL IMPERDIBLE24 - Calaceite -15-16 junio.pdf
 
Catálogo de Oriflame Costa Rica Junio 2024
Catálogo de Oriflame Costa Rica Junio 2024Catálogo de Oriflame Costa Rica Junio 2024
Catálogo de Oriflame Costa Rica Junio 2024
 

Man3

  • 1. DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 2 Contrastes de hipótesis en los diseños de una muestra
  • 2. Introducción • En las investigaciones que parten del conocimiento proporcionado por los datos recogidos de una muestra, el objetivo es inferir las características de la población de la cual los datos recolectados constituyen una muestra representativa.
  • 3. En este tipo de investigaciones la hipótesis a contrastar especifica una característica de la población, por ejemplo: • Si un determinado parámetro poblacional puede tomar un valor concreto. • Si las variables medidas en la muestra son independientes en la población. • La forma de la distribución de la variable, X, en la población. • Si los datos observados en la muestra son independientes entre sí.
  • 4. • Los dos primeros casos se incluyen dentro de los contrastes paramétricos ya que se relacionan con el estudio de un parámetro poblacional (media, varianza, proporción, correlación, etc.) y siempre que la variable de estudio provenga de una población con una función de densidad de probabilidad (fdp) conocida o supuesta.
  • 5. • Por su parte, los dos siguientes contrastes se englobarían dentro de los contrastes no paramétricos que o bien no se relacionan con parámetros poblacionales o se encuentran referidas a datos que provienen de una población con una función de densidad de probabilidad desconocida.
  • 6. Contrastes paramétricos vs no paramétricos • Resulta difícil proporcionar una definición precisa del concepto de “técnicas no paramétricas” ya que no existe un consenso absoluto al respecto. • La literatura técnica diferencia estas técnicas de formas muy diversas.
  • 7. • Así, por ejemplo, Ross (2004) las define como aquellas pruebas que se aplican cuando los datos proceden de una distribución de probabilidad cuya forma no viene especificada, es decir, cuando no podemos asumir una forma concreta de la distribución poblacional para los datos (normal, exponencial, binomial, etc.). • Es por ello que muchos autores denominan a estas pruebas como “pruebas sin supuesto distribucional” (distribution-free) en vez de “no paramétricas”.
  • 8. • No obstante, sería equivocado afirmar que los contrastes no paramétricos no realizan ningún tipo de supuestos (lo que en estadística se conoce como assumption-free) aunque sí es cierto que los supuestos realizados por los contrastes no paramétricos son menos rígidos que los realizados por los contrastes paramétricos.
  • 9. • Contrariamente a lo que se suele afirmar, los contrastes no paramétricos sí realizan supuestos aunque estos no están referidos a la forma específica de la distribución poblacional.
  • 10. • Por ejemplo, un supuesto muy utilizado en pruebas no paramétricas es el supuesto de distribución simétrica de la variable dependiente en la población. Debido a que existen otras muchas distribuciones distintas de la normal que también son simétricas, este supuesto no nos obliga a trabajar necesariamente con una distribución normal (que es simétrica).
  • 11.
  • 12. • No obstante, sí nos elimina del área de búsqueda todas las distribuciones asimétricas (v.g., la F, la chi-cuadrado, la Gamma). Esta es una de las razones por las que algunos autores han introducido otros términos que pretenden establecer matizaciones a medio camino entre las técnicas paramétricas y las no paramétricas (v.g., técnicas semiparamétricas).
  • 13.
  • 14. • En relación a las distinciones anteriores, el estudiante debe diferenciar entre los supuestos realizados por el método de inferencia de las pruebas (criterio que diferencia las técnicas paramétricas de las no paramétricas) de las distribuciones muestrales utilizadas en los cálculos para el contraste de hipótesis en cualquiera de estas técnicas (tanto paramétricas como no paramétricas).
  • 15. • Aunque la estadística no paramétrica no incluya entre sus supuestos a una f.d.p. (función de densidad de probabilidad) concreta como la distribución poblacional de la variable dependiente, no obstante, los estadísticos que se calculan en la estadística no paramétrica sí se distribuirán según una u otra distribución paramétrica concreta.
  • 16. • Por ejemplo, cuando veamos la prueba de los signos comprobaremos que no se hace ningún supuesto sobre cómo se distribuyen los datos observados en la población de la cual se ha extraído la muestra de estudio (en este sentido es un contraste no paramétrico) pero, sin embargo, utilizará la distribución binomial como distribución muestral del estadístico para realizar los cálculos de los niveles de probabilidad asociados a la hipótesis nula.
  • 17. • La distribución binomial es una distribución paramétrica pero la prueba de los signos no la utiliza como un supuesto necesario para aplicarla, sino como una herramienta para calcular niveles de probabilidad.
  • 18. • Otros autores hacen hincapié simplemente en que, de forma genérica, estas últimas realizan supuestos menos restrictivos o rígidos que las técnicas paramétricas (Daniel, 1990). Desde esta perspectiva, la distinción entre paramétrico vs. no paramétrico no es una distinción cualitativa sino cuantitativa
  • 19. • Hay procedimientos que se acercan más al extremo paramétrico y otros al extremo no paramétrico, existiendo otros en puntos intermedios del continuo. Aunque esta clasificación cuantitativa de los contrastes es una definición más vaga que las anteriores, resulta muy útil ya que hay técnicas estadísticas entre cuyos objetivos iniciales explícitos se encuentra el realizar los menos supuestos posibles sobre la procedencia de los datos.
  • 20. • Una tercera opinión insiste en que lo que caracteriza a las técnicas no paramétricas es el nivel de medida de los datos. Las técnicas no paramétricas se suelen utilizar cuando las escalas utilizadas para medir la variable dependiente, es decir, los datos recogidos en la muestra, son de tipo nominal u ordinal o bien cuando las escalas sean de tipo de intervalo/razón pero han sido recodificadas en variables de tipo nominal u ordinal
  • 21. • Estamos de acuerdo con Wasserman (2006) cuando subraya que el punto esencial de las técnicas no paramétricas consiste en que los métodos estadísticos desarrollados en este área tratan de mantener los supuestos lo menos restrictivos o rígidos posibles.
  • 22. • Hemos de señalar que cuanto menos restrictivos sean los supuestos que se realicen a la hora de seleccionar la prueba que se aplicará para el contraste de hipótesis, más amplias serán las posibilidades que tendremos que contemplar (más amplio el espacio de búsqueda).
  • 23. • Este espacio de búsqueda puede llegar a ser infinito por lo que también se conoce a las técnicas no paramétricas como “técnicas paramétricas de dimensionalidad infinita”. • El concepto de “no paramétrico” no tiene una definición precisa y universalmente aceptada.
  • 25. Contraste sobre la media poblacional. • Conocida la varianza poblacional. Aunque esta situación no es frecuente, si por trabajos o información previa podemos asumir un determinado valor para la varianza poblacional, entonces la distribución muestral de la media es una distribución normal, y el estadístico de contraste para la media poblacional es:
  • 26. • El estadístico Z cuantifica la distancia entre la media de la muestra a la media poblacional asumida en H0 en unidades de error típico de la distribución muestral.
  • 27. • Es una regla de tres 1 SX -------------------------- Z= ¿? --------------------------
  • 28. Ejemplo 2.2 • Por estudios previos conocemos que la población masculina de la tercera edad de una determinada Comunidad Autónoma tiene un gasto medio en medicamentos de 215 euros/año con una desviación típica de 36 euros y queremos saber si la población femenina tiene el mismo gasto.
  • 29. Ejemplo 2.2 • Con tal finalidad analizamos el gasto medio de una muestra de 324 mujeres de la tercera edad de esa misma comunidad observando que la media es de 220 euros/año. Asumimos que esta variable se distribuye normalmente en la población. Fijando un nivel de confianza del 95%, contraste si el gasto de las mujeres es significativamente distinto de 215 euros/año.
  • 30. No hay dos muestras, solo una: la de mujeres DM de la media Gasto Variable X farmacéutico = en mujeres gasto farmacéutico MUESTRA POBLACIÓN
  • 31. ¡Supuesto! -> Paramétrico DM de la media Gasto Variable X farmacéutico = en mujeres gasto farmacéutico MUESTRA POBLACIÓN
  • 32. Condiciones y supuestos • El estudio utiliza un diseño de una muestra de mujeres en la que la variable “gasto medio” se mide en una escala de razón (variable cuantitativa) y sabemos que se distribuye normalmente en la población. • Adicionalmente conocemos la desviación típica poblacional que es de 36 euros.
  • 33. Condiciones y supuestos • Se trata de un contraste paramétrico bilateral ya que, a priori, no sabemos si el gasto de las mujeres es mayor o menor de 220 euros/año, solo queremos contrastar que el gasto de las mujeres es diferente a esa cantidad, pero sin señalar el sentido de esa diferencia.
  • 34. Formulación de las hipótesis • La hipótesis de investigación es que “las mujeres tienen un gasto distinto a los 215 euros/año” (H1). • La hipótesis nula (H0) dice que el gasto de las mujeres es de 215 euros/año y la hipótesis alternativa que el gasto medio de las mujeres es un valor distinto.
  • 35. • Partimos de que, provisionalmente, la hipótesis nula es verdadera, es decir, que las mujeres tienen un gasto de 215 euros/año y se trata de encontrar evidencia contra esta hipótesis a partir de la información proporcionada por una muestra representativa.
  • 36. • ¿La diferencia de 5 euros entre el valor observado en la muestra y el que planteamos en la hipótesis nula significa realmente un gasto distinto o esta diferencia puede deberse a fluctuaciones aleatorias?. El rechazo de la hipótesis nula y la consiguiente aceptación de la hipótesis alternativa significará que la diferencia observada es “estadísticamente significativa” confirmando una diferencia real que no puede atribuirse al azar o a fluctuaciones aleatorias debidas al muestreo.
  • 37. Estadístico de contraste • Para contrastar nuestra hipótesis se calcula la discrepancia entre la evidencia observada de que el gasto medio es de 220 euros en la muestra de mujeres con el valor hipotéticamente establecido para la población general de que el gasto medio es de 215 euros.
  • 38.
  • 39. Regla de decisión • Los valores críticos representan la máxima diferencia atribuible al azar en la distribución muestral que puede existir entre los datos empíricos observados en la muestra y los datos teóricos que planteamos en la hipótesis nula.
  • 40. Regla de decisión • En la muestra el valor observado es 220 euros/año y el valor hipotético planteado es de 215 euros/año. Esta diferencia corresponde a 2,5 desviaciones típicas de la distribución muestral lo cual es poco probable si H0 es cierta • Poco probable significa menos probabilidad que el nivel alpha.
  • 41. Conclusión • El valor de este estadístico de contraste obtenido en el paso anterior, sobrepasa el valor máximo de 1,96 por lo que debemos rechazar la hipótesis nula con un nivel de confianza del 95%.
  • 42. • De otra forma, al valor del estadístico de contraste obtenido de Z=2,5 le corresponde un nivel p-crítico de 0,0124. Esta probabilidad indica que suponiendo verdadera la hipótesis de que las mujeres tienen un gasto medio de 215 euros/año, la probabilidad de observar un gasto de 220 euros/año se obtiene buscando en la tabla de la distribución normal, la probabilidad de P(Z≤-2,5) que es 0,0062.
  • 43.
  • 44. • 1-0.9938 =0.0062 • Como el contraste es bilateral 0.0062 * 2 = 0.0124 • Este valor es el nivel p-crítico y resulta ser inferior al nivel alpha. En consecuencia, rechazamos H0
  • 45. Interpretación • A la vista de los cálculos podemos decir que, con un nivel de confianza del 95%, el gasto de las mujeres difiere significativamente de 215 euros/año, que es el que realizan los hombres.
  • 46. Interpretación • Si hubiéramos utilizado un nivel de confianza del 99% no habría evidencia suficiente para rechazar la hipótesis nula ya que en este caso el nivel p-crítico de p=0,0124 es mayor que el nivel de significación “alfa” de 0,01. Es decir que la diferencia encontrada es significativa con “alfa”=0,05 pero no lo es con un nivel de significación de 0,01.
  • 47. • Estas conclusiones ponen de manifiesto: a) la importancia de la replicación de la investigación para añadir más evidencia a favor o en contra de la hipótesis b) la exigencia de informar del valor del estadístico de contraste y el nivel p-crítico
  • 48. Contraste sobre la media poblacional. • Desconocida la varianza poblacional. Si se desconoce la varianza poblacional y la forma de la distribución de la variable en la población entonces la distribución muestral de la media es la distribución t de “Student”, que se aproxima a la normal cuando se utilizan muestras grandes (con más de 30 elementos).
  • 49. • En estas circunstancias el estadístico de contraste es: • El acento circunflejo representa “estimador”.
  • 50. es el estimador de la desviación típica poblacional que se puede realizar bien a partir de la varianza o de la cuasi-varianza de la muestra (aunque el mejor estimador es este último).
  • 51.
  • 52.
  • 53. • El estimador insesgado de la varianza poblacional es la cuasi-varianza muestral por lo que el estadístico de contraste obtenido utilizando la cuasi-varianza muestral es:
  • 54. Ejemplo 2.1 • En un experimento sobre atención, un psicólogo presenta durante 300 mseg un grupo de 16 letras del alfabeto (con una disposición de 4 filas y 4 columnas). Cada uno de los 12 sujetos que participan en el experimento debe verbalizar tantas letras como recuerde. El promedio obtenido de letras bien recordadas es de 7 y la desviación típica insesgada (cuasi-desviación típica) de la muestra es de 1,3.
  • 55. Ejemplo 2.1 • Sabiendo que el recuerdo es una variable que se distribuye normalmente en la población, ¿Puede ser la media de letras recordadas de 8? Trabaje con una probabilidad de 0,95.
  • 56. ¡Supuesto! -> Paramétrico DM de la media Nº de letras Variable X bien = recordadas nº de letras bien recordadas MUESTRA POBLACIÓN
  • 57. Condiciones y supuestos • El estudio utiliza un diseño de una muestra de participantes en la que la variable “número medio de letras recordadas” se mide en una escala de razón (variable cuantitativa) y sabemos que se distribuye normalmente en la población (paramétrico). • No conocemos la desviación típica poblacional. • Conocemos la cuasidesviación típica muestral (1.3).
  • 58. Calculamos el resto de estadísticos muestrales que podemos necesitar
  • 59. Calculamos el resto de estadísticos muestrales que podemos necesitar
  • 60. Calculamos el resto de estadísticos muestrales que podemos necesitar
  • 61. ¡Supuesto! -> Paramétrico MUESTRA DM de la media Nº de letras Variable X bien = recordadas nº de letras bien recordadas POBLACIÓN
  • 62. Formulación de las hipótesis • Se plantea un contraste bilateral debido a que no han dado información acerca de una posible unilateralidad.
  • 63. Formulación de las hipótesis • Partimos de que la H0 es verdadera, es decir, que el número de palabras recordadas en este tipo de pruebas es de 8, y se trata de evaluar si los datos recogidos en una investigación bien diseñada y utilizando una muestra aleatoria arrojan evidencia a favor o en contra de la hipótesis nula.
  • 64. Estadístico de contraste • La discrepancia entre el estimador (media de la muestra) y el valor del parámetro formulado en la hipótesis nula, es:
  • 65. Regla de decisión • Con un nivel de confianza del 95% en un contraste bilateral, la máxima discrepancia que cabe esperar por simple azar entre el estimador y el valor planteado en la hipótesis nula es 2,201 (valores críticos).
  • 67. Regla de decisión • El valor del estadístico de contraste obtenido, supera este valor máximo lo que nos lleva a rechazar la hipótesis nula. El nivel p-crítico asociado a este estadístico de contraste es p=0,022 que resulta menor que el nivel de significación fijado en 0,05.
  • 68. Valor p-crítico = 0.011*2 = 0.022 Área en azul = valor p-crítico = probabilidad de obtener una t empírica igual o más extrema que la obtenida (2.66) =
  • 69.
  • 70. Interpretación • Interpretación: A partir de la evidencia que muestran los datos de la investigación, debemos rechazar la hipótesis nula de que el número medio de palabras recordadas es de 8. Por tanto y a falta de más evidencia, nada se opone a rechazar la hipótesis nula con un nivel de confianza del 95%.
  • 71. Contrastes no paramétricos • La prueba de los signos • Es una prueba no paramétrica equivalente a la prueba t de una muestra que se aplica cuando no se cumplen los supuestos que ésta exige. • El conjunto de observaciones (Xi) procederá de una población de puntuaciones que siguen una función de distribución continua y desconocida a la que denominaremos D.
  • 72. Prueba de los signos • Pero si no conocemos ni podemos asumir la forma concreta de D no podemos utilizar la prueba paramétrica (t o z). Tendremos que utilizar, por consiguiente, pruebas no paramétricas. Esto quiere decir que debemos admitir que D puede adoptar cualquier forma (normal, exponencial, gamma, Pareto, ex- gaussiana, etc.).
  • 73. • Supongamos que estamos interesados en poner a prueba la hipótesis de que la mediana de D, a la que llamaremos (eta) es igual a un valor específico al que llamaremos m0. Es decir, estamos poniendo a prueba el siguiente contraste de hipótesis para la mediana poblacional:
  • 74. • Asumiendo que H0 es cierta, esto significa que en el valor m0 aproximadamente la mitad de los datos de la muestra deben quedar por debajo del mismo y la mitad restante por encima, excepto variaciones debidas al azar. • En otras palabras, estamos planteando en H0 que m0 es el percentil 50 de la distribución (la mediana). • ¡Y esto sin importar el tipo de distribución concreta que pueda adoptar D en la realidad!
  • 75. • Si H0 es cierta, entonces cada observación será menor que m0 con probabilidad 0.5 (o superior a m0 con probabilidad 1- 0.5 = 0.5). Es decir, que si H0 es cierta la probabilidad de que cada observación sea superior o inferior a m0 será similar al experimento aleatorio consistente en arrojar una moneda insesgada (no trucada) y determinar si cae cara o cruz.
  • 76. • El modelo estadístico que subyace a un proceso dicotómico del tipo cara-cruz, repetido varias veces (n ensayos), se modela mediante una variable aleatoria de Bernouilli con parámetro p (probabilidad de éxito).
  • 77. • En nuestro caso, el valor de p deberá ser 0.5 siempre y cuando H0 sea cierta. • En consecuencia, partiendo de los valores de Xi obtenidos empíricamente en el experimento u observación, podemos calcular otra variable aleatoria, a la que llamaremos I, que se distribuirá según Bernouilli, es decir, según la fórmula:
  • 78. • Esto significa que cada valor concreto de Xi se transforma en un 1 si es menor que m0 (el valor propuesto para la mediana en H0) o en un 0 si es igual o superior a m0. En consecuencia Ii se puede considerar una función indicatriz (nos señala si ese valor se encuentra por encima o por debajo del valor m0 propuesto en H0).
  • 79. • Si H0 es cierta, entonces la nueva variable aleatoria Ii será una variable aleatoria de Bernouilli con p = 0.5. • Ahora podemos sumar los valores de Ii (a esta suma solo aportarán valor efectivo los Ii que valgan 1 ya que el resto vale 0 y se pierden en la suma) para toda la muestra. • Llamemos S al estadístico resultante de sumar todos los valores de Ii:
  • 80. • Este valor S (que es igual al número de unos de Ii) se distribuye según la binominal con parámetros p y n (en donde p valdrá 0.5 si H0 es cierta y n será el número de datos de la muestra). En un contraste bilateral, para calcular la probabilidad de obtener un valor tan extremo o más que el obtenido en la muestra para el valor S, asumiendo que H0 es cierta, aplicaremos la binomial según la fórmula:
  • 81. • El nombre de “prueba de los signos” proviene de que en muchas ocasiones se utiliza como estadístico el número de signos positivos o negativos (en lugar de unos y ceros) que se obtienen realizando la diferencia entre cada puntuación original y la mediana planteada en H0, es decir
  • 82. • Los valores que resultan de este cálculo (número de signos positivos o negativos) son conceptualmente idénticos al cálculo de la variable aleatoria Ii ya que si Xi es inferior a m0 entonces el signo es negativo y si Xi es superior a m0, entonces el signo es positivo.
  • 83. Supuestos • Asumimos que la variable de interés es continua. Esto significa que teóricamente no deberían producirse diferencias nulas cuando calculamos (es decir, que no deberíamos encontrarnos con valores de Xi y m0 idénticos, en cuyo caso la diferencia sería 0). • No obstante, como en la práctica se producen debido a la precisión limitada de nuestros instrumentos de medida, el procedimiento usual es descartar aquellas observaciones que generen estas diferencias nulas y reducir n en consecuencia.
  • 84. Supuestos • La variable de interés viene medida, como mínimo, en una escala ordinal. • Obsérvese que estamos diferenciando entre la “variable de interés” real (que asumimos continua) y la forma en que la medimos (mediante una escala ordinal como mínimo).
  • 85. Supuestos • Así, por ejemplo, teóricamente podríamos considerar la “belleza” de una obra de arte como una variable continua pero cuando la medimos podemos utilizar simplemente una escala que distinga únicamente tres valores ordenados: 0 (“me parece fea”), 1 (“normal”) y 2 (“me parece bella”), aunque obviamente podríamos utilizar escalas ordinales con un mayor número de categorías.
  • 86. Supuestos • La muestra se ha extraído aleatoriamente de una población con mediana desconocida.
  • 87. Ejemplo 2.3 • Sabiendo que la distribución de los tiempos de reacción (TR) tiene una distribución asimétrica negativa, un investigador decide aplicar un contraste no paramétrico para contrastar la hipótesis de que la mediana en un experimento de TR simple es de 450 ms.
  • 88. Ejemplo 2.3 • Ha sometido a 10 participantes a un experimento de TR simple, calculando para cada uno de ellos la media de TR en 100 ensayos. Los datos obtenidos han sido {X1= 430 , X2= 480 , X3= 510 , X4= 500, X5= 390 , X6= 455, X7= 440 , X8= 470, X9= 475, X10= 465}. El investigador publicará sus resultados en una revista científica que exige un nivel de confianza del 95%.
  • 89. Condiciones y supuestos • El investigador utiliza un diseño de una muestra y decide aplicar una prueba no paramétrica debido a la asimetría de la distribución de los TR y no debido al nivel de medida de la variable dependiente, que en este caso sería de razón.
  • 90. Formulación de las hipótesis • La hipótesis de investigación es que la mediana de los TR en la población es de 450 ms, por lo que la hipótesis alternativa dirá que no es de 450 ms. Se trata, por tanto, de un contraste bilateral:
  • 91. Estadístico de contraste • Para contrastar la hipótesis, transformamos los datos observados en unos y ceros, o en signos positivos y negativos:
  • 92. Los subíndices son una forma de identificar a la puntuación
  • 93. Calculamos la diferencia entre cada puntuación y m0
  • 94. Las diferencias con signo negativo son 1 y las diferencias positivas son 0
  • 95. Calculamos la suma de valores (S o S-)
  • 96. • Con el valor S nos preguntamos por la probabilidad asociada al mismo bajo el supuesto de que H0 es cierta ¿cuál es la probabilidad de obtener 3 valores negativos (o 7 negativos) si m0 = 450? • Veamos la función de probabilidad binomial con n=10 (el número de participantes) y p = 0.5 (la probabilidad de éxito si H0 es cierta).
  • 97.
  • 98. • La probabilidad de obtener un valor del estadístico de contraste S menor o igual al obtenido en nuestra muestra (recordemos que S = 3) viene dado por la suma de los niveles de probabilidad para n entre 0 y 3, es decir
  • 99. • Ahora bien, como estamos trabajando con una H0 bilateral estamos asumiendo a priori que el estadístico S puede ser superior o inferior a la mediana. En el cálculo anterior sólo hemos contemplado las probabilidades de obtener valores de S iguales o inferiores a 3, pero tenemos que contemplar también que S pueda ser igual o superior a n-S, es decir, igual o superior a 10-3=7.
  • 100. • Considerando que la distribución binomial, para p=0.5, es simétrica es fácil ver que para calcular el nivel de probabilidad asociado con el estadístico S = 3 sólo tenemos que multiplicar la p unilateral obtenida por 2.
  • 101. Regla de decisión • La decisión a tomar respecto a la H0 la hacemos comparando este valor de probabilidad calculado (nivel p-crítico porque representa la probabilidad de obtener el S empírico obtenido) con el nivel de significación, o error tipo I, que estemos dispuestos a cometer (0.05 en este ejemplo). 0.34 > 0.05
  • 102. Conclusión • Si utilizamos un alpha de 0.05 podemos observar que 0.05 < 0.34. Esto nos conduce a no rechazar H0. Como ya sabemos, sólo en el caso de que alpha fuese mayor que la probabilidad de obtener un estadístico S igual o más extremo que el calculado (el nivel p- crítico) rechazaríamos H0.
  • 103. Interpretación • Ambos procedimientos conducen a no rechazar H0: no existe evidencia para sospechar que la mediana de los TR sea diferente de 450 ms.
  • 104. • En el caso anterior hemos puesto a prueba el contraste bilateral lo cual se representa gráficamente mediante un conjunto de valores del estadístico S (o el número de signos) compatibles con H0 y otros valores a derecha e izquierda (más extremos) poco probables si H0 es cierta.
  • 105. • Si deseamos hacer un contraste unilateral izquierdo el procedimiento cambia ligeramente en función del cambio de H0 pero es fácil razonar de forma similar a como lo hicimos anteriormente. De esta forma, si planteamos la H0 unilateral izquierda
  • 106.
  • 107. • Estamos proponiendo en H0 (a priori la asumimos cierta) que la mediana poblacional es igual o superior a un valor concreto m0. Por consiguiente, si H0 es cierta esto implica que el grueso de datos, Xi, serán superiores a m0 y la diferencia será mayoritariamente positiva. A su vez, esto implica que se espera un valor muy bajo de signos negativos (muy pocos unos, es decir, una S muy baja si H0 es cierta) :
  • 108. En el ejemplo anterior calcularíamos la probabilidad asociada con una S igual o inferior a la obtenida (como es unilateral, sin multiplicar por dos)
  • 109. • Por el contrario, si tenemos información que nos conduzca a realizar un contraste unilateral derecho:
  • 110.
  • 111. • Debido a la simetría de la distribución binomial, daría igual calcular una probabilidad u otra.
  • 112. • Ya se vio en cursos anteriores que la binomial se aproxima a la normal conforme n aumenta. Por ello cuando el número de elementos muestrales es lo suficientemente elevado, puede utilizarse el estadístico Z como aproximación a la binomial:
  • 113. • No obstante, no hay acuerdo preciso acerca del tamaño muestral que garantiza o recomienda la utilización de Z. Así, Daniel (1990) defiende que n debería ser igual o superior a 12. Sin embargo Siegel y Castellan (1988) recomiendan que la aproximación se utilice cuando n sea mayor que 25.
  • 114. La prueba de Wilcoxon para una muestra • Hemos visto que la prueba de los signos solo hace uso de la información presente en la muestra acerca de si cada valor muestral observado, Xi, es superior o inferior a la mediana (m0). Esto se podía reflejar ya fuese en los signos de las diferencias o utilizando una función indicatriz. En cualquier caso, la prueba de los signos no utiliza la magnitud de esta diferencia entre Xi y m0 en sus cálculos
  • 115. • Ante este problema de falta de sensibilidad del test de los signos, Frank Wilcoxon (1945, 1949) desarrolló un procedimiento que utiliza ambas informaciones: la dirección o signo de la diferencia y la magnitud de esta diferencia, permitiendo poner a prueba hipótesis sobre la mediana. • Además, pone a prueba la hipótesis de que la distribución sea simétrica (que el conjunto de datos superior a m0 es igual al conjunto de datos inferior a m0).
  • 116. Supuestos • La muestra se ha seleccionado al azar de la población que representa. • La variable dependiente medida es de intervalo o de razón. • La distribución poblacional subyacente es simétrica.
  • 117. • El test de Wilcoxon se recomienda especialmente como sustituto de la prueba t cuando se sospeche que el supuesto de normalidad se incumple de forma obvia. • La hipótesis nula bilateral es similar a la formulada para la prueba de los signos:
  • 118. • Si H0 es cierta y recordando que la mediana deja por debajo de sí a la mitad de los datos muestrales, esto se traduce en que la suma de los órdenes de las puntuaciones por encima de la mediana deberá ser aproximadamente igual a la suma de los órdenes de las puntuaciones por debajo de la mediana, es decir, ΣR+ ≈ ΣR-. El incumplimiento de esta desigualdad conducirá al rechazo de H0.
  • 119. Cálculo de los rangos promediados • El rango R (u orden) de una observación Xi se obtiene disponiendo todas las observaciones en orden de la más pequeña a la mayor. A cada observación directa se le asocia su orden, es decir, a la observación más pequeña se le asocia el rango 1, a la siguiente observación el 2 y así sucesivamente. A la mayor observación se le proporciona el rango n.
  • 120. Cálculo de los rangos promediados • Este procedimiento para asignar rangos a las observaciones directas asume que no hay empates, es decir, que no ha dos medidas exactamente iguales. • Esto sólo podría suceder si las mediciones originales se realizasen con una precisión infinita, lo cual no es el caso en las situaciones reales. Las observaciones reales tienen una precisión finita y, por consiguiente, se pueden producir empates.
  • 121. • Podemos pensar en dos estudiantes, Juan y Pedro, a los que se les ha sometido a un experimento de TR y podrían tener un TR medio de 453.5432…ms. y 453.5382…ms. respectivamente. Pero si el cronómetro que se utilice para su medición sólo puede precisar hasta el milisegundo significa que obtendrá para ambos el mismo valor de 453 ms., aunque en realidad tienen diferente puntuación siempre y cuando pudiéramos medirla con una precisión inferior al milisegundo.
  • 122. • Este argumento puede ampliarse a cualquier nivel de precisión que podamos alcanzar con un instrumento de medida real. Es por ello que en la realidad y debido a la precisión finita de nuestros instrumentos de medida tendremos empates. En estos casos los rangos iniciales (1, 2, 3, …, n) se reemplazan por los rangos promediados.
  • 123. • Supongamos que disponemos de las siguientes observaciones de TR: {450, 500, 732, 322, 450}
  • 124. • Si disponemos estas puntuaciones en orden y les asignamos a cada una el número de orden tendríamos
  • 125. • Pero como no tiene sentido proporcionar a una única puntuación directa (450) dos rangos distintos (el 2 y el 3), se les proporciona un único rango (2.5) que es la media entre los rangos otorgados inicialmente.
  • 126. • Y si tuviéramos tres puntuaciones empatadas, el procedimiento sería similar. Por ejemplo, asumamos que las puntuaciones originales hubiesen sido {322, 450, 450, 500, 450}
  • 127. • Los rangos apropiados serían:
  • 128. • El procedimiento que seguimos para calcular el test de Wilcoxon calcula primero la diferencia entre cada puntuación directa Xi y la mediana postulada en H0. De esta forma obtendremos un conjunto de n puntuaciones diferencia El signo de Yi dependerá de que Xi sea mayor (signo positivo) o menor (signo negativo) que m0.
  • 129. Para cada puntuación Yi registraremos también su orden o rango utilizando los siguientes criterios: • Ordenamos los valores absolutos de los Yi, es decir, sin considerar el signo de Yi. Eliminamos cualquier Yi que valga 0 porque coincide con la m0 lo que debería ser imposible según el supuesto de distribución continua subyacente.
  • 130. Para cada puntuación Yi registraremos también su orden o rango utilizando los siguientes criterios: • Cuando hayan valores de Yi que en valor absoluto se encuentren empatados se proporcionará a cada valor empatado el promedio de los órdenes. Se asigna el orden 1 a la puntuación con el valor absoluto más bajo y el rango mayor (n) a la puntuación diferencia con el valor absoluto más alto.
  • 131. • A continuación se suman los valores absolutos de las puntuaciones diferencia que tienen signos positivos para producir una puntuación que denotaremos por ΣR+ (sumatorio de los rangos positivos) y los valores absolutos de las puntuaciones diferencia que tienen signos negativos para producir ΣR- (sumatorio de los rangos negativos).
  • 132. • Si H0 es cierta, es de esperar que los valores ΣR+ y ΣR- sean similares entre sí. • Bajo el supuesto anterior entonces la media y varianza de esta variable son
  • 133. • Ejemplo: • Si disponemos del conjunto de datos {3, 5, 7, 9.5, 12, 15, 22} representados por un diagrama de puntos sobre el eje X.
  • 134. • Si quisiéramos poner a prueba la hipótesis de que la mediana vale 8 en la población de la que se han extraído estos datos (la mediana viene representada por la línea vertical en la situada en X = 8)
  • 136. • Rangos correctos: al calcular la distancia en valor absoluto (es decir, sin considerar el signo) observemos como los rangos se van alternando a derecha e izquierda.
  • 137.
  • 138.
  • 139.
  • 140.
  • 141.
  • 142.
  • 143. • Rangos correctos: • Al calcular la distancia en valor absoluto (es decir, sin considerar el signo) observemos como los rangos se van alternando a derecha e izquierda. Estas distancias en valor absoluto vienen representadas por la longitud de las flechas horizontales. Ahora sí es razonable esperar que la suma de los rangos inferiores a m0 sea aproximadamente igual a la suma de rangos superiores a m0 (siempre y cuando H0 sea cierta).
  • 144.
  • 145. • Observamos que los datos han cambiado . Aunque la situación es cualitativamente similar a la Figura anterior (3 datos a izquierda de m0 y 4 a la derecha) ahora los rangos correctos han cambiado totalmente porque al utilizar la distancia en valor absoluto de cada puntuación a m0 ahora los rangos inferiores quedan todos a mano izquierda de m0 y los rangos superiores a mano derecha.
  • 146.
  • 147. • La pregunta a responder es si la diferencia entre ΣR+ y ΣR- es lo suficientemente grande como para sospechar que H0 no es cierta. Si el valor de ΣR+ es significativamente mayor que el valor de ΣR- nos señala que existe una alta probabilidad de que la muestra se derive de una población con una mediana mayor que el valor planteado en la H0 para la población
  • 148. • Y a la inversa si ΣR+ es significativamente menor que el valor de ΣR-. • Cuando estos valores sean equivalentes ambos tendrán un valor de n(n+1)/4 excepto por desviaciones debidas al azar.
  • 149. • ¿De dónde viene esta media? Anécdota sobre Gauss, el príncipe de los matemáticos
  • 150. • La Tabla del estadístico W de Wilcoxon se encuentra tabulada en función de los valores inferiores que pueda adoptar cualquiera de las sumas de rangos. • Por ello, como estadístico de contraste o discrepancia entre los rangos observados y los que cabría esperar si la H0 fuese verdadera, se adoptará el valor más pequeño de las dos sumas de rangos (ΣR+ y ΣR-) obtenidas en nuestra muestra
  • 151. • A este estadístico (de Wilcoxon) lo representaremos por W. Para poder interpretar este valor es necesario calcular la probabilidad de obtener un valor igual o tan extremo como el obtenido. Si esta probabilidad (nivel p-crítico) es inferior al nivel de significación alpha, rechazaremos H0.
  • 152. Ejemplo 2.4 • Una muestra aleatoria de estudiantes fueron entrevistados para determinar el número real de horas que dedicaban al estudio del examen final de una asignatura concreta. Los resultados fueron {25, 12, 10, 15, 20, 17, 30, 125, 3}
  • 153. • Si estudios anteriores han mostrado que la mediana del número de horas que se estudia es de 15 horas ¿apoya la evidencia esta observación? Trabaje a un alpha de 0.05.
  • 154.
  • 155.
  • 156.
  • 157.
  • 158.
  • 159.
  • 160. Condiciones y supuestos • El investigador utiliza una muestra para realizar un contraste sobre la mediana que no representa un parámetro de una distribución poblacional y aún tratándose de una variable medida, al menos con escala de intervalo, desconoce la distribución de la variable en la población
  • 161. Condiciones y supuestos • Por otra parte, puede verse un aspecto muy interesante an la gráfica de los datos: tenemos un dato muy alejado del resto de datos (un outlier). Esta puede ser otra de las razones por las que se ha adoptado por una técnica no paramétrica (si hubiéramos utilizado un contraste de la media, este valor extremo habría desplazado hacia la derecha la estimación de la media).
  • 162. Formulación de las hipótesis • La hipótesis de investigación es que la mediana de las horas de estudio es de 15 horas. Se trata, por tanto, de un contraste bilateral
  • 163. Estadístico de contraste • Para contrastar la hipótesis, calculamos la diferencia entre cada puntuación y la mediana, sin tener en cuenta el signo (valor absoluto). • Posteriormente ordenamos estas diferencias asignándoles un rango de menor a mayor y de n=1 hasta n=6.
  • 164. Estadístico de contraste • Observemos que tenemos un dato que coincide con la mediana (m0=15) por lo que debemos eliminarlo pasando de tener 9 datos a 8 (n = 8). Además, tenemos dos datos que están a la misma distancia de m0 (10 y 20) por lo que tendremos que utilizar el cálculo de los rangos ponderados para este par de datos.
  • 165. Estadístico de contraste • Además, tenemos solo 3 datos a la izquierda de m0 y 5 a la derecha con los rangos alternando a derecha e izquierda. Intuitivamente no tenemos una base firme para sospechar que H0 sea cierta o falsa. En otros casos, la simple gráfica nos puede dar indicaciones muy útiles.
  • 166.
  • 167.
  • 168.
  • 169. • Los estadísticos valen ΣR- = 11.5 y ΣR+= 24.5. Utilizaremos como estadístico W el valor de ΣR- ya que es el más pequeño de ambos. Luego W = 11.5. • Obsérvese que el signo negativo de ΣR- se ha utilizado simplemente como señal para sumar estos valores pero con signo positivo, es decir, en vez de sumar (-6)+(-3.5)+(-2) sumamos 6+3.5+2 ya que el signo negativo solo es un indicador de que estos rangos van juntos en un único sumatorio.
  • 170. Regla de decisión • Ahora debemos acudir a las tablas de Wilcoxon para un contraste bilateral con para extraer los valores críticos. Para n = 8 en un contraste bilateral el valor crítico es Wc = 3.
  • 171.
  • 172. Conclusión • Debido a que la H0 solo puede rechazarse si W≤3 y hemos obtenido una W de 11.5, concluimos que a partir de los datos observados en la muestra, no hay evidencia para rechazar la H0.
  • 173. Interpretación • No hay evidencia para rechazar la hipótesis de que el número real de horas semanales que los estudiantes emplean para repasar el examen final es de 15.
  • 174. Contraste sobre la proporción poblacional • La proporción P, o frecuencia relativa de aparición de una observación en un conjunto de datos, es el cociente entre el número de veces que aparece esa observación y el número total de observaciones.
  • 175. Contraste sobre la proporción poblacional • En el tema anterior se ha visto que la distribución muestral de la proporción es una distribución binomial. • Sabemos que la distribución binomial se aproxima a la normal cuando el tamaño de la muestra es grande (n > 25 o n x p > 5 ).
  • 176. Contraste sobre la proporción poblacional • En esta distribución muestral, la media y desviación típica (o error típico de la proporción) valen:
  • 177. DM de la proporción Variable Variable X dicotómica = Variable dicotómica MUESTRA POBLACIÓN
  • 178. Contraste sobre la proporción poblacional (Pi) • El intervalo de confianza para la proporción poblacional a partir de la proporción observada en una muestra se obtiene sumando a la proporción observada en la muestra el error muestral o error máximo de estimación, que vale O
  • 180.
  • 181. • Igual que razonábamos en el caso de la media, para contrastar una hipótesis referida a un valor hipotéticamente establecido como proporción poblacional, podemos determinar este intervalo con un determinado nivel de confianza y comprobar si el valor planteado en la hipótesis nula se encuentra incluido o no en el intervalo.
  • 182. • De forma similar se puede determinar el estadístico de contraste para cuantificar la discrepancia entre el valor observado en la muestra y el planteado en la hipótesis nula. Para el caso de la proporción y sabiendo que la distribución muestral del estadístico, p, se aproxima a la normal cuando las muestras son grandes (n>25 o > 5), este estadístico es:
  • 183. • Si la hipótesis nula es falsa esta discrepancia debe superar el valor crítico de la distribución muestral Z (la distribución normal tipificada). De igual forma, el nivel p-crítico asociado a esta discrepancia debe ser menor que el nivel de significación, alpha , para poder rechazar la H0.
  • 184. Ejemplo 2.5 • Un investigador de estudios de mercado cree que más del 20% de los adolescentes cambian de móvil cada año. Con esta finalidad realiza una encuesta sobre una muestra de 150 adolescentes observando que 39 de ellos afirman haber cambiado de móvil en el último año. • Con un nivel de confianza del 99%, ¿podemos admitir la hipótesis del investigador?
  • 185. Condiciones y supuestos • El estudio utiliza un diseño de una muestra de 150 adolescentes en la que la variable “cambiar de móvil” es cualitativa dicotómica sí/no a nivel de la unidad de observación (en este caso, el participante).
  • 186. Contraste de la proporción DM de la proporción Variable Cambiar de dicotómica móvil (Si/No) = N = 150 Variable Si =39 dicotómica MUESTRA POBLACIÓN
  • 187. Condiciones y supuestos • Cuando contabilizamos en cada muestra el número de participantes que contestan sí o no, entonces esta variable tiene una distribución binomial que, en este caso, se aproxima a la normal por tratarse de una muestra grande. El investigador quiere demostrar que el porcentaje de adolescentes que cambia de móvil cada año es superior al 20%.
  • 188. Planteamiento de las hipótesis • Se trata de un contraste unilateral ya que si la hipótesis alternativa dice que “la proporción supera el 0,20”, la hipótesis nula dice que “la proporción es igual o no supera el 0,20”.
  • 189. • A partir de los datos de la muestra la proporción de adolescentes que cambian de móvil es del 26% (0,26).
  • 191. Regla de decisión • Con un nivel de confianza del 99% y en un contraste unilateral, el valor crítico para rechazar la hipótesis nula es 2,33.
  • 192.
  • 193.
  • 194.
  • 195. • El nivel p-crítico asociado al estadístico de contraste obtenido es 0,0329 que es una probabilidad mayor que el nivel de significación establecido a priori. • Debe buscarse en las tablas de la distribución normal la probabilidad de obtener puntuaciones Z mayores que 1, 84. P(Z≥1,84)=1-P(Z≤1,84)= 1-0,9671=0,0329
  • 196.
  • 197. Conclusión • Como el estadístico de contraste (discrepancia entre datos observados y datos teóricos) no supera la máxima diferencia que puede esperarse por simple azar (el valor crítico), no tenemos evidencia suficiente para rechazar la hipótesis nula. • De otra forma, el nivel p-crítico= 0,0329 es mayor que el nivel de significación por lo que no podemos rechazar la hipótesis nula.
  • 198. Interpretación • A la luz de los datos obtenidos por el investigador no hay evidencia suficiente para asumir que más del 20% de los adolescentes cambian de móvil cada año.
  • 199. Contraste de hipótesis sobre la varianza poblacional • En el tema anterior vimos que si de una población donde la variable X se distribuye normalmente con media mu y varianza sigma se extraen todas las posibles muestras del mismo tipo y tamaño en las que podemos calcular sus varianzas, entonces se puede demostrar que la variable aleatoria:
  • 200. sigue una distribución chi-cuadrado con n-1 grados de libertad.
  • 201. • Si en vez de utilizar la varianza utilizamos la cuasi-varianza muestral: • que también se distribuye según chi-cuadrado con n-1 grados de libertad.
  • 202. • También vimos que el intervalo de confianza para la varianza poblacional delimita los valores entre los que se encontrará la varianza poblacional, con una probabilidad de 1-alpha.
  • 203. Estadístico de contraste • Adopta la siguiente expresión: Utilizando la Utilizando la varianza muestral cuasivarianza muestral
  • 207. Ejemplo 2.6 • El manual de un test para detectar niños con problemas de aprendizaje afirma que la varianza de las puntuaciones del test disminuye con la edad, tomando el valor de 18,1 para los niños promedio de 5 años.
  • 208. Ejemplo 2.6 • Un psicólogo infantil considera que actualmente esta variabilidad ha aumentado y para probarlo, utiliza una muestra de 25 niños de 5 años a los que aplica el test obteniendo una desviación típica sesgada de 4,9 puntos. Trabajando con un nivel de significación de 0,01, contraste la hipótesis del investigador.
  • 209. Contraste de la varianza DM de la varianza X X= Puntuaciones en el test N = 25 MUESTRA POBLACIÓN
  • 210. Contraste de la varianza DM de la varianza X X= N = 25 Puntuaciones en el test MUESTRA POBLACIÓN
  • 211. Condiciones y supuestos • El estudio utiliza un diseño de una muestra aleatoria de 25 niños a los que se les pasa un test. Asumimos que estas puntuaciones se miden, al menos con escala de intervalo y se distribuyen normalmente en la población con varianza 18,1. • En la muestra se obtiene una desviación típica sesgada de 4,9.
  • 212. Contraste de la varianza DM de la varianza X X= N = 25 Puntuaciones en el test MUESTRA POBLACIÓN
  • 213. Formulación de hipótesis • El investigador quiere probar que la varianza del test en los niños de 5 años es ahora mayor de 18,1 como afirma el manual. Esta es la hipótesis alternativa. • Se trata por tanto de un contraste unilateral derecho.
  • 214. Estadístico de contraste • Conociendo la cuasi-varianza de la muestra, el estadístico de contraste es:
  • 215. • El nivel p-crítico de 33.16 hay que buscarlo en la tabla de la distribución chi-cuadrado con 24 gl, y por aproximación es: p = 0,10
  • 216. La puntuación Chi-cuadrado = 33.16 deja por encima de sí el 0.90 de la distribución
  • 217.
  • 218. El valor crítico para alpha = 0.01 vale 42.97
  • 219. Regla de decisión • En la distribución chi-cuadrado con 24 grados de libertad y un nivel de confianza del 99%, el valor crítico para rechazar la hipótesis nula es aproximadamente 43. • Rechazaremos la hipótesis nula si el estadístico de contraste es mayor que el valor crítico de 43 o si el nivel p-crítico es menor que el nivel de significación de 0,01.
  • 220.
  • 221. Interpretación • No tenemos evidencia suficiente para afirmar que la variabilidad de las puntuaciones obtenidas por los niños de 5 años en el test es ahora mayor de lo que afirma el manual del test para detectar problemas de aprendizaje.
  • 222. Conclusión • Como el estadístico de contraste obtenido no supera el valor crítico, debemos concluir que no tenemos evidencia suficiente para rechazar la hipótesis nula. • Igualmente, como el nivel p-crítico (p=0.10) es mayor que el nivel de significación (0.01), debemos informar que no tenemos evidencia suficiente para rechazar la hipótesis nula.
  • 223. Cálculo de la Potencia del contraste • Recordemos los tipos de error: Rechazar una hipótesis nula que es verdadera (error tipo I) y no rechazar una hipótesis nula que es falsa (error tipo II). • Vamos a ver, apoyándonos en el desarrollo de un ejemplo, el procedimiento para calcular la potencia de un contraste paramétrico referido a la media poblacional en el diseño de una muestra.
  • 224. Ejemplo 2.7 • Supongamos que la duración media de una lámpara de bajo consumo de una determinada marca es de 1000 horas con un desviación estándar de 220 horas. La empresa que las fabrica introduce un nuevo proceso de fabricación y afirma que la vida media de las nuevas es superior a las antiguas.
  • 225. Ejemplo 2.7 • Vamos a suponer que como hipótesis alternativa única se plantea un promedio de duración de 1060 horas. Tomando un nivel de significación del 5%, determinar el error tipo II y la potencia de la prueba, si el estudio se realizara con un muestra de 100 lámparas.
  • 226. Contraste de la media DM de la media X N = 100 X = Duración de lás lámparas MUESTRA POBLACIÓN
  • 228. Ejemplo 2.7 • Una vez establecido el error tipo I (0,05) y que se corresponde con una puntuación estandarizada de 1,64, se trata de determinar a qué valor corresponde esta puntuación Z en la distribución muestral de las duraciones medias de las lámparas.
  • 229.
  • 232. • Luego sabemos que una duración de 1036 horas deja por encima de sí el 0.05 de todos los valores posibles si H0 es cierta. • Para determinar el error tipo II primero es preciso saber a puntuación estandarizada se corresponde este valor (1036) respecto del valor planteado como hipótesis alternativa, es decir, desde
  • 233.
  • 234. • La probabilidad de obtener un valor de Z igual o menor de -1,09 es 0,1379, que es la probabilidad de cometer un error tipo II.
  • 235.
  • 236.
  • 237. • Si se rechazara la hipótesis nula de que el promedio de duración es de 1000 horas pero en realidad esta hipótesis fuera verdadera (es decir, el nuevo proceso de fabricación no alarga la duración) entonces estaríamos cometiendo un error (tipo I). Esto se producirá el 5 % de las veces en que realizáramos este experimento y H0 fuese cierta.
  • 238. • Por el contrario, si se acepta la hipótesis nula, pero la alternativa es la verdadera, estaríamos cometiendo un error tipo II. Siendo H0, la probabilidad de cometer este error (tipo II) es del 13,79%. • Por tanto, la potencia de la prueba es del 86,21% (1 – 0,1379 = 0,8621).
  • 239. • En este ejemplo hemos visto que para calcular la potencia de un contraste se necesita que la hipótesis nula y la alternativa sean simples, es decir, que establezcan un único valor como parámetro poblacional. • Cuando la hipótesis alternativa es compuesta, es decir, plantea más de un valor como media poblacional, v.g.,
  • 240. Entonces, la potencia del contraste, o probabilidad de rechazar una hipótesis nula que en realidad es falsa, varía en función de dos factores: • la distancia entre el valor de la hipótesis nula y la hipótesis alternativa y • el tamaño muestral (n).
  • 241. • De este modo y para un concreto valor del error tipo I, se pueden confeccionar lo que se denomina curvas de potencia, las cuales permiten fácilmente localizar la potencia de un contraste según sea el valor que puede tomar H1 y el tamaño de la muestra.
  • 242.
  • 243. Nivel p-crítico y errores en los contrastes • En la prueba clásica de contraste que hemos explicado, tanto en los paramétricos como no paramétricos, es preciso establecer el error tipo I (nivel de “alfa”) antes de realizar el contraste, de modo que este valor no influya en la decisión final que se toma..
  • 244. Nivel p-crítico y errores en los contrastes • Este error es, pues, el máximo riesgo que estamos dispuestos a admitir al tomar una decisión. No obstante, establecer previamente un nivel de error tipo I, presenta algún inconveniente que puede ser decisivo en la decisión que se tome.
  • 245. Nivel p-crítico y errores en los contrastes • La decisión que se tome sobre H0 puede depender del nivel de significación que se establezca, y se puede dar la circunstancia de que sea rechazada con un nivel del 5% y aceptada con uno del 1%.
  • 246. Nivel p-crítico y errores en los contrastes • Aunque hay un acuerdo en el ámbito científico acerca de que debe ser un valor pequeño, es más difícil determinar cuán pequeño debe ser, ya que en parte dependerá de algunos factores como las creencias previas sobre los procesos de toma de decisión que se han realizado anteriormente sobre la misma o parecida cuestión, y también sobre las consecuencias que se deriven al tomar una decisión errónea (errores tipo I y II).
  • 247. Nivel p-crítico y errores en los contrastes • Debido a estos inconvenientes, en el análisis de datos se introdujo el denominado nivel p- crítico (que se designa como p) y que se define como el nivel de significación más pequeño al que una hipótesis puede ser rechazada con la medida de discrepancia obtenida. • Es decir, el nivel p-crítico es la probabilidad asociada a la medida de discrepancia.
  • 248. • Al utilizar como criterio para la decisión el nivel crítico no hay que establecer necesaria y previamente un nivel de significación, y ésta se toma en función del valor de p. Si p es pequeño se rechazará H0, y si es grande se aceptará H0
  • 249. • Obviamente, persiste el problema de determinar qué es grande y qué pequeño. Entonces para tomar una decisión hay que recurrir al criterio del grado de cercanía o alejamiento de p a, por ejemplo, el valor 0,05. Si es claramente inferior, se rechaza H0, si es claramente superior se acepta H0, y si está en torno a ese valor, se vuelve a tomar nueva evidencia muestral y se repite el contraste.
  • 250. • No obstante, el empleo del nivel crítico como criterio de decisión no está exento de problemas, ya que, al igual que las medidas de discrepancia observada entre H0 y la evidencia muestral, depende del tamaño de la muestra utilizada, y es por ello que, desde la década de los ochenta del siglo pasado se han explorado nuevas medidas independientes del tamaño muestral, que explicamos más adelante.
  • 251. • What do you call a tea party with more than 30 people? • A Z party!!!
  • 252. • Why did the statistician take Viagra? • Since his sample was large, he did not want to be rejected with a small p-value and be declared practically nonsignificant!!
  • 253. • What is a triple-blinded, completely randomized case-control clinical drug trial? • One in which the patients do not know which drug treatment they are receiving, the nurses do not know which drug treatment they are administering, and the physicians conducting the study do not know what they are doing!!!
  • 254.