Compara medias

Según la Posición
en la Investigación
.

Parámetro
Es un número que resume la cantidad de
datos que pueden derivarse del estudio de
una variable estadística. El cálculo de este
número está bien definido, usualmente
mediante una fórmula aritmética obtenida
a partir de datos de la población

Inferencia Estadística

Se llaman así porque su cálculo implica una estimación de
los parámetros de la población con base en muestras
estadísticas. Mientras más grande sea la muestra más
exacta será la estimación, mientras más pequeña, más
distorsionada será la media de las muestras por los valores
raros extremos.

•Más poder de eficiencia.
•Menos posibilidad de errores.
• Muestras obtenidas aleatoriamente
• Distribución normal de las observaciones
• Existe un parámetro de interés que buscamos estimar

1. Independencia de las observaciones excepto datos apareados.
2. Las observaciones para la variable dependiente se han obtenido de
manera aleatoria de una población con distribución normal.
3. La variable dependiente es medida al menos en una escala de
intervalo.
4. Se recomienda un tamaño por muestra mínimo de 30.
5. Los datos son obtenidos de poblaciones que tienen varianzas
iguales (una varianza no debe ser el doble o mayor que la otra).
6. Habitualmente las hipótesis se hacen sobre valores numéricos,
especialmente el promedio de una población (μ), como ejemplo:
Ho: μ1 = μ2
H1: μ1 ≠ μ2


Son procedimientos estadísticos para prueba de hipótesis que
no requieren de la suposición de la normalidad de la población
de la cual fue extraída la muestra y se pueden aplicar a datos de
tipo cuantitativo y cualitativo.
1. Determinación sencilla. Mediante fórmulas simples de combinación.
2. Fáciles de aplicar.
3. Rápidas de aplicar. Cuando las muestras son pequeñas.
4. Tipo de medición requerida. Se pueden utilizar con datos ordinales o
nominales.
5. Tamaño de la muestra. Cuando la muestra es < 10 son sencillas, rápidas y
sólo un poco menos eficaces. Conforme aumenta el tamaño de la muestra se
hacen más laboriosas y tardadas, y menos efectivas.

DECISIONES AL SELECCIONAR LA
MUESTRA
Se quiere saber cómo se
comporta una cierta
característica en un
Universo particular
Hacer
un Censo
Sí

El Universo
está bien
definido
?

NO
Definir
El
Universo

Sí

Es posible
observar todo el
Universo ?

NO
Tomar
una Muestra
No representativa

NO
Observar
una Muestra

Se quiere
inferir la medición
al Universo

Las
observaciones
pueden
atribuirse a los
miembros del
Universo

Las
observaciones
solo pueden
atribuirse a la
muestra, NO a
los miembros
del Universo

?

Sí

Tomar
una Muestra
Representativa

Las
observaciones
pueden
atribuirse a los
miembros del
Universo


INDEPENDIENTE
Una muestra es independiente cuando los datos de la misma no se pueden
relacionar con los de otra. Se trata entonces de dos conjuntos de datos
independientes entre sí y cuyos tamaños de muestra pueden ser diferentes.
DEPENDIENTE
Una muestra es dependiente cuando existen dos conjuntos de datos
relacionados por la misma muestra, es decir, existe un antes y un después.
Las observaciones se realizan sobre las mismas unidades muestrales.
Tips
– Datos de dos poblaciones distintas. DI/DnA
– Datos de la misma persona en dos momentos diferentes. DD/DA


Se aplica la distribución normal, utilizando el estadístico Z o lo que es
comúnmente llamado como Prueba Z.

Significación de la Media
 Se establece la diferencia entre una media muestral y una media
poblacional hipotética conocida.
 Se supone conocida la varianza.

Estadístico de prueba

  0
Z

n


Rechace la
hipótesis nula

Rechace la
hipótesis nula

α

α
 Z  

z

0

0

Hipótesis alternativa µ < µ0

z

Z  

Hipótesis alternativa µ > µ0
Rechace la
hipótesis nula

Rechace la
hipótesis nula

α/2

α/2

Z 

 2

0

z

Z

 2

Hipótesis alternativa µ ≠ µ0

• Un investigador en el campo de la educación conoce que la cantidad de

estudiantes que aprueban un determinado curso es de 260 con una
desviación típica de 10. Para comprobar la validez de esta hipótesis, se
tomo una muestra al azar de 36 observaciones obteniendo que el promedio
de aprobados fuera de 267. ¿Está este valor muestral obtenido, de acuerdo
con la hipótesis al 5% de significancia?

Paso 1: plantear las hipótesis
H0: µ = µ0
H1: µ ≠ µ0
Paso 2: Se establece el nivel de significancia α = 0,05

Paso 3: Estadístico de prueba

Z

7
  0 267  260
=
=
= 4,19

10
1,67
n
36

Paso 4: Se establece la región de aceptación y la de rechazo o región
crítica para una prueba de dos extremos. (Como se plantearon las
hipótesis H0: µ = µ0 H1: µ ≠ µ0 se establece 2 colas)
Región de
aceptación

Región Crítica:

Z  Z  
2
se rechaza H0

Z  Z
0,025


 1 
 2

0,025

0,95

Se buscan los valores de

Z  
2

Z


 1 
 2

Z   y
2

Z


 1 
 2

En la tabla Z para el nivel de significancia dado
α = 0,05
Por lo tanto la región crítica es:
Z  1,96

Z  1,96

Paso 5: Decisión y conclusiones.

Como Z = 4,19 > 1,96.
Se rechaza la hipótesis H0
(no existen diferencias significativas entre la media muestral y la
poblacional)

Por lo tanto se toma la H1
(existe diferencia significativa)

Se recomienda no considerar en estudios futuros el
promedio de aprobados anualmente en el curso, como de
260 estudiantes.

Pruebas Estadísticas para la comparación de Medias

TEST T PARA DIFERENCIA PAR
TEST T PARA MUESTRAS INDEPENDIENTES

Las pruebas t desapareadas o de muestras
independientes, se utilizan cuando se obtienen dos
grupos de muestras aleatorias, independientes e
idénticamente distribuidas a partir de las dos
poblaciones a ser comparadas.

Supóngase que estamos evaluando el efecto de un tratamiento
médico, y reclutamos a 100 sujetos para el estudio. Luego elegimos
aleatoriamente 50 sujetos para el grupo en tratamiento y 50 sujetos
para el grupo de control. En este caso, obtenemos dos muestras
independientes y podríamos utilizar la forma desapareada de la
prueba t. La elección aleatoria no es esencial en este caso, si
contactamos a 100 personas por teléfono y obtenemos la edad y
género de cada una, y luego se utiliza una prueba t bimuestral para
ver en que forma la media de edades difiere por género, esto también
sería una prueba t de muestras independientes, a pesar de que los
datos son observacionales.

Las pruebas t de muestras dependientes o apareadas,
consisten típicamente en una muestra de pares de valores
con similares unidades estadísticas, o un grupo de
unidades que han sido evaluadas en dos ocasiones
diferentes (una prueba t de mediciones repetitivas).
Cuando los sujetos sean evaluados antes y después de
un tratamiento.
Ejemplo: Prueba Diagnóstica aplicada al inicio de la
clase.


No
paramétricas

Para datos
apareados

Equivalente
a T de
STUDENT

Muestra
pequeñas,
Mayor a 6
Menores a
25


Trabaja con
datos
ordinales
Establece
diferencias
de
magnitudes
(+ y -)

Dos
muestras
apareadas
Establece
Diferencias

Muestras,
grandes
Mayores a
25 , se
intenta lograr
distribución
Normal

Prueba de U de
Mann Whitney

Pruebas No
Paramétricas

Permiten analizar datos en
escala nominal u ordinal a
pesar de que no se conozcan
los
parámetros
de
una
población.

Utiliza el criterio de que no plantea hipótesis
sobre parámetros o el de que analiza datos
obtenidos con una escala de medida débil
(datos que aun cuando están cuantificados se
aprovechan sus características nominales u
ordinales).

Se
habla
de
distribucion libre al
aplicar estas pruebas
porque no establece
supuestos
exigentes
sobre las poblaciones
originales sobre donde
se muestrea.

Prueba de Mann Whitney
Se usa cuando
Es, de hecho, la
Cuyos datos han
se quiere
versión no
sido medidos al
comparar dos
paramétrica de
menos en una
poblaciones
la
usando muestras escala de nivel habitual prueba
ordinal.
t de Student.
independientes

Prueba de U de Mann Whitney
• Con ella se calcula el llamado estadístico
U, cuya distribución para muestras con
más de 20 observaciones se aproxima
bastante bien a la distribución normal

Pasos para Efectuar la Prueba
• Para efectuar la prueba, se combinan dos
muestras en un arreglo ordenado,
identificando los valores muestrales, de
acuerdo con el grupo muestral al que
pertenecen.

• Luego se determinar el tamaño de las
muestras (n1 y n2). Si n1 y n2 son
menores que 20, se consideran
muestras pequeñas, pero si son
mayores que 20, se consideran
muestras grandes.

• En caso de muestras grandes, calcular el
valor Z, pues en estas condiciones se
distribuye normalmente.

• Despues se ordenan los valores de menor
a mayor, asignando el rango uno al valor
mas pequeño.
• Cuando
se
encuentran
valores
iguales(ligas o empates ), se le asigna el
promedio de sus rangos

• Se calculan los valores de U1 y U2, de
modo que se elija el más pequeño para
comparar con los críticos de U MannWhitney de la tabla de probabilidades
asociadas con valores pequeños como los
de U en la prueba de Mann-Whitney

• Luego se designa mediante U a la
estadística que se calcula para realizar
esta prueba y el cual se basa en el
numero de veces que un puntaje de un
grupo antecede aun puntaje de otro grupo,
si hay dos grupos.

• Y por ultimo decidir si se acepta o se
rechaza la Ho

No obstante es mas fácil basarse en la suma de rangos de
cualquiera de las dos muestras aleatorias mediante las
siguientes formulas:

U1 y U2 = valores estadísticos de U MannWhitney.
n1 = tamaño de la muestra del grupo 1.
n2 = tamaño de la muestra del grupo 2.
R1 = sumatoria de los rangos del grupo 1.
R2 = sumatoria de los rangos del grupo 2.

Ejemplos Muestras Pequeñas
• Un experimentador utiliza dos métodos para enseñar a leer a
un grupo de 10 niños de 6 años, quienes ingresan por
primera vez a la escuela. El experimentador quiere demostrar
que el procedimiento ideado por él es más efectivo que el
tradicional; para ello, mide el desempeño en la lectura en
función de la fluidez, comprensión, análisis y síntesis. El plan
experimental preliminar consiste en elegir al azar tanto una
muestra de 10 niños como el método por utilizar.

Hipótesis de Trabajo
• Hipótesis alterna (Ha). Las calificaciones de
ejecución de lectura, según el método de
enseñanza del experimentador son más altas y
diferentes que las observadas en el método
tradicional.
• Hipótesis nula (Ho). Las diferencias observadas
entre las calificaciones de ejecución de lectura
mediante los dos métodos se deben al azar.

• Nivel de significación.
Para todo valor de probabilidad igual o
menor que p = 0.05, se acepta Ha y se
rechaza Ho.
• Zona de rechazo.
Para todo valor de probabilidad mayor que
0.05, se acepta Ho y se rechaza Ha.

Dos métodos diferentes
aplicados en dos grupos de
niños.

• Aplicación de la prueba estadística.
De acuerdo con los paso, las
observaciones se deben ordenar en
rangos del menor al mayor.
• Rangos de lectura de la tabla anterior.

• De los dos valores de U calculados, se elige el
más pequeño (4) y se comparan con los valores
críticos de U Mann-Whitney
• En caso de que el valor de U calculado no se
localice en las tablas correspondientes, se
transformará en la fórmula siguiente
U = n1n2 - U'
• En esta fórmula, U' corresponde al valor más
alto.

Decisión.
A la probabilidad del valor U de MannWhitney,
calculado
anteriormente,
corresponde 0.048, el cual es más
pequeño que el nivel de significancia; por
lo tanto, se acepta Ha y se rechaza Ho.

Interpretación
• Entre las calificaciones de la ejecución de lectura
mediante los dos métodos de enseñanza existe una
diferencia significativa a un nivel de probabilidad de
error menor que 0.05; es decir, aun cuando las
muestras son pequeñas, las calificaciones más altas
mediante el método diseñado por el experimentador
señalan más efectividad, con la probabilidad de
equivocarse de 0.048 para aceptarlo.


Es lo que se conoce como análisis de a Varianza, este
procedimiento es para mas de dos (2) pruebas es decir realiza una
comparación de medias en Variable cuantitativas; se usa para
contrastar la Hipótesis de que varias medias son iguales.

•Analizar una respuesta cuantitativa
•Condiciones experimentales identificadas
•Posibilidad de crear subconjuntos


Es un método no paramétrico para probar si un
grupo de datos proviene de la misma población,
intuitivamente idéntico al anova. Es el método
mas adecuado para comparar poblaciones
cuyas distribuciones no son normales,
permitiendo comparar mas de dos muestras.

Esta prueba se emplea como sustituta del
análisis de varianza ya que no supone ni la
normalidad de la población ni la homogeneidad
de la varianza como la ANOVA


No hace predicción alguna sobre las medias
de la población, sólo afirma que cuando
menos una de las distribuciones
poblaciones es diferente de algunas de las
otras distribuciones poblacionales

Por lo que la hipótesis nula afirma que las
muestras son aleatorias, extraídas de las
mismas o idénticas distribuciones
poblaciones


Esta prueba utiliza rango muestrales de
tres o más poblaciones independientes

Cada muestra tiene al menos cinco
observaciones

Si los rangos se distribuyen de una
manera equitativa entre los grupos
muestrales, entonces H debe ser un
número relativamente pequeño por lo
que no se rechazará la hipótesis nula

Compara medias

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Compara medias

Similar a Compara medias (20)

Último

Último (20)

Compara medias