3. Pruebas de homogeneidad
Estudian si dos o más muestras que se diferencian
en el valor de una característica proceden de
poblaciones donde los parámetros que las definen
son iguales.
Valoran si hay diferencias entre
medias,varianzas,proporciones, etc.
• Pruebas de homogeneidad de dos medias
• Pruebas de homogeneidad de dos
proporciones
4. Prueba de homogeneidad de dos medias
2 Muestras
1: N1, x1
S 21
2: N2, x2
S 22
¿Pertenecen
a2
poblaciones
de igual
media?
• Se desea contrastar las hipótesis:
– Ho= µ1 = µ2 (µ1 - µ2 = 0)
– H1= (µ1 ≠ µ2 )
2 Poblaciones
1: µ1σ1
2: µ2 σ2
5. QUE ES LA PRUEBA T DE STUDENT?
La t de student, es una prueba práctica, bastante
poderosa ampliamente utilizada en las ciencias del
comportamiento.
Esta prueba es muy similar a la prueba Z y la
diferencia radica en que Z utiliza la una desviación
poblacional y la prueba t en cambio utiliza una
desviación estándar muestra
6. FORMULAS
USO:
x−µ
Zobt =
σ N
x−µ
tobt =
δ N
1. Probar hipótesis en experimentos con una sola
muestra.
2. Estimar la media de la población al construir
intervalos de confianza.
3. Probar la significancia de la r de Pearson.
7. • PROBAR HIPOTESIS EN EXPERIMENTOS CON UNA
SOLA MUESTRA.
La prueba t es adecuada cuando:
•
Se conoce la media poblacional de la Ho y se desconoce
la σ
x−µ
tobt =
δ N
8. La distribución t, es una familia de curvas que varían
con los grados de libertad asociados al cálculo de t.
Existe N-1 grados de libertad asociados con la prueba t
para una muestra.
Las curvas de la distribución muestral son simétricas,
con forma de campana y media = 0.
La prueba t es adecuada cuando la distribución
x es normal. Para que la distribución
muestral de
muestral de x sea normal, la población de datos
debe poseer una distribución normal, o bien N<30
9.
Intervalos de confianza: Rango de valores que
probablemente, contengan al valor poblacional.
Límites de confianza: Valores que delimitan al
intervalo de confianza.
Significacia de la r de Pearson: Nos permite examinar
el valor de la muestra para ver si existe una
correlación de la población.
11. Tipos de pruebas t
Prueba t para una muestra: prueba si la media de la muestra de una
variable difiere significativamente de la media conocida de la
población
Prueba t no pareada o independiente: prueba si las medias estimadas
de la población por 2 muestras independientes difieren
significativamente (grupo de hombres y grupo de mujeres)
Prueba t pareada: prueba si la media estimada de la población por
muestras dependientes difieren significativamente (media de pre y
post-tratamiento para el mismo grupo de pacientes.
12.
La fórmula para grupos independientes
x1 - x 2
t=
S21/N1 + S22/N2
Con un nº de grados de
libertad de N1+N2-2
Nº de datos que pueden
variar independientemente
para una determinada
operación
* Si t≤ tα,N se acepta la hipótesis nula
* Si t > tα,N se rechaza la hipótesis nula.
13.
Pruebas de independencia
Ver si en un estudio de 2 ó más variables, éstas
relacionadas
Coeficiente de correlación de Pearson (r)
Designa la magnitud de la relación entre 2 variables
14. Sus valores absolutos oscilan entre 0 y 1.
La correlación es perfecta positiva si su valor es +1
La correlación es perfecta negativa si su valor es -1
La relación entre 2 variables x e y es positiva cuando al
aumentar una, aumenta la otra y negativa cuando al
disminuir una disminuye la otra
16.
Es usada para descubrir el efecto principal y los efectos
de interacción de variables categóricas independientes
(llamados factores) sobre un intervalo de la variable
dependiente
17.
Tipos de anova
Anova de una forma prueba diferencias en un intervalo
de la variable dependiente entre dos, tres o más
grupos formados por las categorías de una variable
categórica independiente.
18.
Uno de las pruebas mas importantes que utiliza la
varianza en la F, que básicamente es la razón de dos
estimaciones independientes de la varianza de la misma
poblacion.
Varian con los grados de libertad.
19.
La distribución F:
Está sesgada positivamente
No tiene valores negativos
Posee una mediana aproximadamente igual a 1 según la
n de las estimaciones.
20.
La técnica del análisis de varianza se utiliza con los
experimentos con más de dos grupos independientes.
Esta técnica permite comparar las medias de los
distintos grupos en una sola evaluación y asi evita el
aumento de probabilidad de cometer un error de tipo I.
21. – Se compara con la Ft de la tabla, para (N-1) gº de
libertad del numerador y denominador:
– Si F < Ft: no existen diferencias en las varianzas
Cuando hay igualdad de varianzas: única
estimación de la varianza poblacional en la
diferencia de medias.
24.
Una de las técnicas de inferencia de uso más frecuente,
para el análisis de datos nominales es la prueba no
paramétrica llamada Ji – cuadrado. Es adecuada para el
análisis de datos consistentes en frecuencias que
provienen de una o dos variables.
25.
Pruebas de homogeneidad de 2 proporciones
(Prueba de χ2)
χ2 : Estadístico que indica, en general, la discrepancia
entre ciertas frecuencias observadas (empíricas) de
una variable cualitativa dividida en k categorías y la
frecuencia teórica.
26.
La Ji cuadrada mide, es esencia, la discrepancia entre la
frecuencia observada y la frecuencia esperada, para
cada una de las celdas en una tabla de doble entrada.
27. REQUERIMIENTOS
Datos deberán estar en forma de frecuencias
El total número de observaciones deberá exceder 20
Frecuencia esperada en una categoría o en cualquier celda
deberá ser >5 (cuando un de las celdas tiene <5 observados
se usa corrección de Yates o si tiene <5 de esperados se usa
exacta de Fisher)
El grupo de comparación deberá ser aproximadamente igual.
28.
Usada para probar la fuerza de asociación entre dos
variables cualitativas
Usada para datos categóricos
29. •
Se compara el valor de χ2 obtenido con el
teórico que proporciona la tabla de su función
de probabilidad:
– Si χ20> χ2t , se rechaza Ho
– Si χ20 ≤ χ2t , se acepta Ho.
•
Se obtiene el estadístico χ2
30.
El valor de χ2 teórica depende de:
Nivel de significación α
Grados de libertad (k-1)(y-1)
k = nº de muestras
y = nº de categorías
Al trabajar con una tabla de contingencia tetracórica de
2 X 2 el nº de gº de libertad es 1
32. Como seleccionar la prueba estadística
adecuada
Tipo de variables
Cuantitativa (tensión arterial)
Cualitativa (género)
Tipos de preguntas de investigación
Asociación
Comparación
Factor de riesgo
37. N ensayos
2 posibles resultados
DISTRIBUCION
BINOMIAL
Distribución de
probabilidad
Mutuamente excluyentes
Son independientes entre sí
C/resultado posible es la misma
38. (P+Q)N
DESARROLLO
BINOMIAL
De donde:
P es la probabilidad de uno de
los dos resultados posibles en
un ensayo
Q es la probabilidad del otro
resultado posible
N es el número de ensayos
39. Sustituto del desarrollo binomial.
USO DE
TABLA
BINOMIAL
Proporciona la distribución binomial
para valores de N ( número de
ensayo) hasta 20 en la primera
columna y los resultados posibles
están en la segunda columna, bajo
el encabezado “Número de eventos
P y Q.
El resto de columnas contienen
datos de probabilidad para diversos
valores de P o Q
40. Ejemplo:
USO DE
TABLA
BINOMIAL
Si lanzo tres monedas que no están
cargadas, una sola vez, ¿Cuál es la
probabilidad de obtener 2 caras y
una cruz? Suponga que cada
moneda sólo puede caer en cara o
en cruz.
Datos.
N= 3 (monedas)
P= 2 (cara o cruz)
p= 0.50
43. HIPOTESIS
ALTERNATIVA
Afirma que la diferencia de resultados entre las
condiciones se debe a la variable
independiente.
Direccional
Cuando existe una
buena base
teórica y buena
evidencia de
apoyo literario
Evalúa con un valor
de prob. De una
cola
No
direccional
Cuando el
experimento es
básico para
determinar el
hecho
Evalúa con un
valor de prob. De
dos colas
44. Es la contraparte lógica de la
alternativa, de modo que si la primera
es falsa, la segunda debe ser
verdadera.
HIPOTESIS NULA
H1 no direccionada H0 especifica
que la Var. Ind. No influye sobre la
Var. Dep.
H1 direccionada H0 establece que
la Var. Ind. No influye sobre la Var.
Dep. en la dirección dada
45. Siempre evaluamos los resultados de un
experimento evaluando la H0 porque
podemos calcular la prob. De los eventos
aleatorios.
EVALUACION
PEGLA DE
DECISION
H0 es V y si esta es menor o igual al nivel
alfa o nivel de probabilidad crítica
Rechazamos la Ho y aceptamos de manera
indirecta la H1. Por lo tanto los resultados
son significativos o confiables.
Si la prob. Obtenido es mayor al nivel alfa,
conservamos la Ho
46. ERROR TIPO I
Rechazamos la H0 cuando esta
es verdadera
ERROR TIPO II
No rechazamos la H0 cuando
esta es falsa
ERROR DE
TIPO I Y DE
TIPO II
CONCLUSION
Estado
real
Decisión
H0 (V)
H0
(F)
Aceptar Ho
Decisión
Correcta
Error Tipo II
Rechazar H0
Error Tipo I
Decisión Correcta
47. Nivel al cual desean limitar la
probabilidad de cometer un
Error Tipo I
NIVEL
ALFA Y EL
PROCESO
DE
DECISION
CONCLUSION
Estado real
Nivel Alfa
Prob. Obt.
Decisión
H0 (V)
H0 (F)
0.05
0.02
Aceptar Ho
Decisión Correcta
Error Tipo II
0.01
0.02
Rechazar H0
Error Tipo I
Decisión Correcta
48. EVALUACION
DE LA COLA
DE LA
DISTRIBUCIO
N
H1 no direccionada
Evaluamos el resultado
obtenido en ambas direcciones
o colas.
H1 direccionada
Evaluamos solamente la cola de
la distribución que está en la
dirección dada por la H1
Necesitamos de Signos
positivos y negativos y hemos
de incluir de los resultados
positivos los tantos o valores
mas extremos.
49. Ejemplo.
N= 10 y p=0.50
EVALUACION
DE LA COLA
DE LA
DISTRIBUCIO
N
Signos positivos: 9
Tantos extremos: 0,1,9,10
Tabla B
P(0,1,9,10)=
p(0)+p(1)+p(9)+p(10)
=
0.0010+0.0098+0.0098+0.001
0
= 0.0216
50. Nivel alfa.
Determina si la evaluación de la
probabilidad debe ser de una o
dos colas.
EVALUACION
DE
PROBABILIDA
DES PARA
UNA O DOS
COLAS
Regla.
La evaluación debe ser siempre
de dos colas, a menos que el
experimentador conserve H0
cuando los resultados sean
extremos en la dirección
opuesta a la prevista.
52. Distribución Muestral
Todos los valores
La probabilidad de
que se pueden
obtener cada valor
asumir
Población de la hipótesis nula
Conjunto real o teórico de datos si se realiza sobre
toda la población y la variable independiente no
tuviese efectos.
Una distribución muestral. Proporciona todos los
valores que puede asumir un estadístico, junto con
la probabilidad de obtener cada valor si el muestreo
es aleatorio a partir de la población de hipótesis
nula.
53. La prueba (Z) de la desviación normalizada
Se utiliza cuando conocemos los parámetros de la
población de la H0.
Distribución muestral de la media
Proporciona todos los valores que puede asumir la
media, junto con la probabilidad de obtener cada
valor si el muestreo es aleatorio a partir de la
población de H0
54. Características de la dist. Muestral de la media
a). Tiene una media y una desviación estándar.
ux= es la media de la distribución muestral de la media
Gx= es la desviación estándar de la distribución muestral de
la media.
b). Tiene una media igual a la media poblacional de datos
crudos.
ux= u
c) Tiene una desviación estándar igual a la desviación estándar
poblacional de datos crudos, dividida entre la raíz cuadrada
de N (ensayos o población)
Gx= G / N
d) Presenta una forma normal que depende de cómo se
distribuya la población de datos crudos y del tamaño de la
muestra.