Chi cuadrada

ESTADÍSTICA II
ESCUELA:

PSICOLOGÍA

PONENTE:

Ec. Miriam Guajala

BIMESTRE:

II BIMESTRE

CICLO:

ABRIL – AGOSTO 2007

PRUEBA DE T DE STUDENT PARA UNA
MUESTRA

Pruebas de homogeneidad
Estudian si dos o más muestras que se diferencian
en el valor de una característica proceden de
poblaciones donde los parámetros que las definen
son iguales.
Valoran si hay diferencias entre
medias,varianzas,proporciones, etc.
• Pruebas de homogeneidad de dos medias
• Pruebas de homogeneidad de dos
proporciones

Prueba de homogeneidad de dos medias


2 Muestras

1: N1, x1
S 21


2: N2, x2
S 22

¿Pertenecen
a2
poblaciones
de igual
media?



• Se desea contrastar las hipótesis:
– Ho= µ1 = µ2 (µ1 - µ2 = 0)
– H1= (µ1 ≠ µ2 )

2 Poblaciones

1: µ1σ1


2: µ2 σ2

QUE ES LA PRUEBA T DE STUDENT?
La t de student, es una prueba práctica, bastante
poderosa ampliamente utilizada en las ciencias del
comportamiento.
Esta prueba es muy similar a la prueba Z y la
diferencia radica en que Z utiliza la una desviación
poblacional y la prueba t en cambio utiliza una
desviación estándar muestra

FORMULAS

USO:

x−µ
Zobt =
σ N

x−µ
tobt =
δ N

1. Probar hipótesis en experimentos con una sola
muestra.
2. Estimar la media de la población al construir
intervalos de confianza.
3. Probar la significancia de la r de Pearson.

• PROBAR HIPOTESIS EN EXPERIMENTOS CON UNA
SOLA MUESTRA.
La prueba t es adecuada cuando:
•

Se conoce la media poblacional de la Ho y se desconoce
la σ

x−µ
tobt =
δ N

La distribución t, es una familia de curvas que varían
con los grados de libertad asociados al cálculo de t.
Existe N-1 grados de libertad asociados con la prueba t
para una muestra.
Las curvas de la distribución muestral son simétricas,
con forma de campana y media = 0.
La prueba t es adecuada cuando la distribución
x es normal. Para que la distribución
muestral de
muestral de x sea normal, la población de datos
debe poseer una distribución normal, o bien N<30



Intervalos de confianza: Rango de valores que
probablemente, contengan al valor poblacional.



Límites de confianza: Valores que delimitan al
intervalo de confianza.



Significacia de la r de Pearson: Nos permite examinar
el valor de la muestra para ver si existe una
correlación de la población.

Tipos de pruebas t


Prueba t para una muestra: prueba si la media de la muestra de una
variable difiere significativamente de la media conocida de la
población



Prueba t no pareada o independiente: prueba si las medias estimadas
de la población por 2 muestras independientes difieren
significativamente (grupo de hombres y grupo de mujeres)



Prueba t pareada: prueba si la media estimada de la población por
muestras dependientes difieren significativamente (media de pre y
post-tratamiento para el mismo grupo de pacientes.



La fórmula para grupos independientes
x1 - x 2


t=
S21/N1 + S22/N2

Con un nº de grados de
libertad de N1+N2-2

Nº de datos que pueden
variar independientemente
para una determinada
operación

* Si t≤ tα,N se acepta la hipótesis nula
* Si t > tα,N se rechaza la hipótesis nula.



Pruebas de independencia

Ver si en un estudio de 2 ó más variables, éstas
relacionadas


Coeficiente de correlación de Pearson (r)


Designa la magnitud de la relación entre 2 variables

Sus valores absolutos oscilan entre 0 y 1.
La correlación es perfecta positiva si su valor es +1
La correlación es perfecta negativa si su valor es -1
La relación entre 2 variables x e y es positiva cuando al
aumentar una, aumenta la otra y negativa cuando al
disminuir una disminuye la otra



Es usada para descubrir el efecto principal y los efectos
de interacción de variables categóricas independientes
(llamados factores) sobre un intervalo de la variable
dependiente



Tipos de anova



Anova de una forma prueba diferencias en un intervalo
de la variable dependiente entre dos, tres o más
grupos formados por las categorías de una variable
categórica independiente.



Uno de las pruebas mas importantes que utiliza la
varianza en la F, que básicamente es la razón de dos
estimaciones independientes de la varianza de la misma
poblacion.



Varian con los grados de libertad.






La distribución F:
Está sesgada positivamente
No tiene valores negativos
Posee una mediana aproximadamente igual a 1 según la
n de las estimaciones.





La técnica del análisis de varianza se utiliza con los
experimentos con más de dos grupos independientes.
Esta técnica permite comparar las medias de los
distintos grupos en una sola evaluación y asi evita el
aumento de probabilidad de cometer un error de tipo I.

– Se compara con la Ft de la tabla, para (N-1) gº de
libertad del numerador y denominador:
– Si F < Ft: no existen diferencias en las varianzas



Cuando hay igualdad de varianzas: única
estimación de la varianza poblacional en la
diferencia de medias.



Una de las técnicas de inferencia de uso más frecuente,
para el análisis de datos nominales es la prueba no
paramétrica llamada Ji – cuadrado. Es adecuada para el
análisis de datos consistentes en frecuencias que
provienen de una o dos variables.



Pruebas de homogeneidad de 2 proporciones
(Prueba de χ2)

χ2 : Estadístico que indica, en general, la discrepancia
entre ciertas frecuencias observadas (empíricas) de
una variable cualitativa dividida en k categorías y la
frecuencia teórica.



La Ji cuadrada mide, es esencia, la discrepancia entre la
frecuencia observada y la frecuencia esperada, para
cada una de las celdas en una tabla de doble entrada.

REQUERIMIENTOS






Datos deberán estar en forma de frecuencias
El total número de observaciones deberá exceder 20
Frecuencia esperada en una categoría o en cualquier celda
deberá ser >5 (cuando un de las celdas tiene <5 observados
se usa corrección de Yates o si tiene <5 de esperados se usa
exacta de Fisher)
El grupo de comparación deberá ser aproximadamente igual.





Usada para probar la fuerza de asociación entre dos
variables cualitativas
Usada para datos categóricos

•

Se compara el valor de χ2 obtenido con el
teórico que proporciona la tabla de su función
de probabilidad:
– Si χ20> χ2t , se rechaza Ho
– Si χ20 ≤ χ2t , se acepta Ho.

•

Se obtiene el estadístico χ2



El valor de χ2 teórica depende de:

Nivel de significación α

Grados de libertad (k-1)(y-1)

k = nº de muestras

y = nº de categorías


Al trabajar con una tabla de contingencia tetracórica de
2 X 2 el nº de gº de libertad es 1

1

1

2

A

a1

a2

NA

B

b1

b2

NB

N1

N2

N

Frecuencias observadas
Sumando cada diferencia:
χ2 = N (a1b2 – a2b1)
N1N2NANB

A

2

N1 NA

N2NA

N
B

N1NB

NA

N
N2NB

N

N

N1

N2

NB
N

Frecuencias esperadas o
teóricas

χ2

Como seleccionar la prueba estadística
adecuada




Tipo de variables

Cuantitativa (tensión arterial)

Cualitativa (género)
Tipos de preguntas de investigación

Asociación

Comparación

Factor de riesgo

•Estructura de datos
•Independientes
•Dependientes
•Pareados

Pregunta de investigación
Asociación de 2 variables (dep, indep)
Tipos de variable
Dependiente independiente

Prueba

categórica

categórica

chi-cuadrada

categórica

cuantitativa

Regresión logística

Cuantitativa

categórica

2

Cuantitativa

Cuantitativa

Prueba T
+3 ANOVA
Correlación Spearman
Regresión lineal

Buscando el factor de riesgo
Tipos de variables
Dependiente algunas indep.

Prueba

Categórica

Categórica

Regresión log
múltiple

Cuantitativa

Categórica

ANOVA

Cuantitativa

Cuantitativa

Regresión log lineal

N ensayos
2 posibles resultados
DISTRIBUCION
BINOMIAL
Distribución de
probabilidad

Mutuamente excluyentes
Son independientes entre sí
C/resultado posible es la misma

(P+Q)N
DESARROLLO
BINOMIAL

De donde:
P es la probabilidad de uno de
los dos resultados posibles en
un ensayo
Q es la probabilidad del otro
resultado posible
N es el número de ensayos

Sustituto del desarrollo binomial.

USO DE
TABLA
BINOMIAL

Proporciona la distribución binomial
para valores de N ( número de
ensayo) hasta 20 en la primera
columna y los resultados posibles
están en la segunda columna, bajo
el encabezado “Número de eventos
P y Q.
El resto de columnas contienen
datos de probabilidad para diversos
valores de P o Q

Ejemplo:

USO DE
TABLA
BINOMIAL

Si lanzo tres monedas que no están
cargadas, una sola vez, ¿Cuál es la
probabilidad de obtener 2 caras y
una cruz? Suponga que cada
moneda sólo puede caer en cara o
en cruz.
Datos.
N= 3 (monedas)
P= 2 (cara o cruz)
p= 0.50

Característica
DISEÑO DE
MEDIDAS
REPETIDAS

Son la existencia de resultados
pareados en las condiciones y la
elaboración de un estudio que
analiza la diferencia entre
éstos.

HIPOTESIS
ALTERNATIVA
Afirma que la diferencia de resultados entre las
condiciones se debe a la variable
independiente.
Direccional
Cuando existe una
buena base
teórica y buena
evidencia de
apoyo literario
Evalúa con un valor
de prob. De una
cola

No
direccional
Cuando el
experimento es
básico para
determinar el
hecho
Evalúa con un
valor de prob. De
dos colas

Es la contraparte lógica de la
alternativa, de modo que si la primera
es falsa, la segunda debe ser
verdadera.
HIPOTESIS NULA

H1 no direccionada  H0 especifica
que la Var. Ind. No influye sobre la
Var. Dep.
H1 direccionada  H0 establece que
la Var. Ind. No influye sobre la Var.
Dep. en la dirección dada

Siempre evaluamos los resultados de un
experimento evaluando la H0 porque
podemos calcular la prob. De los eventos
aleatorios.
EVALUACION
PEGLA DE
DECISION

H0 es V y si esta es menor o igual al nivel
alfa o nivel de probabilidad crítica 
Rechazamos la Ho y aceptamos de manera
indirecta la H1. Por lo tanto los resultados
son significativos o confiables.
Si la prob. Obtenido es mayor al nivel alfa,
conservamos la Ho

ERROR TIPO I
Rechazamos la H0 cuando esta
es verdadera
ERROR TIPO II
No rechazamos la H0 cuando
esta es falsa
ERROR DE
TIPO I Y DE
TIPO II

CONCLUSION

Estado

real
Decisión
H0 (V)
H0
(F)
Aceptar Ho
Decisión
Correcta
Error Tipo II
Rechazar H0
Error Tipo I
Decisión Correcta

Nivel al cual desean limitar la
probabilidad de cometer un
Error Tipo I
NIVEL
ALFA Y EL
PROCESO
DE
DECISION

CONCLUSION

Estado real

Nivel Alfa
Prob. Obt.
Decisión
H0 (V)
H0 (F)
0.05
0.02
Aceptar Ho
Decisión Correcta
Error Tipo II
0.01
0.02
Rechazar H0
Error Tipo I
Decisión Correcta

EVALUACION
DE LA COLA
DE LA
DISTRIBUCIO
N

H1 no direccionada
Evaluamos el resultado
obtenido en ambas direcciones
o colas.
H1 direccionada
Evaluamos solamente la cola de
la distribución que está en la
dirección dada por la H1
Necesitamos de Signos
positivos y negativos y hemos
de incluir de los resultados
positivos los tantos o valores
mas extremos.

Ejemplo.
N= 10 y p=0.50
EVALUACION
DE LA COLA
DE LA
DISTRIBUCIO
N

Signos positivos: 9
Tantos extremos: 0,1,9,10
Tabla B
P(0,1,9,10)=
p(0)+p(1)+p(9)+p(10)
=
0.0010+0.0098+0.0098+0.001
0
= 0.0216

Nivel alfa.
Determina si la evaluación de la
probabilidad debe ser de una o
dos colas.
EVALUACION
DE
PROBABILIDA
DES PARA
UNA O DOS
COLAS

Regla.
La evaluación debe ser siempre
de dos colas, a menos que el
experimentador conserve H0
cuando los resultados sean
extremos en la dirección
opuesta a la prevista.

Distribución Muestral
Todos los valores
La probabilidad de
que se pueden
obtener cada valor
asumir
Población de la hipótesis nula
Conjunto real o teórico de datos si se realiza sobre
toda la población y la variable independiente no
tuviese efectos.
Una distribución muestral. Proporciona todos los
valores que puede asumir un estadístico, junto con
la probabilidad de obtener cada valor si el muestreo
es aleatorio a partir de la población de hipótesis
nula.

La prueba (Z) de la desviación normalizada
Se utiliza cuando conocemos los parámetros de la
población de la H0.
Distribución muestral de la media
Proporciona todos los valores que puede asumir la
media, junto con la probabilidad de obtener cada
valor si el muestreo es aleatorio a partir de la
población de H0

Características de la dist. Muestral de la media
a). Tiene una media y una desviación estándar.
ux= es la media de la distribución muestral de la media
Gx= es la desviación estándar de la distribución muestral de
la media.
b). Tiene una media igual a la media poblacional de datos
crudos.
ux= u
c) Tiene una desviación estándar igual a la desviación estándar
poblacional de datos crudos, dividida entre la raíz cuadrada
de N (ensayos o población)
Gx= G / N
d) Presenta una forma normal que depende de cómo se
distribuya la población de datos crudos y del tamaño de la
muestra.

Chi cuadrada

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Chi cuadrada

Similar a Chi cuadrada (20)

Más de PSICOLOGIA Y EDUCACION INTEGRAL A.C.

Más de PSICOLOGIA Y EDUCACION INTEGRAL A.C. (20)

Último

Último (20)

Chi cuadrada

Notas del editor