2007
PRESENTACION
El presente trabajo se lo ha realizado con la finalidad de
conocer otra herramienta necesaria y fundamental para
determinar si un proyecto es factible o no, como es la
prueba del chi – cuadrado, que además de la prueba de
hipótesis y la t de student, esta prueba también se debe
conocer y aprender para luego de su respectivo cálculo y
análisis se pueda tomar decisiones adecuadas al asunto al
cual se esta haciendo referencia. Para poder llevar a cabo
esta prueba hemos tenido como fuentes primarias y
secundarias libros, textos y también el internet y varias
páginas web de las cuales hemos obtenido información que
nos ha ayudado a conocer y aprender acerca de lo que es el
Chi – cuadrado.
 Las distribución Chi cuadrado, se derivan de la distribución
Normal y están relacionadas con la teoría del muestreo
pequeño n< 30.
 Son muy importantes pues son la base de metodologías
inferenciales, tales como Intervalos de Confianza y
Pruebas de Hipótesis.
 En otros estudios se les define como la suma de
diferencias cuadráticas relativas entre valores
experimentales (observados) y valores teóricos
(esperados).
2

 En una prueba de ajuste la hipótesis nula establece que una variable X tiene
una cierta distribución de probabilidad con unos determinados valores de los
parámetros. El tipo de distribución se determina, según los casos, en función
de: La propia definición de la variable, consideraciones teóricas al margen de
esta y/o evidencia aportada por datos anteriores al experimento actual.
A menudo, la propia definición del tipo de variable lleva implícitos los valores de
sus parámetros o de parte de ellos; si esto no fuera así dichos parámetros se
estimarán a partir de la muestra de valores de la variable que utilizaremos para
realizar la prueba de ajuste.
Como en casos anteriores, empezaremos definiendo las hipótesis.
 Hipótesis nula: X tiene distribución de probabilidad f(x) con parámetros
y1,...,yp
 Hipótesis alternativa: X tiene cualquier otra distribución de probabilidad.
Es importante destacar que el rechazo de la hipótesis nula no implica que sean falsos
todos sus aspectos sino únicamente el conjunto de ellos; por ejemplo, podría ocurrir
que el tipo de distribución fuera correcto pero que nos hubiésemos equivocado en
los valores de los parámetros.
Obviamente, necesitaremos una muestra de valores de la variable X. Si la variable es
discreta y tiene pocos valores posible estimaremos las probabilidades de dichos
valores mediante sus frecuencias muéstrales; si la variable es continua o si es una
discreta con muchos o infinitos valores estimaremos probabilidades de grupos de
valores (intervalos).
Metodológicamente, la prueba se basa en la comparación entre la serie de
frecuencias absolutas observadas empíricamente para los valores de la variable (Oi) y
las correspondientes frecuencias absolutas teóricas obtenidas en base a la función
de probabilidad supuesta en la hipótesis nula (Ei).
Distribución Chi-cuadrado
Definición: Sea Sea
k variables aleatorias normales e
independientes, cada una con media 0 y
desviación típica 1. entonces, la variable
aleatoria
Se llama la variable aleatoria chi
cuadrado con k grados de libertad.
2

Definición de los Términos
 Fórmula de Chi Cuadrado
 α = Nivel de Significancia:
En estadística, un resultado se denomina estadísticamente
significativo cuando no es probable que haya sido debido al
azar.
Son comunes los niveles de significancia del 0,05, 0,01 y 0,1.
En algunas situaciones es conveniente expresar la significancia
estadística como percentil 1 − α.
Este valor hace referencia al nivel de confianza que deseamos
que tengan los cálculos de la prueba; es decir, si queremos
tener un nivel de confianza del 95%, el valor de alfa debe ser
del 0.05, lo cual corresponde al complemento porcentual de
la confianza.
e
eo
f
ff 

2
2
)(

 Hipótesis:
Si un contraste de hipótesis proporciona un valor P inferior a
α, la hipótesis nula es rechazada, siendo tal resultado
denominado “estadísticamente significativo”. Cuanto menor
sea el nivel de significancia, más fuerte será la evidencia de
que un hecho no se debe a una mera coincidencia (al azar).
 Grados de Libertad: GL=k-1
En estadística, grados de libertad es un estimador del número
de categorías independientes en una prueba particular o
experimento estadístico. Se encuentran mediante la fórmula n
− r, donde n=número de sujetos en la muestra, también
pueden ser representados por k − r,
k=número de grupos, cuando se realizan operaciones con grupos y
no con sujetos individuales
r=número de sujetos o grupos estadísticamente dependientes
Distribución Chi-cuadrado
2

Distribución Chi-cuadrado
2

Chi Cuadrado Crítico
2

La Regla de Decisión
Ch² observado < Ch² critico Rechazar
Ho
Aceptar Ho
Si
No
PROPIEDADES DISTRUBUCIÓN CHI-CUADRADO
 En estadística, la distribución de Pearson, llamada también ji
cuadrada(o) o chi cuadrado(a) (χ²), es una distribución de
probabilidad continua con un parámetro que representa los grados
de libertad de la variable aleatoria.
 Su función de densidad es:
𝑓 𝑥 = {
2−𝑟/2
Γ(
r
2
)
𝑥
𝑟
2
−1
𝑒−𝑥/2
Sí x ≥ 0
Sí x < 0
 PROPIEDADES:
FUNCIÓN DE DENSIDAD JI CUADRADO:
La variable no toma valores negativos, su campo de variación (R x2) es igual a 0 £ C2 £ ¥. La función f(x2; V)
es≥0.
Por ser una función de densidad, el área bajo una curva Ji cuadrado y sobre el eje horizontal tiene un valor
unitario.
Además, como se muestra gráficamente, la función de densidad de probabilidad de una variable aleatoria Ji
cuadrado, C2 , es:
 Unimodal
 Marcadamente asimétrica con sesgo positivo, es decir con cola a la derecha, cuando el número de grados
de libertad es muy pequeño. Conforme aumentan los grados de libertad, se hace menos sesgada y para 20
grados de libertad resulta bastante simétrica. A partir de Para n ≥30, la distribución se considera
aproximadamente normal.
 FUNCIÓN DE DENSIDAD FORMULA.
Su función de densidad es:
Donde r, es la función gamma
 FUNCIÓN DE DISTRIBUCIÓN ACUMULADA PARA UNA VARIABLE JI CUADRADO:
Los valores las áreas de probabilidad acumulada desde x2 = 0, hasta los percentiles x2 ∝
.
Mediante la Tabla de la función de distribución acumulada, F(x2; n ), se pueden resolver problemas del
tipo siguiente: ¿cuál es la probabilidad de encontrar valores mayores a cierto x2 i?; ¿Qué proporción
del área de probabilidad se encuentra a la izquierda de cierto x2 i?; ¿Qué valor de la variable X 2es
superado solamente por el 10% de los datos posibles?.
 FUNCIÓN DE DISTRIBUCIÓN ACUMULADA FORMULA.
Su función de distribución es:
 Donde {displaystyle  gamma (k,z)}es la función gamma incompleta.
 El valor esperado y la varianza de una variable aleatoria X con distribución χ² son,
respectivamente, k y 2k.
PARÁMETROS:
r > 0 grados de libertad
Las pruebas chi-cuadrado son un grupo de contrastes de hipótesis que
sirven para comprobar afirmaciones acerca de las funciones de
probabilidad (o densidad) de una o dos variables aleatorias
Estas pruebas no pertenecen propiamente a la estadística paramétrica
pues no establecen suposiciones restrictivas en cuanto al tipo de
variables que admiten, ni en lo que refiere a su distribución de
probabilidad ni en los valores y/o el conocimiento de sus parámetros.
Se aplican en dos situaciones básicas:
 a) Cuando queremos comprobar si una variable, cuya descripción
parece adecuada, tiene una determinada función de probabilidad. La
prueba correspondiente se llama chi-cuadrado de ajuste.
 b) Cuando queremos averiguar si dos variables (o dos vías de
clasificación) son independientes estadísticamente. En este caso la
prueba que aplicaremos ser la chi-cuadrado de independencia o chi-
cuadrado de contingencia.
¿Para que utilizamos una Prueba
de Chi Cuadrado?
 Para determinar si la muestra se ajusta o no se ajusta a una
distribución teórica.
 Para saber si la(s) poblacione(s) son homogénea(s) o no.
 Para determinar la dependencia e independencia la(s)
variable(s) a analizar.
2

Ejemplo 1:
Un gerente de ventas que tiene su mercado
dividido en cuatro zonas le indica a sus vendedores
que las zonas tienen el mismo potencial de ventas.
Ante la duda de los vendedores sobre el potencial
de sus zonas el gerente hace el siguiente
procedimiento :Se extrae una muestra de los
archivos de la empresa de 40 ventas realizadas el
año pasado y encuentra que el numero de ventas
por zona son: zona 1 = 6, Zona 2 = 12, Zona 3 = 14 y
zona 4 = 8 . En vista de esos resultados se realiza
una prueba de bondad de ajuste.
Solución:
Planteamiento de Hipótesis
 H0 : las ventas están igualmente distribuidas.
 H1: las ventas no están igualmente distribuidas
Nivel de Significancia
 α = 5% = 0.05
Cálculos
 GL= k-1 = 4-1 = 3
 El critico = 7.81 (Según Tabla)
2

Chi Cuadrado Crítico
2

Solución:
 Elaborar la tabla de y y calcular el .
ZONAS
A B C D
Frecuencia
observada (fo) 6 12 14 8 40
Frecuencia
esperada (fe) 10 10 10 10 40
Ch² 1.6 0.4 1.6 0.4 4
Los individuales se calculan con la
formula; y luego se suman:
Este valor es el observado = 4
e
eo
f
ff
2
2
)( 

of ef
2

2

2

La decisión:
 Como: observado < Critico
observado (4) < critico (7.81) Si se
Cumple
entonces, no rechazamos Ho.
Es decir que la Ho de que las ventas se
encuentran igualmente distribuidas en las
cuatro zonas no se puede rechazar para un
nivel de significancia de 5%.
2
 2

2

2

Se usa para analizar la frecuencia de dos variables con
categorías múltiples para determinar si las dos variables son
independientes o no.
 Hipótesis nula (H0) : Las variables X e Y son independientes, (
X e Y no están relacionadas)
 Hipótesis alternativa (H1): Las variables X e Y no son
independientes, (X e Y están relacionadas)
 



F
i
C
j ij
ijij
CF
E
EO
1 1
2
)1)(1(
2 )(

Tablas de contingencias
 Grados de libertad GL= (m-1)(n-1)
 Calculo de frecuencia esperado.
 Una Tabla de contingencia con r filas y c columnas tiene la
siguiente forma:
)(
)()(
total
columnasumafilasuma
fe


Los datos de variables cualitativa o categóricas representan
atributos o categorías y se organizan en tablas llamadas tablas
de contingencia o tablas de clasificación cruzada.
Donde:
Oi j : es el número de sujetos que tienen las características Ai y Bj
a la vez.
Ri : (i = 1,…,r) es la suma de la i-ésima fila de la tabla. Es decir, es
el total de sujetos que poseen la característica Ai.
Cj :(j = 1,…,c) es la suma de la j-ésima columna de la tabla. Es
decir, es el total de sujetos que poseen la característica Bj.
n : representa el total de observaciones tomadas.
 



F
i
C
j ij
ijij
CF
E
EO
1 1
2
)1)(1(
2 )(

El uso de bebida ordenado con alimentos en El Salón de té
HUAPRI ¿es independiente de la edad del consumidor? Se
toma una muestra aleatoria de 289 clientes del restaurante
de donde resulta el siguiente cuadro de valores observados.
Utilice α = 1% para determinar si las dos variedades son
independientes.
EDAD CAFÉ (TÉ) REFRESCO LECHE
21 – 34 26 95 18
35 – 55 41 40 20
>55 24 13 32
Ejemplo
Solución:
Planteamiento de Hipótesis
 H0 : El tipo de bebida preferida es independiente de la edad
 H1 : El tipo de bebida preferida no es independiente ,esta relacionada con
la edad
Nivel de significancia
 α = 0.01
Cálculos
 Grados de Libertad GL = (m-1)(n-1)
Tenemos 3 filas y tres columnas, es decir
GL = (3-1)(3-1) = 4
 El critico = 13.27 (Según Tabla)
2

Chi Cuadrado Crítico
2

Solución:
Calculo de frecuencia esperado. )(
)()(
total
columnasumafilasuma
fe


EDAD CAFÉ (TÉ) REFRESCO LECHE TOTAL
21 – 34 26 95 18 139
Frecuencia
Esperada
35 – 55 41 40 20 101
Frecuencia
Esperada
≥55 24 13 32 49
Frecuencia
Esperada
Total fo 91 148 50 289
Total fe
43,8 71,2
EDAD CAFÉ (TÉ) REFRESCO LECHE TOTAL
21 – 34 26 95 18 139
Frecuencia
Esperada
43.8 71.2 24.0 139,0
35 – 55 41 40 20 101
Frecuencia
Esperada
31.8 51.7 17.5 101,1
≥55 24 13 32 49
Frecuencia
Esperada
15.4 25.1 8.5 49,0
Total fo 91 148 50 289
Total fe 91.0 148.0 50,0 289,0
La Decisión
 Como: observado < Critico
observado (97,93) < critico (13,27)
No se Cumple
entonces, rechazamos H0, es decir se acepta la hipótesis
alternativa H1
Las dos variables, bebida preferida y edad, no son
independientes. El tipo de bebida que un cliente ordena
con alimentos está relacionada con la edad y depende de
está.
2
 2

2

2

Se extraen Muestras Independientes de varias
poblaciones y se prueban para ver si son
homogéneas con respecto a algún criterio de
clasificación.
 H0 = Las Poblaciones son Homogéneas
 H1 = Las Poblaciones no son Homogéneas
 



F
i
C
j ij
ijij
CF
E
EO
1 1
2
)1)(1(
2 )(

Ejemplo 3:
La siguiente tabla indica las familias de cuatro
distritos y el número de personas que vieron
un programa especial de política económica
nacional. Use α=1%
A B C D TOTAL
Número de personas que si vio 10 15 5 18 48
Número de personas que no vio 40 35 45 32 152
50 50 50 50 200
Solución:
Planteamiento de Hipótesis
 H0: todos vieron el programa
 H1: No todos vieron el programa
Nivel de Significancia
 α = 0.011
Cálculos
 GL = (m-1)(n-1) = (2-1)(4-1) = 3
 = 11.35
 Calcular las frecuencias esperadas y el Ch2 observado.
2

Solución:
A B C D TOTAL
VEN EL PROGRAMA 0.33 0.75 4.08 3.00
NO VEN EL
PROGRAMA 0.11 0.24 1.29 0.95
TOTAL 10.75
Como el valor observado (10.75) es menor que el valor
critico (11.35). No podemos rechazar H0 para un nivel del
1%. La diferencia de las proporciones no es suficientemente
grande para rechazar H0.
ELABORADO:
Arauco Ingunza, Suayl
Santa María Ramírez, Priscilla
De la Cruz Luciano, Marycarmen
Pablo Acosta, Giner
Estadistica chi cuadrado

Estadistica chi cuadrado

  • 1.
  • 2.
    PRESENTACION El presente trabajose lo ha realizado con la finalidad de conocer otra herramienta necesaria y fundamental para determinar si un proyecto es factible o no, como es la prueba del chi – cuadrado, que además de la prueba de hipótesis y la t de student, esta prueba también se debe conocer y aprender para luego de su respectivo cálculo y análisis se pueda tomar decisiones adecuadas al asunto al cual se esta haciendo referencia. Para poder llevar a cabo esta prueba hemos tenido como fuentes primarias y secundarias libros, textos y también el internet y varias páginas web de las cuales hemos obtenido información que nos ha ayudado a conocer y aprender acerca de lo que es el Chi – cuadrado.
  • 3.
     Las distribuciónChi cuadrado, se derivan de la distribución Normal y están relacionadas con la teoría del muestreo pequeño n< 30.  Son muy importantes pues son la base de metodologías inferenciales, tales como Intervalos de Confianza y Pruebas de Hipótesis.  En otros estudios se les define como la suma de diferencias cuadráticas relativas entre valores experimentales (observados) y valores teóricos (esperados). 2 
  • 4.
     En unaprueba de ajuste la hipótesis nula establece que una variable X tiene una cierta distribución de probabilidad con unos determinados valores de los parámetros. El tipo de distribución se determina, según los casos, en función de: La propia definición de la variable, consideraciones teóricas al margen de esta y/o evidencia aportada por datos anteriores al experimento actual. A menudo, la propia definición del tipo de variable lleva implícitos los valores de sus parámetros o de parte de ellos; si esto no fuera así dichos parámetros se estimarán a partir de la muestra de valores de la variable que utilizaremos para realizar la prueba de ajuste. Como en casos anteriores, empezaremos definiendo las hipótesis.  Hipótesis nula: X tiene distribución de probabilidad f(x) con parámetros y1,...,yp  Hipótesis alternativa: X tiene cualquier otra distribución de probabilidad.
  • 5.
    Es importante destacarque el rechazo de la hipótesis nula no implica que sean falsos todos sus aspectos sino únicamente el conjunto de ellos; por ejemplo, podría ocurrir que el tipo de distribución fuera correcto pero que nos hubiésemos equivocado en los valores de los parámetros. Obviamente, necesitaremos una muestra de valores de la variable X. Si la variable es discreta y tiene pocos valores posible estimaremos las probabilidades de dichos valores mediante sus frecuencias muéstrales; si la variable es continua o si es una discreta con muchos o infinitos valores estimaremos probabilidades de grupos de valores (intervalos). Metodológicamente, la prueba se basa en la comparación entre la serie de frecuencias absolutas observadas empíricamente para los valores de la variable (Oi) y las correspondientes frecuencias absolutas teóricas obtenidas en base a la función de probabilidad supuesta en la hipótesis nula (Ei).
  • 6.
    Distribución Chi-cuadrado Definición: SeaSea k variables aleatorias normales e independientes, cada una con media 0 y desviación típica 1. entonces, la variable aleatoria Se llama la variable aleatoria chi cuadrado con k grados de libertad. 2 
  • 7.
    Definición de losTérminos  Fórmula de Chi Cuadrado  α = Nivel de Significancia: En estadística, un resultado se denomina estadísticamente significativo cuando no es probable que haya sido debido al azar. Son comunes los niveles de significancia del 0,05, 0,01 y 0,1. En algunas situaciones es conveniente expresar la significancia estadística como percentil 1 − α. Este valor hace referencia al nivel de confianza que deseamos que tengan los cálculos de la prueba; es decir, si queremos tener un nivel de confianza del 95%, el valor de alfa debe ser del 0.05, lo cual corresponde al complemento porcentual de la confianza. e eo f ff   2 2 )( 
  • 8.
     Hipótesis: Si uncontraste de hipótesis proporciona un valor P inferior a α, la hipótesis nula es rechazada, siendo tal resultado denominado “estadísticamente significativo”. Cuanto menor sea el nivel de significancia, más fuerte será la evidencia de que un hecho no se debe a una mera coincidencia (al azar).  Grados de Libertad: GL=k-1 En estadística, grados de libertad es un estimador del número de categorías independientes en una prueba particular o experimento estadístico. Se encuentran mediante la fórmula n − r, donde n=número de sujetos en la muestra, también pueden ser representados por k − r, k=número de grupos, cuando se realizan operaciones con grupos y no con sujetos individuales r=número de sujetos o grupos estadísticamente dependientes
  • 9.
  • 10.
  • 11.
  • 12.
    La Regla deDecisión Ch² observado < Ch² critico Rechazar Ho Aceptar Ho Si No
  • 13.
    PROPIEDADES DISTRUBUCIÓN CHI-CUADRADO En estadística, la distribución de Pearson, llamada también ji cuadrada(o) o chi cuadrado(a) (χ²), es una distribución de probabilidad continua con un parámetro que representa los grados de libertad de la variable aleatoria.  Su función de densidad es: 𝑓 𝑥 = { 2−𝑟/2 Γ( r 2 ) 𝑥 𝑟 2 −1 𝑒−𝑥/2 Sí x ≥ 0 Sí x < 0
  • 14.
     PROPIEDADES: FUNCIÓN DEDENSIDAD JI CUADRADO: La variable no toma valores negativos, su campo de variación (R x2) es igual a 0 £ C2 £ ¥. La función f(x2; V) es≥0. Por ser una función de densidad, el área bajo una curva Ji cuadrado y sobre el eje horizontal tiene un valor unitario. Además, como se muestra gráficamente, la función de densidad de probabilidad de una variable aleatoria Ji cuadrado, C2 , es:  Unimodal  Marcadamente asimétrica con sesgo positivo, es decir con cola a la derecha, cuando el número de grados de libertad es muy pequeño. Conforme aumentan los grados de libertad, se hace menos sesgada y para 20 grados de libertad resulta bastante simétrica. A partir de Para n ≥30, la distribución se considera aproximadamente normal.
  • 15.
     FUNCIÓN DEDENSIDAD FORMULA. Su función de densidad es: Donde r, es la función gamma  FUNCIÓN DE DISTRIBUCIÓN ACUMULADA PARA UNA VARIABLE JI CUADRADO: Los valores las áreas de probabilidad acumulada desde x2 = 0, hasta los percentiles x2 ∝ . Mediante la Tabla de la función de distribución acumulada, F(x2; n ), se pueden resolver problemas del tipo siguiente: ¿cuál es la probabilidad de encontrar valores mayores a cierto x2 i?; ¿Qué proporción del área de probabilidad se encuentra a la izquierda de cierto x2 i?; ¿Qué valor de la variable X 2es superado solamente por el 10% de los datos posibles?.  FUNCIÓN DE DISTRIBUCIÓN ACUMULADA FORMULA. Su función de distribución es:  Donde {displaystyle gamma (k,z)}es la función gamma incompleta.  El valor esperado y la varianza de una variable aleatoria X con distribución χ² son, respectivamente, k y 2k.
  • 16.
    PARÁMETROS: r > 0grados de libertad Las pruebas chi-cuadrado son un grupo de contrastes de hipótesis que sirven para comprobar afirmaciones acerca de las funciones de probabilidad (o densidad) de una o dos variables aleatorias Estas pruebas no pertenecen propiamente a la estadística paramétrica pues no establecen suposiciones restrictivas en cuanto al tipo de variables que admiten, ni en lo que refiere a su distribución de probabilidad ni en los valores y/o el conocimiento de sus parámetros. Se aplican en dos situaciones básicas:  a) Cuando queremos comprobar si una variable, cuya descripción parece adecuada, tiene una determinada función de probabilidad. La prueba correspondiente se llama chi-cuadrado de ajuste.  b) Cuando queremos averiguar si dos variables (o dos vías de clasificación) son independientes estadísticamente. En este caso la prueba que aplicaremos ser la chi-cuadrado de independencia o chi- cuadrado de contingencia.
  • 17.
    ¿Para que utilizamosuna Prueba de Chi Cuadrado?  Para determinar si la muestra se ajusta o no se ajusta a una distribución teórica.  Para saber si la(s) poblacione(s) son homogénea(s) o no.  Para determinar la dependencia e independencia la(s) variable(s) a analizar. 2 
  • 19.
    Ejemplo 1: Un gerentede ventas que tiene su mercado dividido en cuatro zonas le indica a sus vendedores que las zonas tienen el mismo potencial de ventas. Ante la duda de los vendedores sobre el potencial de sus zonas el gerente hace el siguiente procedimiento :Se extrae una muestra de los archivos de la empresa de 40 ventas realizadas el año pasado y encuentra que el numero de ventas por zona son: zona 1 = 6, Zona 2 = 12, Zona 3 = 14 y zona 4 = 8 . En vista de esos resultados se realiza una prueba de bondad de ajuste.
  • 20.
    Solución: Planteamiento de Hipótesis H0 : las ventas están igualmente distribuidas.  H1: las ventas no están igualmente distribuidas Nivel de Significancia  α = 5% = 0.05 Cálculos  GL= k-1 = 4-1 = 3  El critico = 7.81 (Según Tabla) 2 
  • 21.
  • 22.
    Solución:  Elaborar latabla de y y calcular el . ZONAS A B C D Frecuencia observada (fo) 6 12 14 8 40 Frecuencia esperada (fe) 10 10 10 10 40 Ch² 1.6 0.4 1.6 0.4 4 Los individuales se calculan con la formula; y luego se suman: Este valor es el observado = 4 e eo f ff 2 2 )(   of ef 2  2  2 
  • 23.
    La decisión:  Como:observado < Critico observado (4) < critico (7.81) Si se Cumple entonces, no rechazamos Ho. Es decir que la Ho de que las ventas se encuentran igualmente distribuidas en las cuatro zonas no se puede rechazar para un nivel de significancia de 5%. 2  2  2  2 
  • 24.
    Se usa paraanalizar la frecuencia de dos variables con categorías múltiples para determinar si las dos variables son independientes o no.  Hipótesis nula (H0) : Las variables X e Y son independientes, ( X e Y no están relacionadas)  Hipótesis alternativa (H1): Las variables X e Y no son independientes, (X e Y están relacionadas)      F i C j ij ijij CF E EO 1 1 2 )1)(1( 2 )( 
  • 25.
    Tablas de contingencias Grados de libertad GL= (m-1)(n-1)  Calculo de frecuencia esperado.  Una Tabla de contingencia con r filas y c columnas tiene la siguiente forma: )( )()( total columnasumafilasuma fe   Los datos de variables cualitativa o categóricas representan atributos o categorías y se organizan en tablas llamadas tablas de contingencia o tablas de clasificación cruzada.
  • 26.
    Donde: Oi j :es el número de sujetos que tienen las características Ai y Bj a la vez. Ri : (i = 1,…,r) es la suma de la i-ésima fila de la tabla. Es decir, es el total de sujetos que poseen la característica Ai. Cj :(j = 1,…,c) es la suma de la j-ésima columna de la tabla. Es decir, es el total de sujetos que poseen la característica Bj. n : representa el total de observaciones tomadas.      F i C j ij ijij CF E EO 1 1 2 )1)(1( 2 )( 
  • 27.
    El uso debebida ordenado con alimentos en El Salón de té HUAPRI ¿es independiente de la edad del consumidor? Se toma una muestra aleatoria de 289 clientes del restaurante de donde resulta el siguiente cuadro de valores observados. Utilice α = 1% para determinar si las dos variedades son independientes. EDAD CAFÉ (TÉ) REFRESCO LECHE 21 – 34 26 95 18 35 – 55 41 40 20 >55 24 13 32 Ejemplo
  • 28.
    Solución: Planteamiento de Hipótesis H0 : El tipo de bebida preferida es independiente de la edad  H1 : El tipo de bebida preferida no es independiente ,esta relacionada con la edad Nivel de significancia  α = 0.01 Cálculos  Grados de Libertad GL = (m-1)(n-1) Tenemos 3 filas y tres columnas, es decir GL = (3-1)(3-1) = 4  El critico = 13.27 (Según Tabla) 2 
  • 30.
  • 31.
    Solución: Calculo de frecuenciaesperado. )( )()( total columnasumafilasuma fe   EDAD CAFÉ (TÉ) REFRESCO LECHE TOTAL 21 – 34 26 95 18 139 Frecuencia Esperada 35 – 55 41 40 20 101 Frecuencia Esperada ≥55 24 13 32 49 Frecuencia Esperada Total fo 91 148 50 289 Total fe 43,8 71,2 EDAD CAFÉ (TÉ) REFRESCO LECHE TOTAL 21 – 34 26 95 18 139 Frecuencia Esperada 43.8 71.2 24.0 139,0 35 – 55 41 40 20 101 Frecuencia Esperada 31.8 51.7 17.5 101,1 ≥55 24 13 32 49 Frecuencia Esperada 15.4 25.1 8.5 49,0 Total fo 91 148 50 289 Total fe 91.0 148.0 50,0 289,0
  • 32.
    La Decisión  Como:observado < Critico observado (97,93) < critico (13,27) No se Cumple entonces, rechazamos H0, es decir se acepta la hipótesis alternativa H1 Las dos variables, bebida preferida y edad, no son independientes. El tipo de bebida que un cliente ordena con alimentos está relacionada con la edad y depende de está. 2  2  2  2 
  • 33.
    Se extraen MuestrasIndependientes de varias poblaciones y se prueban para ver si son homogéneas con respecto a algún criterio de clasificación.  H0 = Las Poblaciones son Homogéneas  H1 = Las Poblaciones no son Homogéneas      F i C j ij ijij CF E EO 1 1 2 )1)(1( 2 )( 
  • 34.
    Ejemplo 3: La siguientetabla indica las familias de cuatro distritos y el número de personas que vieron un programa especial de política económica nacional. Use α=1% A B C D TOTAL Número de personas que si vio 10 15 5 18 48 Número de personas que no vio 40 35 45 32 152 50 50 50 50 200
  • 35.
    Solución: Planteamiento de Hipótesis H0: todos vieron el programa  H1: No todos vieron el programa Nivel de Significancia  α = 0.011 Cálculos  GL = (m-1)(n-1) = (2-1)(4-1) = 3  = 11.35  Calcular las frecuencias esperadas y el Ch2 observado. 2 
  • 36.
    Solución: A B CD TOTAL VEN EL PROGRAMA 0.33 0.75 4.08 3.00 NO VEN EL PROGRAMA 0.11 0.24 1.29 0.95 TOTAL 10.75 Como el valor observado (10.75) es menor que el valor critico (11.35). No podemos rechazar H0 para un nivel del 1%. La diferencia de las proporciones no es suficientemente grande para rechazar H0.
  • 37.
    ELABORADO: Arauco Ingunza, Suayl SantaMaría Ramírez, Priscilla De la Cruz Luciano, Marycarmen Pablo Acosta, Giner