SlideShare una empresa de Scribd logo
1 de 32
Punto 2
Punto 3
Punto 4
Punto 1Punto 1
Punto 2
Punto 3
Punto 4
TEMA 8TEMA 8
Análisis inferencial de datos categóricos
Estadística
INGENIERÍA MULTIMEDIA
Violeta Migallón
Punto 2
Punto 3
Punto 4
Punto 1
Introducción
Contrastes de homogeneidad y
contingencia
El test de bondad de ajuste Ji-cuadrado
Actividades prácticas
Punto 1
Punto 2
Punto 3
Punto 4
TEMA 8TEMA 8
Análisis inferencial de datos categóricos
Punto 2
Punto 3
Punto 4
Punto 1
Test Ji-cuadrado de homogeneidad
Test Ji-cuadrado de contingencia
Test de bondad de ajuste Ji-cuadrado
Punto 1
TEMA 8TEMA 8
Introducción
Punto 2
Punto 3
Punto 4
Punto 1
Contrastes de homogeneidad
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
Punto 2
Punto 3
Punto 4
Punto 1
Contrastes de contingencia
(independencia)
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
Punto 2
Punto 3
Punto 4
Punto 1
Tabla de doble entrada: Forma de
presentar las frecuencias observadas
conjuntas de las variables que aparecen
en el problema
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
Ejemplo para ilustrar los conceptos del tema
Punto 2
Punto 3
Punto 4
Punto 1
Ejemplo: En un estudio del sistema de justicia juvenil de una
ciudad se formuló la hipótesis de que las chicas recibían un
tratamiento más suave que los chicos. De los ficheros de la ciudad
se seleccionaron al azar los registros de 152 casos de chicos y 156
casos de chicas y se clasificó la disposición de cada caso en orden
creciente de severidad como (1) aconsejados y librados, (2) una
intervención del departamento de libertad vigilada, (3) dos o más
intervenciones y (4) envío al tribunal juvenil. Los datos están en
la siguiente tabla de doble entrada:
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
Punto 2
Punto 3
Punto 4
Punto 1
H0: El sistema judicial juvenil se comporta de
forma homogénea (análoga) con los chicos y
con las chicas
H1: No H0
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
Punto 2
Punto 3
Punto 4
Punto 1
Notación:
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
θij=frecuencia observada en la celda correspondiente a la
fila i-ésima y a la columna j-ésima
Ri=total fila i
Cj=total columna j
r=número de filas
c=número de columnas
θ31=18
R2=76
C1=152
r=4
c=2
Punto 2
Punto 3
Punto 4
Punto 1
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Frecuencias esperadas:
Eij= frecuencia absoluta esperada para la fila i y
columna j si H0 es cierta
Punto 1
Punto 2
Ri=total fila i
Cj=total columna j
T=tamaño de la muestra
Punto 2
Punto 3
Punto 4
Punto 1
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
E32=(R3·C2)/T=
(25*156)/308=12.7
Punto 2
Punto 3
Punto 4
Punto 1
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Contraste de hipótesis con el estadístico Ji-
cuadradoPunto 1
Punto 2
Punto 2
Punto 3
Punto 4
Punto 1Punto 1
Punto 2
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
El SPSS obtiene dicho valor de
χ2
0
sin tener que hacer nosotros
los cálculos
Punto 2
Punto 3
Punto 4
Punto 1Punto 1
Punto 2
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Contraste de hipótesis con el estadístico Ji-
cuadrado
En el ejemplo anterior para un nivel de significación
α=0.05, se obtiene:
χ2
0
=30.952≥χ2
0.05,3
=IDF.CHISQ(0.95,3)=7.81,
por tanto se debe rechazar la hipótesis de
homogeneidad en el tratamiento del sistema judicial
juvenil con los chicos y las chicas al 5 por ciento de
nivel de significación
Punto 2
Punto 3
Punto 4
Punto 1Punto 1
Punto 2
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Contraste de hipótesis con el estadístico Ji-
cuadrado
Recordemos que, tal y como se ha explicado en
clase, en caso de no darnos el nivel de
significación, si el P-valor es pequeño rechazaremos la
hipótesis nula
Punto 2
Punto 3
Punto 4
Punto 1Punto 1
Punto 2
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Contraste de hipótesis con el estadístico Ji-
cuadrado
Para el ejemplo,
P-valor=P(χ2
3
≥30.952)=1-CDF.CHISQ(30.952,3)=0,
es decir, para todo α mayor que 0 rechazaremos la
hipótesis nula, por lo que concluimos que el sistema
de justicia juvenil no se comporta de forma
homogénea con las chicas y con los chicos
El SPSS obtiene el P-valor
directamente, sin tener que
hacer nosotros los cálculos
Punto 2
Punto 3
Punto 4
Punto 1
Adecuación de la aproximación Ji-cuadrado:
Todas las frecuencias esperadas mayores o igual que 1
Al menos un 20 por ciento de las celdas con frecuencia
esperada mayor o igual que 5
Combinar categorías
Olvidar parte de la
información
En caso contrario
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
Punto 2
Punto 3
Punto 4
Punto 1Punto 1
Punto 2
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Estudio de las celdas de interés:
El SPSS obtiene los Zij
directamente, sin tener que
hacer nosotros los cálculos
Punto 2
Punto 3
Punto 4
Punto 1
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
Estudio de las celdas de interés: (Ejemplo)
Las diferencias
interesantes vienen
marcadas por @
seguidas de las
marcadas por O. En
caso de no existir
ningún símbolo del
tipo @, se
analizarán las del
tipo O. Además
habrá que analizar
el signo de los Zij
Punto 2
Punto 3
Punto 4
Punto 1
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
Estudio de las celdas de interés: (Ejemplo)
Observamos en la tabla que las celdas de mayor interés
(las marcadas con @ y O) son las correspondientes a
envíos al tribunal juvenil y la de aconsejados y librados
 En el primer caso se observa un número significativamente
mayor de personas que son chicos y enviados al tribunal juvenil de
lo que cabría esperar si el sistema judicial se comportara de forma
homogénea con los chicos y con las chicas. Mientras que se
observa un número significativamente menor de personas que son
chicas y enviadas al tribunal juvenil de lo que cabría esperar si el
sistema judicial se comportara de forma homogénea con los chicos
y con las chicas
Punto 2
Punto 3
Punto 4
Punto 1
TEMA 8TEMA 8
Contrastes de homogeneidad y contingencia
Punto 1
Punto 2
Estudio de las celdas de interés: (Ejemplo)
 Por otra parte en las categorías de aconsejados y librados se
observa un número significativamente mayor de personas que son
chicas y aconsejadas y libradas de lo que cabría esperar si el
sistema judicial se comportara de forma homogénea con los chicos
y con las chicas. Mientras que se observa un número
significativamente menor de personas que son chicos y
aconsejados y librados de lo que cabría esperar si el sistema
judicial se comportara de forma homogénea con los chicos y con
las chicas
 De todo ello, se deduce que se ha tratado de forma más
dura a los chicos
Punto 2
Punto 3
Punto 4
Punto 1
H0: la muestra procede de la población
especificada
H1: no H0
TEMA 8TEMA 8
El test de bondad de ajuste Ji-cuadrado
Punto 1
Punto 2
Punto 3
i=1
Punto 2
Punto 3
Punto 4
Punto 1
Ejemplo: Un periódico nacional publicó un estudio que indicaba
que el desglose de clientes de centros comerciales según su edad
en una ciudad grande en porcentajes era:
A una muestra aleatoria de clientes de unos grandes almacenes,
se le pidió que indicara su categoría de edad. Y se obtuvo la
siguiente distribución de frecuencias observadas:
Queremos saber si las edades encontradas por el centro comercial
se corresponden con la distribución de edades publicadas por el
periódico a un nivel de significación del 1 por ciento
TEMA 8TEMA 8
El test de bondad de ajuste Ji-cuadrado
Punto 1
Punto 2
Punto 3
Punto 2
Punto 3
Punto 4
Punto 1
Ejemplo (continuación):
p1
=proporción poblacional de clientes de centros comerciales
menores de 21 años
p2
=proporción poblacional de clientes de centros comerciales con
edad entre 21 y 35 años
p3
=proporción poblacional de clientes de centros comerciales con
edad entre 36 y 55 años
p4
=proporción poblacional de clientes de centros comerciales con
edad entre 56 y 65 años
p5
=proporción poblacional de clientes de centros comerciales de
edad mayor o igual a 66
El contraste de hipótesis es el siguiente:
H0
: p1
=0.10, p2
=0.32, p3
=0.31, p4
=0.16, p5
=0.11
H1
: Las proporciones de la población no son p1
=0.10,
p2
=0.32, p3
=0.31, p4
=0.16, p5
=0.11
TEMA 8TEMA 8
El test de bondad de ajuste Ji-cuadrado
Punto 1
Punto 2
Punto 3
Punto 2
Punto 3
Punto 4
Punto 1
Ejemplo (continuación):
El contraste de hipótesis es el siguiente:
H0
: p1
=0.10, p2
=0.32, p3
=0.31, p4
=0.16, p5
=0.11
H1
: Las proporciones de la población no son p1
=0.10,
p2
=0.32, p3
=0.31, p4
=0.16, p5
=0.11
TEMA 8TEMA 8
El test de bondad de ajuste Ji-cuadrado
Punto 1
Punto 2
Punto 3
θ1=18, θ2=51, θ3=42, θ4=89, θ5=50,
E1=0.10·250=25, E2=0.32·250=80,
E3=0.31·250=77.5, E4=0.16·250=40, E5=0.11·250=27.5
Punto 2
Punto 3
Punto 4
Punto 1
TEMA 8TEMA 8
El test de bondad de ajuste Ji-cuadrado
Punto 1
Punto 2
Punto 3
Ejemplo (continuación):
El SPSS obtiene dicho valor de
χ2
0
sin tener que hacer nosotros
los cálculos
Punto 2
Punto 3
Punto 4
Punto 1
Ejemplo (continuación):
Entonces:
χ2
0
=107.1679
Por otro lado, a un nivel de significación α=0.01, se tiene:
χ2
0.01, 4
=IDF.CHISQ(0.99,4)=13.28
Por tanto como χ2
0
es mayor o igual que χ2
0.01, 4
se rechaza la
hipótesis nula, lo que significa que, con un nivel de significación del
1 por ciento, los clientes de ese gran almacén no se ajustan a la
distribución de edades de la gran ciudad publicada por el periódico
TEMA 8TEMA 8
El test de bondad de ajuste Ji-cuadrado
Punto 1
Punto 2
Punto 3
Punto 2
Punto 3
Punto 4
Punto 1
Ejemplo (continuación):
Resolución mediante el cálculo del P-valor:
χ2
0
=107.1679
Entonces P-valor=P(χ2
4
≥107.1679)=1-CDF.CHISQ(107.1679,4)=0
Por tanto para todo α mayor que 0 (y en particular para α=0.01), se
rechaza la hipótesis nula, lo que significa que los clientes de ese
gran almacén no se ajustan a la distribución de edades de la gran
ciudad publicada por el periódico
TEMA 8TEMA 8
El test de bondad de ajuste Ji-cuadrado
Punto 1
Punto 2
Punto 3
El SPSS obtiene el P-valor
directamente, sin tener que
hacer nosotros los cálculos
Punto 2
Punto 3
Punto 4
Punto 1 Estudio de las celdas de interés: En un test de bondad
de ajuste Ji-cuadrado es interesante estudiar también qué
casillas han contribuido en mayor medida a esto. Veamos
cómo:
Se calculan los residuos tipificados:
TEMA 8TEMA 8
El test de bondad de ajuste Ji-cuadrado
Punto 1
Punto 2
Punto 3
Punto 2
Punto 3
Punto 4
Punto 1
Estudio de las celdas de interés: Las diferencias
interesantes vienen marcadas por @ seguidas de las
marcadas por O. En caso de no existir ningún símbolo del
tipo @, se analizarán las del tipo O.
TEMA 8TEMA 8
El test de bondad de ajuste Ji-cuadrado
Punto 1
Punto 2
Punto 3
Ejemplo (continuación):
i θi
Ei
Zi
Símbolo
Menor de 21 años 1 18 25 -1.4 .
21-35 2 51 80 -3.24 @
36-55 3 42 77.5 -4.03 @
56-65 4 89 40 7.75 @
Mayor o igual a 66 años 5 50 27.5 4.29 @
Estudio de las celdas de interés: Las diferencias
interesantes vienen marcadas por @ seguidas de las
marcadas por O. En caso de no existir ningún símbolo del
tipo @, se analizarán las del tipo O.
Estudio de las celdas de interés: Las diferencias
interesantes vienen marcadas por @ seguidas de las
marcadas por O. En caso de no existir ningún símbolo del
tipo @, se analizarán las del tipo O
Punto 2
Punto 3
Punto 4
Punto 1
TEMA 8TEMA 8
El test de bondad de ajuste Ji-cuadrado
Punto 1
Punto 2
Punto 3
Ejemplo (continuación):
Se deduce que se han observado menos clientes con
edades comprendidas entre 21 y 55 años de los que cabría
esperar si este gran almacén hubiera seguido la
distribución publicada por el periódico y más clientes con
edad mayor o igual a 56 años de lo que cabría esperar si
este gran almacén hubiera seguido la distribución
publicada por el periódico
Punto 2
Punto 3
Punto 4
Punto 1
TEMA 8TEMA 8
Actividades prácticas
Punto 1
Punto 2
Punto 3
Punto 4
HACED LAS ACTIVIDADES
PROPUESTAS PARA ESTE TEMA

Más contenido relacionado

La actualidad más candente

La actualidad más candente (14)

Tarea. estadística inferencial
Tarea. estadística inferencialTarea. estadística inferencial
Tarea. estadística inferencial
 
Pruebas no parametricas de wilcoxon 2007.
Pruebas no parametricas de wilcoxon 2007.Pruebas no parametricas de wilcoxon 2007.
Pruebas no parametricas de wilcoxon 2007.
 
Deber chi cuadrado
Deber chi cuadradoDeber chi cuadrado
Deber chi cuadrado
 
Pruebas de Uniformidad
Pruebas de UniformidadPruebas de Uniformidad
Pruebas de Uniformidad
 
Tarea 7
Tarea 7Tarea 7
Tarea 7
 
Datos por rango u37
Datos por rango u37Datos por rango u37
Datos por rango u37
 
Deber chi cuadrado (2)
Deber chi cuadrado (2)Deber chi cuadrado (2)
Deber chi cuadrado (2)
 
Estadística
EstadísticaEstadística
Estadística
 
Deber chi cuadrado
Deber chi cuadradoDeber chi cuadrado
Deber chi cuadrado
 
Infe2
Infe2Infe2
Infe2
 
Prueba de los signos
Prueba de los signosPrueba de los signos
Prueba de los signos
 
Deber chi cuadrado
Deber chi cuadradoDeber chi cuadrado
Deber chi cuadrado
 
SIMULACION UNIDAD II
SIMULACION UNIDAD IISIMULACION UNIDAD II
SIMULACION UNIDAD II
 
Seminario 8. Test de Chi - cuadrado.
Seminario 8. Test de Chi - cuadrado.Seminario 8. Test de Chi - cuadrado.
Seminario 8. Test de Chi - cuadrado.
 

Similar a Análisis inferencial de datos categóricos

Similar a Análisis inferencial de datos categóricos (20)

Tema12 ud5
Tema12 ud5Tema12 ud5
Tema12 ud5
 
Deber chi cuadrado
Deber chi cuadradoDeber chi cuadrado
Deber chi cuadrado
 
SSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSS
SSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSS
SSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSS
 
Seminario 5
Seminario 5Seminario 5
Seminario 5
 
Seminario 5
Seminario 5Seminario 5
Seminario 5
 
Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango
Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rangoCapítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango
Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango
 
Taller de estadistica
Taller de estadisticaTaller de estadistica
Taller de estadistica
 
Deber 1.pdf
Deber 1.pdfDeber 1.pdf
Deber 1.pdf
 
Chi Cuadrado
Chi CuadradoChi Cuadrado
Chi Cuadrado
 
Tarea chi cuadrado
Tarea chi cuadradoTarea chi cuadrado
Tarea chi cuadrado
 
1DATOS NO AGRUPADOS ESATADISTICA 1
1DATOS NO AGRUPADOS ESATADISTICA 11DATOS NO AGRUPADOS ESATADISTICA 1
1DATOS NO AGRUPADOS ESATADISTICA 1
 
ANOVA.ppt
ANOVA.pptANOVA.ppt
ANOVA.ppt
 
Organizacion de datos lv
Organizacion de datos lvOrganizacion de datos lv
Organizacion de datos lv
 
Estadística inferencial
Estadística inferencialEstadística inferencial
Estadística inferencial
 
Prueba no paramétrica- Wilcoxon
Prueba no paramétrica- WilcoxonPrueba no paramétrica- Wilcoxon
Prueba no paramétrica- Wilcoxon
 
F 07 probabilidad
F 07 probabilidadF 07 probabilidad
F 07 probabilidad
 
Clase 02
Clase 02Clase 02
Clase 02
 
MATEMÁTICA - 5TO GRADO - UNIDAD 10.pdf
MATEMÁTICA - 5TO GRADO - UNIDAD 10.pdfMATEMÁTICA - 5TO GRADO - UNIDAD 10.pdf
MATEMÁTICA - 5TO GRADO - UNIDAD 10.pdf
 
EstadìStica Clase 1
EstadìStica  Clase 1EstadìStica  Clase 1
EstadìStica Clase 1
 
Cuadernillo entrada1 matematica_2do_grado
Cuadernillo entrada1 matematica_2do_gradoCuadernillo entrada1 matematica_2do_grado
Cuadernillo entrada1 matematica_2do_grado
 

Más de Violeta Migallón

Cuatro ejercicios de probabilidad
Cuatro ejercicios de probabilidadCuatro ejercicios de probabilidad
Cuatro ejercicios de probabilidadVioleta Migallón
 
Modelos de distribución discretos y continuos
Modelos de distribución discretos y continuosModelos de distribución discretos y continuos
Modelos de distribución discretos y continuosVioleta Migallón
 
Nuevas tecnologías y perspectiva de género
Nuevas tecnologías y perspectiva de géneroNuevas tecnologías y perspectiva de género
Nuevas tecnologías y perspectiva de géneroVioleta Migallón
 
Cálculo de probabilidades y análisis combinatorio
Cálculo de probabilidades y análisis combinatorioCálculo de probabilidades y análisis combinatorio
Cálculo de probabilidades y análisis combinatorioVioleta Migallón
 

Más de Violeta Migallón (6)

Intervalos de confianza
Intervalos de confianzaIntervalos de confianza
Intervalos de confianza
 
Cuatro ejercicios de probabilidad
Cuatro ejercicios de probabilidadCuatro ejercicios de probabilidad
Cuatro ejercicios de probabilidad
 
Modelos de distribución discretos y continuos
Modelos de distribución discretos y continuosModelos de distribución discretos y continuos
Modelos de distribución discretos y continuos
 
Nuevas tecnologías y perspectiva de género
Nuevas tecnologías y perspectiva de géneroNuevas tecnologías y perspectiva de género
Nuevas tecnologías y perspectiva de género
 
Estadística descriptiva
Estadística descriptivaEstadística descriptiva
Estadística descriptiva
 
Cálculo de probabilidades y análisis combinatorio
Cálculo de probabilidades y análisis combinatorioCálculo de probabilidades y análisis combinatorio
Cálculo de probabilidades y análisis combinatorio
 

Último

BITÁCORA DE ESTUDIO DE PROBLEMÁTICA. TUTORÍA V. PDF 2 UNIDAD.pdf
BITÁCORA DE ESTUDIO DE PROBLEMÁTICA. TUTORÍA V. PDF 2 UNIDAD.pdfBITÁCORA DE ESTUDIO DE PROBLEMÁTICA. TUTORÍA V. PDF 2 UNIDAD.pdf
BITÁCORA DE ESTUDIO DE PROBLEMÁTICA. TUTORÍA V. PDF 2 UNIDAD.pdfsolidalilaalvaradoro
 
4° SES COM MAR 09 Leemos una noticia del dengue e identificamos sus partes (1...
4° SES COM MAR 09 Leemos una noticia del dengue e identificamos sus partes (1...4° SES COM MAR 09 Leemos una noticia del dengue e identificamos sus partes (1...
4° SES COM MAR 09 Leemos una noticia del dengue e identificamos sus partes (1...MagalyDacostaPea
 
Biografía del General Eloy Alfaro Delgado
Biografía del General Eloy Alfaro DelgadoBiografía del General Eloy Alfaro Delgado
Biografía del General Eloy Alfaro DelgadoJosé Luis Palma
 
4° SEM23 ANEXOS DEL DOCENTE 2023-2024.pptx
4° SEM23 ANEXOS DEL DOCENTE 2023-2024.pptx4° SEM23 ANEXOS DEL DOCENTE 2023-2024.pptx
4° SEM23 ANEXOS DEL DOCENTE 2023-2024.pptxfotofamilia008
 
4 ÑOS EXPERIENCIA DE APRENDIZAJE 1 (1).docx
4 ÑOS EXPERIENCIA DE APRENDIZAJE 1 (1).docx4 ÑOS EXPERIENCIA DE APRENDIZAJE 1 (1).docx
4 ÑOS EXPERIENCIA DE APRENDIZAJE 1 (1).docxElicendaEspinozaFlor
 
Cuadernillo de actividades eclipse solar.pdf
Cuadernillo de actividades eclipse solar.pdfCuadernillo de actividades eclipse solar.pdf
Cuadernillo de actividades eclipse solar.pdflizcortes48
 
Presentación MF 1445 EVALUACION COMO Y QUE
Presentación MF 1445 EVALUACION COMO Y QUEPresentación MF 1445 EVALUACION COMO Y QUE
Presentación MF 1445 EVALUACION COMO Y QUEJosé Hecht
 
Actividades eclipse solar 2024 Educacion
Actividades eclipse solar 2024 EducacionActividades eclipse solar 2024 Educacion
Actividades eclipse solar 2024 Educacionviviantorres91
 
Desarrollo de habilidades del siglo XXI - Práctica Educativa en una Unidad-Ca...
Desarrollo de habilidades del siglo XXI - Práctica Educativa en una Unidad-Ca...Desarrollo de habilidades del siglo XXI - Práctica Educativa en una Unidad-Ca...
Desarrollo de habilidades del siglo XXI - Práctica Educativa en una Unidad-Ca...Carol Andrea Eraso Guerrero
 
ENSEÑAR ACUIDAR EL MEDIO AMBIENTE ES ENSEÑAR A VALORAR LA VIDA.
ENSEÑAR ACUIDAR  EL MEDIO AMBIENTE ES ENSEÑAR A VALORAR LA VIDA.ENSEÑAR ACUIDAR  EL MEDIO AMBIENTE ES ENSEÑAR A VALORAR LA VIDA.
ENSEÑAR ACUIDAR EL MEDIO AMBIENTE ES ENSEÑAR A VALORAR LA VIDA.karlazoegarciagarcia
 
Apunte de clase Pisos y Revestimientos 3
Apunte de clase Pisos y Revestimientos 3Apunte de clase Pisos y Revestimientos 3
Apunte de clase Pisos y Revestimientos 3Gonella
 
historieta materia de ecologías producto
historieta materia de ecologías productohistorieta materia de ecologías producto
historieta materia de ecologías productommartinezmarquez30
 
Docencia en la Era de la Inteligencia Artificial UB4 Ccesa007.pdf
Docencia en la Era de la Inteligencia Artificial UB4  Ccesa007.pdfDocencia en la Era de la Inteligencia Artificial UB4  Ccesa007.pdf
Docencia en la Era de la Inteligencia Artificial UB4 Ccesa007.pdfDemetrio Ccesa Rayme
 
HISTORIETA: AVENTURAS VERDES (ECOLOGÍA).
HISTORIETA: AVENTURAS VERDES (ECOLOGÍA).HISTORIETA: AVENTURAS VERDES (ECOLOGÍA).
HISTORIETA: AVENTURAS VERDES (ECOLOGÍA).hebegris04
 
DIDÁCTICA DE LA EDUCACIÓN SUPERIOR- DR LENIN CARI MOGROVEJO
DIDÁCTICA DE LA EDUCACIÓN SUPERIOR- DR LENIN CARI MOGROVEJODIDÁCTICA DE LA EDUCACIÓN SUPERIOR- DR LENIN CARI MOGROVEJO
DIDÁCTICA DE LA EDUCACIÓN SUPERIOR- DR LENIN CARI MOGROVEJOLeninCariMogrovejo
 
Filosofía del gobierno del general Alfaro
Filosofía del gobierno del general AlfaroFilosofía del gobierno del general Alfaro
Filosofía del gobierno del general AlfaroJosé Luis Palma
 
CARTEL CONMEMORATIVO DEL ECLIPSE SOLAR 2024 EN NAZAS , DURANGO. Autor y dise...
CARTEL CONMEMORATIVO DEL ECLIPSE SOLAR 2024 EN NAZAS , DURANGO.  Autor y dise...CARTEL CONMEMORATIVO DEL ECLIPSE SOLAR 2024 EN NAZAS , DURANGO.  Autor y dise...
CARTEL CONMEMORATIVO DEL ECLIPSE SOLAR 2024 EN NAZAS , DURANGO. Autor y dise...JAVIER SOLIS NOYOLA
 

Último (20)

BITÁCORA DE ESTUDIO DE PROBLEMÁTICA. TUTORÍA V. PDF 2 UNIDAD.pdf
BITÁCORA DE ESTUDIO DE PROBLEMÁTICA. TUTORÍA V. PDF 2 UNIDAD.pdfBITÁCORA DE ESTUDIO DE PROBLEMÁTICA. TUTORÍA V. PDF 2 UNIDAD.pdf
BITÁCORA DE ESTUDIO DE PROBLEMÁTICA. TUTORÍA V. PDF 2 UNIDAD.pdf
 
4° SES COM MAR 09 Leemos una noticia del dengue e identificamos sus partes (1...
4° SES COM MAR 09 Leemos una noticia del dengue e identificamos sus partes (1...4° SES COM MAR 09 Leemos una noticia del dengue e identificamos sus partes (1...
4° SES COM MAR 09 Leemos una noticia del dengue e identificamos sus partes (1...
 
Biografía del General Eloy Alfaro Delgado
Biografía del General Eloy Alfaro DelgadoBiografía del General Eloy Alfaro Delgado
Biografía del General Eloy Alfaro Delgado
 
4° SEM23 ANEXOS DEL DOCENTE 2023-2024.pptx
4° SEM23 ANEXOS DEL DOCENTE 2023-2024.pptx4° SEM23 ANEXOS DEL DOCENTE 2023-2024.pptx
4° SEM23 ANEXOS DEL DOCENTE 2023-2024.pptx
 
4 ÑOS EXPERIENCIA DE APRENDIZAJE 1 (1).docx
4 ÑOS EXPERIENCIA DE APRENDIZAJE 1 (1).docx4 ÑOS EXPERIENCIA DE APRENDIZAJE 1 (1).docx
4 ÑOS EXPERIENCIA DE APRENDIZAJE 1 (1).docx
 
Cuadernillo de actividades eclipse solar.pdf
Cuadernillo de actividades eclipse solar.pdfCuadernillo de actividades eclipse solar.pdf
Cuadernillo de actividades eclipse solar.pdf
 
Presentación MF 1445 EVALUACION COMO Y QUE
Presentación MF 1445 EVALUACION COMO Y QUEPresentación MF 1445 EVALUACION COMO Y QUE
Presentación MF 1445 EVALUACION COMO Y QUE
 
Actividades eclipse solar 2024 Educacion
Actividades eclipse solar 2024 EducacionActividades eclipse solar 2024 Educacion
Actividades eclipse solar 2024 Educacion
 
Desarrollo de habilidades del siglo XXI - Práctica Educativa en una Unidad-Ca...
Desarrollo de habilidades del siglo XXI - Práctica Educativa en una Unidad-Ca...Desarrollo de habilidades del siglo XXI - Práctica Educativa en una Unidad-Ca...
Desarrollo de habilidades del siglo XXI - Práctica Educativa en una Unidad-Ca...
 
ENSEÑAR ACUIDAR EL MEDIO AMBIENTE ES ENSEÑAR A VALORAR LA VIDA.
ENSEÑAR ACUIDAR  EL MEDIO AMBIENTE ES ENSEÑAR A VALORAR LA VIDA.ENSEÑAR ACUIDAR  EL MEDIO AMBIENTE ES ENSEÑAR A VALORAR LA VIDA.
ENSEÑAR ACUIDAR EL MEDIO AMBIENTE ES ENSEÑAR A VALORAR LA VIDA.
 
Apunte de clase Pisos y Revestimientos 3
Apunte de clase Pisos y Revestimientos 3Apunte de clase Pisos y Revestimientos 3
Apunte de clase Pisos y Revestimientos 3
 
Mimos _
Mimos                                       _Mimos                                       _
Mimos _
 
Acuerdo segundo periodo - Grado Sexto.pptx
Acuerdo segundo periodo - Grado Sexto.pptxAcuerdo segundo periodo - Grado Sexto.pptx
Acuerdo segundo periodo - Grado Sexto.pptx
 
historieta materia de ecologías producto
historieta materia de ecologías productohistorieta materia de ecologías producto
historieta materia de ecologías producto
 
Docencia en la Era de la Inteligencia Artificial UB4 Ccesa007.pdf
Docencia en la Era de la Inteligencia Artificial UB4  Ccesa007.pdfDocencia en la Era de la Inteligencia Artificial UB4  Ccesa007.pdf
Docencia en la Era de la Inteligencia Artificial UB4 Ccesa007.pdf
 
Unidad 2 | Teorías de la Comunicación | MCDIU
Unidad 2 | Teorías de la Comunicación | MCDIUUnidad 2 | Teorías de la Comunicación | MCDIU
Unidad 2 | Teorías de la Comunicación | MCDIU
 
HISTORIETA: AVENTURAS VERDES (ECOLOGÍA).
HISTORIETA: AVENTURAS VERDES (ECOLOGÍA).HISTORIETA: AVENTURAS VERDES (ECOLOGÍA).
HISTORIETA: AVENTURAS VERDES (ECOLOGÍA).
 
DIDÁCTICA DE LA EDUCACIÓN SUPERIOR- DR LENIN CARI MOGROVEJO
DIDÁCTICA DE LA EDUCACIÓN SUPERIOR- DR LENIN CARI MOGROVEJODIDÁCTICA DE LA EDUCACIÓN SUPERIOR- DR LENIN CARI MOGROVEJO
DIDÁCTICA DE LA EDUCACIÓN SUPERIOR- DR LENIN CARI MOGROVEJO
 
Filosofía del gobierno del general Alfaro
Filosofía del gobierno del general AlfaroFilosofía del gobierno del general Alfaro
Filosofía del gobierno del general Alfaro
 
CARTEL CONMEMORATIVO DEL ECLIPSE SOLAR 2024 EN NAZAS , DURANGO. Autor y dise...
CARTEL CONMEMORATIVO DEL ECLIPSE SOLAR 2024 EN NAZAS , DURANGO.  Autor y dise...CARTEL CONMEMORATIVO DEL ECLIPSE SOLAR 2024 EN NAZAS , DURANGO.  Autor y dise...
CARTEL CONMEMORATIVO DEL ECLIPSE SOLAR 2024 EN NAZAS , DURANGO. Autor y dise...
 

Análisis inferencial de datos categóricos

  • 1. Punto 2 Punto 3 Punto 4 Punto 1Punto 1 Punto 2 Punto 3 Punto 4 TEMA 8TEMA 8 Análisis inferencial de datos categóricos Estadística INGENIERÍA MULTIMEDIA Violeta Migallón
  • 2. Punto 2 Punto 3 Punto 4 Punto 1 Introducción Contrastes de homogeneidad y contingencia El test de bondad de ajuste Ji-cuadrado Actividades prácticas Punto 1 Punto 2 Punto 3 Punto 4 TEMA 8TEMA 8 Análisis inferencial de datos categóricos
  • 3. Punto 2 Punto 3 Punto 4 Punto 1 Test Ji-cuadrado de homogeneidad Test Ji-cuadrado de contingencia Test de bondad de ajuste Ji-cuadrado Punto 1 TEMA 8TEMA 8 Introducción
  • 4. Punto 2 Punto 3 Punto 4 Punto 1 Contrastes de homogeneidad TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2
  • 5. Punto 2 Punto 3 Punto 4 Punto 1 Contrastes de contingencia (independencia) TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2
  • 6. Punto 2 Punto 3 Punto 4 Punto 1 Tabla de doble entrada: Forma de presentar las frecuencias observadas conjuntas de las variables que aparecen en el problema TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2 Ejemplo para ilustrar los conceptos del tema
  • 7. Punto 2 Punto 3 Punto 4 Punto 1 Ejemplo: En un estudio del sistema de justicia juvenil de una ciudad se formuló la hipótesis de que las chicas recibían un tratamiento más suave que los chicos. De los ficheros de la ciudad se seleccionaron al azar los registros de 152 casos de chicos y 156 casos de chicas y se clasificó la disposición de cada caso en orden creciente de severidad como (1) aconsejados y librados, (2) una intervención del departamento de libertad vigilada, (3) dos o más intervenciones y (4) envío al tribunal juvenil. Los datos están en la siguiente tabla de doble entrada: TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2
  • 8. Punto 2 Punto 3 Punto 4 Punto 1 H0: El sistema judicial juvenil se comporta de forma homogénea (análoga) con los chicos y con las chicas H1: No H0 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2
  • 9. Punto 2 Punto 3 Punto 4 Punto 1 Notación: TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2 θij=frecuencia observada en la celda correspondiente a la fila i-ésima y a la columna j-ésima Ri=total fila i Cj=total columna j r=número de filas c=número de columnas θ31=18 R2=76 C1=152 r=4 c=2
  • 10. Punto 2 Punto 3 Punto 4 Punto 1 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Frecuencias esperadas: Eij= frecuencia absoluta esperada para la fila i y columna j si H0 es cierta Punto 1 Punto 2 Ri=total fila i Cj=total columna j T=tamaño de la muestra
  • 11. Punto 2 Punto 3 Punto 4 Punto 1 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2 E32=(R3·C2)/T= (25*156)/308=12.7
  • 12. Punto 2 Punto 3 Punto 4 Punto 1 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Contraste de hipótesis con el estadístico Ji- cuadradoPunto 1 Punto 2
  • 13. Punto 2 Punto 3 Punto 4 Punto 1Punto 1 Punto 2 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia El SPSS obtiene dicho valor de χ2 0 sin tener que hacer nosotros los cálculos
  • 14. Punto 2 Punto 3 Punto 4 Punto 1Punto 1 Punto 2 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Contraste de hipótesis con el estadístico Ji- cuadrado En el ejemplo anterior para un nivel de significación α=0.05, se obtiene: χ2 0 =30.952≥χ2 0.05,3 =IDF.CHISQ(0.95,3)=7.81, por tanto se debe rechazar la hipótesis de homogeneidad en el tratamiento del sistema judicial juvenil con los chicos y las chicas al 5 por ciento de nivel de significación
  • 15. Punto 2 Punto 3 Punto 4 Punto 1Punto 1 Punto 2 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Contraste de hipótesis con el estadístico Ji- cuadrado Recordemos que, tal y como se ha explicado en clase, en caso de no darnos el nivel de significación, si el P-valor es pequeño rechazaremos la hipótesis nula
  • 16. Punto 2 Punto 3 Punto 4 Punto 1Punto 1 Punto 2 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Contraste de hipótesis con el estadístico Ji- cuadrado Para el ejemplo, P-valor=P(χ2 3 ≥30.952)=1-CDF.CHISQ(30.952,3)=0, es decir, para todo α mayor que 0 rechazaremos la hipótesis nula, por lo que concluimos que el sistema de justicia juvenil no se comporta de forma homogénea con las chicas y con los chicos El SPSS obtiene el P-valor directamente, sin tener que hacer nosotros los cálculos
  • 17. Punto 2 Punto 3 Punto 4 Punto 1 Adecuación de la aproximación Ji-cuadrado: Todas las frecuencias esperadas mayores o igual que 1 Al menos un 20 por ciento de las celdas con frecuencia esperada mayor o igual que 5 Combinar categorías Olvidar parte de la información En caso contrario TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2
  • 18. Punto 2 Punto 3 Punto 4 Punto 1Punto 1 Punto 2 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Estudio de las celdas de interés: El SPSS obtiene los Zij directamente, sin tener que hacer nosotros los cálculos
  • 19. Punto 2 Punto 3 Punto 4 Punto 1 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2 Estudio de las celdas de interés: (Ejemplo) Las diferencias interesantes vienen marcadas por @ seguidas de las marcadas por O. En caso de no existir ningún símbolo del tipo @, se analizarán las del tipo O. Además habrá que analizar el signo de los Zij
  • 20. Punto 2 Punto 3 Punto 4 Punto 1 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2 Estudio de las celdas de interés: (Ejemplo) Observamos en la tabla que las celdas de mayor interés (las marcadas con @ y O) son las correspondientes a envíos al tribunal juvenil y la de aconsejados y librados  En el primer caso se observa un número significativamente mayor de personas que son chicos y enviados al tribunal juvenil de lo que cabría esperar si el sistema judicial se comportara de forma homogénea con los chicos y con las chicas. Mientras que se observa un número significativamente menor de personas que son chicas y enviadas al tribunal juvenil de lo que cabría esperar si el sistema judicial se comportara de forma homogénea con los chicos y con las chicas
  • 21. Punto 2 Punto 3 Punto 4 Punto 1 TEMA 8TEMA 8 Contrastes de homogeneidad y contingencia Punto 1 Punto 2 Estudio de las celdas de interés: (Ejemplo)  Por otra parte en las categorías de aconsejados y librados se observa un número significativamente mayor de personas que son chicas y aconsejadas y libradas de lo que cabría esperar si el sistema judicial se comportara de forma homogénea con los chicos y con las chicas. Mientras que se observa un número significativamente menor de personas que son chicos y aconsejados y librados de lo que cabría esperar si el sistema judicial se comportara de forma homogénea con los chicos y con las chicas  De todo ello, se deduce que se ha tratado de forma más dura a los chicos
  • 22. Punto 2 Punto 3 Punto 4 Punto 1 H0: la muestra procede de la población especificada H1: no H0 TEMA 8TEMA 8 El test de bondad de ajuste Ji-cuadrado Punto 1 Punto 2 Punto 3 i=1
  • 23. Punto 2 Punto 3 Punto 4 Punto 1 Ejemplo: Un periódico nacional publicó un estudio que indicaba que el desglose de clientes de centros comerciales según su edad en una ciudad grande en porcentajes era: A una muestra aleatoria de clientes de unos grandes almacenes, se le pidió que indicara su categoría de edad. Y se obtuvo la siguiente distribución de frecuencias observadas: Queremos saber si las edades encontradas por el centro comercial se corresponden con la distribución de edades publicadas por el periódico a un nivel de significación del 1 por ciento TEMA 8TEMA 8 El test de bondad de ajuste Ji-cuadrado Punto 1 Punto 2 Punto 3
  • 24. Punto 2 Punto 3 Punto 4 Punto 1 Ejemplo (continuación): p1 =proporción poblacional de clientes de centros comerciales menores de 21 años p2 =proporción poblacional de clientes de centros comerciales con edad entre 21 y 35 años p3 =proporción poblacional de clientes de centros comerciales con edad entre 36 y 55 años p4 =proporción poblacional de clientes de centros comerciales con edad entre 56 y 65 años p5 =proporción poblacional de clientes de centros comerciales de edad mayor o igual a 66 El contraste de hipótesis es el siguiente: H0 : p1 =0.10, p2 =0.32, p3 =0.31, p4 =0.16, p5 =0.11 H1 : Las proporciones de la población no son p1 =0.10, p2 =0.32, p3 =0.31, p4 =0.16, p5 =0.11 TEMA 8TEMA 8 El test de bondad de ajuste Ji-cuadrado Punto 1 Punto 2 Punto 3
  • 25. Punto 2 Punto 3 Punto 4 Punto 1 Ejemplo (continuación): El contraste de hipótesis es el siguiente: H0 : p1 =0.10, p2 =0.32, p3 =0.31, p4 =0.16, p5 =0.11 H1 : Las proporciones de la población no son p1 =0.10, p2 =0.32, p3 =0.31, p4 =0.16, p5 =0.11 TEMA 8TEMA 8 El test de bondad de ajuste Ji-cuadrado Punto 1 Punto 2 Punto 3 θ1=18, θ2=51, θ3=42, θ4=89, θ5=50, E1=0.10·250=25, E2=0.32·250=80, E3=0.31·250=77.5, E4=0.16·250=40, E5=0.11·250=27.5
  • 26. Punto 2 Punto 3 Punto 4 Punto 1 TEMA 8TEMA 8 El test de bondad de ajuste Ji-cuadrado Punto 1 Punto 2 Punto 3 Ejemplo (continuación): El SPSS obtiene dicho valor de χ2 0 sin tener que hacer nosotros los cálculos
  • 27. Punto 2 Punto 3 Punto 4 Punto 1 Ejemplo (continuación): Entonces: χ2 0 =107.1679 Por otro lado, a un nivel de significación α=0.01, se tiene: χ2 0.01, 4 =IDF.CHISQ(0.99,4)=13.28 Por tanto como χ2 0 es mayor o igual que χ2 0.01, 4 se rechaza la hipótesis nula, lo que significa que, con un nivel de significación del 1 por ciento, los clientes de ese gran almacén no se ajustan a la distribución de edades de la gran ciudad publicada por el periódico TEMA 8TEMA 8 El test de bondad de ajuste Ji-cuadrado Punto 1 Punto 2 Punto 3
  • 28. Punto 2 Punto 3 Punto 4 Punto 1 Ejemplo (continuación): Resolución mediante el cálculo del P-valor: χ2 0 =107.1679 Entonces P-valor=P(χ2 4 ≥107.1679)=1-CDF.CHISQ(107.1679,4)=0 Por tanto para todo α mayor que 0 (y en particular para α=0.01), se rechaza la hipótesis nula, lo que significa que los clientes de ese gran almacén no se ajustan a la distribución de edades de la gran ciudad publicada por el periódico TEMA 8TEMA 8 El test de bondad de ajuste Ji-cuadrado Punto 1 Punto 2 Punto 3 El SPSS obtiene el P-valor directamente, sin tener que hacer nosotros los cálculos
  • 29. Punto 2 Punto 3 Punto 4 Punto 1 Estudio de las celdas de interés: En un test de bondad de ajuste Ji-cuadrado es interesante estudiar también qué casillas han contribuido en mayor medida a esto. Veamos cómo: Se calculan los residuos tipificados: TEMA 8TEMA 8 El test de bondad de ajuste Ji-cuadrado Punto 1 Punto 2 Punto 3
  • 30. Punto 2 Punto 3 Punto 4 Punto 1 Estudio de las celdas de interés: Las diferencias interesantes vienen marcadas por @ seguidas de las marcadas por O. En caso de no existir ningún símbolo del tipo @, se analizarán las del tipo O. TEMA 8TEMA 8 El test de bondad de ajuste Ji-cuadrado Punto 1 Punto 2 Punto 3 Ejemplo (continuación): i θi Ei Zi Símbolo Menor de 21 años 1 18 25 -1.4 . 21-35 2 51 80 -3.24 @ 36-55 3 42 77.5 -4.03 @ 56-65 4 89 40 7.75 @ Mayor o igual a 66 años 5 50 27.5 4.29 @ Estudio de las celdas de interés: Las diferencias interesantes vienen marcadas por @ seguidas de las marcadas por O. En caso de no existir ningún símbolo del tipo @, se analizarán las del tipo O. Estudio de las celdas de interés: Las diferencias interesantes vienen marcadas por @ seguidas de las marcadas por O. En caso de no existir ningún símbolo del tipo @, se analizarán las del tipo O
  • 31. Punto 2 Punto 3 Punto 4 Punto 1 TEMA 8TEMA 8 El test de bondad de ajuste Ji-cuadrado Punto 1 Punto 2 Punto 3 Ejemplo (continuación): Se deduce que se han observado menos clientes con edades comprendidas entre 21 y 55 años de los que cabría esperar si este gran almacén hubiera seguido la distribución publicada por el periódico y más clientes con edad mayor o igual a 56 años de lo que cabría esperar si este gran almacén hubiera seguido la distribución publicada por el periódico
  • 32. Punto 2 Punto 3 Punto 4 Punto 1 TEMA 8TEMA 8 Actividades prácticas Punto 1 Punto 2 Punto 3 Punto 4 HACED LAS ACTIVIDADES PROPUESTAS PARA ESTE TEMA