Este documento describe diferentes medidas de tendencia central y dispersión de datos estadísticos. Explica la media, la mediana, la moda, los cuartiles, deciles, percentiles, quintiles y diagrama de caja. También describe tablas de contingencia y cómo muestran la relación entre dos variables clasificadas.
1. MEDIDAS DE TENDENCIA CENTRAL
MEDIA MEDIANA (Me) MODA (Mo)
Se refiere a una medida en la muestra
o en la población intenta medir lo justo,
lo equitativo, la esperanza
• En datos NO agrupados la mediana se calcula por
simple observación.
• Los datos tienen que estar ordenados
• Si n es impar la mediana es el dato central
• Si n es par la mediana es el promedio de los datos
centrales
1 moda: Unimodal
2 moda: Bimodal
3 moda: Polimodal
Es una distribución de datos, es el
dato que mas se repite, si los datos no
están agrupados la moda se calcula
por simple observación
En una distribución pueden existir
Es el punto central de una distribución de datosTambién llamada promedio.
Son valores o parámetros que representan a toda la población
De la misma manera en una
distribución de datos puede no
existir moda y se llama AMODAL.
CUARTILES
DECILES
Los cuartiles son los tres valores de la variable
que dividen a un conjunto de datos
ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores
correspondientes al 25%, al 50% y al 75% de
los datos.
Q2 coincide con la mediana.
Los deciles son los nueve
valores que dividen la serie de datos en diez
partes iguales.
Los deciles dan los valores correspondientes
al 10%, al 20%... y al 90% de los datos.
D5 coincide con la mediana.
PERCENTILES
Los percentiles son los 99
valores que dividen la serie de datos en 100
partes iguales.
Los percentiles dan los valores
correspondientes al 1%, al 2%... y al 99% de
los datos.
P50 coincide con la mediana.
CUANTILES
QUINTILES
Un quintil es la quinta parte de una población
estadística ordenada de menor a mayor en alguna
característica de esta.
dividen a la población en cinco partes iguales,
cada una de ellas contiene al 20% de los datos de
la población. Existen 4 quintiles que se denotan
por Q1, Q2, Q3, Q4
2. TABLA DE CONTINGENCIA
Una compañía opera cuatro
máquinas tres turnos al día.
De los registros de
producción, se obtienen los
siguientes datos sobre el
número de fallas.
En ciertas ocasiones, los elementos de una muestra tomada de una población pueden
clasificarse de acuerdo con dos criterios diferentes. Por tanto, es importante conocer si
estadísticamente los dos métodos de clasificación son estadísticamente
independientes.
EJEMPLO
El interés en una tabla de contingencia es probar la hipótesis de que los
métodos de clasificación renglón-columna son independientes. Si se
rechaza la hipótesis entonces se concluye que existe alguna interacción
entre los dos criterios de clasificación.
Existen diversos gráficos utilizados para la presentación de tablas de
contingencia, a continuación se presenta el gráfico de barras y el grafico de
barra combinadas.
3. DIAGRAMA DE CAJA (BOX-PLOT)
suministra información sobre los valores mínimo y máximo,
los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de
valores atípicos y la simetría de la distribución. Primero es
necesario encontrar la mediana para luego encontrar los 2
cuartiles restantes
Es un gráfico, basado en cuartiles, mediante el cual se
visualiza un conjunto de datos. Está compuesto por un
rectángulo, la "caja", y dos brazos, los "bigotes".
Para expresarlo gráficamente hay que tener en cuenta.
• Ordenar los datos y obtener el valor mínimo, el
máximo, los cuartiles Q1, Q2 y Q3 y el Rango Inter
Cuartilico (RIC)
• Los bigotes, las líneas que se extienden desde la
caja, se extienden hasta los valores máximo y
mínimo de la la serie o hasta 1.5 veces el RIC
Cuando los datos se extienden más allá de esto,
significa que hay valores atípicos en la serie y
entonces hay que calcular los límites superior e
inferior, Li y Ls
• Ahora se buscan los últimos valores que NO son
atípicos, que serán los extremos de los bigotes.
• Marcar como atípicos todos los datos que están
fuera del intervalo (Li, Ls).
Proporcionan una visión general de la simetría de la distribución
de los datos; si la mediana no está en el centro del rectángulo, la
distribución no es simétrica.
Pertenece a las herramientas de las estadística descriptiva.
Permite ver como es la dispersión de los puntos con la mediana,
los percentiles 25 y 75 y los valores máximos y mínimos.