Este documento proporciona una guía sobre medidas estadísticas descriptivas, incluyendo medidas de tendencia central, posición y dispersión para datos agrupados y no agrupados. Explica cómo calcular la media, moda, mediana, deciles, cuartiles, percentiles, varianza, desviación estándar y otros. También describe los tipos de sesgo y cómo determinar las clases y los intervalos para datos agrupados.
Sesión de aprendizaje Planifica Textos argumentativo.docx
Formulario Estadística Descriptiva
1. ELABORÓ: PROFA. DALIA QUIROZ MARTINEZ 1
FORMULARIO BÁSICO DE ESTADÍSTICA DESCRIPTIVA
Medidas de Tendencia Central: Para datos NO agrupados.
Donde:
X: Media o promedio Mo: Moda (Dato que mayor frecuencia tiene es decir el que
∑: Sumatoria de todos los datos más veces se repite).
𝑥𝑖:Datos que se tienen Mdn: Mediana (Dato que se encuentra a la mitad, previamente
n: número total de datos acomodando los datos en forma creciente, si el número
de datos es par entonces los dos que quedan en medio
se suman y dividen entre 2)
Para formar los intervalos:
1. Deteerminar el número de clases (renglones)
Con la Regla de Sturges:
𝐶 = 3.3 log( 𝑛) + 1 (No se redondea se deja en el entero que sale)
2. Determinar el rango
Xmáx – Xmín (dato mayor – dato menor)
3. Obtener la amplitud (qué tanto se va contar del límite inferior al superior)
𝐴 =
𝑅𝑎𝑛𝑔𝑜
𝑁𝑜.𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠
Medidas de Tendencia Central: Para datos agrupados. (Cuando hay intervalos)
Media: Donde:
=
∑(𝑥𝑖 𝑓 𝑖)
𝑛
: media
∑: Sumatoria
𝑥𝑖:Datos (marca de clase:
𝐿 𝑖+𝐿 𝑠
2
, dado un intervalo: 𝐿𝑖 − 𝐿 𝑠)
𝑓𝑖: Frecuencia
n: número total de datos (el que se suma de toda la frecuencia 𝑓𝑖)
Mediana:
𝑀𝑑𝑛 = 𝐿𝑖 + [
𝑛
2
−𝑓𝑎
𝑓𝑐
] 𝐼 Mdn: Mediana
𝐿𝑖: Límite real inferior del renglón que si se está trabajando (cuando se hace el “8” con
Los extremos de los límites).
n: número total de datos
𝑓𝑎: frecuencia acumulada anterior al renglón que si se está trabajando
𝑓𝑐: frecuencia del renglón que se está trabajando
I: Intervalo (Diferencia en forma vertical tomando cualquier par de los intervalos)
Nota: para saber con qué renglón se va a trabajar la mediana se saca la clase mediana:
𝑛
2
y este valor se busca es
la frecuencia acumulada (donde quepa) y ese es el renglón con el que se va a trabajar.
Moda:
𝑀𝑜 = 𝐿𝑖 + [
∆1
∆1+∆2
] 𝐼 Mo: Moda (la clase que mayor frecuencia tiene)
𝐿𝑖: Límite real inferior del renglón que si se está trabajando (cuando se hace el “8”
Los extremos de los límites).
∆1: frecuencia mayor – frecuencia anterior
∆2: frecuencia mayor – frecuencia siguiente
Nota: Si la clase modal coincide con la clase mediana (es decir en el mismo renglón) el 𝐿𝑖 será el mismo. El intervalo
(I) no cambia es el mismo en ambos casos.
2. ELABORÓ: PROFA. DALIA QUIROZ MARTINEZ 2
Tipos de Sesgo
Medidas de posición
Las medidas de posición son los deciles (D), cuartiles (Q) y percentiles (P).
Los deciles van de 10 en 10, los cuartiles de 25 en 25 y lo percentiles de 1 en 1. Como el total de los datos
es el 100%, entonces hay 10 deciles (10%...90%), 4 cuartiles (25%, 50% y 75%) y 100 percentiles (1%...99%)
Para conocer la posición del decil, cuartil o percentil:
𝑄1 =
𝑖(𝑛+1)
4
Q: cuartil
𝐷1 =
𝑖(𝑛+1)
10
i: Número del decil, cuartil o percentil (el decil se toma como un solo dígito por ejemplo
𝑃1 =
𝑖(𝑛+1)
100
si el decil es 40 se toma como 4, el percentil si se toma completo, y el decil si el 1
Corresponde al 25%, si es el 2 al 50% y si es el 3 al 75%)
n: número de datos.
Una vez que se conoce la posición se ubica el renglón dónde va a “caer” con respecto a la frecuencia
acumulada.
Cuartil
𝑄1 = 𝐿𝑖 + [
𝑁 𝑜−𝑓𝑎
𝑓𝑐
] 𝐼
Decil
𝐷1 = 𝐿𝑖 + [
𝑁 𝑜−𝑓𝑎
𝑓𝑐
] 𝐼
Percentil
𝑃1 = 𝐿𝑖 + [
𝑁 𝑜−𝑓𝑎
𝑓𝑐
] 𝐼
Sesgo +Sesgo -
La moda es la
línea más alta.
Las fórmulas son idénticas a la de la mediana sólo
cambia 𝑁𝑜 que es el valor de la posición que se
obtuvo anteriormente (con la fórmula para
obtener la posición).
3. ELABORÓ: PROFA. DALIA QUIROZ MARTINEZ 3
Medidas de Dispersión o Variabilidad (Para una muestra)
Para dataos No agrupados:
Varianza: Donde:
𝑆2
=
∑(𝑥𝑖− )2
𝑛−1
𝑆2
: Varianza
𝑥𝑖: Dato
: Media o promedio
Desviación estándar:
Es la raíz cuadrada de la varianza.
𝑆 = √𝑆2 S: Desviación estándar
Coeficiente de variación:
𝐶𝑉 =
𝑆
(100) CV: Coeficiente de variación
S: Desviación estándar
: Media o promedio
Índice de Asimetría
𝑎3 =
[
∑(𝑥 𝑖− )3
𝑛−1
]
𝑆3 𝑎3: índice de asimetría
𝑆3
: Desviación estándar al cubo
Tipo de Sesgo:
Índice de Curtosis
𝑎4 =
[
∑(𝑥 𝑖− )4
𝑛−1
]
𝑆4 𝑎4: Índice de curtosis
𝑆4
: Desviación estándar a la cuarta
𝑎3 > 0 Positivo 𝑎3 = 0 Simétrica 𝑎3 < 0 Negativo
𝑎4 > 3 𝑎4 = 3 𝑎4 < 3
4. ELABORÓ: PROFA. DALIA QUIROZ MARTINEZ 4
Las fórmulas para una población de las medidas de dispersión son exactamente iguales a las de la muestra
sólo cambia:
En muestra En población
Media 𝜇
No. de datos n – 1 N
Varianza 𝑆2
𝜎2
Desv. Estándar 𝑆 𝜎
Por lo tanto:
Varianza: Desv. Estándar Índice de asimetría Índice de curtosis
𝜎2
=
∑(𝑥𝑖−𝜇)2
𝑁
𝜎 = √𝜎2 𝑎3 =
[
∑(𝑥 𝑖−𝜇)3
𝑁
]
𝜎3 𝑎4 =
[
∑(𝑥 𝑖−𝜇)4
𝑁
]
𝜎4
Regla empírica
𝜇
𝜇
𝜇
¡La regla empírica sólo es para éstos valores!!
Medidas de Dispersión para datos Agrupados (Con Intervalos)
Dado que hay un intervalo el dato que se toma como “X” es el de la marca de clase o sea el punto medio de cada
intervalo: 𝑚𝑗.
Varianza: Desv. Estándar: Coef. De Var. Índice de asimetría Índice de curtosis
𝑆2
=
∑[(𝑚 𝑗− )2 𝑓 𝑖]
𝑛−1
𝑆 = √𝑆2 𝐶𝑉 =
𝑆
(100) 𝑎3 =
[
∑(𝑚 𝑗− )3 𝑓 𝑖
𝑛−1
]
𝑆3 𝑎4 =
[
∑(𝑚 𝑗− )4 𝑓 𝑖
𝑛−1
]
𝑆4
𝑚𝑖: marca de clase (
𝐿 𝑖+𝐿 𝑠
2
)
𝑓𝑖: frecuencia
: media o promedio
68%
16%
16%
%&
%
Margen de error
𝜇 + 1𝜎𝜇 − 1𝜎
95%
𝜇 + 2𝜎𝜇 − 2𝜎
2.5%
2.5%
Margen de error
99%
0.5%0.5%
𝜇 + 3𝜎𝜇 − 3𝜎
Margen de error