Este documento presenta información sobre medidas estadísticas descriptivas como la media, mediana, moda, cuartiles, desviación estándar y varianza. Explica que las medidas de tendencia central como la media solo proporcionan información parcial y deben estar acompañadas de medidas de dispersión. También define conceptos como la varianza, que cuantifica cuán dispersos están los valores de una distribución con respecto a la media.
1. Núcleo Monagas, Campus Juanico
Postgrado en Agricultura Tropical
Universidad de Oriente
Ramón Silva-Acuña (Ph. D)
Renny Barrios M. (M. Sc.)
Maturín, Mayo 2015
Estadística Descriptiva:
Medidas de tendencia central y de dispersión
2. Unidad I. Estadística Descriptiva
Tema 3. Medidas de tendencia central
Media aritmética, mediana, moda, cuantiles.
Tema 4. Medidas de dispersión o de variabilidad
Rango, desviación estándar, varianza, coeficiente
de variación, intervalos de confianza.
3. • Estadística: Descriptiva e inferencial
a la recolección
Presentación
descripción
análisis e interpretación de una colección de datos
• Resumirlos con elementos de información (medidas
• descriptivas): que caracterizan la totalidad de las
• observaciones.
Y poder elaborar las propias conclusiones
5. Medidas de tendencia central
• ¿Que significa una temperatura promedio de 21°C?
• Es una medida vaga pero informativa, asociarla con
una de dispersión en publicaciones científicas.
• Medidas de tendencia central
– Moda
– Mediana
– Cuantiles
• La medida de tendencia central mas común y la
mejor en muchos casos es la media aritmética
6. Medidas de tendencia central
• Que es la moda: el valor que ocurre con mas
frecuencia en una muestra o en una
población. El investigador muestra el tipo de
observación que ocurre con mas frecuencia
• Caso ocurra distribución de Poisson la moda
y la media serian iguales
• Distribución binomial la moda y la media
están relacionadas, son diferentes
7. Escor (% de correctos) Frecuencia
58 2
60 2
62 3
64 2
66 3
67 4
68 1
69 1
70 1
93 5
Medidas de tendencia central
( La moda )
8. Ventajas de la moda
Permite visualizar cuando dos o más grupos
distintos aparecen en un mismo grupo de datos.
(Distribuciones bimodales, trimodales)
Cuando un valor predomina es fácil de detectar
9. Desventajas de la moda
No provee información referente a la distribución
de frecuencia de un grupo de datos
No siempre existe
Pueden existir dos modas o sea dos grupos de
valores con la misma frecuencia
Es insensible a la presencia de valores
extremos
10. Medidas de tendencia central
• La mediana (Posición)
• Es una medida de tendencia central que divide los datos en
partes iguales, tanto hacia arriba como hacia abajo
• Para su calculo es necesario organizar los datos de mayor a
menor
• El numero de datos puede ser par o impar
• Si el numero de datos es par
2
2
1
2
• Si es impar el calculo se realiza de la siguiente manera
1
2
• Donde n representa el numero de datos
11. Medidas de tendencia central
La mediana
• Caso que el numero de datos sea par,
la mediana es el valor promedio de los
dos valores centrales
• La media y la mediana son mas
confiables porque están próximas al
lugar donde se encuentran la mayoría
de las observaciones
12. Calculo de la mediana
Planta Altura
1 2,06
2 2,05
3 2,00
4 2,00
5 1,95
6 1,90
7 1,80
8 1,71
9 1,70
10 1,70
Medidas de tendencia central
Para datos pares. N = 10
ó
13. Calculo de la mediana
Planta Altura
1 2,06
2 2,05
3 2,00
4 2,00
5 1,95
6 1,90
7 1,80
8 1,71
9 1,70
Medidas de tendencia central
Para datos pares. N = 10
14. Medidas de tendencia central
Ventajas de la mediana
• No es muy sensible a la presencia de valores
extremos
• Reduce el efecto de valores extremos para obtener
un valor representativo de centro
15. Medidas de tendencia central
Desventajas de la mediana
Sensible al tamaño del conjunto de datos
Implica ordenar los datos
Insensible a la magnitud de los valores
16. Medidas de tendencia central
• La necesidad de que ambos tipos de
medidas estén asociadas (tendencia central
y e dispersión) donde se presenten
La media
• Es la medida de tendencia central mas
utilizada es conocida también como media
aritmética.
• La media de una muestra es una estimativa
de la media de la población.
• La diferencia entre una muestra y una
población
17. Medidas de tendencia central
• La media aritmética o simplemente la media
+ + + + ……+ )/n
18. Medidas de tendencia central
Características de la media
• De las medidas de tendencia central es la
mas confiable, porque ella tiende a variar
menos entre muestras de una misma
población
• Para cualquier distribución, la media es el
punto alrededor del cual todos los valores de
Xi se concentran.
• La suma de los desvíos alrededor de la
media es cero
19. Medidas de tendencia central
La suma de los desvíos entorno a la media es
igual a cero
Xi Xi - X
65 (65 – 78) = -13
73 (73 – 78) = -5
77 (77 – 78) = -1
85 (85 – 78) = 7
90 (90 – 78) = 12
= 0
Rehacer el ejercicio empleando un valor mayor o menor a la media (79 y 76)
20. Medidas de tendencia central
La suma de los desvíos entorno a la media es
igual a cero
Xi Xi - X
65 (65 – 79) = -14
73 (73 – 79) = -6
77 (77 – 79) = -2
85 (85 – 79) = +6
90 (90 – 79) = +11
= - 5
21. Medidas de tendencia central
Ventajas de la media
Extrae el máximo de información de un
conjunto de datos
Siempre existe
Es fácil de calcular
22. Medidas de tendencia central
Desventaja de la media
• Se ve seriamente afectada por valores extremos en
un conjunto de datos
23. Medidas de tendencia central
CUANTILES
• Un cuantil es una medida de posición que
permite determinar que valor de un grupo de
datos es de tal forma que sólo cierto porcentaje
del total de datos está por debajo de dicho valor.
24. Medidas de tendencia central
CUANTILES
• Los cuantiles más utilizados son:
• Cuartiles: dividen un conjunto de datos
en subgrupos de 25
• Deciles: dividen un conjunto de datos
en subgrupos de 10
• Percentiles: dividen un conjunto de
datos en subgrupos de 100
25. CUANTILES
Las fórmulas para cálculo de estos cuantiles son
(Datos no agrupados):
2
1
4
knk XQ
2
1
10
knk XD
2
1
100
knk XP
PercentilesDecilesCuartiles
Donde: k = Cuantil a calcular
n = número de datos
Medidas de tendencia central
26. CUANTILES
Como el cálculo es sobre las posiciones de los valores al
ordenarlos de manera ascendente se debe tomar en
cuenta lo siguiente:
• Si la posición calculada es un número entero se toma el
valor que guarda dicha posición.
• Si la posición calculada es un número con decimales
entonces se toma el entero superior próximo.
Medidas de tendencia central
31. • La probabilidad de tener un accidente de tráfico
aumenta con el tiempo que pasas en la calle. Por tanto,
cuanto mas rápido circules, menor es la probabilidad de
que tengas un accidente.
• El 33% de los accidentes mortales involucran a alguien
que ha bebido. Por tanto, el 67% restante ha sido
causado por alguien que no había bebido.
Datos curiosos
Entonces, está claro, que la forma mas
segura de conducir es ir borracho y a gran
velocidad!!!
33. MEDIDAS DE DISPERSIÓN
• La varianza
• La desviación estándar
• La amplitud
• El error estándar de la media
• El coeficiente de variación
34. Media es igual a 10
MEDIDAS DE DISPERSIÓN
8 8 9 10 11 12 12
5 6 8 10 12 14 15
1 2 5 10 15 18 19
Las medidas de tendencias central solo proporcionan
un resumen parcial de la información de un conjunto
de datos; por lo tanto, es evidente que debe estar
acompañada de una medida de dispersión
• Las medias, similar a otras medidas de tendencia
central no nos dice nada de la variación
35. MEDIDAS DE DISPERSIÓN
8 9 10 10 10 11 12
5 7 9 10 11 13 15
1 5 8 10 12 15 19
8 8 9 10 11 12 12
5 6 8 10 12 14 15
1 2 5 10 15 18 19
• En ambos cuadros el valor promedio es 10
• Observe que ambos grupos tienen dispersiones de 4,
10 y 18
• El primer conjunto presenta mas dispersión en los
extremos
• En el segundo grupo hay mayor concentración hacia la
media
Grupos de datos [La varianza]
36. MEDIDAS DE DISPERSIÓN
La varianza
• Parece deseable tener una definición que utilice todas las
observaciones y que proporcione un valor pequeño cuando
estas se encuentren alrededor de la media y un valor grande
Cuando estén muy dispersas
• Sean los números: 5, 6, 8, 10, 12, 14, 15
• De acuerdo con nuestra definición estos números no son mas
variables que los números: 105, 106, 108, 110, 120, 140, 115
• Así, nuestra definición no depende del tamaño de los números
en el sentido de relacionar la medida de la dispersión con la
media, dará el mismo valor para los dos conjuntos de datos
37. s2
=
+(X1 – X ) 2 ( X2 – X )2+ ( Xi –Xn )2
n – 1
s2
=
( Xi – X )
2
n – 1
∑
MEDIDAS DE DISPERSIÓN
La Varianza
• La medida numérica de dispersión resultante debe
admitir interpretación en términos de observaciones.
La unidad de la medida debe ser la misma.
• La mejor medida de dispersión y la mas
generalizada es la varianza o su raíz cuadrada la
desviación estándar.
38. X
3, 6, 8 y 11 s2
=
( Xi – X )
2
n – 1
∑
X = 7
(3 - 7)2 + (6 - 7)2 + (8 - 7)2 + (11 - 7)2
(- 4)2 + (- 1)2 + (- 1)2 + (- 4)2
16 + 1 + 1 + 16
Veamos este ejemplo de calculo de varianza
34 / 3 = 11,33
39. Otra manera de presentarlo
s2
=
( xi – X )
2
n – 1
∑
Xi Xi Xi – X ( Xi – X )
22
3
6
8
11
9
36
64
121
( 3 – 7 )
( 6 – 7 )
( 8 – 7 )
( 11 – 7 )
- 4
- 1
+ 1
+ 4
16
1
1
16
0 34 / 3 = 11,33
s
2
=
Xi 2 –
2
n – 1
∑
(∑ Xi )
n
40. Otro ejemplo: con datos menos dispersos
s2
=
( xi – X )
2
n – 1
∑
Xi Xi Xi – X ( Xi – X )
22
4,1
3,7
3,5
4,0
18,81
13,69
12,25
16,00
( 4,1 – 3,825)
( 3,7 – 3,825)
( 3,5 – 3,825)
( 4,0 – 3,825)
0,275 0,07
0,01
0,10
0,03
0
0,21 / 3 = 0,07s
2
=
Xi 2 –
2
n – 1
∑
(∑ Xi )
n
- 0,125
- 0,325
0,175
41. Veamos la comparación de las varianzas y las medias
con los dos ejemplos
Xi1 Xi2
4,1
3,7
3,5
4,0
3,0
6,0
8,0
11,0
s2
0,07 11,33
X 3,82 7,00
Mas adelante
calcularemos
el coeficiente de
variación, para estos
valores
42. ¿Que representa la varianza, como resumen de la
distribución de frecuencia?
s2=2 s2=1
s2=0.4
26.34 31.46 36.59 41.72 46.84
Variable
0.00
0.02
0.04
0.06
0.08
frecuenciasrelativas
Distribución de frecuencias con varianzas diferentes
Muestra
Distribución de frecuencias con varianzas diferentes
S2 =2 S2 =1
S2 =0,4
43. [La desviación estándar]
s
2
=
( xi – X )2
n – 1
∑
s2
=
Xi –
2
n – 1
∑ (∑ Xi )
n
2
Varianza
Desviación estándar
s =
( xi – X )2
n – 1
∑√ s =
Xi –
2
n – 1
∑ (∑ Xi )
n
2
√
44. Otras medida de dispersión:
La diferencia entre el valor mas alto y el mas bajo del
rol de datos
[El error estándar de la media]
[La amplitud]
s y =
s
√ n
45. Otra medida de dispersión muy importante:
[El coeficiente de variación]
CV( % ) =
100 s
X
Es la medida usada por los investigadores para
evaluar los resultados de diferentes experimentos
con la misma característica y realizadas en diferentes
investigaciones.
La explicación de porque el coeficiente de variación
es alto o bajo
46. X – t Sx ≤ µ ≤ X + t Sx
Error estándar
de la media
50. EJERCICIOS DE ESTADISTICA EXPERIMENTAL
(Calculo de estadísticas descriptivas e intervalo de confianza
en rol de datos)
Maturín, Abril-Septiembre, 2015
[Primer periodo]
51. Ejercicio de estadística descriptiva
Ejemplo : Peso de 14 adultos muestreados al azar en un
salón de aulas
76 75 74 73 72 71 70
69 68 67 66 65 64 63
Calcule la media, la mediana, la moda, la varianza,
la desviación estándar y, el intervalo de confianza
para la media
Agricultura: Altura de plantas, estudios de taxonomia de insectos, etc.
52. M =
70 + 69
2
= 69,5
2- Calculo de la media
X
∑ Xi
=
N
X =
973
14
=X 69,5
Md = [ (n/2) + (n/2 + 1) / 2 ]
Para datos pares
= [ (14/2) + (14/2 + 1) / 2 ]
= [ (7) + (8) / 2 ]
= 7,5 posición
Distribución normal
54. 1- Calculo de la varianza (S2)
s2
=
( xi – X )2
n – 1
∑
=
13
227,50
s
2
= 17,5
2- Calculo de la desviación estándar (S)
S = √ varianza (S2)
= √ 17,5
= 4,18
s = 4,18
55. 3- Calculo del error estándar de la media ( Sx )
S x =
Desviación estándar(S)
√ N
=
4,18
√14
=
4,18
3,74
1,11S x =
56. X – t Sx ≤ µ ≤ X + t Sx
Se iguala a la media de
la población
57. 4- Calculo del intervalo de confianza
X – t Sx ≤ µ ≤ X + t Sx
69,5 – 2,16 . 1,11 ≤ µ ≤ 69,5 + 2,16 . 1,11
t = 2,16
13 g l
α 0,05 ó 5%
67,5 ≤ µ ≤ 71,4
t Sx = 2,16 x 1,11 = 2,39
1,11S x =
=X 69,5
69,5 – t 1,11 ≤ µ ≤ 69,5 + t 1,11
69,5 – 2,39 ≤ µ ≤ 69,5 + 2,39
¿Qué significa esto?
Interpretar el intervalo
58. La frase de la semana
Todo dolor físico es la expresión de un dolor emocional