Este documento presenta conceptos básicos de estadística descriptiva. Explica que la estadística es una herramienta útil para el análisis de datos y la toma de decisiones. Se dividen los temas en presentación y organización de datos, medidas de tendencia central, gráficos estadísticos y ejemplos ilustrativos.
1. LICEO NAVAL CAPITÁN DE CORBETA
MANUEL CLAVERO
ESTADÍSTICA
DESCRIPTIVA
Jose Gonzales Villanueva
Profesor de Matemática
clavero_matematica_gonzales@yahoo.es
www.mate-clavero.blogspot.com
2. ¿Por qué hay que conocer la
Estadística y quiénes la utilizan?
• Está presente en todas las áreas del
saber humano. Lo utilizan médicos,
banqueros, deportistas, amas de
casa.
• Es una herramienta fundamental en
la investigación.
• Permite realizar una buena toma de
decisiones.
3. Definición
• La Estadística es una ciencia con base
matemática que utiliza instrumentos
para recoger datos, presentarlos,
ordenarlos y analizarlos para obtener
información útil que permita inferir
conclusiones y garantice una buena
toma de decisiones.
4. Subdivisión de la Estadística
ESTADÍSTICA
ESTADÍSTICA ESTADÍSTICA TEORÍA DE
DESCRIPTIVA INFERENCIA DECISIONES
6. Organización y Presentación
de datos
• Cuando se realiza la recopilación , se
obtiene una gran cantidad de datos.
•Clasificados
deben
DATOS •Ordenados
ser
•Presentados
en
Tablas •Comprensión
para
y •Descripción
facilitar
Gráficos •Análisis
7. Presentación de datos
no agrupados
• Ejemplo 1: Los sueldos mensuales de 60 empleados de la
empresa Metro de Ventanilla, son los siguientes
440 560 335 587 613 400 424 466 565 393
453 650 407 376 470 560 321 500 528 526
570 430 618 537 409 600 550 432 591 428
440 340 558 460 560 607 382 67 512 492
450 530 501 471 660 470 364 634 580 450
574 500 462 380 518 480 625 507 645 382
Datos no agrupados
8. Presentación de datos
agrupados
• Ejemplo 2: Número de alumnos de tercer grado de
secundaria matriculados el presente año 2008 en cada
sección
Nº de
Sección
alumnos
A 30
B 34
C 32
D 36
E 30
F 31
G 35
h 32
Datos agrupados en una
tabla sin intervalos
9. Presentación de datos
agrupados
• Ejemplo 3: Distribución de 150 habitantes de la unidad
vecinal Santa Rosa según estatura
Estatura (cm.) Frecuencia
[1,00 - 1,10> 13
[1,10 - 1,20> 15
[1,20 - 1,30> 15
[1,30 - 1,40> 14
[1,40 - 1,50> 18
[1,50 - 1,60> 16
[1,60 - 1,70> 15
[1,70 - 1,80> 15
[1,80 - 1,90> 14
[1,90 - 2,00> 15
Datos agrupados en una
tabla con intervalos
10. Construcción de una
distribución de frecuencias
1. Nos fijamos en el número de datos (n)
2. Buscamos el dato mínimo y máximo y
calculamos el rango (r)
r = máx. - mín.
3. Determinamos el número de intervalos (m)
m = 1 + 3,3 log(n)
4. Verificamos la amplitud del intervalo (c)
c = r/m
11. Construcción de una
distribución de frecuencias
• Ejemplo 4: La siguiente tabla muestra los gastos semanales de
80 trabajadores de una compañía agrupados en intervalos
Frecuencia
Frecuencia Frecuencia Frecuencia
Marca Frecuencia Frecuencia relativa
Intervalos absoluta relativa relativa
de clase absoluta relativa acumulada
acumulada acumulada porcentual
porcentual
[Li - Ls> xi fi Fi hi Hi hi x 100% Hi x 100%
150 5 5 0.0625 0.0625 6.25 6.25
[100 -200>
250 7 12 0.0875 0.15 8.75 15
[200 - 300>
350 28 40 0.35 0.5 35 50
[300 - 400>
450 17 57 0.2125 0.7125 21.25 71.25
[400 - 500>
550 18 75 0.225 0.9375 22.5 93.75
[500 - 600>
650 5 80 0.0625 1 6.25 100
[700 - 800>
80 1 100
Total
13. Reducción de Datos
Medidas de
Resumen
De Posición De Dispersión De Deformación De Apuntamiento
o o o o
Tendencia Central Variabilidad Asimetría Kurtosis
Simetría Platikúrtica
Media Rango
Asimetría Positiva Mesokúrtica
Mediana Varianza
Asimetría Negativa Leptokúrtica
Moda Desviación Estándar
14. ¡¡¡ Ganaste un viaje !!!
Playa Bávaro Playa Tambor
Punta Cana Punta Arenas
República Dominicana Costa Rica
15. Gráfico de temperaturas
registradas el año 2008
40
35
Temperatura (ºC)
30
25
20
15
10
5
0
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
Playa Tambor Playa Bavaro
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
Playa Tambor 15 20 20 25 30 32 38 35 20 25 15 10
Playa Bavaro 20 24 22 30 25 30 35 35 33 30 22 15
17. Nº de personas que visitan mensualmente
el Parque de las Leyendas
Mes Nº de Mes Nº de
personas personas
Enero 154250 Julio 325415
Febrero 187234 Agosto 245615
Marzo 102435 Setiembre 254611
Abril 123543 Octubre 182568
Mayo 154757 Noviembre 142510
Junio 243518 Diciembre 132534
18. Medidas de Posición o
Tendencia Central
• Son valores numéricos en torno a los
cuales se agrupan los valores de una
variable estadística.
19. La Media (X)
es
el valor de la variable que indica
el promedio de todos los datos
trabajados
Se calcula
PARA DATOS PARA DATOS
NO AGRUPADOS AGRUPADOS
n
n
∑X ∑Xf
X + X + ... + Xn X1 f1 + X2 f2 +...+ Xn fn
i ii
X= =1 2 X= =
i =1 i =1
n n n n
Donde:
n : es el número de datos trabajados
X1,X2,…: En los Datos No Agrupados son los valores de la variable y en los
Datos Agrupados son la marca de clase del intervalo 1, intervalo 2, …
f : es la frecuencia absoluta.
20. Ejemplo 1 Ejemplo 2
Para Datos No Agrupados Para Datos Agrupados
Dada la siguiente tabla de
Sean los puntajes obtenidos
en 5 exámenes de Aritmética: distribución de frecuencias,
15 ; 12 ; 13 ; 15 ; 20 calcular la media aritmética
Determinar la nota media
xi fi xi x fi
[Li - Ls>
30 - 38 34 4 136
15 + 12 + 13 + 15 + 20 75
X= = = 15 38 - 46 42 6 252
5 5 46 - 54 50 3 150
54 - 62 58 3 174
62 - 70 66 4 264
70 - 78 74 5 370
25 1346
1346
X= = 53,84
25
21. La Mediana (Me)
es
el valor de la variable que divide
al total de observaciones en dos
partes de igual tamaño
Se calcula
PARA DATOS PARA DATOS
NO AGRUPADOS AGRUPADOS
n
− F
Ordenando de menor a mayor y eligiendo
el central. Si no hubiese un dato central,
Me = Li + ×C
2
entonces será igual a la media de los dos
valores centrales f
Donde:
Li : es el límite inferior del intervalo mediano
n : es el número de datos trabajados
F : es la frecuencia absoluta acumulada del intervalo anterior al intervalo
mediano
f : es la frecuencia absoluta del intervalo mediano
C : es el tamaño de la amplitud del intervalo
22. Ejemplo 1 Ejemplo 2
Para Datos No Agrupados Para Datos Agrupados
Dada la siguiente tabla de
Sean los puntajes obtenidos
distribución de frecuencias,
en 5 exámenes de Aritmética:
calcular la mediana
15 ; 12 ; 13 ; 15 ; 20
Determinar la mediana xi fi Fi
[Li - Ls>
30 - 38 34 4 4
Ordenar datos: 38 - 46 42 6 10
46 - 54 50 3 13
12 ; 13 ; 15 ; 15 ; 20 54 - 62 58 3 16
62 - 70 66 4 20
70 - 78 74 5 25
Me = 15 25
Datos
n/2= f = 3
12.5
Li = C=
46 8
F= Me =
10 52.67
23. La Moda (Mo)
es
el dato que más se repite
o la mayor frecuencia de un
conjunto de datos
Se calcula
PARA DATOS PARA DATOS
NO AGRUPADOS AGRUPADOS
Se toma el dato que más se repite
d1
Mo = Li +
d + d ×C
Si fuesen dos valores diferentes,
se habla de bimodal, de ser tres,
1 2
sería trimodal
Donde:
Li : es el límite inferior del intervalo modal
d1 : es la diferencia de la frecuencia (fi) del intervalo modal y la frecuencia (fi)
del intervalo inmediato anterior.
d2 : es la diferencia de la frecuencia (fi) del intervalo modal y la frecuencia (fi)
del intervalo inmediato posterior.
C : es el tamaño de la amplitud del intervalo
24. Ejemplo 1 Ejemplo 2
Para Datos No Agrupados Para Datos Agrupados
Dada la siguiente tabla de
Sean los puntajes obtenidos
distribución de frecuencias,
en 5 exámenes de Aritmética:
15 ; 12 ; 13 ; 15 ; 20 calcular la mediana
Determinar la moda
xi fi
[Li - Ls>
30 - 38 34 4
Conteo:
38 - 46 42 6
12 1 vez
46 - 54 50 3
13 1 vez 54 - 62 58 3
15 2 veces 62 - 70 66 4
20 1 vez 70 - 78 74 5
25
Mo = 15 Datos
fMo = Li =
6 38
fi-1 = 4 2
d1 =
fi+1 = 3 3
d2 =
C= Mo =
8 41.20
25. COMPARACIÓN DE MEDIA,
MEDIANA Y MODA
Media Mediana Moda
Toma en cuenta No toma en cuenta los Es la que más
todos los valores valores extremos fácilmente se
de la variable determina, puesto que
Es útil cuando la tabla de la podemos obtener
Es fácil de frecuencias no presenta por inspección
interpretar los valores del extremo
Ventajas
Cuando la
inferior del 1er intervalo y
distribución es casi
del extremo superior del
simétrica se puede
ultimo intervalo
utilizar:
Moda = 3Me- 2X
Se ve influenciada Requiere de un Pueden haber
por los valores ordenamiento previo de muchas modas o
Desventa
extremos datos que sería difícil sin ninguna
jas un ordenador
26. Ejemplo Demostrativo 1
Usando la hoja de calculo de Excel halle las tres
MTC estudiadas para los siguientes datos:
12, 141, 11, 14, 12, 10, 10, 12, 11, 14
Media Mediana Moda
24,7 12 12
Vemos que:
La media se ve afectada por el valor extremo 141.
27. Ejemplo Demostrativo 2
Usando la hoja de calculo de Excel halle las tres
MTC estudiadas para los siguientes datos:
12, 15, 11, 14, 13, 10, 20, 17
Media Mediana Moda
14 13,5 amodal
Vemos que:
Al no haber ningún valor que se repita, no hay
moda , por lo tanto el sistema es amodal
28. Posiciones relativas de la
Media, la Mediana y la Moda.
En casos en que la distribución de frecuencias es poco asimétrica se
cumple la siguiente relación empírica
Media – Moda = 3(media- mediana)
De acuerdo a la simetría o asimetría de la distribución de frecuencias
se cumple lo siguiente
30. Ejemplo demostrativo 1
En un estudio sobre comprensión de lectura en
inglés hecho a 100 personas la menor nota fue de
40 puntos y la mayor, de 180. Para la distribución
de frecuencias se usaron siete intervalos de igual
longitud y las frecuencias de los intervalos fueron
respectivamente: 19, 20, 25, 15, 10, 6 y 5.
1.Construye la distribución de frecuencias con sus intervalos,
marcas de clase y frecuencias.
2.Calcula la media, la mediana y la moda de las notas
3.Dibuja el HISTOGRAMA y ubica en él la media, la mediana
y la moda
34. Ahora tu
Los gastos semanales de 65 amas de casa oscilan
entre 60 y 300 soles. Agrupando los datos en 8
intervalos de igual amplitud se tienen las siguientes
frecuencias: 2, 3, 5, 7, 12, 15, 13, 8
1.Construye la distribución de frecuencias con sus intervalos,
marcas de clase y frecuencias.
2.Calcula la media, la mediana y la moda de las notas
3.Dibuja el HISTOGRAMA y ubica en él la media, la mediana
y la moda