1. ESTADESTADÍÍSTICASTICA
DESCRIPTIVADESCRIPTIVA
Jose Gonzales VillanuevaJose Gonzales Villanueva
Profesor de MatemProfesor de Matemááticatica
clavero_matematica_gonzales@yahoo.esclavero_matematica_gonzales@yahoo.es
www.matewww.mate--clavero.blogspot.comclavero.blogspot.com
LICEO NAVAL CAPITLICEO NAVAL CAPITÁÁN DE CORBETAN DE CORBETA
MANUEL CLAVEROMANUEL CLAVERO
2. ¿¿Por quPor quéé hay que conocer lahay que conocer la
EstadEstadíística y quistica y quiéénes la utilizan?nes la utilizan?
• Está presente en todas las áreas del
saber humano. Lo utilizan médicos,
banqueros, deportistas, amas de
casa.
• Es una herramienta fundamental en
la investigación.
• Permite realizar una buena toma de
decisiones.
3. DefiniciDefinicióónn
• La Estadística es una ciencia con base
matemática que utiliza instrumentos
para recoger datos, presentarlos,
ordenarlos y analizarlos para obtener
información útil que permita inferir
conclusiones y garantice una buena
toma de decisiones.
4. SubdivisiSubdivisióón de la Estadn de la Estadíísticastica
ESTADÍSTICA
ESTADÍSTICA
DESCRIPTIVA
ESTADÍSTICA
INFERENCIA
TEORÍA DE
DECISIONES
6. OrganizaciOrganizacióón y Presentacin y Presentacióónn
de datosde datos
• Cuando se realiza la recopilación , se
obtiene una gran cantidad de datos.
DATOS
•Clasificados
•Ordenados
•Presentados
deben
ser
•Comprensión
•Descripción
•Análisis
Tablas
y
Gráficos
para
facilitar
en
7. PresentaciPresentacióón de datosn de datos
no agrupadosno agrupados
• Ejemplo 1: Los sueldos mensuales de 60 empleados de la
empresa Metro de Ventanilla, son los siguientes
450580634364470660471501530450
382645507625480518380462500574
340
430
650
560
460
537
376
587
607
600
560
400
492
428
526
393
67
432
500
466
512382560558440
591550409618570
528321470407453
565424613335440
Datos no agrupados
8. 32h
35G
31F
30E
36D
32C
34B
30A
Nº de
alumnos
Sección
• Ejemplo 2: Número de alumnos de tercer grado de
secundaria matriculados el presente año 2008 en cada
sección
Datos agrupados en una
tabla sin intervalos
PresentaciPresentacióón de datosn de datos
agrupadosagrupados
9. 15[1,90 - 2,00>
14[1,80 - 1,90>
15[1,70 - 1,80>
15[1,60 - 1,70>
16[1,50 - 1,60>
18[1,40 - 1,50>
14[1,30 - 1,40>
15[1,20 - 1,30>
15[1,10 - 1,20>
13[1,00 - 1,10>
FrecuenciaEstatura (cm.)
• Ejemplo 3: Distribución de 150 habitantes de la unidad
vecinal Santa Rosa según estatura
Datos agrupados en una
tabla con intervalos
PresentaciPresentacióón de datosn de datos
agrupadosagrupados
10. ConstrucciConstruccióón de unan de una
distribucidistribucióón de frecuenciasn de frecuencias
1. Nos fijamos en el número de datos (n)
2. Buscamos el dato mínimo y máximo y
calculamos el rango (r)
r = máx. - mín.
3. Determinamos el número de intervalos (m)
m = 1 + 3,3 log(n)
4. Verificamos la amplitud del intervalo (c)
c = r/m
11. • Ejemplo 4: La siguiente tabla muestra los gastos semanales de
80 trabajadores de una compañía agrupados en intervalos
ConstrucciConstruccióón de unan de una
distribucidistribucióón de frecuenciasn de frecuencias
100180Total
1006.2510.0625805650[700 - 800>
93.7522.50.93750.2257518550[500 - 600>
71.2521.250.71250.21255717450[400 - 500>
50350.50.354028350[300 - 400>
158.750.150.0875127250[200 - 300>
6.256.250.06250.062555150[100 -200>
Hi x 100%hi x 100%HihiFifixi[Li - Ls>
Frecuencia
relativa
acumulada
porcentual
Frecuencia
relativa
porcentual
Frecuencia
relativa
acumulada
Frecuencia
relativa
Frecuencia
absoluta
acumulada
Frecuencia
absoluta
Marca
de clase
Intervalos
13. ReducciReduccióón de Datosn de Datos
Medidas deMedidas de
ResumenResumen
De Posición
o
Tendencia Central
De Dispersión
o
Variabilidad
De Deformación
o
Asimetría
Rango
Varianza
Desviación Estándar
De Apuntamiento
o
Kurtosis
Media
Mediana
Moda
Simetría
Asimetría Positiva
Asimetría Negativa
Platikúrtica
Mesokúrtica
Leptokúrtica
14. ¡¡¡¡¡¡ Ganaste un viaje !!!Ganaste un viaje !!!
Playa Bávaro
Punta Cana
República Dominicana
Playa Tambor
Punta Arenas
Costa Rica
15. GrGrááfico de temperaturasfico de temperaturas
registradas el aregistradas el añño 2008o 2008
152230333535302530222420Playa Bavaro
101525203538323025202015Playa Tambor
DicNovOctSepAgoJulJunMayAbrMarFebEne
0
5
10
15
20
25
30
35
40
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
Temperatura(ºC)
Playa Tambor Playa Bavaro
17. NNºº de personas que visitan mensualmentede personas que visitan mensualmente
el Parque de las Leyendasel Parque de las Leyendas
142510Noviembre154757Mayo
254611Setiembre102435Marzo
245615Agosto187234Febrero
132534Diciembre243518Junio
182568Octubre123543Abril
325415Julio154250Enero
Nº de
personas
MesNº de
personas
Mes
18. Medidas de PosiciMedidas de Posicióón on o
Tendencia CentralTendencia Central
• Son valores numéricos en torno a los
cuales se agrupan los valores de una
variable estadística.
19. La Media (X)La Media (X)
el valor de la variable que indica
el promedio de todos los datos
trabajados
PARA DATOS
NO AGRUPADOS
PARA DATOS
AGRUPADOS
n
XXX
n
X
X n21
n
1i
i
+++
==
∑= ...
es
Se calcula
n
fXfXfX
n
fX
X nn2211
n
1i
ii
+++
==
∑= ...
Donde:
n : es el número de datos trabajados
X1,X2,…: En los Datos No Agrupados son los valores de la variable y en los
Datos Agrupados son la marca de clase del intervalo 1, intervalo 2, …
f : es la frecuencia absoluta.
20. Ejemplo 1Ejemplo 1
Para Datos No AgrupadosPara Datos No Agrupados
Sean los puntajes obtenidos
en 5 exámenes de Aritmética:
15 ; 12 ; 13 ; 15 ; 20
Determinar la nota media
15
5
752015131215
==
++++
=
5
X
Ejemplo 2Ejemplo 2
Para Datos AgrupadosPara Datos Agrupados
Dada la siguiente tabla de
distribución de frecuencias,
calcular la media aritmética
134625
37057478-70
26446670-62
17435862-54
15035054-46
25264246-38
13643438-30
xi x fifixiLs>-[Li
84,53
25
1346
==X
21. Donde:
Li : es el límite inferior del intervalo mediano
n : es el número de datos trabajados
F : es la frecuencia absoluta acumulada del intervalo anterior al intervalo
mediano
f : es la frecuencia absoluta del intervalo mediano
C : es el tamaño de la amplitud del intervalo
La Mediana (Me)La Mediana (Me)
el valor de la variable que divide
al total de observaciones en dos
partes de igual tamaño
PARA DATOS
NO AGRUPADOS
PARA DATOS
AGRUPADOS
Ordenando de menor a mayor y eligiendo
el central. Si no hubiese un dato central,
entonces será igual a la media de los dos
valores centrales
C
f
F
2
n
LMe i ×
−
+=
es
Se calcula
22. Ejemplo 1Ejemplo 1
Para Datos No AgrupadosPara Datos No Agrupados
Sean los puntajes obtenidos
en 5 exámenes de Aritmética:
15 ; 12 ; 13 ; 15 ; 20
Determinar la mediana
Ordenar datos:
12 ; 13 ; 15 ; 15 ; 20
Me = 15 25
2557478-70
2046670-62
1635862-54
1335054-46
1064246-38
443438-30
FifixiLs>-[Li
Ejemplo 2Ejemplo 2
Para Datos AgrupadosPara Datos Agrupados
Dada la siguiente tabla de
distribución de frecuencias,
calcular la mediana
10
46
12.5
F =
Li =
n / 2 =
52.67Me =
8C =
3f =
Datos
23. Donde:
Li : es el límite inferior del intervalo modal
d1 : es la diferencia de la frecuencia (fi) del intervalo modal y la frecuencia (fi)
del intervalo inmediato anterior.
d2 : es la diferencia de la frecuencia (fi) del intervalo modal y la frecuencia (fi)
del intervalo inmediato posterior.
C : es el tamaño de la amplitud del intervalo
La Moda (La Moda (MoMo))
el dato que más se repite
o la mayor frecuencia de un
conjunto de datos
PARA DATOS
NO AGRUPADOS
PARA DATOS
AGRUPADOS
Se toma el dato que más se repite
Si fuesen dos valores diferentes,
se habla de bimodal, de ser tres,
sería trimodal
C
dd
d
LMo
21
1
i ×
+
+=
es
Se calcula
24. Ejemplo 1Ejemplo 1
Para Datos No AgrupadosPara Datos No Agrupados
Sean los puntajes obtenidos
en 5 exámenes de Aritmética:
15 ; 12 ; 13 ; 15 ; 20
Determinar la moda
Conteo:
12 1 vez
13 1 vez
15 2 veces
20 1 vez
Mo = 15
25
57478-70
46670-62
35862-54
35054-46
64246-38
43438-30
fixiLs>-[Li
Ejemplo 2Ejemplo 2
Para Datos AgrupadosPara Datos Agrupados
Dada la siguiente tabla de
distribución de frecuencias,
calcular la mediana
3d2 =3fi+1 =
8
4
6
C =
fi-1 =
fMo =
41.20Mo =
2d1 =
38Li =
Datos
25. COMPARACICOMPARACIÓÓN DE MEDIA,N DE MEDIA,
MEDIANA Y MODAMEDIANA Y MODA
Pueden haber
muchas modas o
ninguna
Requiere de un
ordenamiento previo de
datos que sería difícil sin
un ordenador
Se ve influenciada
por los valores
extremos
Desventa
jas
Es la que más
fácilmente se
determina, puesto que
la podemos obtener
por inspección
Cuando la
distribución es casi
simétrica se puede
utilizar:
Moda = 3Me- 2X
No toma en cuenta los
valores extremos
Es útil cuando la tabla de
frecuencias no presenta
los valores del extremo
inferior del 1er intervalo y
del extremo superior del
ultimo intervalo
Toma en cuenta
todos los valores
de la variable
Es fácil de
interpretar
Ventajas
ModaMedianaMedia
26. Ejemplo Demostrativo 1Ejemplo Demostrativo 1
Usando la hoja de calculo de Excel halle las tres
MTC estudiadas para los siguientes datos:
12, 141, 11, 14, 12, 10, 10, 12, 11, 14
121224,7
ModaMedianaMedia
Vemos que:
La media se ve afectada por el valor extremo 141.
27. Ejemplo Demostrativo 2Ejemplo Demostrativo 2
Usando la hoja de calculo de Excel halle las tres
MTC estudiadas para los siguientes datos:
12, 15, 11, 14, 13, 10, 20, 17
amodal13,514
ModaMedianaMedia
Vemos que:
Al no haber ningún valor que se repita, no hay
moda , por lo tanto el sistema es amodal
28. Posiciones relativas de laPosiciones relativas de la
Media, la Mediana y la Moda.Media, la Mediana y la Moda.
En casos en que la distribución de frecuencias es poco asimétrica se
cumple la siguiente relación empírica
Media – Moda = 3(media- mediana)
De acuerdo a la simetría o asimetría de la distribución de frecuencias
se cumple lo siguiente
30. Ejemplo demostrativo 1Ejemplo demostrativo 1
En un estudio sobre comprensión de lectura en
inglés hecho a 100 personas la menor nota fue de
40 puntos y la mayor, de 180. Para la distribución
de frecuencias se usaron siete intervalos de igual
longitud y las frecuencias de los intervalos fueron
respectivamente: 19, 20, 25, 15, 10, 6 y 5.
1.Construye la distribución de frecuencias con sus intervalos,
marcas de clase y frecuencias.
2.Calcula la media, la mediana y la moda de las notas
3.Dibuja el HISTOGRAMA y ubica en él la media, la mediana
y la moda
31. 1. Distribuci1. Distribucióón de frecuenciasn de frecuencias
8910.000.890.108910130140-1205
7915.000.790.157915110120-1004
6425.000.640.25642590100-803
100.001.00100
1005.001.000.051005170180-1607
956.000.950.06956150160-1406
3920.000.390.2039207080-602
1919.000.190.1919195060-401
Hi x 100%hi x 100%HihiFifixiLs>-[LiNº
Frecuencia
relativa
acumulada
porcentual
Frecuencia
relativa
porcentual
Frecuencia
relativa
acumulada
Frecuencia
relativa
Frecuencia
absoluta
acumulada
Frecuencia
absoluta
Marca de
clase
Intervalos7
32. 2. Medidas de tendencia central2. Medidas de tendencia central
9300
850
900
1300
1650
2250
1400
950
xi x fi
20C =
25f =
39F =
80Li =
50n / 2 =
Datos
20C =
80Li =
10d2 =
5d1 =
15fi+1 =
20fi-1 =
25fMo =
Datos
93S / n =
Media (x)
88.80Me =
Mediana (Me)
86.67Mo =
Moda (Mo)
34. Ahora tuAhora tu
Los gastos semanales de 65 amas de casa oscilan
entre 60 y 300 soles. Agrupando los datos en 8
intervalos de igual amplitud se tienen las siguientes
frecuencias: 2, 3, 5, 7, 12, 15, 13, 8
1.Construye la distribución de frecuencias con sus intervalos,
marcas de clase y frecuencias.
2.Calcula la media, la mediana y la moda de las notas
3.Dibuja el HISTOGRAMA y ubica en él la media, la mediana
y la moda