Medidas de tendencia Central , Posicion y de Dispersion
Estadistica descriptiva 1
1. Estadística DescriptivaEstadística Descriptiva
≻ Medidas de la Tendencia Central
≻ Medidas de Dispersión
Asignación #2Asignación #2
≻ Del Libro
– Estadística para Administración y Economía
Anderson, Sweeney, Williams
Capitulo #2 Pag 52 ejercicios 36 al 52Capitulo #2 Pag. 52 ejercicios 36 al 52
Capitulo #3, Pag. 72 ejercicios 5 al 14
Pag. 79 ejercicios 18 al 26
2
2. Temas a cubrirTemas a cubrir
≻ Medidas de tendencia
central
– La media aritmética
≻ Medidas de distancia de
dispersión
– VariabilidadLa media aritmética
• Para datos no
agrupados
• Expresión simbólica
• Para datos
Variabilidad
– Rango
• Rangos interfractiles
• Percentiles y cuartiles
La desviación mediaPara datos
agrupados
• La naturaleza de la
media
– La mediana
– La desviación media
absoluta
– La varianza
• Para datos no
agrupados
• Expresión simbólica
• Para datos
agrupados
• Media contra
mediana
agrupados
• Para datos agrupados
– La desviación estándar
• Significado especial de
la desviación estándarmediana
– La moda
• Para datos
agrupados
• La moda y la curva
la desviación estándar
3
• La moda y la curva
de frecuencia
– La media ponderada
Estadística DescriptivaEstadística Descriptiva
≻ Medidas de la Tendencia Central
3. IntroducciónIntroducción
≻ Las herramientas utilizadas en la representaciónp
de los datos (tablas de frecuencias, gráficos de
barras o diagramas de tallo y hojas)
proporcionan una idea general del patrón oproporcionan una idea general del patrón o
distribución del conjunto de datos.
≻ No indican valores típicos de la mitad o
promedio.
≻ Estos valores del “medio” son utilizados para
tomar las grandes decisiones en muchastomar las grandes decisiones en muchas
situaciones,
5
IntroducciónIntroducción
≻ La palabra “promedio” tiene al menos 3≻ La palabra promedio tiene al menos 3
significados
– Puede significar el valor mas común, moda
– Puede significar “el valor de en medio”,
mediana
P d i ifi “ l di it éti ”– Puede significar “el promedio aritmético”,
promedio
6
4. ModaModa
≻ La Moda es el valor de los datos que se presentaq p
con más frecuencia.
– Este valor se aproxima a la moda de los datos no
agrupados actualesagrupados actuales.
• 32 42 46 46 54
• Egresado Sueldo Mensual Egresado Sueldo Mensual
1 2 350 00 7 2 390 001 2,350.00 7 2,390.00
2 2,450.00 8 2,630.00
3 2,550.00 9 2,440.00
4 2,380.00 10 2,825.00
5 2,255.00 11 2,420.00
6 2,210.00 12 2,380.00
7
ModaModa
≻ La moda también se puede utilizar para datosp p
agrupados en tablas
Marca Frec
Coca-cola 19
Diet-coke 8
Pepsi-cola 13
Clase Modal
Pepsi cola 13
Fanta 5
Sprite 5
5050
8
5. MedianaMediana
≻ La Mediana de un conjunto de datos es el valor de “en medio”
cuando los datos están acomodados de menor a mayor.
≻ Solo tiene significado si hay un orden natural de los valores de
menor a mayor.
Si l t ñ d l t i l di l l≻ Si el tamaño de la muestra, n, es impar la mediana es el valor
localizado en (n+1)/2
≻ Si el tamaño de la muestra, n, es par la mediana es el promedio
de los valores n/2 y (n+2)/2de los valores n/2 y (n+2)/2
25 16 61 12 18 15 20
24 17 19 28
25 16 61 12 18 15 20
24 17 19 28 72
9
PromedioPromedio
≻ El Promedio de una variable es la suma de las mediciones
tomadas en esa variable divididas por el número de
mediciones.
≻ Tiene solo significado para variables cuantitativas.
≻ Es el punto en el cual el histograma de datos se
“balancea”. x
x i
i∑
=
≻ El Promedio es la más útil y conveniente medida del valor
promedio
n
x =
promedio.
10
6. PromedioPromedio
≻ Un valor extremo puede jalar el promedio en su dirección
y ocasionar que el promedio parezca atípico para el
conjunto de valores.
– 46 54 42 46 3246 54 42 46 32
– 46 54 42 46 32 10
– 46 54 42 46 32 7046 54 42 46 32 70
11
Medidas de la Tendencia CentralMedidas de la Tendencia Central
≻ La moda, mediana, promedio y promedio truncado son
ll d “ d d d b ó ” “ d d d lllamadas “medidas de ubicación” o “medidas de la
tendencia central”
≻ Indican el centro o la ubicación general de un conjunto de
datosdatos.
≻ La relación entre estas variables depende del sesgo de los
datos. Si la distribución es redondeada y simétrica
alrededor de un solo pico estas medidas son todasp
iguales.
≻ Para una distribución sesgada, una que tenga una cola
larga en una dirección
– El promedio es “jalado” hacia la dirección de la cola
– La mediana cae entre el promedio y la moda
– El Promedio truncado cae entre la media y el promedio.
12
7. Medidas de la Tendencia CentralMedidas de la Tendencia Central
≻ El promedio es la medida mas utilizada por lasp p
siguientes razones:
– Su utilidad en problemas de inferencia estadística
Es posible combinar los promedios de subgrupos en un– Es posible combinar los promedios de subgrupos en un
promedio general
• Esta propiedad no aplica para las otras medidas de la
tendencia centraltendencia central.
13
Estadística DescriptivaEstadística Descriptiva
≻Medidas de Dispersión
8. IntroducciónIntroducción
≻ Una de las ideas unificadoras en las estadísticas
es la noción de variabilidad.
≻ Variabilidad es una idea absolutamente
f d t l t l d lid d d h hfundamental en control de calidad, de hecho uno
de los principales temas en Control Estadístico
de Proceso es contabilizar las fuentes de
variación.
≻ La primera tarea para lidiar con la variación es
sumarizarlasumarizarla.
15
IntroducciónIntroducción
≻ Las medidas de variación que veremos en esteq
curso son:
– Rango
Varianza– Varianza
– Desviación Estándar
16
9. RangoRango
≻ La medida más simple de variación es el Rango –p g
La diferencia entre el valor más grande y el valor
más pequeño.
≻ E fá il d l l t h h≻ Es fácil de calcular y por este hecho es
grandemente usada en control de calidad para
medir variabilidad.
≻ Cuando los datos son tomados y graficados a lo
largo del tiempo, el gráfico resultante es un
gráfico de rangosgráfico de rangos.
17
La Varianza y La Desviación Estándara a a a y a es ac ó stá da
≻ La varianza de una muestra
d di i ll d
2
)( xxi −∑de n mediciones es llamada
frecuentemente “error
cuadrado promedio” por que
es el promedio del cuadrado
d l d i ió d fi id
2
1n
s i
−
=
∑
de la desviación definida
como la suma del cuadrado
de las desviaciones dividida
entre n-1
2
ss =
C l l l V i D E tá d
≻ Se utiliza s2 para denotar la
varianza.
Calcule la Varianza y Desv. Estándar
de los siguientes datos: 11, 12, 13,
14 y 30
18
10. La Varianza y La Desviación Estándara a a a y a es ac ó stá da
≻ ¿Qué significa una desviación estándar?
– Una aproximación razonablemente buena asume que las
mediciones tienen toscamente una forma redondeada similar
a una curva normal.
l l í– Llamamos a esto una regla empírica.
• Para un conjunto de mediciones que tienen una forma
normal entonces tenemos…
e
40%
30%
amplevalue
95%
68% Cumulative probability
of obtaining a value
between two values
Cumulative probability
of obtaining a value
between two values
20%
10%
babilityofsa
99.73%
19
43210-1-2-3-4
0%
Prob
Number of standard deviations from the mean
La Varianza y La Desviación Estándara a a a y a es ac ó stá da
≻ Una muestra de 20 días del año anterior indica
que el promedio del precio de venta del acero por
kilogramo fue de $0.61 y su desviación estándar fue de
$0.07. Si el histograma tiene la forma de una curva
l d ib l i bilid d d l d d lnormal, describa la variabilidad de los datos usando la
regla empírica.
20
11. La Varianza y La Desviación Estándara a a a y a es ac ó stá da
≻ Debido a que la desviación estándar esta basada en el
cuadrado de las desviaciones del promedio, es más
sensible a “outliers” que el promedio.
≻ Por ejemplo suponga que 10 vendedores de carros nuevos
i i l i i len una agencia tienen las siguientes ventas mensuales:
16,18, 19, 20, 20, 22, 24, 26, 28 y 80
21