2. • Una población es la colección de todos los artículos de interés
o bajo investigación
• N representa el tamaño de la población
• Una muestra es un subconjunto observado de la población
• n representa el tamaño de la muestra
• Un parámetro es una característica específica de una
población
• Una estadística es una característica específica de una
muestra
3. • Valores calculados usando datos poblacionales se llaman
parámetros.
• Valores calculados desde los datos muestrales se llaman
estadísticas.
POBLACIÓN MUESTRA
4. MUESTREO ALEATORIO
cada miembro de la población es escogido estrictamente por azar.
cada miembro de la población tiene la misma probabilidad de ser
elegido.
todas las muestras posibles de n objetos tienen igual probabilidad de
ser elegidas.
La muestra resultante se denomina muestra aleatoria
5. RAMAS DE LA ESTADÍSTICA
Estadística descriptiva
Procedimientos gráficos y numéricos para resumir y procesar datos
Estadística inferencial
Uso de datos para hacer predicciones, pronósticos y estimaciones para
ayudar a la toma de decisiones
7. Estadística inferencial
Estimación
Por ejemplo: Estimar el peso medio de la
población utilizando el peso promedio de la
muestra.
Prueba de Hipótesis
Por ejemplo: Probar la afirmación de que el
peso medio de la población es de 140 libras.
La inferencia es el proceso de sacar conclusiones y tomar
decisiones sobre una población basada en los resultados
de la muestra
8. • Clasificación de las variables:
Variables
Cualitativas:
Categorías
Cuantitativas
Numérico
Discretas:
Artículos contados
Continuas:
Características medidas
9. Escalas de Medición
Diferencias entre medidas
con cero real Razón
Datos Cuantitativos
Diferencias entre medidas
pero no cero real Intervalos Iguales
Datos Ordenados (Rangos) Ordinal
Datos Cualitativos
Categorías (No hay orden o
dirección) Nominal
10. REPRESENTACIÓN DESCRIPTIVA DE LOS DATOS
Variables Categóricas Variables Numéricas
Distribución de frecuencias
Tablas cruzadas
Diagrama de Sectores
Diagrama de Pareto
Distribución de frecuencias
Diagrama de Barras
Histograma y Ojiva
Caja y Bigotes
Diagrama de Dispersión
11. TABLA DE DISTRIBUCIÓN DE FRECUENCIA PARA
VARIABLE CUALITATIVA
DISTRIBUCION DE 40 PERSONAS SEGÚN MARCA DE CARRO
MARCA Nº DE PERSONAS % DE
PERSONAS
FORD 7 17.5
MAZDA 11 27.5
RENAULT 16 40
CHEVROLET 6 15
TOTAL 40 100
12. GRÁFICO PARA VARIABLE CUALITATIVA
MARCA
17,5%
27,5%
40,0%
15,0%
FORD
MAZDA
RENAULT
CHEVROLET
13. TABLA DE DISTRIBUCIÓN DE FRECUENCIA PARA VARIABLE DISCRETA
DISTRIBUCIÓN DE 25 CAJAS SEGÚN EL NUMERO DE ARTICULOS DEFECTUOSOS
NÚMERO DE ARTICULOS DEFECTUOSOS NÚMERO DE CAJAS PROPORCIÓN
DE CAJAS
NÚMERO
ACUMULADO
DE CAJAS
PROPORCIÓN
ACUMULADA
DE CAJAS
0 3 0.12 3 0.12
1 5 0.20 8 0.32
2 11 0.44 19 0.76
3 4 0.16 23 0.92
4 2 0.08 25 1.00
TOTAL 25 1 - -
14. GRÁFICO PARA VARIABLE CUALITATIVA
DISTRIBUCIÓN DE 25 CAJAS SEGÚN EL NÚMERO DE
ARTICULOS DEFECTUOSOS
0
5
10
15
0 1 2 3 4
NUMERO DE ARTICULOS DEFECTUOSOS
NUMERODE
CAJAS
15. TABLA DE DISTRIBUCIÓN DE FRECUENCIA PARA VARIABLE CONTINUA
DISTRIBUCIÓN DE 50 PADRES SEGÚN SU INGRESO MENSUAL
INGRESO MENSUAL (MILES DE $)
INTERVALOS
INGRESO
MEDIO
Nº. DE
PADRES
PROPORCIÓN DE
PADRES
NUMERO
ACUMULADO DE
PADRES DE FAMILIA
PROPORCIÓN
ACUMULADA DE PADRES
DE FAMILIA
325-384 354,5 6 0,12 6 0,12
384-443 413,5 15 0,30 21 0,42
443-502 472,5 13 0,26 34 0,68
502-561 531,5 8 0,16 42 0,84
561-620 590,5 8 0,16 50 1
TOTAL 50 1 -
18. DESCRIPCIÓN NUMÉRICA DE LOS DATOS
Tendencia Central Posición Dispersión - Variabilidad
Media Aritmética
Mediana
Moda
Percentiles
Cuartiles
Deciles
Rango
Rango Intercuartilico
Varianza
Desviación Típica –
Estándar
Coeficiente de Variación
20. La Media Aritmética es la más común de las medidas de
tendencia central
• Para una población:
• x = =
• Para una muestra
• = =
N
XXX N...21
N
X
N
i
i1
X
n
xxx n ....21
nx
n
i
i /
1
21. Percentiles
• Los percentiles y cuartiles indican la posición de un valor relativo a todo el conjunto
de datos
• Generalmente se utiliza para describir grandes conjuntos de datos
• Ejemplo: Una puntuación de una variable en el percentil k significa que el k% de la
población tiene un puntaje menor a dicho dato y (100-k)% tiene un puntaje mayor.
• 0 ≤ k≤ 100
• Para k=25,50 y 75 se habla de cuartiles: Q1, Q2 y Q3 respectivamente.
• Para k=10,20 ,…, 90 se habla de deciles: D1, D2, …, y D9 respectivamente.
22. MEDIDAS DE DISPERSIÓN - VARIABILIDAD
La variación en los procesos constituye una de las fuentes principales de problemas de
calidad; si se encuentra su causa raíz y se elimina, los clientes sentirán la diferencia. No
siempre se obtiene el mismo producto o servicio con el mismo nivel de conformidad a
lo especificado y de forma consistente y repetitiva
23. VARIACIÓN
La variación desde el punto estadístico, son las diferencias obtenidas en las
características de un producto, o servicio, no importa que tan pequeña sea.
Dispersión: Se entiende como la homogeneidad del producto. Responde a la pregunta
¿Qué tan diferentes son las características de desempeño de un producto?
Desviación: Se entiende como la distancia entre el valor de la medición y el valor
objetivo. Responde a la pregunta ¿Cuánto difiere la característica de desempeño del
producto con respecto a un valor de referencia?
Medidas de variación proporcionan información sobre la
propagación o variabilidad de los valores de los datos.
24.
25. RANGO
Es la más simple medida de variabilidad
Es la diferencia entre el máximo y el mínimo de los datos
26. RANGO INTERCUARTILICO RIQ
• Se pueden eliminar algunos problemas de datos atípicos utilizando este RIQ
• Se eliminan las observaciones del 25% superior y del 25% inferior y por lo tanto se
calcula el rango del 50% medio de los datos
RIQ=Q3-Q1
27. DIAGRAMA DE CAJA Y BIGOTE
• Un gráfico de caja y bigote es un gráfico que describe la forma de una distribución
• Creado a partir del resumen de cinco números: el valor mínimo, Q1, la mediana, Q3
y el máximo
• El cuadro interior muestra el intervalo de Q1 a Q3, con una línea dibujada en en el
centro que corresponde a la mediana
• Los "bigotes" se extienden desde la caja. Un bigote es la línea de Q1 al mínimo, el
otro es la línea de Q3 al valor máximo
• Extremo superior: Q3 +1,5RIQ
• Extremo inferior: Q3 -1,5RIQ
• Valores por debajo de estos extremos se consideran atípicos
28. DIAGRAMA DE CAJA Y BIGOTE
El gráfico puede ser realizado horizontal o verticalmente
29. COMPARACIÓN DE DIAGRAMAS DE CAJA Y BIGOTES (BOX – WISKER)
Permiten realizar análisis de varianza descriptivo
Permiten estratificar el análisis
Permiten hacer posteriores pruebas de hipótesis
30. VARIANZA POBLACIONAL
Es promedio que corresponde al cuadrado de los desvíos de los datos con respecto a
su media
Xi: iésimo valor de la variable
µ: Media de los datos
Tiene las unidades al cuadrado
N
μ)(x
σ
N
1i
2
i
2
31. VARIANZA MUESTRAL
Promedio (aproximado) de desviaciones al cuadrado de los valores con respecto a la
media
: promedio muestral
Tiene las unidades al cuadrado
1-n
)x(x
s
n
1i
2
i
2
X
32. DESVIACIÓN TÍPICA - ESTÁNDAR
Es la raíz cuadrada positiva de la varianza, tanto para poblaciones como para
muestras.
= X = +
Tiene las mismas unidades de la variable
Expresa lo que en promedio se desvían los datos con respecto a la media
2
33. COEFICIENTE DE VARIACIÓN
Es una medida de dispersión Relativa (Las anteriores son absolutas)
Se calcula como cociente entre la desviación típica y la media, en valor absoluto,
por cien.
Si es menor a 30% se dice:
1. La población es homogénea
2. La media aritmética simple es un buen representante de los datos
3. Se debe utilizar Muestreo Aleatorio Simple
Si es mayor a 30% se dice:
1. La población es heterogénea
2. La media aritmética ponderada (mediana) es un buen representante de los datos
3. Se debe utilizar Muestreo Aleatorio Estratificado