Este documento introduce conceptos básicos de estadística y probabilidad. Explica que la estadística se divide en descriptiva e inferencial, y describe métodos como tablas, gráficos y cálculos para resumir y describir datos. También cubre temas como poblaciones, muestras, variables, recolección de datos, y técnicas de muestreo.
3. 1.1 DEFINICIÓN DE ESTADÍSTICA1.1 DEFINICIÓN DE ESTADÍSTICA
• La Estadística es la ciencia que recopila,
clasifica, presenta, describe e interpreta
conjuntos de datos. Generalmente se
ocupa de estudiar fenómenos aleatorios.
• La estadística puede dividirse en dos
ramas: descriptiva e inferencial
4. Estadística descriptivaEstadística descriptiva
• es el conjunto de métodos estadísticos
que se relacionan con el resumen y
descripción de los datos, como tablas,
gráficos, y el análisis mediante algunos
cálculos.
5. Estadística inferencialEstadística inferencial
• Es una técnica mediante la cual se
obtienen generalizaciones o se toman
decisiones en base a una información
parcial o completa obtenida mediante
técnicas descriptivas.
6. 1.2DEFINICIÓN DE TÉRMINOS1.2DEFINICIÓN DE TÉRMINOS
ESTADÍSTICOS BÁSICOSESTADÍSTICOS BÁSICOS
• Población o
Universo
• Unidad de análisis
• Muestra
• Muestra aleatoria
• Variable
• Dato
• Parámetro
• Estadístico Censo
• Encuesta
• Escalas de medición
7. 1.3 TIPOS DE VARIABLES1.3 TIPOS DE VARIABLES
A.Variables
cualitativas
• Variables Nominales
• Variables Ordinales
B. Variables cuantitativas
• Variable Cuantitativa
Discreta
• Variable Cuantitativa
Continúa
8. 1.4 TÉCNICAS DE MUESTREO1.4 TÉCNICAS DE MUESTREO
a) Muestreo Aleatorio
b) Muestreo Estratificado
c) Muestreo por conglomerados
(¨Clusters¨)
d) Muestreo Sistemático
9. 1.5 MANERAS DE RECOLECTAR1.5 MANERAS DE RECOLECTAR
DATOSDATOS
a) Haciendo entrevistas personales.
b) Haciendo entrevistas por teléfono.
c) Mediante cuestionarios emitidos por
correo.
d) Por observación directa.
e) A través de Internet.
f) Usando simulación por computadoras
10. 1.6 EJERCICIOS PROPUESTOS1.6 EJERCICIOS PROPUESTOS
¿Cual es la definición de la Estadística?
Tipos o ramas de la estadística
¿En que se diferencian los conceptos de
Población y Muestra?
Ejemplos de variables (cuantitativa o cualitativa)
Inferencia estadística, ejemplos
Tipos de muestreo
Ventajas de los muestreos estratificado y por
conglomerados
11. CAPÍTULO II: ORGANIZACIÓN YCAPÍTULO II: ORGANIZACIÓN Y
REPRESENTACIÓN DE DATOSREPRESENTACIÓN DE DATOS
12. 2.1 DISTRIBUCIÓN DE2.1 DISTRIBUCIÓN DE
FRECUENCIASFRECUENCIAS
2.1.1 TIPOS DE DISTRIBUCIONES.
• Distribución categórica; es aquella que
se aplica a la variable cualitativa, en
donde sus valores son cualidades o
categorías.
• Distribución numérica; es aquella que
se aplica a la variable cuantitativa, en
donde sus valores son números.
13. DISTRIBUCIÓN DE FRECUENCIAS: Variable
cualitativa
Categoría de
la variable Xi
Frecuencias
absolutas
Frecuencias
relativas
Ci ni
C1 n1 f1
C2 n2 f2
Ck n2 fk
total n 1
n
ni
=if
14. EjemploEjemplo: En una encuesta de opinión acerca de las preferencias de: En una encuesta de opinión acerca de las preferencias de
una tipo de platos de comida en un pueblito de Perú dieron lasuna tipo de platos de comida en un pueblito de Perú dieron las
siguientes respuestas:siguientes respuestas: P: Pachamanca; L: lomo saltado; C: cebicheP: Pachamanca; L: lomo saltado; C: cebiche
P, P, P, P, P, P, P, P, L, L, L, L, L, L, L, L, L, C, C, C; construir laP, P, P, P, P, P, P, P, L, L, L, L, L, L, L, L, L, C, C, C; construir la
distribución de frecuenciasdistribución de frecuencias
Plato de comida
Xi
Nº de personas % de personas
Pachamanca(P) 8 40
Lomo saltado(L) 9 45
Cebiche (c) 3 15
total 20 100
15. DISTRIBUCIÓN DE FRECUENCIAS: Variable
cuantitativa discreta
n
N2
N1
Frec
absolutas
acumuladas
100
F2
F1
Frec
relativas
acumuladas
f2n2X2
1ntotal
fknkxk
f1n1X1
niXi
Frecuencia
s relativas
Frecuencias
absolutas
Valores
de Xi
∑=
=
k
1i
ii nN
n
ni
=if ∑=
=
k
i
if
1
iF
16. EjemploEjemplo Ante la pregunta del número de hijos por familiaAnte la pregunta del número de hijos por familia
(variable x) una muestra de 20 hogares, marco las siguientes(variable x) una muestra de 20 hogares, marco las siguientes
respuestas: 2 ,0, 3, 1, 1, 1, 2, 2, 2, 2, 3, 3, 1, 3, , 2, 3, 3, 4, 4, 2respuestas: 2 ,0, 3, 1, 1, 1, 2, 2, 2, 2, 3, 3, 1, 3, , 2, 3, 3, 4, 4, 2
Construir la distribución de la variable X.Construir la distribución de la variable X.
Número
de hijos
Xi
Número de
familias ni %Familias
fi
Número
familias
acumuladas
% familias
acumuladas
0 1 5 1 5
1 4 20 5 25
2 7 35 12 60
3 6 30 18 90
4 2 10 20 100
total 20 100
17. DISTRIBUCIÓN DE FRECUENCIAS: Variable
cuantitativa continua
n
N2
N1
Frec
absolutas
acumuladas
100
F2
F1
Frec
relativas
acumuladas
f2n2L2-L3
1ntotal
fknkLk-1-Lk
f1n1L1-L2
niLo-L1
Frecuencia
s relativas
Frecuencias
absolutas
Interval
os
Li-1-Li
∑=
=
k
1i
ii nN
n
ni
=if ∑=
=
k
i
if
1
iF
18. Ejemplo 3.Ejemplo 3. Los ingresos semanales en dólares (variable X) de 50Los ingresos semanales en dólares (variable X) de 50
empleados son:empleados son: 4646 47 52 54 56 57 57 58 58 59 60 61 63 63 64 65 66 6747 52 54 56 57 57 58 58 59 60 61 63 63 64 65 66 67
67 67 67 67 68 68 69 69 70 70 70 70 72 72 73 73 73 74 76 76 77 77 7767 67 67 67 68 68 69 69 70 70 70 70 72 72 73 73 73 74 76 76 77 77 77
79 80 82 84 85 86 88 9379 80 82 84 85 86 88 93 9494 Construir una distribución de frecuencias.Construir una distribución de frecuencias.
• 1. Decidir cuantos intervalos usar, para eso usaremos la
regla de Sturges;
• K=1+ 3,322 Log(n) = 1+ 3,322 Log (50) = 1+ 3,322 (1,69897)
= 6.644≈7
• Por lo tanto el número de intervalos es K =7
• NOTA: la aproximación es al entero inmediatamente superior;
se recomienda que el número de intervalos deba ser entero y
entre 5 y 20.
• 2. Calcular el rango o recorrido de los datos
• R = Valor máximo – Valor mínimo = 94-46+1 = 49
• 3. Calcular la amplitud común del intervalo, usaremos un
indicador:
• A=R/K=49/7=7 ; Luego la amplitud es: A= 7
• Determinamos el exceso: E = AK-R = 7x7-49=0
19. Li-1-Li ni Ni fi Fi
45-53 3 3 6 6
53-60 8 11 16 22
60-67 11 22 22 44
67-74 14 36 28 72
74-81 7 43 14 86
81-88 5 48 10 96
88-95 2 50 4 100
total 50 100
Tabla 01: Ingresos semanales de Empleados ($)Tabla 01: Ingresos semanales de Empleados ($) ..
Interpretación.
n3= 11; 11 empleados que ganan entre 46 y 53 $ semN4= 14 empleados que ganan semanalmente entre 67 y 74 $
•F6 = 96, el 96% de los empelados ganan entre 46 y 88 $ por
semana.
20. PROPIEDADES DE LAS FRECUENCIAS.PROPIEDADES DE LAS FRECUENCIAS.
• Sean el número total de observaciones realizadas de la
variable X que toma los valores distintos X1,...,
entonces, tenemos las siguientes propiedades:
1. n1+n2+n3+…nk=n
2. f1+f2+f3+…+fk=1
3. Nk=n
4. Fk=1
5. 0 ≤ ni ≤ n ; i = 1, 2, 3,..., k
6. 0 ≤ fi ≤ 1; i= 1,2, 3, ...,k
7. Ni=Ni-1+ni = Ni-Ni-1
8. El porcentaje correspondiente a un valor de la variable
X se obtiene multiplicado la frecuencia relativa por 100
esto es (%)Xi = 100
21. 2.2 REPRESENTACIONES GRAFICAS2.2 REPRESENTACIONES GRAFICAS
La representación gráfica de una distribución de frecuencias depende delLa representación gráfica de una distribución de frecuencias depende del
tipo de variable.tipo de variable.
2.2.1 VARIABLES CUALITATIVAS2.2.1 VARIABLES CUALITATIVAS
Veremos dos tipos de representaciones:Veremos dos tipos de representaciones:
• Diagrama de sectores (tarta):
Está representación gráfica consiste en dividir un
círculo en tantos sectores circulares como
modalidades presente el carácter cualitativo,
asignando un ángulo central a cada sector circular
proporcional a la frecuencia absoluta ni, consiguiendo
de esta manera un sector con área proporcional
también a ni.
• El ángulo central se determina así:angulo=360ni/n
22. Ejemplo 4Ejemplo 4 Hacer el diagrama de sectores para tabla siguiente.Hacer el diagrama de sectores para tabla siguiente.
Causas Número de casos
Mala atención 20
Productos inconformes 3
Reclamos 10
Otras causas 1
Total 40
23. Causas Número de
casos
Ángulo(grados)
Mala atención 26 234º
Productos
inconformes
3 37º
Reclamos 10 90º
Otras causas 1 9º
Total 40 360º
360x26/40=234º
360x3/4=27º
360x10/40=90º
360x1/40=9º Tabla 01. Número de Casos según causa
24. Grafico 01: Número de casos según CausasGrafico 01: Número de casos según Causas
Mala
atención 26
Productos
Inconformes
3
Reclamos,
10
Otros
1
25. Diagrama de rectángulos:Diagrama de rectángulos:
• Esta representación gráfica consiste en construir tantos
rectángulos como categorías presente la variable cualitativa
en estudio, todo ellos con base de igual amplitud. La altura
se toma igual a la frecuencia absoluta o relativa (según la
distribución de frecuencias que estemos representando),
consiguiendo de esta manera rectángulos con áreas
proporcionales a las frecuencias que se quieren representar.
26. Ejemplo.Ejemplo. Hacer el diagrama de rectángulos para tabla siguiente.Hacer el diagrama de rectángulos para tabla siguiente.
Causas Número de casos
Mala atención 20
Productos inconformes 3
Reclamos 10
Otras causas 1
Total 40
27. Grafico 01: Número de casos según CausasGrafico 01: Número de casos según Causas
Otras causasReclamosProductos inconformesMala atención
25
20
15
10
5
0
Causas
Casos
Diagrama de rectángulos
28. 2.2.2 VARIABLES CUANTITATIVAS: DATOS SIN2.2.2 VARIABLES CUANTITATIVAS: DATOS SIN
AGRUPARAGRUPAR
• Estudiaremos dos tipos de representaciones
gráficas, correspondientes a distribuciones de
frecuencias (absolutas o relativas) no
acumuladas y acumuladas.
• Diagrama de barras:
Consiste en levantar, para cada valor de la
variable, una barra cuya altura sea su
frecuencia absoluta o relativa, dependiendo de
la distribución de frecuencias que estemos
representando.
29. Ejemplo.Ejemplo. La tabla expresa el número de hijos de 25 familias,La tabla expresa el número de hijos de 25 familias,
construya el diagrama de barras de las frecuencias relativasconstruya el diagrama de barras de las frecuencias relativas
simples (fi) Nº de hijos(Xi) 0 1 2 3 4 Totalsimples (fi) Nº de hijos(Xi) 0 1 2 3 4 Total
Nº de familias(ni) 5 6 8 4 2 25Nº de familias(ni) 5 6 8 4 2 25
Numero de hijos
fi
Xi
ni
fi
0 5 0.20
1 6 0.24
2 8 0.32
3 4 0.16
4 2 0.08
25 1.00
Grafico 02. Número de hijos por familia
30. Diagrama de frecuencias acumuladas:Diagrama de frecuencias acumuladas:
Esta representación gráfica se corresponde con la de una funciónEsta representación gráfica se corresponde con la de una función
constante entre cada dos valores de la variable a representar, econstante entre cada dos valores de la variable a representar, e
igual en cada tramo a la frecuencia relativa acumulada (oigual en cada tramo a la frecuencia relativa acumulada (o
absoluta acumulada si se trata de representar una distribución deabsoluta acumulada si se trata de representar una distribución de
frecuencias absolutas) hasta el menor de los dos valores de lafrecuencias absolutas) hasta el menor de los dos valores de la
variable que construyen el tramo en el que es constante.variable que construyen el tramo en el que es constante.
• Ejemplo . Graficar el diagrama de frecuencias relativas
acumuladas del ejemplo anterior
Xi
ni
fi
0 5 0.20
1 6 0.24
2 8 0.32
3 4 0.16
4 2 0.08
25 1.00
32. 2.2.3 VARIABLES CUANTITATIVAS: DATOS2.2.3 VARIABLES CUANTITATIVAS: DATOS
AGRUPADOS EN INTERVALOSAGRUPADOS EN INTERVALOS
• Existen dos tipos de representaciones gráficas dependiendo de si la
distribución de frecuencias en estudio es de datos acumulados o de
datos sin acumular.
• Histograma. Al ser esta representación una representación por
áreas, hay que distinguir si los intervalos en los que aparecen
agrupados los datos son de igual amplitud o no.
• Si la amplitud de los intervalos es constante, dicha amplitud puede
tomarse como unidad y al ser
• Frecuencia (área) = amplitud del intervalo · altura,
• la altura correspondiente a cada intervalo puede tomarse igual a la
frecuencia.
• Si los intervalos tienen diferente amplitud, se toma alguna de ellas
como unidad (generalmente la menor) y se levantan alturas para
cada intervalo de forma que la ecuación anterior se cumpla.
33. Ejemplo. Grafique los datos de la tablaEjemplo. Grafique los datos de la tabla
Ii
ni fi
7.65 9.15 4
9.15 10.65 8
10.65 12.15 10
12.15 13.65 9
13.65 15.15 2
15.15-17.0 1
34
34. Polígono de frecuencias acumuladasPolígono de frecuencias acumuladas::
Se utiliza para representar distribuciones de frecuencias (relativas oSe utiliza para representar distribuciones de frecuencias (relativas o
absolutas) acumuladas. Consiste en representar la gráfica de una funciónabsolutas) acumuladas. Consiste en representar la gráfica de una función
que una por segmentos las alturas correspondientes a los extremosque una por segmentos las alturas correspondientes a los extremos
superiores de cada intervalo, tengan o no todos igual amplitud, siendosuperiores de cada intervalo, tengan o no todos igual amplitud, siendo
dicha altura igual a la frecuencia acumulada, dando una altura cero aldicha altura igual a la frecuencia acumulada, dando una altura cero al
extremo inferior del primer intervalo y siendo constante a partir delextremo inferior del primer intervalo y siendo constante a partir del
extremo superior del último.extremo superior del último.
Ii
ni
fi
Ni Fi
07.65 - 09.15 4 0.118 4 0.118
09.15 - 10.65 8 0.235 12 0.353
10.65 - 12.15 10 0.294 22 0.647
12.15 - 13.65 9 0.265 31 0.912
13.65 - 15.15 2 0.059 33 0.971
15.15 - 16.65 1 0.029 34 1
34 1
36. 2.3 OTRAS REPRESENTACIONES GRAFICAS2.3 OTRAS REPRESENTACIONES GRAFICAS
2.3.1 DIAGRAMA TALLO- HOJA (STEM & LEAF)
De manera similar al histograma permite ver el lote como un todo
y advertir aspectos como:
• Cuan aproximadamente simétricos son los datos.
• Cuan diversos están los valores.
• La aparición de los valores inesperadamente mas frecuentes,
• Si algunos valores están alejados del resto.
• Si hay concentraciones de valores.
• Si hay grupos separados.
Características
No se pierde información.
Divide el dato (número) en dos partes; tallo y hoja
Puede haber 1, 2 o 5 líneas por tallo (el tallo se puede dividir en dos
partes iguales o en 5 partes iguales)
37. Ejemplo 11.Ejemplo 11. Suponga que los siguientes datos representan elSuponga que los siguientes datos representan el
salario anual de los obreros de la compañía Xsalario anual de los obreros de la compañía X
20 14 21 29 43 17 15 26 08 14 39 23 16 46 28 11 26 35 26 28 3020 14 21 29 43 17 15 26 08 14 39 23 16 46 28 11 26 35 26 28 30
22 23 07 32 19 22 18 27 0922 23 07 32 19 22 18 27 09
Construya el diagrama tallo-hojaConstruya el diagrama tallo-hoja
• Ordenamos los datos
• 07 08 09 11 14 14 15 16 17 18 19 20 21 22 23 23 26 26 26 27
28 28 29 30 32 35 39 43 46
• Y separamos los datos en dos fracciones (dígitos), ejemplo el
07 se separa (0 y 7 ), el 08 (0 y 8) el 21(2 y 1) el 39(3 y 9)
• En este caso el tallo es el primer digito (decenas) y la hoja el
ultimo (unidades)
39. 2.3.2 DIAGRAMA DE CAJA (BOX-2.3.2 DIAGRAMA DE CAJA (BOX-
PLOT)PLOT)
• A diferencia de los otros gráficos ya vistos, los diagramas de
caja hacen énfasis en las medidas de posición. Es muy útil
para hacer comparaciones entre muestras de distintas
poblaciones.
• Un diagrama de caja consiste en un rectángulo cuya longitud
es el rango intercuartílico (IQR), dividido por un segmento a
la altura de la mediana y complementado por dos líneas
(llamadas bigotes) que parten de los extremos del rectángulo,
cuya longitud no supera 1,5 veces el rango intercuartílico y
que intentan alcanzar los valores mínimo y máximo
observados.
• En un simple gráfico se suministra información sobre la
mediana (o media), sobre el 50% y 90% de los datos, sobre la
existencia de situaciones con datos atípicos, así como de la
simetría de la distribución.
41. Ejemplo.Ejemplo. Con base en una muestra de 20 entregas, Marco’s PizzaCon base en una muestra de 20 entregas, Marco’s Pizza
determinó la siguiente información:determinó la siguiente información:
Valor mínimo = 13 minutos, Q1 = 15 minutos, mediana = 18 minutos,Valor mínimo = 13 minutos, Q1 = 15 minutos, mediana = 18 minutos,
Q3 = 22 minutos,Q3 = 22 minutos,
Valor máximo = 30 minutosValor máximo = 30 minutos
Desarrolle un diagrama de caja para los tiempos de entrega.Desarrolle un diagrama de caja para los tiempos de entrega.
Li = q1 - 1.5 IQR = 15 - 1.5 (22-15) = 15- 1.5(7) = 4.5,
como min=13, el Li=13 y no 4.5
Ls = q3 + 1.5 IQR = 22 + 1.5 (22-15) = 22 + 1.5(7) = 32.5,
como el máximo es 30 entonces Ls=30 y no 32.5
43. 2.3.3 DIAGRAMA DE PUNTOS (DOT-PLOT)2.3.3 DIAGRAMA DE PUNTOS (DOT-PLOT)
• Un Dotplot es una alternativa informal al Histograma
para mostrar datos continuos. En el dotplot cada valor
de los datos mostrado como un punto en el eje
horizontal. Cuando dos valores se separan por menos
de un cierto espacio se apilan en una columna. Si el
incremento es muy pequeño es imposible ver la forma
de la distribución. Sin embargo, si el incremento es muy
grande entonces sólo se obtiene una columna de
puntos.
44. Ejemplo. Los siguiente datos presenta los resultados observados del
número de plántulas de malezas por m2 en una muestra de tamaño
n=20.
5 3 4 7 5 9 8 4 7 4 5 1 4 5 8 4 7 5 3 5
Grafique el diagrama de punto o dot plot
45. 2.3.4 DIAGRAMA DE PARETO2.3.4 DIAGRAMA DE PARETO
Se ordenan las categorías de mayor a
menor frecuencia y se dibujan los
rectángulos correspondientes. Es muy
utilizado en controles de la calidad, donde
cada clase representa un tipo de
disconformidad o problema de
producción.
46. Ejemplo 16.Ejemplo 16. Durante una jornada laboral el equipo de control de calidadDurante una jornada laboral el equipo de control de calidad
decidió hacer un conteo de los defectos que se presentaban en losdecidió hacer un conteo de los defectos que se presentaban en los
elementos estructurales para puertas que se manufacturaban dentro de laelementos estructurales para puertas que se manufacturaban dentro de la
empresa recabando los siguientes datos. Construir el diagrama deempresa recabando los siguientes datos. Construir el diagrama de
Pareto de los defectos en elementos estructurales en puertas.Pareto de los defectos en elementos estructurales en puertas.
Defecto Cantidad Porcentaje
del total
Fuera de perfil 30 37
Piezas desordenadas 21 26
Agujeros/ranuras perdidos 6 7
Fuera de secuencia 6 7
Partes no lubricadas 5 6
Piezas con rebabas 5 6
Abolladuras/Picaduras 4 5
Otros 4 5
47. Digama de paretoDigama de pareto
Cantidad 30 21 6 6 5 5 4 4
Percent 37.0 25.9 7.4 7.4 6.2 6.2 4.9 4.9
Cum % 37.0 63.0 70.4 77.8 84.0 90.1 95.1 100.0
Defecto
O
ther
Abolladuras/Picaduras
Piezas
con
rebabas
Partes
no
lubricadas
Fuera
de
secuencia
Agujeros/ranuras
perdidos
Piezas
desordenadas
Fuera
de
perfil
90
80
70
60
50
40
30
20
10
0
100
80
60
40
20
0
Cantidad
Percent
Pareto Chart of Defecto