El documento presenta conceptos estadísticos como variables discretas y continuas, muestras, intervalos de confianza, porcentajes, tablas de distribución, histogramas, polígonos de frecuencia, diagramas de sectores, barras y Pareto. Explica medidas de variación como rango, desviación media, varianza y cómo calcularlas para datos agrupados. Incluye ejemplos ilustrativos de cada concepto.
3. Notas
Variable discreta:
• Variable continua: Una variable discreta es aquella que solo puede tomar un número finito
de valores entre dos valores cuales quiera de una característica.
El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
• Una variable continua: es aquella que puede tomar un número infinito de valores entre
dos valores cualesquiera de una característica.
La altura de los 5 amigos: 1.73 m , 1.82 m , 1.77 m , 1.69 m , 1.75 m.
4. Porción de una población
Una muestra en la elaboración de 400 termómetros de mercurio, se encontraron
20 defectuosos. Encontrar el intervalo de confianza para los termómetros de
mercurio, utilizar un nivel de confianza del 95%, y determinar la proporción de
los termómetros defectuosos.
• Procedimiento:
1. Datos:
n= 400 termómetros de mercurio.
x= (No. De aciertos = al numero de termómetros defectuosos)
5. • Operación:
P = x / n = 200/400 = 0.05 = 5%
1 – α = 0.95 (nivel de confianza)
q = 1 – p = 1 – 0.05 = 0.95 x 100% = 95%
6. Porcentaje
Es la relación que se establece entre cada una de las partes que forman
un todo, entre todo o total multiplicado por 100; en otras palabras, es
una relación que se establece entre un subconjunto, dividido entre
todos los elementos que forman el conjunto de un estudio multiplicado
por 100. Este porcentaje se representa por un %.
El todo o total se representa por 100 por ciento.
8. La suma de todos los porcentajes de los subconjuntos
mutuamente excluyentes que forman el conjunto ser a siempre
100. El principal objetivo de los porcientos es que se pueden
establecer comparaciones.
10. Tabla de distribución
• Distribución t de student
• Distribución x2
• Distribucion F de Fisher
11. Histograma
Es una representación grafica de una variable en forma de barra.
Se utilizan para variables continuas o para variables discretas, con un
gran número de datos, y que se han agrupado. En el eje abscisas se
construyen unos rectángulos que tienen por base la amplitud del
intervalo, y por altura, la frecuencia absoluta de cada intervalo
en clases.
12. Ejemplo
• El peso de 65 personas adultas viene dado de la siguiente forma
13. Polígono de frecuencia.
Un polígono de frecuencias se forma uniendo los extremos de
las barras de un diagrama de barras mediante segmentos.
También se puede realizar trazando los puntos que representan
las frecuencias y uniéndolos mediante segmentos.
14. Diagrama de tallo y hoja
Es una representación grafica que permite ordenar los datos.
• Procedimiento
1. Ordenar los datos
2. Establecer el tallo (Tomar las cifras enteras únicas)
3. Establecer las hojas (Tomar las cifras en decimales)
4. No se aceptan repeticiones
16. Graficas para datos cualitativos
Los diagramas para datos
cualitativos son los que se
usan para representar
datos que no son
contables o datos no
cuantitativos.
17. Diagrama de sector circular o pastel
Se utiliza con todo tipo de variables, los datos se representan en un
circulo, de como que cada sector es proporcional a la frecuencia
absoluta correspondiente.
18. Ejemplo
En una sala de emergencia
hay 30 pacientes, 12 son
niños, 3 son niñas, 9 son
adolescentes y el resto son
adultos.
Niños
Niñas
Adolescentes
Adultos
Niños
Adolescentes
Niñas
19. Diagrama de barras simples
Se representa la frecuencia simple (absoluta o relativa) de cada
modalidad o categoría de la variable mediante la altura de una barra,
donde la altura de una barra es proporcional a la frecuencia simple de
una categoría que se representa.
20. Ejemplo
Un estudio hecho al conjunto de los 20 alumnos de una clase para
determinar su grupo sanguíneo ha dado el siguiente resultado:
Grupo sanguíneo fi
A 6
B 4
AB 1
0 9
Total 20
21. Diagrama de Pareto o curva 80/20
Grafica de barras que ilustra las causas de los problemas por orden de
importancia y frecuencia (porcentaje) de aparición, costo o actuación.
Donde la regla de Pareto establece que el 80% de las consecuencias
están ligadas al 20% de las causas. Por medio de un diagrama de barra
de orden descendente se determina cual es el 80% que causa el
problema (determinar prioridades de problemas) para trabajar en su
mejora.
22. Procedimiento:
1. Conocer el problema.
2. Ordenar el problema de mayor a menor
3. Obtener el porcentaje de cada problema según la frecuencia
4. Colocar los resultados en la tabla de problemas.
5. No necesariamente tiene que ser 100% pero si aproximado, 98 +
6. Establecer el porcentaje acumulado (frecuencia absoluta acumulada)
7. Realizar una grafica con el eje x y dos ejes y (derecho he izquierdo)
8. Establecer rangos en la grafica (eje y derecho: porcentaje)
9. Eje de la x: problemas
10.Graficar las barras según los datos (de manera separada según el eje de las y
izquierdo)
11.Graficar un polígono de frecuencia según el eje y
23.
24. Ejemplo
En la sala de emergencia del hospital María de la Concepción se coloco
una caja de quejas y sugerencias, los usuarios hicieron uso de ella. El
personal administrativo recolecto las siguientes quejas.
Paso 1: Determinar el problema
- Enfermeras groseras: 10
- Doctores desconcentrados: 7
- Higiene inadecuada en los baños: 20
- Carencia de insumos: 65
25. Ejemplo
Paso 2: Ordenar los datos
- Carencia de insumos: 65
- Higiene inadecuada en
los baños: 20
- Enfermeras groseras: 10
- Doctores
desconcentrados: 7
Queja Frecuencia Porcentaje Porcentaje
acumulado
Carencia de insumos 65 65% 65%
Higiene inadecuado en los
baños
20 20% 85%
Enfermeras groseras 10 10% 95%
Doctores desconcentrados 5 5% 100%
Total 100 100%
Paso 3: Ordenarlos en una tabla
27. Medidas de variación
Medidas de dispersión.
Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución.
Las medidas de dispersión son:
Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.
Desviación media
La desviación respecto a la media es la diferencia entre cada valor de la variable estadística y la media
aritmética. La desviación media es la media aritmética de los valores absolutos de las desviaciones
respecto a la media.
28. La desviación media para datos agrupados es:
xi fi xi · fi |x - x| |x - x| · fi
[10, 15) 12.5 3 37.5 9.286 27.858
[15, 20) 17.5 5 87.5 4.286 21.43
[20, 25) 22.5 7 157.5 0.714 4.998
[25, 30) 27.5 4 110 5.714 22.856
[30, 35) 32.5 2 65 10.174 21.428
21 457.5 98.57
29. Varianza
Varianza para datos agrupados
Varianza para datos agrupados
La varianza es la media aritmética del cuadrado de las desviaciones
respecto a la media de una distribución estadística.
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes
expresiones que son equivalentes a las anteriores.