7. HERRAMIENTAS DE LA ESTADÍSTICA Diagrama de puntos Ejemplo: Se toman 10 mediciones del diámetro interno de los tornillos para los pistones del motor de un automóvil. Los datos (en mm) son: 74.001, 74.003, 74.015, 74.000, 74.002, 74.005, 74.001, 74.001, 74.002 y 74.004. El diagrama de puntos correspondiente se presenta en la figura.
8. Diagrama de tallos y hojas Ejemplo: La siguiente tabla representa el porcentaje de algodón en un material utilizado para la fabricación de camisas para caballeros.
9. Ejemplo Diagrama de barras: Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguíneo ha dado el siguiente resultado:
10. Ejemplo Diagrama de Pastel: En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natación, 4 juegan al fútbol y el resto no practica ningún deporte.
13. Tamaño de muestra La muestra es el número de elementos, elegidos o no al azar, que hay que tomar de un universo para que los resultados puedan extrapolarse al mismo, y con la condición de que sean representativos de la población. El tamaño de la muestra depende de tres aspectos: • Del error permitido. • Del nivel de confianza con el que se desea el error. • Del carácter finito o infinito de la población.
14. TABLA DE APOYO AL Cálculo DEL TAMAÑO DE UNA MUESTRA POR NIVELES DE CONFIANZA
15. Calculo de la muestra • Para poblaciones infinitas (más de 100.000 habitantes): n=𝑍2𝑝𝑞𝑒2 • Para poblaciones finitas (menos de 100.000 habitantes): n=𝑍2𝑝𝑞𝑁 𝑒2𝑁−1+𝑍2𝑝𝑞 Leyenda: n = Número de elementos de la muestra. N = Número de elementos del universo. p/q = Probabilidades con las que se presenta el fenómeno. Z = Valor crítico correspondiente al nivel de confianza elegido; siempre se opera con valor sigma 2, luego Z = 2. e = Margen de error permitido (a determinar por el director del estudio). Cuando el valor de P y de Q no se conozca, o cuando la encuesta se realice sobre diferentes aspectos en los que estos valores pueden ser diferentes, es conveniente tomar el caso más favorable, es decir, aquel que necesite el máximo tamaño de la muestra, lo cual ocurre para P = Q = 50, luego, P = 50 y Q = 50.
16. EJEMPLO 1 (valor Z = 2) Población infinita. España tiene 44.000.000 de habitantes. En una investigación de mercados que se está realizando en España, se desea conocer entre otras cosas el número de personas que estarían dispuestas a trasladarse a vivir a otro país de la Comunidad Económica Europea. ¿Cuál será el tamaño de la muestra a estudiar para un nivel de confianza de la encuesta del 95,5 por 100 y un margen de posible error del ± 4 por 100? n=𝑍2𝑝𝑞𝑒2 n = 22x 50 x 50 42 n= = 625 personas
17. Tabla de distribución de frecuencias Pasos. Toma de datos Ordenación de datos Calculo de rango (R), intervalo (clase C) y tamaño de clase R= LS-LI C= 1 + 3.332log (n) (aprox al menor) Tamaño de clase = R/C 4. Construcción tabla de frecuencias.
18. Ejemplo tabla de frecuencia Edades de alumnos de quinto grado del colegio san Bartolomé. 3. Cálculo de rango, intervalo y tamaño de clase R= LS-LI R= 12-1 = 11 C = 1 + 3.332log (n) C = 1+3,332log (50) C = 6,666 C = 6 Tamaño de clase = R/C = 11/6 = 2
20. Medidas de tendencia central Media (Datos sin agrupar) Media (Datos agrupados) Para el ejemplo: 𝜇= 𝐹𝐴∗𝑋 El promedio de edad de los alumnos es de 6 años Media = 319,5/50 = 6,39
22. Mediana Datos no agrupados impares y pares En datos pares se promedian los dos datos que dividen en dos partes iguales.
23. Ejemplo mediana datos agrupados: Como los datos son 90 (número par) la mediana esta localizada entre la observación cuadragésima quinta y cuadragésima sexta (45a y 46a) que corresponde al intervalo entre 15.7 y 19.7 como se muestra en la tabla con una FRAi que contiene el 50% de datos acumulados: Esta medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del mismo.
24. mediana Cálculo de la mediana para datos agrupados : La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas. Li es el límite inferior de la clase donde se encuentra la mediana. es la semisuma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase mediana. ai es la amplitud de la clase.
25. Ejemplo: Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla: 100/2 = 50 Clase de la mediana: [66, 69) La mitad de los datos se encuentran por debajo de 67,93 y la mitad por encima.
26. Datos no agrupados Es el valor que mas se repite Datos agrupados En una tabla de frecuencias, la moda se define como el valor medio de la clase cuya frecuencia tiene el valor numérico mayor, la cual recibe el nombre de clase modal. Ejemplo: Moda (Mo) = 17.7 que es el punto medio del intervalo donde la frecuencia absoluta (24) es mayor que los demás, y es de tipo unimodal. Moda
27. Medidas de variabilidad LA VARIANZA Y LA DESVIACIÓN STANDAR Se puede definir como el "casi promedio" de los cuadrados de las desviaciones de los datos con respecto a la media muestral. Su formula matemática para el caso de datos referentes a una muestra es: Datos Datos agrupados La desviación estándar es la raíz cuadrada de la varianza y es una medida del grado de dispersión de los datos con respecto al valor promedio. Una desviación estándar grande indica que los puntos están lejos de la media y una desviación pequeña indica que los datos están agrupados cerca de la media.
28. Ejemplo de varianza Calcular la varianza de la distribución: 9, 3, 8, 8, 9, 8, 9, 18
29. Ejemplo:Calcular la varianza de la distribución de la tabla: Media. Varianza Desviación estándar Ơ =2Ơ2 Ơ =2218,94 Ơ = 14,796 El promedio es de 43,33 La varianza es de 218,94 La desviación estándar es de 14,796
30. Coeficiente de variación El coeficiente de variación es la relación entre la desviación típica de una muestra y su media. Ejemplo: Una distribución tiene x (promedio) = 140 y σ (desviación estándar)= 28.28 y otra x = 150 y σ = 25. ¿Cuál de las dos presenta mayor dispersión?