Se ha denunciado esta presentación.
Utilizamos tu perfil de LinkedIn y tus datos de actividad para personalizar los anuncios y mostrarte publicidad más relevante. Puedes cambiar tus preferencias de publicidad en cualquier momento.

Grouped data 03

460 visualizaciones

Publicado el

Grouped Data Statistics 3
Estadística de datos agrupados 3

Publicado en: Ingeniería

Grouped data 03

  1. 1. Datos Agrupados
  2. 2. Contenido Introducción Antecedentes Marcas de clase y Frecuencias
  3. 3. Introducción La agrupación de datos Esta presentación es la tercera parte de cuatro, en las que se construye una tabla de distribución de frecuencias para datos agrupados. El objetivo es mostrar detalladamente las operaciones aritméticas necesarias para resumir un conjunto de datos agrupándolos en intervalos, también llamados clases o categorías.
  4. 4. Introducción El resultado final será el llenado de esta tabla que, una vez completa, describirá los datos de modo que podamos interpretarlos, elaborar conclusiones y, posteriormente, construir inferencias acerca de la población en estudio.
  5. 5. Antecedentes El cálculo de intervalos aparentes e intervalos reales se llevó a cabo en la primera y segunda parte, ahora vamos a estudiar cómo se determinan las marcas de clase y las frecuencias.
  6. 6. Antecedentes En caso que sea necesario, este es el conjunto de datos con el que se está trabajando.
  7. 7. Antecedentes Los intervalos aparentes determinados en la primera parte de esta presentación cumplen con las cuatro condiciones que se requieren y, por la forma en que se calculan, también los intervalos reales.
  8. 8. Marcas de clase Pérdida de exactitud Es importante aclarar que la agrupación de datos conlleva una pérdida de exactitud. Específicamente, al utilizar las marcas de clase como si todos los valores en cada intervalo fueran iguales a la marca de clase xi, se introduce un cierto error que es considerado aceptable.
  9. 9. Marcas de clase Cálculo de las marcas de clase El procedimiento para calcular las marcas de clase consiste en promediar los límites de cada intervalo, es decir, sumar ambos valores y dividir entre dos. 𝑥1 = 40.5 + 46.5 2 ∴ 𝑥1 = 43.5 𝑥2 = 46.5 + 52.5 2 ∴ 𝑥2 = 49.5 Y así sucesivamente
  10. 10. Marcas de clase Las marcas de clase en la tabla de análisis estadístico Las marcas de clase “representan” a los intervalos, y se considera que todos los valores dentro de ellos tienen como valor la marca de clase, por ejemplo; el primer intervalo contiene valores entre 40.5 y 46.5, al realizar los cálculos de las siguientes columnas, vamos a tomarlos como si todos ellos fueran igual a 43.5. Se anotan junto a cada intervalo, clase o categoría. Marcas de Límite Límite clase F. absoluta F. acumulada F. Relativa F. rel. Acum. inferior superior 40.5 46.5 43.5 46.5 52.5 49.5 52.5 58.5 55.5 58.5 64.5 61.5 64.5 70.5 67.5 70.5 76.5 73.5 76.5 82.5 79.5 82.5 88.5 85.5 88.5 94.5 91.5 94.5 100.5 97.5 Intervalos reales Frecuencias 𝑥
  11. 11. Frecuencias Cantidad de datos dentro de cada intervalo Esta parte del proceso, cuando se realiza a mano, puede resultar laboriosa; se resaltan los datos que están dentro del primer intervalo, son 3, por lo tanto, se anotará la frecuencia f1, igual a 3. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 1 81 52 81 64 83 79 77 74 79 70 77 77 62 67 81 62 67 79 71 79 65 70 84 62 73 87 65 72 65 92 2 71 68 71 85 65 91 51 61 80 82 63 91 71 74 78 72 59 60 66 63 83 65 87 62 79 89 51 70 70 56 3 86 65 66 56 73 75 83 62 70 60 68 86 66 83 75 54 62 82 78 64 76 71 71 73 53 68 85 77 68 72 4 67 45 78 77 83 65 89 54 60 69 75 66 73 72 68 67 77 42 80 68 64 73 55 79 43 58 74 78 79 57 5 86 76 48 66 67 74 58 70 60 49 88 56 68 90 75 67 66 75 77 66 73 76 70 54 90 61 62 90 81 81 6 74 70 85 73 76 66 72 87 69 70 66 70 55 88 70 66 83 69 72 65 85 74 79 59 72 78 67 81 77 57 7 71 80 70 75 76 69 71 77 72 63 64 56 57 66 80 78 54 77 77 79 75 75 62 73 80 53 89 59 67 78 8 75 74 90 89 81 64 62 91 61 62 64 58 72 69 59 81 65 62 63 85 68 74 75 61 60 62 50 94 77 91 9 75 71 79 86 74 74 75 81 67 97 54 73 80 63 70 65 80 73 81 50 75 89 71 59 79 83 80 92 69 57 10 63 67 49 100 66 79 71 77 75 60 66 58 72 57 60 75 69 60 73 62 83 72 66 85 61 52 86 55 83 80 Marcas de Límite Límite clase F. absoluta F. acumu inferior superior 40.5 46.5 43.5 3 46.5 52.5 49.5 52.5 58.5 55.5 58.5 64.5 61.5 64.5 70.5 67.5 70.5 76.5 73.5 76.5 82.5 79.5 82.5 88.5 85.5 88.5 94.5 91.5 94.5 100.5 97.5 Intervalos reales F 𝑥
  12. 12. Marcas de Límite Límite clase F. absoluta F. acumula inferior superior 40.5 46.5 43.5 3 46.5 52.5 49.5 9 52.5 58.5 55.5 58.5 64.5 61.5 64.5 70.5 67.5 70.5 76.5 73.5 76.5 82.5 79.5 82.5 88.5 85.5 88.5 94.5 91.5 94.5 100.5 97.5 Intervalos reales Fr 𝑥 Frecuencias Cantidad de datos dentro de cada intervalo Los datos dentro del segundo intervalo son nueve, por lo tanto, se anotará la frecuencia f2, igual a 9. (Se utiliza la opción “formato condicional” en Excel para resaltar las celdas) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 1 81 52 81 64 83 79 77 74 79 70 77 77 62 67 81 62 67 79 71 79 65 70 84 62 73 87 65 72 65 92 2 71 68 71 85 65 91 51 61 80 82 63 91 71 74 78 72 59 60 66 63 83 65 87 62 79 89 51 70 70 56 3 86 65 66 56 73 75 83 62 70 60 68 86 66 83 75 54 62 82 78 64 76 71 71 73 53 68 85 77 68 72 4 67 45 78 77 83 65 89 54 60 69 75 66 73 72 68 67 77 42 80 68 64 73 55 79 43 58 74 78 79 57 5 86 76 48 66 67 74 58 70 60 49 88 56 68 90 75 67 66 75 77 66 73 76 70 54 90 61 62 90 81 81 6 74 70 85 73 76 66 72 87 69 70 66 70 55 88 70 66 83 69 72 65 85 74 79 59 72 78 67 81 77 57 7 71 80 70 75 76 69 71 77 72 63 64 56 57 66 80 78 54 77 77 79 75 75 62 73 80 53 89 59 67 78 8 75 74 90 89 81 64 62 91 61 62 64 58 72 69 59 81 65 62 63 85 68 74 75 61 60 62 50 94 77 91 9 75 71 79 86 74 74 75 81 67 97 54 73 80 63 70 65 80 73 81 50 75 89 71 59 79 83 80 92 69 57 10 63 67 49 100 66 79 71 77 75 60 66 58 72 57 60 75 69 60 73 62 83 72 66 85 61 52 86 55 83 80
  13. 13. Marcas de Límite Límite clase F. absoluta F. acumu inferior superior 40.5 46.5 43.5 3 46.5 52.5 49.5 9 52.5 58.5 55.5 23 58.5 64.5 61.5 64.5 70.5 67.5 70.5 76.5 73.5 76.5 82.5 79.5 82.5 88.5 85.5 88.5 94.5 91.5 94.5 100.5 97.5 Intervalos reales F 𝑥 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 1 81 52 81 64 83 79 77 74 79 70 77 77 62 67 81 62 67 79 71 79 65 70 84 62 73 87 65 72 65 92 2 71 68 71 85 65 91 51 61 80 82 63 91 71 74 78 72 59 60 66 63 83 65 87 62 79 89 51 70 70 56 3 86 65 66 56 73 75 83 62 70 60 68 86 66 83 75 54 62 82 78 64 76 71 71 73 53 68 85 77 68 72 4 67 45 78 77 83 65 89 54 60 69 75 66 73 72 68 67 77 42 80 68 64 73 55 79 43 58 74 78 79 57 5 86 76 48 66 67 74 58 70 60 49 88 56 68 90 75 67 66 75 77 66 73 76 70 54 90 61 62 90 81 81 6 74 70 85 73 76 66 72 87 69 70 66 70 55 88 70 66 83 69 72 65 85 74 79 59 72 78 67 81 77 57 7 71 80 70 75 76 69 71 77 72 63 64 56 57 66 80 78 54 77 77 79 75 75 62 73 80 53 89 59 67 78 8 75 74 90 89 81 64 62 91 61 62 64 58 72 69 59 81 65 62 63 85 68 74 75 61 60 62 50 94 77 91 9 75 71 79 86 74 74 75 81 67 97 54 73 80 63 70 65 80 73 81 50 75 89 71 59 79 83 80 92 69 57 10 63 67 49 100 66 79 71 77 75 60 66 58 72 57 60 75 69 60 73 62 83 72 66 85 61 52 86 55 83 80 Frecuencias Cantidad de datos dentro de cada intervalo Los datos dentro del tercer intervalo son veintitrés, por lo tanto, se anotará la frecuencia f3, igual a 23. (La opción “formato condicional” en Excel permite resaltar diferentes grupos de celdas)
  14. 14. Marcas de Límite Límite clase F. absoluta F. acumula inferior superior 40.5 46.5 43.5 3 46.5 52.5 49.5 9 52.5 58.5 55.5 23 58.5 64.5 61.5 43 64.5 70.5 67.5 62 70.5 76.5 73.5 63 76.5 82.5 79.5 53 82.5 88.5 85.5 26 88.5 94.5 91.5 16 94.5 100.5 97.5 2 Intervalos reales Fre 𝑥 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 1 81 52 81 64 83 79 77 74 79 70 77 77 62 67 81 62 67 79 71 79 65 70 84 62 73 87 65 72 65 92 2 71 68 71 85 65 91 51 61 80 82 63 91 71 74 78 72 59 60 66 63 83 65 87 62 79 89 51 70 70 56 3 86 65 66 56 73 75 83 62 70 60 68 86 66 83 75 54 62 82 78 64 76 71 71 73 53 68 85 77 68 72 4 67 45 78 77 83 65 89 54 60 69 75 66 73 72 68 67 77 42 80 68 64 73 55 79 43 58 74 78 79 57 5 86 76 48 66 67 74 58 70 60 49 88 56 68 90 75 67 66 75 77 66 73 76 70 54 90 61 62 90 81 81 6 74 70 85 73 76 66 72 87 69 70 66 70 55 88 70 66 83 69 72 65 85 74 79 59 72 78 67 81 77 57 7 71 80 70 75 76 69 71 77 72 63 64 56 57 66 80 78 54 77 77 79 75 75 62 73 80 53 89 59 67 78 8 75 74 90 89 81 64 62 91 61 62 64 58 72 69 59 81 65 62 63 85 68 74 75 61 60 62 50 94 77 91 9 75 71 79 86 74 74 75 81 67 97 54 73 80 63 70 65 80 73 81 50 75 89 71 59 79 83 80 92 69 57 10 63 67 49 100 66 79 71 77 75 60 66 58 72 57 60 75 69 60 73 62 83 72 66 85 61 52 86 55 83 80 Frecuencias Cantidad de datos dentro de cada intervalo Las frecuencias completas quedan como se muestra. (Para que Excel determine las frecuencias y evitar contar manualmente los datos de cada clase es necesario emplear la fórmula matricial “FRECUENCIA”).
  15. 15. Frecuencias e histograma Representación gráfica de la frecuencia absoluta para datos agrupados. Colocando en el eje equis los intervalos reales y en el eje ye la frecuencia absoluta podemos trazar un histograma.
  16. 16. Frecuencias e histograma Este histograma, aunque correcto, está incompleto. Para que este gráfico resulte útil, es necesario agregarle algunas líneas en las posiciones adecuadas para facilitar el análisis de la información. Posteriormente se explicará cómo obtener los valores que faltan, por ahora vamos a calcular las otras tres columnas de frecuencias.
  17. 17. Frecuencia acumulada La frecuencia acumulada fai es parte de la tabla de análisis de datos estadísticos, también se le llama frecuencia de no excedencia, y se define como la frecuencia de ocurrencia de valores menores a un valor específico. Marcas de Límite Límite clase F. absoluta F. acumulada F. Relativa F. rel. Acum. inferior superior 40.5 46.5 43.5 3 3 46.5 52.5 49.5 9 52.5 58.5 55.5 23 58.5 64.5 61.5 43 64.5 70.5 67.5 62 70.5 76.5 73.5 63 76.5 82.5 79.5 53 82.5 88.5 85.5 26 88.5 94.5 91.5 16 94.5 100.5 97.5 2 Intervalos reales Frecuencias 𝑥 Cálculo de la frecuencia acumulada fai. A continuación vamos a calcular la frecuencia acumulada fai El primer valor de frecuencia acumulada fa1 es igual al primer valor de la frecuencia absoluta f1 En nuestro ejemplo f1 = 3, por lo tanto la frecuencia acumulada también es igual a 3: fa1 = 3
  18. 18. Marcas de Límite Límite clase F. absoluta F. acumulada F. Relativa F. rel. Acum. inferior superior 40.5 46.5 43.5 3 3 46.5 52.5 49.5 9 12 52.5 58.5 55.5 23 35 58.5 64.5 61.5 43 78 64.5 70.5 67.5 62 140 70.5 76.5 73.5 63 203 76.5 82.5 79.5 53 256 82.5 88.5 85.5 26 282 88.5 94.5 91.5 16 298 94.5 100.5 97.5 2 300 Intervalos reales Frecuencias 𝑥 Frecuencia acumulada Los valores restantes de la frecuencia acumulada se determinan sumando, a la frecuencia acumulada anterior, el valor de la frecuencia absoluta actual, de modo que la última frecuencia acumulada deberá ser igual al número de datos. Cálculo de la frecuencia acumulada fai. En nuestro ejemplo f1 = 3, por lo tanto la frecuencia acumulada también es igual a 3: fa1 = 3 Las siguientes frecuencias acumuladas son igual a: fa2 = fa1 + f2 = 3 + 9 = 12 fa3 = fa2 + f3 = 12 + 23 = 35 Y así sucesivamente…
  19. 19. Marcas de Límite Límite clase F. absoluta F. acumulada F. Relativa F. rel. Acum. inferior superior 40.5 46.5 43.5 3 3 0.010 46.5 52.5 49.5 9 12 0.030 52.5 58.5 55.5 23 35 0.077 58.5 64.5 61.5 43 78 0.143 64.5 70.5 67.5 62 140 0.207 70.5 76.5 73.5 63 203 0.210 76.5 82.5 79.5 53 256 0.177 82.5 88.5 85.5 26 282 0.087 88.5 94.5 91.5 16 298 0.053 94.5 100.5 97.5 2 300 0.007 Intervalos reales Frecuencias 𝑥 Frecuencia relativa La frecuencia relativa fri de una clase xi es la proporción de valores iguales a xi en un conjunto de datos, se obtiene como el cociente de la frecuencia absoluta fi, entre el tamaño de la muestra o número de datos n Cálculo de la frecuencia relativa fri. En cada clase se efectúa la división: 1 = 1 𝑛 = 3 300 ∴ 1 = 0.01 2 = 2 𝑛 = 9 300 ∴ 2 = 0.03 Y así sucesivamente…Habrá pequeñas variaciones en las cifras decimales
  20. 20. Marcas de Límite Límite clase F. absoluta F. acumulada F. Relativa F. rel. Acum. inferior superior 40.5 46.5 43.5 3 3 0.010 0.0100 46.5 52.5 49.5 9 12 0.030 0.0400 52.5 58.5 55.5 23 35 0.077 0.1167 58.5 64.5 61.5 43 78 0.143 0.2600 64.5 70.5 67.5 62 140 0.207 0.4667 70.5 76.5 73.5 63 203 0.210 0.6767 76.5 82.5 79.5 53 256 0.177 0.8533 82.5 88.5 85.5 26 282 0.087 0.9400 88.5 94.5 91.5 16 298 0.053 0.9933 94.5 100.5 97.5 2 300 0.007 1.0000 Intervalos reales Frecuencias 𝑥 Frecuencia relativa acumulada La frecuencia relativa acumulada frai de una clase xi es la proporción de valores iguales o menores a xi en un conjunto de datos, se obtiene sumando consecutivamente las frecuencias relativas fri Cálculo de la frecuencia relativa acumulada fri. 1 = 1 ∴ 1 = 0.01 2 = 1 + 2 = 0.01 + 0.03 ∴ 1 = 0.04 3 = 2 + 3 = 0.04 + 0.077 ∴ 1 = 0.1167 Y así sucesivamente…Habrá pequeñas variaciones en las cifras decimales
  21. 21. Marcas de Límite Límite clase F. absoluta F. acumulada F. Relativa F. rel. Acum. inferior superior 40.5 46.5 43.5 3 3 0.010 0.0100 46.5 52.5 49.5 9 12 0.030 0.0400 52.5 58.5 55.5 23 35 0.077 0.1167 58.5 64.5 61.5 43 78 0.143 0.2600 64.5 70.5 67.5 62 140 0.207 0.4667 70.5 76.5 73.5 63 203 0.210 0.6767 76.5 82.5 79.5 53 256 0.177 0.8533 82.5 88.5 85.5 26 282 0.087 0.9400 88.5 94.5 91.5 16 298 0.053 0.9933 94.5 100.5 97.5 2 300 0.007 1.0000 Intervalos reales Frecuencias 𝑥 Marcas de clase y frecuencias Con estos cálculos ya está terminada la sección de frecuencias, sólo quedan pendientes las medidas de tendencia central y dispersión. Es importante verificar que la última frecuencia relativa acumulada sea igual a uno. Es posible que pueda haber alguna variación por no tomar suficientes cifras decimales. Con esta información es posible trazar otras gráficas, como la gráfica circular y la ojiva. Habrá pequeñas variaciones en las cifras decimales
  22. 22. Presentaciones Se han cumplido los tres primeros pasos, la tabla se ha llenado hasta las frecuencias. En la siguiente presentación se llenarán las columnas faltantes: medidas de tendencia central y dispersión.
  23. 23. Marcas de Límite Límite clase F. absoluta F. acumulada F. Relativa F. rel. Acum. inferior superior 40.5 46.5 43.5 3 3 0.010 0.0100 46.5 52.5 49.5 9 12 0.030 0.0400 52.5 58.5 55.5 23 35 0.077 0.1167 58.5 64.5 61.5 43 78 0.143 0.2600 64.5 70.5 67.5 62 140 0.207 0.4667 70.5 76.5 73.5 63 203 0.210 0.6767 76.5 82.5 79.5 53 256 0.177 0.8533 82.5 88.5 85.5 26 282 0.087 0.9400 88.5 94.5 91.5 16 298 0.053 0.9933 94.5 100.5 97.5 2 300 0.007 1.0000 Totales: Media aritmética: Desviación media: Varianza: s 2 = Desviación estándar: s = Coeficiente de variación: Cv = Intervalos reales Frecuencias Medidas de tendencia central y dispersión 𝑥 𝑥 𝑥 = = 𝑥 𝑥 𝑥 𝑥 2 Presentaciones Las medidas de tendencia central y dispersión son muy importantes en el análisis de datos, incluso es recomendable que se representen en el histograma como se verá en la siguiente presentación.
  24. 24. Por su atención Gracias

×