Este documento presenta los pasos para agrupar un conjunto de datos en intervalos para facilitar su análisis. Inicialmente se calculan el valor máximo, mínimo y rango de los datos. Luego se determina el número de intervalos y su tamaño. Con esta información se construyen los límites inferiores y superiores de cada intervalo, revisando que cumplan ciertas condiciones. Finalmente, se ajustan algunos valores como el número de intervalos o tamaño para que todos los límites cumplan con las condiciones requeridas.
Pruebas de Hipótesis para dos medias y proporciones.estadisticaYanina C.J
Sea X1,…. Xn una m.a. tomada de una población N(1,21) y Sea Y1,…. Yn una m.a. tomada de una población N(2,22), donde 21 y 22 son conocidos . Existen tres tipos de contrastes:
Pruebas de Hipótesis para dos medias y proporciones.estadisticaYanina C.J
Sea X1,…. Xn una m.a. tomada de una población N(1,21) y Sea Y1,…. Yn una m.a. tomada de una población N(2,22), donde 21 y 22 son conocidos . Existen tres tipos de contrastes:
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...JAVIER SOLIS NOYOLA
El Mtro. Javier Solis Noyola diseña y desarrolla presentación sobre tema PRUEBA DE HIPÓTESIS para distribuciones de probabilidad (Normal, y t de Student)
Percentiles para datos sin agrupar y Percentiles para datos agrupadosRodrigo Palomino
Teoría básica para el cálculo de los percentiles para datos sin agrupar y agrupados, ejemplos de cálculo de percentiles e interpretación de los percentiles
Medidas de tendencia central, posición y dispersión José Ontiveros
Las medidas de tendencia central, son medidas estadísticas que pretenden resumir en un solo valor a un conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas son: media, mediana y moda.
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...JAVIER SOLIS NOYOLA
El Mtro. Javier Solis Noyola diseña y desarrolla presentación sobre tema PRUEBA DE HIPÓTESIS para distribuciones de probabilidad (Normal, y t de Student)
Percentiles para datos sin agrupar y Percentiles para datos agrupadosRodrigo Palomino
Teoría básica para el cálculo de los percentiles para datos sin agrupar y agrupados, ejemplos de cálculo de percentiles e interpretación de los percentiles
Medidas de tendencia central, posición y dispersión José Ontiveros
Las medidas de tendencia central, son medidas estadísticas que pretenden resumir en un solo valor a un conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas son: media, mediana y moda.
Elaboración de tablas de frecuencia, estadísticaGerardo Lagos
A través de la presentación se ilustra de manera fácil el procedimiento para elaborar tablas de distribución de frecuencias para datos agrupados, como ser: Rango, tamaño o ancho de una clase, marca de clase, distribución de frecuencias y límites reales de clase.
Factores a Considerar al Medir
Exactitud y Precisión
Cifras Significativas
Operaciones con Cifras Significativas
Notación Científica
Operaciones con Notación Científica
Utilización de subconsultas para realizar cálculos sobre “N” cantidad de columnas sin utilizar sentencias CASE
Hay ocasiones en que debemos realizar cálculos que parecen simples en papel, sin embargo al intentar hacer la consulta en SQL nos damos cuenta que son más complejas de lo que pensamos, o que requieren de mucha codificación para llevarla a cabo.
El presente documento resuelve de forma elegante y escalable un problema común de SQL para realizar cálculos de agrupación sobre columnas.
En la parte final del documento, hay un anexo que describe la solución completa del problema con indicaciones especiales acerca de las sentencias UNION, UNION ALL y cálculo de las funciones de agregación cuando existen valores nulos en los campos.
2. Introducción
Cuando el número de categorías es
demasiado grande, por ejemplo mayor a
25, la tabla de distribución de frecuencias
quedaría muy grande
Al ser tan grande esta tabla de distribución
de frecuencias, no resulta útil como
herramienta para organizar y presentar la
información.
En este caso se recurre a la agrupación de
datos
3. Introducción
En estas presentaciones se construye una tabla
de datos agrupados, paso por paso.
El objetivo es mostrar detalladamente las
operaciones aritméticas necesarias para resumir
un conjunto de datos agrupándolos en
intervalos.
Se incluye el cálculo de intervalos aparentes y
reales además de las medidas de tendencia
central y dispersión más usuales.
5. Datos agrupados
Procedimiento para datos agrupados
Ejemplo: Completa la tabla estadística para los
siguientes datos, agrupándolos en 10 intervalos.
Posteriormente trazaremos un histograma, como el
que se muestra.
9. Datos agrupados
Segundo paso:
Determinar el número de intervalos en que se van a
agrupar los datos. Existen varias formas:
El número de intervalos se puede calcular
obteniendo la raíz cuadrada del número de datos:
Se tomarían 17 ó 18 intervalos
Pero en este caso no lo haremos.
300 17.3205
10. Datos agrupados
Segundo paso:
El número de intervalos se puede calcular
obteniendo la raíz cuadrada del número de datos:
Se tomarían 17 ó 18 intervalos
Otra forma consiste en establecer arbitrariamente
el número de intervalos.
En este caso, de acuerdo con las indicaciones,
vamos a fijarlo en 10
300 17.3205
11. Datos agrupados
Tercer paso:
Determinar el tamaño del intervalo
Se divide el rango entre el número de intervalos:
Como los datos son enteros, se toma un tamaño de
intervalo también entero, podría ser 5 ó 6. Vamos a
tomar el 5 y veamos cómo quedan los intervalos.
58
5.8
10
12. Datos agrupados
Cuarto paso:
Construir los 10 intervalos aparentes.
Existen muchas formas de llevar a cabo este paso
debido a que son sólo operaciones aritméticas,
vamos a ver una de ellas.
Se elige un valor inicial para que sea el primer
límite inferior. Debe ser menor o igual al valor
mínimo (el valor mínimo es 42).
Por lo tanto, vamos a elegir el 40 como valor inicial.
13. Datos agrupados
Intervalo
número
Intervalos aparentes
Límites inferiores Límites superiores
1 40
2
3
4
5
6
7
8
9
10
Este valor inicial debe ser menor o
igual al mínimo; pudo haberse
elegido 39, 40, 41, 42, etcétera.
Posteriormente puede cambiarse en
caso necesario.
14. Datos agrupados
Cuarto paso:
A partir de este valor inicial (40) se calculan los 10
límites inferiores.
Se va sumando a cada límite, el tamaño del
intervalo, como se muestra en la siguiente
diapositiva.
16. Datos agrupados
Cuarto paso:
Antes de continuar debemos revisar que el último
límite inferior (el décimo límite inferior, ya que
fijamos en 10 el número de intervalos) sea menor o
igual al valor máximo (100).
Observa en la siguiente diapositiva que el décimo
límite inferior es igual a 85.
18. Datos agrupados
Cuarto paso:
Ahora vamos a obtener el primer límite superior.
Como los datos son enteros se le resta un entero al
segundo límite inferior:
Segundo límite inferior = 45
Menos un entero = 44
El primer límite superior será 44
19. Datos agrupados
Intervalo
número
Intervalos aparentes
Límites inferiores Límites superiores
1 40 44
2 45
3 50
4 55
5 60
6 65
7 70
8 75
9 80
10 85
45 – 1 = 44
Se resta un entero
porque los datos son
enteros; si tienen un
decimal se resta 0.1 y si
tiene dos, se resta 0.01
20. Datos agrupados
Cuarto paso:
Finalmente, vamos a sumar el tamaño del intervalo
a cada límite superior en forma similar a lo que se
llevó a cabo con los límites inferiores.
44 + 5 = 49
49 + 5 = 54
…
22. Datos agrupados
Cuarto paso:
Ya están calculados los intervalos, sin embargo,
debemos revisar que se cumplan otras dos
condiciones:
El primer límite superior debe ser mayor o igual al
valor mínimo (42).
El último límite superior debe ser mayor o igual al
valor máximo (100)
23. Datos agrupados
Intervalo
número
Intervalos aparentes
Límites inferiores Límites superiores
1 40 44
2 45 49
3 50 54
4 55 59
5 60 64
6 65 69
7 70 74
8 75 79
9 80 84
10 85 89
Este valor debe
ser mayor o igual
al valor mínimo:
44 ≥ 42
Este valor debe
ser mayor o igual
al valor máximo:
89 ≥ 100 ???
24. Datos agrupados
Cuarto paso:
Una de las condiciones necesarias para continuar
con el procedimiento no se cumplió, debemos
cambiar alguno de los siguientes valores:
El primer límite inferior
El tamaño del intervalo
El número de intervalos
Ajustando estos valores trataremos de obtener 10
intervalos de tal modo que se cumplan las 4
condiciones.
25. Datos agrupados
Cuarto paso:
Si cambiamos el primer límite inferior:
Sólo podemos aumentarlo en dos unidades: Tomar
como valor inicial 42.
Esto aumentaría el último límite superior en dos
unidades: 89 + 2 = 91
No es suficiente, ya que de cualquier modo, no se
cumple la condición de que el último límite superior
debe ser mayor o igual al máximo.
26. Datos agrupados
Cuarto paso:
Estamos tratando de obtener 10 intervalos pero
cumpliendo las 4 condiciones.
Lo intentamos cambiando el valor inicial, pero no
funcionó
Veamos que pasa si cambiamos el tamaño del
intervalo:
Necesitamos un tamaño de intervalo más grande
para que el último límite superior aumente lo
suficiente para que sea mayor que el valor máximo.
Vamos a probar con un tamaño de intervalo igual a 6.
27. Datos agrupados
Cuarto paso:
No olvidemos que:
Si aumentar el valor inicial no es suficiente y
aumentar el tamaño del intervalo tampoco cumple
todas las condiciones.
Nos quedaría como último recurso cambiar el
número de intervalos.
Pero antes de cambiar el número de intervalos
vamos a ver qué sucede al aumentar el tamaño del
intervalo.
28. Datos agrupados
Cuarto paso:
Veamos como queda la tabla si tomamos como
tamaño del intervalo el 6.
El primer límite inferior será igual a 40.
Observa la construcción de la tabla en las
siguientes diapositivas.
29. Datos agrupados
Intervalo
número
Intervalos aparentes
Límites inferiores Límites superiores
1 40
2
3
4
5
6
7
8
9
10
Este valor inicial debe ser menor o
igual al mínimo; pudo haberse
elegido 39, 40, 41 ó 42 .
Posteriormente puede cambiarse en
caso necesario.
34. Datos agrupados
Intervalo
número
Intervalos aparentes
Límites inferiores Límites superiores
1 40 45
2 46 51
3 52 57
4 58 63
5 64 69
6 70 75
7 76 81
8 82 87
9 88 93
10 94 99
Este valor debe
ser mayor o igual
al valor mínimo:
45 ≥ 42
Este valor debe
ser mayor o igual
al valor máximo:
99 ≥ 100 (?)
35. Datos agrupados
Intervalo
número
Intervalos aparentes
Límites inferiores Límites superiores
1 40 45
2 46 51
3 52 57
4 58 63
5 64 69
6 70 75
7 76 81
8 82 87
9 88 93
10 94 99
99 ≥ 100 (?)
No cumple con la
condición de ser
mayor o al menos
igual al máximo.
36. Datos agrupados
Cuarto paso:
Todavía no terminamos el cuarto paso, a veces es
necesario realizar varios ajustes antes de obtener
los intervalos apropiados.
En este caso sólo es necesario aumentar el valor
inicial una unidad, aumentarlo de 40 a 41.
Al aumentar una unidad el valor inicial, todos los
valores aumentan en esa misma unidad, de modo
que el último límite superior será 100, como se
muestra en la siguiente diapositiva.
39. Datos agrupados
Cuarto paso:
Finalmente hemos obtenido los intervalos
aparentes.
Estos intervalos son útiles para contar los datos
cuando hay que hacerlo manualmente, pero en la
tabla deben anotarse los intervalos reales.
En la siguiente presentación continuaremos con el
paso 5: Obtener intervalos reales.
40. Gracias por su atención
licmata@hotmail.com
http://licmata-math.blogspot.com/
http://www.scoop.it/t/mathematics-learning
http://www.slideshare.net/licmata/
http://www.facebook.com/licemata
Twitter: @licemata