2. CLASIFICACIÓN
DE DATOS
• Después de haber investigado y recolectado datos, se procede al
segundo proceso, la clasificación de los datos. Luego seguimos con la
agrupación de los mismos, de acuerdo a un sistema de clasificación
previamente determinado mediante el conteo de las unidades que
pertenecen a cada subclase o subconjunto.
Si la variable es
cuantitativa la
clasificación de los
datos requiere utilizar:
•Intervalo abierto
•Intervalo cerrado
Procedimientos para
determinar el número
y amplitud de los
intervalos de clase
3. DESCRIPCIÓN DE DATOS
• Cuando la muestra que se ha tomado de la población, o sea el proceso
que se desea analizar, tiene 20 elementos en la muestra, entonces estos
datos son analizados sin necesidad de formar clases con ellos y a estos es
lo que se llama tratamiento de datos no agrupados.
• Cuando la muestra consta de 20 o mas datos, lo aconsejable es agrupar
los datos en clases y a partir de estas determinar características de la
muestra y por consiguiente las de la población donde fue tomada.
4. DATOS NO AGRUPADOS
• Distribución de frecuencia para datos no agrupados: Es aquella
distribución que indica las frecuencias con que aparecen los datos
estadísticos, desde el menor de ellos hasta el mayor de ese conjunto sin
que se haya hecho ninguna modificación al tamaño de las unidades
originales.
• En estas distribuciones cada datos mantiene su propia identidad después
que la distribución de frecuencia se ha elaborado, en estas distribuciones
los valores de cada variable han sido solamente reagrupados, siguiendo
un orden lógico con sus respectivas frecuencias.
5. CONCEPTOS BÁSICOS
A UTILIZAR
• INTERVALOS DE CLASE: Son grupos pequeños de datos de igual
tamaño. Se puede construir intervalos de clase, cerrados o intervalos de
clase semi abiertos. Un intervalo cerrado es cuando el límite superior de
una clase no es el límite inferior de la clase siguiente. Mientras que un
intervalo semi abierto el límite superior de una clase es el límite inferior
de la clase siguiente.
• LÍMITE DE CLASES: Los intervalos de clase tienen límites: un límite
inferior y un límite superior.
6. CONCEPTOS BÁSICOS
A UTILIZAR
• AMPLITUD O ANCHO DE CLASE: es la distancia entre el límite superior e
inferior. Si el intervalo es cerrado el ancho de clase se obtiene restando el límite
inferior de la segunda clase menos en limite inferior de la primera clase: en
nuestro ejemplo (tabla azul) 132 – 37 = 95 Pero si el intervalo es Semi-abierto, el
ancho de clase se obtiene restando el límite superior de cualquier intervalo de
clase con el límite inferior de ese mismo intervalo de clase: en nuestro caso
(tabla en blanco): 10 – 5 = 5
• N = Número de datos de la muestra o de la población.
• MARCAS DE CLASE: es el punto medio de cada uno de los intervalos de clase.
La marca de clase se obtiene sumando los límites de la clase y dividiendo para
2: para la tabla azul: la marca de clase del primer intervalo será: 37 + 131 = 168 /
2 = 84 para la tabla blanca: 5 + 10 = 15 / 2 = 7,5, este será la marca de clase del 2ª
intervalo.
7. TIPOS DE INTERVALOS
• El Intervalo, son un par de números entre los cuales se estima que estará
cierto valor desconocido.
• CERRADO: Es un intervalo cerrado porque están incluidos los dos
extremos, 0 (limite inferior) y 4 (limite superior).
• EJEMPLO: Personas de 20 a 28 años de edad y con estatura de 1.60 a 1.75
metros, para que pueden ocupar la vacante de edecanes.
• ABIERTO: Es un intervalo abierto porque en los límites del intervalo solo
solo se conoce el inicio o el final, es decir, se excluye.
• EJEMPLO: Personas menores de 29 años y estatura mayor de 1.59
metros, para que puedan ocupar la vacante de edecanes.
8. NÚMERO Y AMPLITUD DE INTERVALOS
• El procedimiento para determinar el número y amplitud de los intervalos
de clase es el siguientes:
Paso uno: determinar el rango.
Paso dos: determinar el número
de intervalos.
Paso tres: determinar la amplitud de
de cada intervalo de clase.
9. RANGO
• Es la diferencia entre los límites de un intervalo.
• El rango se define como la diferencia entre los datos máximo y mínimo
de una distribución para conocer la amplitud de la variación de un
fenómeno entre un límite claramente especificado.
EN FORMA DE ECUACIÓN:
Rango = Dato máximo - Dato mínimo
154 – 85 = 69
10. FÓRMULA DE STURGES
• PASO DOS: Se utiliza alguna herramienta estadística para calcular el número de
intervalos en función del total de datos del conjunto. Una herramienta
recomendada en este caso es la fórmula de Sturges:
• Se divide el rango en un número conveniente de clases o intervalos del mismo
tamaño. Por ejemplo 10.
EN FORMA DE ECUACIÓN:
K = 1 + 3.322 log 10 N (donde N equivale al número de datos)
Si se utiliza esta fórmula con 70 datos como ejemplo, el logaritmo en base 10 de
ese total es igual a 2.84 que al ser sustituido en esa expresión aritmética reporta el
siguiente resultado:
K = 1 + 3.322 ( 2.84) = 10. 4 *10. Aproximadamente 10
11. PASO TRES
• El investigador, determina cuántos intervalos considera necesarios para realizar su análisis,
sin perder de vista que muchos intervalos provocan dispersión en los datos y pocos
evidencian carencia de forma, que finalmente no ofrecen información suficiente.
• Amplitud de los intervalos = Rango / Número de intervalos
• Amplitud de los intervalos = 69 / 10 = 6.9 Este valor se aproxima a 7, luego, el
primer intervalo contiene 7 datos, comenzando por el menor de ellos 85.
85 – 91 Clase 1 = (85, 86, 87, 88, 89, 90, 91)
92 – 98
99 –105
106–112
113–119
120–126
127–133
134–140
141–147
148–154
15. EJERCICIO 2
• Durante el mes de julio, en una ciudad se han registrado las siguientes
temperaturas máximas:
• 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29,
30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
• Construir la tabla de frecuencias
Para cambiar la imagen de esta diapositiva, seleccione la imagen y elimínela. Después, haga clic en el icono Imágenes del marcador de posición para insertar su propia imagen.