Este documento describe los principios básicos de la organización de datos estadísticos. Explica que la organización de datos es un paso fundamental en el proceso estadístico que implica agrupar y tabular la información recolectada. Presenta dos métodos principales de organización: distribuciones de frecuencia simple, para datos nominales; y distribuciones de frecuencia por intervalos, para datos cuantitativos. Incluye ejemplos detallados de cómo construir tablas para ambos métodos y calcular frecuencias, porcentajes y porcentajes acumulados.
Tiempos Predeterminados MOST para Estudio del Trabajo II
Organización de datos estadísticos
1. REPÚBLICA BOLIVARIANA DE VENEZUELA
INSTITUTO UNIVERSITARIO POLITÉCNICO
“SANTIAGO MARIÑO”
SEDE BARCELONA
ORGANIZACIÓN DE
LOS DATOS
Br.: José Felix Rodríguez Macuare
C.I: 26.632.429
Barcelona, Junio 2020
Prof:
Pedro Beltrán
2. INTRODUCCIÓN
La estadística con frecuencia, se realiza con la intención de llegar a
establecer conclusiones o a obtener resultados, esto demanda muchas veces
estudiar centenares, miles o aun cifras más altas de cosas, objetos, personas o
grupos. Por ejemplo un caso extremo de estudio que involucra a la
estadística es la realización de un censo, a pesar de la ayuda de
procedimientos complejos diseñados para tal fin, constituye siempre una
tarea gigantesca resumir y describir las enormes cantidades de datos que se
generan de los proyectos de investigación.
Usando los principios más elementales de la estadística descriptiva, es
posible describir las características de los datos con bastante claridad y
precisión, de modo que las tendencias o generalidades se puedan descubrir
más rápidamente y comunicar con mayor facilidad. Primero, es menester
clarificar que dependiendo del nivel de medición de la variable se
posibilitará su organización.
3. ORGANIZACIÓN DE LOS DATOS
La organización de datos es el material que se debe procesar,
queremos decir, lo primordial de la estadística es la recolección de los
datos, para lo cual empleamos diferentes técnicas, como la observación,
entrevista, el cuestionario, después pasamos a la fase dos que es la
organización y el ordenamiento de todos los datos, la cual podemos
realizar a través de tablas, las cuales pueden ser a trabes de una
distribución de frecuencias simples o una distribución de frecuencia con
intervalos, en estos dos casos se agrupan todos aquellos que corresponda
a un mismo dato nominal o dependiendo de la variable, luego se expresan
el numero de veces que tiene aparición la variable.
La Frecuencia es el número de veces que aparece cada variable o
dato nominal.
4. EJEMPLO
Podemos realizar una tabla que muestre las notas de
Castellano de un colegio. Se observa que tenemos dos (2) que
obtuvieron una nota de diez (10) puntos, siete (7) alumnos que
obtuvieron una nota de nueve (9) puntos, etc, podemos decir
entonces que la frecuencia del dato nominal 10 es de dos (2);
la frecuencia de la variable (9) es siete.
La distribución de frecuencia viene a ser el resultado de la
organización de los datos recolectados en grupos, mostrando
la frecuencia de cada valor o uno. Pueden ser simples o por
intervalos.
5. TIPOS DE ORGANIZACIÓN DE
DATOS
Según la cantidad y tipo, pueden agruparse de
dos maneras:
• Agruparlos por intervalo: para datos cuantitativos.
• Por conteo individual: según categoría o valor diferente
Una vez que se haya realizado la recolección de
datos, los cuales es rara vez son significativos
mientras se organizan y se tabulan.
6. OPERACIONES CON
ORGANIZACIÓN DE DATOS
La información es activo fundamental para las
empresas e instituciones, presta servicios
orientados a respaldar la información que es clave.
Los datos disponibles pueden dificultar la toma
decisiones en una empresa u organización, por el
universo de información existente y diversidad de
la misma.
Por ejemplo: la música, fotografías, redes,
videos, entre otros.
7. EJEMPLO DE CADA
ORGANIZACIÓN DE DATOS
• Distribución de frecuencia simple: Organizar los datos
recolectados de menor a mayo o viceversa, de manera que se
muestre la frecuencia de cada uno, podemos hacer una
distribución de frecuencia simple. Paso uno es ubicar el dato
menor y el dato mayor dentro del conjunto de datos ya
recolectados, en el caso que los datos sean de carácter
numéricos. Al ubicar lo anterior, se debe colocar en una
columna los datos los datos de números de menor a mayor. Se
cuenta cuantas veces aparece el primer valor nominal, se aconseja
ir marcando con (*) cada vez que se ubique uno. Es el mismo
proceso para cada variable. Finalmente se cuenta el número de
(*) que se hayan registrado por cada valor nominal y luego se
procederá a elaborar una tabla definitiva.
8. Ejemplo: Se ordena y se construye una tabla de frecuencia simple del siguiente
conjunto de datos recolectados:
24 20 32 32 29 21
21 22 33 30 27 26
23 24 20 25 26 32
28 22 29 29 33 35
31 28 32 35 33 32
27 21 33 29 25 24
Solución:
Primer paso: Se debe localizar el número menor (20) y el número mayor (35).
Segundo paso: Se realiza una lista completa de los números desde el 20 hasta el
35:
20 24 28 32
21 25 29 33
22 26 30 34
23 27 31 35
EJEMPLO DE CADA
ORGANIZACIÓN DE DATOS
9. Tercer paso: Se cuenta cuántos datos nominales del número (20) aparecen y a cada uno
que ubiquemos se le coloca un asterisco (*). Se hace lo mismo por cada valor.
Para comprobar y tener la seguridad de que no se nos escapo alguno o se contó demás, se
suman todos los asteriscos (*) la cual debe ser igual al número de datos nominales. En este
caso existen 36 datos nominales y 36 asteriscos (*), lo cual significa que el conteo fue el
correcto.
EJEMPLO DE CADA
ORGANIZACIÓN DE DATOS
20(**) 24 (***) 28 (**) 32 (*****)
21 (***) 25 (**) 29 (****) 33 (****)
22 (**) 26 (**) 30 (*) 34
23 (*) 27 (**) 31 (*) 35 (**)
10. Cuarto paso: Se procede a elaborar tabla definitiva. En la tabla es imperativo:
•Los encabezados o nombres de cada columna.
•Las líneas horizontales que delimitan la tabla tanto por la parte superior como inferior.
•La línea horizontal delimita la parte inferior de los encabezados.
•Las líneas verticales que delimitan las columnas.
EJEMPLO DE CADA
ORGANIZACIÓN DE DATOS
Es conveniente y a veces necesario obtener el total de una columna en
una tabla, se especifican como la muestra la tabla anterior. Para evitar
confundir con otro dato nominal, la suma de cualquier columna debe
ponerse fuera de la tabla.
11. EJEMPLO DE DISTRIBUCIÓN
DE FRECUENCIA
Los datos recolectados podemos también
organizarlos por intervalos. Cada intervalo se llama
también clase. El ancho de clase o longitud del
intervalo es la resta de el límite superior menos el
límite inferior de cada clase o intervalo. No se debe
confundirse el ancho de la clase con el número de
datos nominales que contiene el intervalo.
Cuando se trabaja con variables discretas, el
ancho de la clase o longitud del intervalo es la resta de
el límite superior menos el límite inferior de cada clase
o intervalo, mientras que el número de datos es la resta
de el límite superior menos el límite inferior de cada
clase o intervalo más 1.
12. Cuando se trabaja con variables
continúas, el ancho de clase o longitud del
intervalo es igual que antes, la resta del límite
superior menos el límite inferior de cada clase
o intervalo, mientras que el número de datos
posibles que pudiera contener el intervalo no
es posible conocerlo porque caben todos los
valores intermedios.
A la organización de los datos
recolectados en las tablas por intervalos se les
llama distribución de frecuencias por
intervalos. La característica más importante es
que el ancho de cada clase o longitud del
intervalo debe ser el mismo para cada
intervalo.
EJEMPLO DE DISTRIBUCIÓN
DE FRECUENCIA
13. EJEMPLO
Por ejemplo:
Ordenar y construir una tabla de frecuencia con cuatro intervalos del
siguiente conjunto de datos recolectados.
24 20 32 32 29 21
21 22 33 30 27 26
23 24 20 25 26 32
28 22 29 29 33 35
31 28 32 35 33 32
27 21 33 29 25 24
14. EJEMPLO ( cont…)
Solución:
Conviene iniciar de la misma manera que en la organización de
frecuencias simple. Se localiza el número menor y el mayor; son 20 y 35 y
se hace una lista completa de números desde el 20 al 35. Ahora se cuentan
cuantos datos nominales aparecen por cada uno y se pone un asterisco (*),
20(**) 24 (***) 28 (**) 32 (*****)
21 (***) 25 (**) 29 (****) 33 (****)
22 (**) 26 (**) 30 (*) 34
23 (*) 27 (**) 31 (*) 35 (**)
15. Para comprobar y tener la seguridad que no se escapó algún dato o no
se contaron, la suma de todos los asteriscos (*) debe ser igual al número de
dato recolectado inicialmente. En este caso existen 36 datos recolectados y
36 asterisco (*), lo cual significa que cuando contamos es el correcto. Se
cuenta cuantos datos nominales existen dentro del conjunto. En este caso
hay 16.
Como hay 16 datos nominales y se piden cuatro intervalos, se procede
a dividir por cada intervalo incluirá a cuatro nominales, como lo muestra la
siguiente.
EJEMPLO ( cont…)
16. FRECUENCIAS ACUMULADAS
Muchas veces resulta de gran utilidad tener
información sobre la frecuencia que a partir del
inicio de la tabla se tiene hasta cierto dato
nominal determinado. Se le conoce con el
nombre de frecuencias acumuladas (fa) y se
añade en una columna en la misma tabla.
Ejemplo : En los datos del ejemplo, sus
frecuencias acumuladas son:
Obsérvese que la columna de las frecuencias acumuladas no se suma, pero debe
coincidir el último valor acumulado con la suma de la columna de las frecuencias.
17. PORCENTAJES ACUMULADOS
Dentro de la organización de datos es calcular el
porcentaje de cada variable conforme a su frecuencia, lo
mismo que su porcentaje acumulado, ya sea en una
distribución de frecuencia simple o por intervalos.
Para calcular el porcentaje basta hacer una regla de tres,
en donde el 100% es el numero N de datos recolectados,
es decir, el total de las frecuencias, esto es:
Donde:
n = número total de datos recolectados o frecuencia total
f = frecuencia particular del dato nominal del que se
desea saber su porcentaje
% = porcentaje correspondiente al dato nominal de
frecuencia f
Despejando, se obtiene
n = f
100 %
% = 100 f
n
18. EJEMPLO
En la tabla añadir una columna que exprese los
porcentajes de cada dato nominal y otra de sus
porcentajes acumulados.
Se resuelve: Para obtener el porcentaje del
primer dato x = 20, se plantea una regla de tres
simple, en donde el número total de datos es el
100%.
Donde: =
Se hace lo mismo con cada uno de los datos de
la tabla, de manera de completar la tabla de la
siguiente forma:
36 2
100 %
100 x 2
36
% = = % = 5,5
19. Conclusión
Al recolectar los datos de este trabajo de
investigación en la estadística y todo lo referente a
ella, como la organización de datos es de vital
importancia para todo tipo de empresa,
organizaciones, se centra en dar informaciones de
por si numéricos o ella misma se encarga de
transformarlas en números. Se puede decir que la
estadística es la ciencia que nos habla de las
cantidades.