Este documento describe los conceptos fundamentales de la organización de datos, incluyendo las definiciones de datos, estructuras de datos, tipos de organización de datos cualitativos y cuantitativos, y métodos para organizar los datos como tablas de frecuencias. Explica que la organización de datos es un paso crucial para convertir los datos en información útil mediante el análisis estadístico.
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
Organización de datos estadísticos
1. Republica Bolivariana de Venezuela
Ministerio del Poder Popular para la Educación Superior
I.U.P Santiago Mariño
Extensión Barcelona
Cátedra: Estadística I
Profesor:
Pedro Beltrán
Bachiller:
Mario González C.I: 23.733.626
Barcelona, Junio 2019
2. Introducción
Una organización de datos es una estructura física-lógica que permite
realizar operaciones computacionales (editar, guardar, actualizar, etc.)
sobre un contenido de información.
Estructura física; describe la manera física (bytes) de almacenar los
datos en un soporte (como se almacenan los datos en el soporte).
Estructura lógica; describe la manera lógica de representar la
información a los usuarios (como ve el usuario la información).
3. Organización de los datos:
Siendo el dato el material que se debe procesar, es decir, la materia
prima de la estadística, el primer paso es entonces la recolección de
datos, para lo cual se emplean diferentes técnicas, como la entrevista
personal, el cuestionario, la observación, etc. El segundo paso es la
organización y ordenamiento de los datos, lo que se hace a través de
tablas, las cuales pueden ser por medio de una distribución de
frecuencias simples o una distribución de frecuencias con intervalos, en
ambos casos agrupando todos aquellos que corresponden a una mismo
dato nominal o variable y expresando en una columna el número de
veces que aparece esa variable.
Datos son los hechos que describen sucesos y entidades. "Datos" es
una palabra en plural que se refiere a más de un hecho. A un hecho
simple se le denomina "data-ítem" o elemento de dato.
Los datos son comunicados por varios tipos de símbolos tales como las
letras del alfabeto, números, movimientos de labios, puntos y rayas,
señales con la mano, dibujos, etc. Estos símbolos se pueden ordenar y
reordenar de forma utilizable y se les denomina información.
Definición
4. Los datos son símbolos que
describen condiciones, hechos,
situaciones o valores. Los datos se
caracterizan por no contener
ninguna información. Un dato
puede significar un número, una
letra, un signo ortográfico o
cualquier símbolo que represente
una cantidad, una medida, una
palabra o una descripción.
Cualquier colección o grupo de
datos organizados de tal forma que
tengan asociados un conjunto de
operaciones para poder
manipularlos, se dice que conforma
una estructura de datos. Cualquier
lenguaje de alto nivel provee
típicamente de tipos de datos
estructurados o estructuras de
datos predefinidas, como los
arreglos o los registros.
Se puede pensar en un tipo de dato
abstracto, como un tipo de dato
matemático con una serie de
operaciones definidas en ese
modelo.
Definición
5. Importancia de la Organización de los
Datos
La importancia de los datos está en su capacidad de asociarse dentro
de un contexto para convertirse en información. Por si mismos los datos
no tienen capacidad de comunicar un significado y por tanto no pueden
afectar el comportamiento de quien los recibe. Para ser útiles, los datos
deben convertirse en información para ofrecer un significado,
conocimiento, ideas o conclusiones.
6. Tipos de Organización de los datos
Vamos a considerar por separado los caso de datos cualitativos y
cuantitativos.
Organización de los datos cualitativos: En este caso la agrupación de
los datos es muy sencilla y se hace de acuerdo a las modalidades que
presente las variable en estudio. mediante un conteo se determina el
número de datos (también llamado frecuencia) correspondiente a las
diferentes categorías de la variable. este procedimiento es valido para
cualquier cantidad de datos.
Ejemplo de Organización de los datos cualitativos.
En un estudio sobre las personas que ejercen cargos directivos en una
empresa, se realizaron 15 entrevistas y en relación al Genero se obtuvo la
siguiente información:
f,f,m,m,f,m,m,m,f,f,m,f,f,m,f
Ejemplos
7. Genero Personas
Masculino 7
Femenino 8
total 15
El procedimiento utilizado es intuitivo y una vez resumida la información de
esta manera se facilita la interpretación.
Agrupando los datos de acuerdo a su categoría se obtiene.
Ejemplos
8. Organización de los datos
cuantitativos:
Para organizar y agrupar datos de tipo cuantitativo discretos o continuos, se
utiliza un procedimiento similar, pero más laborioso, al utilizado con los
datos cualitativos.
vamos a utilizar la información correspondiente a la edad de 15 estudiantes.
12,14,10,15,16,12,14,18,20,19,19,18,12,15,17
Un primer intento de organizar esos datos puede consistir en ordenarlos de
menor a mayor tal como se presenta a continuación
10,12,12,12,14,14,15,15,16,17,18,18, 19,19,20
Este ordenamiento de los datos nos permite saber que la edad mínima es 10
y la máxima es 20.
Ejemplos
9. Otra cosa que podemos hacer, dado que algunos datos se repiten, es
agruparlos formando una columna donde aparezcan los valores
diferentes de la edad, ordenados de menor a mayor y al lado de cada
edad el numero de niños que tienen esa edad.
Ejemplos
10. Clasificación de los datos
Los datos estadísticos pueden ser clasificados en cualitativos,
cuantitativos, cronológicos y geográficos.
Datos Cualitativos: cuando los datos son cuantitativos, la diferencia
entre ellos es de clase y no de cantidad. Ejemplo: Si deseamos
clasificar los estudiantes que cursan la materia de estadística I por
su estado civil, observamos que pueden existir solteros, casados,
divorciados, viudos.
Datos cuantitativos: cuando los valores de los datos representan
diferentes magnitudes, decimos que son datos cuantitativos.
Ejemplo: Se clasifican los estudiantes del Núcleo San Carlos de la
UNESR de acuerdo a sus notas, observamos que los valores (nota)
representan diferentes magnitudes.
Datos cronológicos: cuando los valores de los datos varían en
diferentes instantes o períodos de tiempo, los datos son reconocidos
como cronológicos. Ejemplo: Al registrar los promedios de notas de
los Alumnos del Núcleo San Carlos de la UNESR en los diferentes
semestres.
11. Operaciones con Organización de datos
Es la operación estadística, definida como el conjunto de actividades,
incluidas las preparatorias, que conducen a la obtención y/o difusión de
resultados estadísticos sobre un determinado sector o tema o territorio.
También se incluyen en el ámbito de esta definición los trabajos de
infraestructura y de normalización estadística que posibilitan la
coordinación, homogeneización e integración de las estadísticas, así
como la recopilación de resultados y la confección de síntesis.
También se define como operación estadística, a efectos del Inventario,
el conjunto de actividades, incluidas las preparatorias, que partiendo de
una recogida de datos individuales conducen a la obtención y/o difusión
de resultados estadísticos agregados, en forma de tablas o de índices,
sobre un determinado tema relativo a la realidad demográfica, social,
económica, ecológica, etc. de la nación o sobre un determinado
territorio de ella.
13. Ejemplos de cada Organización de datos
La organización de datos en tabla de frecuencias:
Para poder analizar los datos y obtener la información que deseamos a
partir de ellos, necesitamos ordenarlos. Los datos en desorden no nos
dicen nada.
La forma común de ordenarlos consiste en construir con ellos la
llamada tabla de frecuencia.
Esta tabla consiste básicamente en organizar los datos por grupo, a fin
de poder ver:
1. Que datos representan los valores más bajos y cuáles los más
altos.
2. Y con que frecuencia aparecen.
Procedimiento para elaborar la tabla de frecuencia:
Ejemplos
14. Paso 1: Obtención del rango (R).
Se entiende por rango (R) la diferencia que existe entre el dato mayor (VM) y el
menor (Vm) de un conjunto de datos.
R = VM – Vm
Una forma práctica para llevar a cabo este paso es la siguiente:
Los datos se recogen por hileras y por columnas hasta formar un rectángulo.
Ejemplo:
Se desea analizar el tiempo de vida de los focos de las señales direccionales
para autos. Para ello, se procede a obtener una muestra de 30 focos registrando
el número de horas que duran encendidos. Los resultados obtenidos se recogen
por hileras y por columnas en la siguiente forma:
15. 237
290
315
284
261
180
234
284
292
374
285
271
320
192
228
225
295
255
318
358
288
247
305
268
210
232
338
274
279
244
Tabla de frecuencias
Se detectan en cada hilera el dato menor y el dato mayor, los que se colocan en
dos columnas adicionales al rectángulo.
Menor Mayor
237
290
315
284
261
180
234
284
292
374
285
271
320
192
228
225
295
255
318
358
288
247
305
268
210
232
338
274
279
244
180
234
255
192
210
288
338
320
318
374
180 374
Integradas las dos columnas de datos menores y mayores, se identifican el dato
mayor y el dato menor de dichas columnas. Al dato mayor identificado se le resta el
dato menor identificado, siendo el rango (R) el resultado de esta resta.
R = 374 – 180 = 194
16. Paso 2: Determinación del número de clases (K) en las que se van a agrupar
los datos.
Cantidad de datos (N) Cantidad de clases (K)
Menos de 50 5 a7
50 a 100 6 a 10
100 a 250 7 a 12
Más de 250 10 a 20
Se llama clase a cada uno de los subconjuntos en los que se agrupan los datos.
Para determinar en cuantas clases (K) conviene agrupar los datos, se
acostumbra tomar en cuenta la siguiente norma:
En el caso del ejemplo citado, agruparemos los datos en 5 clases, pues la cantidad
de ellos es menor de 50.
Paso 3: Determinación de la amplitud (A) de las clases.
Establecido el número de clases en que van a quedar agrupados los datos, se
determina dentro de que amplitud se escogerán los datos para cada clase.
Esto se lleva a cabo, primero, dividiendo el rango (R) obtenido del conjunto de
datos entre el número establecido de clases.
17. A = R/K
En nuestro ejemplo: A= 194/5 = 38.8
Cuando se manejan datos enteros y el resultado de R/K incluye cifras decimales,
éstas se suprimen y el resultado se redondea elevándolo en una unidad. Cuando
se manejan datos que incluyen un decimal y el resultado incluye dos o más cifras
decimales, esta cantidad se redondea en una única cifra decimal, la inmediata
superior al primer decimal expresado en el resultado; y así sucesivamente.
38 25 27
1.2 1.4 2.8
Por ejemplo, para un cuadro de datos con números enteros
Si R/K = 7.24 entonces A =8;
Para un cuadro de datos con números que estén expresados en décimas.
Si R/K = 0.323 entonces A =0.4;
La unidad minima decimal manejada en este ejemplo es la décima.
Para un conjunto de datos que estén expresados en centésimas.
8.75 7.69 9.23
18. 11.6 17.9 18.1
Si R/K = 0.2566 entonces A =0.26;
La unidad minima decimal manejada en este ejemplo es la centésima.
Para el siguiente cuadro tenemos un valor de R/K en las mismas unidades de los datos.
Si R/K = 1.3 entonces A =1.3;
Aplicando lo anterior a nuestro ejemplo, la cifra 38.8 se redondea a 39.
A = 39
19. Conclusión
La estadística con frecuencia se realiza con la intención de
llegar a establecer conclusiones o a obtener resultados, esto demanda
muchas veces estudiar centenares, miles o aun cifras más altas de
cosas, objetos, personas o grupos. Por ejemplo un caso extremo de
estudio que involucra a la estadística es la realización de un censo, a
pesar de la ayuda de procedimientos complejos diseñados para tal fin,
constituye siempre una tarea gigantesca resumir y describir las
enormes cantidades de datos que se generan de los proyectos de
investigación.
Usando los principios más elementales de la estadística
descriptiva, es posible describir las características de los datos con
bastante claridad y precisión, de modo que las tendencias o
generalidades se puedan descubrir más rápidamente y comunicar con
mayor facilidad. Primero, es menester clarificar que dependiendo del
nivel de medición de la variable se posibilitará su organización.
20. Bibliografía
GÓMEZ RONDON, Francisco. ESTADÍSTICA METODOLÓGICA,
disponible en: http://html.rincondelvago.com/conceptos-
fundamentales-estadisticos.html Consultada: 13/06/2019 a las
10:00am
Runyon, Richard, Haber, Autrey , ESTADÍSTICA PARA LAS
CIENCIAS SOCIALES Fondo educativo Interamericano, 1992
Disponible en: http://html.rincondelvago.com/estadistica_47.html
Consultada: 13/06/2019 a las 11:23pm
Disponible en: http://es.wikipedia.org/wiki/Estad%C3%ADstica