1. INSTITUTO UNIVERSITARIO POLITÉCNICO
«SANTIAGO MARIÑO»
SEDE BARCELONA
CATEDRA ESTADISTICA I
Docente: Autor:
M.Sc. Lcdo. Pedro Beltrán Br. Edgar Pacheco
C.I.: 29.606.220
BARCELONA, JUNIO DE 2020
ORGANIZACIÓN DE DATOS
2. INTRODUCCION
Una organización de datos es una estructura física-lógica que permite
realizar operaciones computacionales (editar, guardar, actualizar, etc.) sobre
un contenido de información.
• Estructura física; describe la manera física (bytes) de almacenar los datos
en un soporte (como se almacenan los datos en el soporte).
• Estructura lógica; describe la manera lógica de representar la información
a los usuarios (como ve el usuario la información).
3. ORGANIZACIÓN DE DATOS
Siendo el dato el material que se debe procesar, es decir, la materia prima de
la estadística, el primer paso es entonces la recolección de datos, para lo cual se
emplean diferentes técnicas, como la entrevista personal, el cuestionario, la
observación, etc. El segundo paso es la organización y ordenamiento de los
datos, lo que se hace a través de tablas, las cuales pueden ser por medio de una
distribución de frecuencias simples o una distribución de frecuencias con
intervalos, en ambos casos agrupando todos aquellos que corresponden a una
mismo dato nominal o variable y expresando en una columna el número de veces
que aparece esa variable.
12. TIPOS DE ORGANIZACIÓN DE DATOS
El número de veces que aparece una determinada modalidad
de una variable (X) es lo que se conoce como la frecuencia
absoluta (ni) de esa modalidad o valor.
• Derivadas de las frecuencias absolutas se pueden obtener
las frecuencias relativas o proporciones (pi): pi= ni / n
• Las frecuencias relativas también pueden expresarse como
porcentajes (%i) con tan sólo multiplicar su valor por 100: %i
=
pi ·100
13. TIPOS DE ORGANIZACIÓN DE DATOS
En el caso de las variables cuantitativas y las cuasi-cuantitativas ,
además de lo anterior, se puede obtener también la siguiente
información para cada una de las modalidades:
• Las frecuencias absolutas acumuladas (na)
• Las frecuencias relativas acumuladas (pa)
• Los porcentajes acumulados (%a).
A la información sobre la frecuencia a partir del inicio de la tabla hasta
cierto dato nominal determinado se le conoce con el nombre de
frecuencias acumuladas (fa) y se añade en una columna en la misma
tabla.
14. TIPOS DE ORGANIZACIÓN DE DATOS
Los datos recolectados pueden también organizarse por intervalos.
Por ejemplo, al realizar un censo en una ciudad, podría interesar
cuántas personas tienen 0, 1 ó 2 hijos, cuántas 3, 4 ó 5 hijos, cuántas
6, 7 u 8 hijos, etc.
A la organización de los datos recolectados en tablas por intervalos se
le llama distribución de frecuencias por intervalos. La característica
más importante es que el ancho de cada clase o longitud del intervalo
debe ser el mismo para cada intervalo.
15. EJEMPLO
Ejemplo para la variable categórica “Estado civil” (X), habiendo sido
recogidos datos para una muestra de 50 personas de la ciudad de
Castellón (n = 50):
X: {0, 0, 1, 2, 2, 0, 1, 3, 2, 0, 1, 0, 1, 2, 0, 2, 1, 1, 0, 1, 0...}
Codificación: [0: soltero/a; 1: casado/a; 2: separado/a o
divorciado/a; 3: viudo/a]
16. EJEMPLO
Ejemplo para la variable cuantitativa “Nº de hijos/as” (X), con datos para
una muestra de 20 familias del barrio de Petare de la ciudad de
Caracas:
X: {2, 1, 0, 3, 2, 2, 3, 1, 1, 0, 1, 2, 1, 2, 0, 2, 4, 2, 3, 1}
17. EJEMPLO
Ejemplo: Ordenar y construir una tabla de frecuencias con cuatro
intervalos del siguiente conjunto de datos recolectados.
24 - 20 - 32 - 32 - 29 - 21 - 21 - 22 - 33 - 30 - 27 - 26 - 23 - 24 - 20 -
25 - 26 - 32 - 28 - 22 - 29 - 29 - 33 - 35 - 31 - 28 - 32 - 35 - 33 - 32 -
27 - 21 - 33 - 29 - 25 - 24
18. EJEMPLO
Nota: a los datos organizados por intervalos, también se les puede
representar sus datos ``acumuladas´´ como las graficas anteriores
19. OPERACIONES CON ORGANIZACIÓN DE
DATOS
• Frecuencia absoluta ("f"): nº de veces que aparece una
modalidad de una variable.
• Frecuencia relativa ("fr") o proporción ("p"): razón entre la
frecuencia absoluta y el nº de casos total.
• Porcentaje ("P"): tanto por ciento correspondiente a una
modalidad de la variable.
Los límites entre los intervalos de valores se pueden estudiar
mediante las siguientes formulas:
límite real superior ("l.r.s")
límite real inferior ("l.r.i.").
Punto medio del intervalo (Xm):
Amplitud del intervalo ("i"):
23. CONCLUSION
La organización de los datos es el procedimiento más importante al
momento de realizar un análisis estadístico, de nada nos vale tener mucha
información y muchos datos, si al intentar procesarlos fallaremos por no
tener un control lógico sobre la forma en como los organizamos y estudiamos
Dicha organización puede ser llevada a cabo de varias maneras, como
cuadros los cuales no son más que un deposito de datos, y después de
almacenarlos en estos cuadros pueden llegar a ser interpretados
gráficamente como barras o tortas. Independientemente del orden una barra
o torta puede interpretarse de tal manera que se logre obtener las
conclusiones sin necesidad de tener el esbozo de la tabla a la mano, así
como al observar la tabla se puede estudiar el suceso sin necesidad de una
gráfica que lo respalde. Existen varias formulas matemáticas que también
nos acompañan en la construcción de tablas o graficas como las expresada
anteriormente.
24. Anderson D SWeeney D y Williams, T. (1005). Estadística para la
administración y economía. México. Editores Thomson.
Freedman D. et al. (1991). Estadística. Barcelona, España. Ed. A. Bosch.
Sote, A. (2005). Principios de la Estadística. Caracas, Venezuela. Ed.
Panapo
BIBLIOGRAFÍA