Factores ecosistemas: interacciones, energia y dinamica
Organizacion de datos
1. Republica Bolivariana De Venezuela
Ministerio Del Poder Popular Para La Educación
Instituto Universitario Politécnico “Santiago Marinó”
Sede Barcelona
Escuela de Ingeniería civil
ORGANIZACIÓN DE
DATOS
DOCENTE: BACHILLER:
LCDO. PEDRO BELTRAN Jose J . Briceño V.
26.896.655
Barcelona, junio del 2020
2. INTRODUCCION
La estadística con frecuencia se realiza con la intención de llegar a
establecer conclusiones o a obtener resultados, esto demanda muchas veces
estudiar centenares, miles o aun cifras más altas de cosas, objetos, personas o
grupos. Por ejemplo un caso extremo de estudio que involucra a la estadística es
la realización de un censo, a pesar de la ayuda de procedimientos complejos
diseñados para tal fin, constituye siempre una tarea gigantesca resumir y describir
las enormes cantidades de datos que se generan de los proyectos de
investigación.
3. ORGANIZACIÓN DE DATOS
Siendo el dato el material que se debe procesar, es decir, la materia prima de la
estadística, el primer paso es entonces la recolección de datos, para lo cual se emplean
diferentes técnicas, como la entrevista personal, el cuestionario, la observación, etc. El
segundo paso es la organización y ordenamiento de los datos, lo que se hace a través de
tablas, las cuales pueden ser por medio de una distribución de frecuencias simples o una
distribución de frecuencias con intervalos, en ambos casos agrupando todos aquellos que
corresponden a una mismo dato nominal o variable y expresando en una columna el
número de veces que aparece esa variable.
4. Usando los principios más elementales de la estadística descriptiva, es posible describir las
características de los datos con bastante claridad y precisión, de modo que las tendencias o
generalidades se puedan descubrir más rápidamente y comunicar con mayor facilidad.
Primero, es menester clarificar que dependiendo del nivel de medición de la variable se posibilitará su
organización.
Los datos podían provenir de variables de tipo categórico o numérico.
Si es el caso de las primeras, la forma de organizarlas tiene que ver con construir una tabla de
frecuencias.
Ejemplo, si se preguntase a un grupo de 52 alumnos el sexo al que pertenecen, se podría generar la
siguiente tabla de frecuencias.
Sexo frecuencia
Femenino 22
Masculino 30
5. Según la cantidad y tipo de éstos se pueden agrupar de dos maneras:
1. Agrupamiento por intervalos: para datos cuantitativos.
2. Por conteo individual: según categoría o valor diferente.
Una vez que se ha realizado la recolección de los datos, se obtienen datos en bruto,
los cuales rara vez son significativos sin una organización y tabulación.
Un arreglo es la forma mas sencilla de organizar los datos en bruto, consiste en
colocar las observaciones en orden según su magnitud: ascendiente o descendiente.
Poco practico cuando se tiene una gran cantidad de datos.
TIPOS DE ORGANIZACIÓN DE DATOS
6. FRECUENCIA
Es el número de veces que aparece cada variable o dato nominal.
Ejemplo: Se desea hacer una tabla que muestre las calificaciones en Matemáticas de un
grupo escolar. Se ve que hubieron dos alumnos que sacaron 10 de calificación, siete
estudiantes sacaron 9, se dice entonces que la frecuencia del dato nominal 10 es de
dos; la frecuencia de la variable 9 es siete, etc. Una distribución de frecuencias es el
resultado de organizar los datos recolectados en grupos, mostrando la frecuencia de
cada uno.
Las distribuciones de frecuencias son tablas que resumen los datos originales en
frecuencias.
7. TIPOS DE FRECUENCIAS
Distribución de frecuencias simple: Organizar los datos recolectados, ya sea de menor a
mayor o viceversa, de manera que se muestre la frecuencia de cada uno de ellos, es hacer
una distribución de frecuencias simple.
El primer paso es localizar el dato menor y el dato mayor dentro del conjunto de datos
recolectados aún en desorden, en el caso que los datos sean de carácter numérico. Una vez
conseguido lo anterior, en una primera columna se escriben todos los números que van desde
el menor hasta el mayor, incluidos éstos. Luego, se cuenta cuántas veces aparece el primer
valor nominal, para lo cual se aconseja ir marcando con una línea ( / ) cada vez que se cuente
uno. El proceso debe repetirse para cada variable. Finalmente se cuentan el número de
marcas que se hayan registrado para cada valor nominal y se procede a construir la tabla
definitiva.
8. Ejemplo : Ordenar y construir una tabla de frecuencias simple del siguiente conjunto de datos
recolectados: 24 20 32 32 29 21 21 22 33 30 27 26 23 24 20 25 26 32 28 22 29 29 33 35 31 28 32 35
33 32 27 21 33 29 25 24 Solución:
Primer paso: Se localizan los números más chico y más grande: son el 20 y el 35.
Segundo paso: Se hace una lista completa de números desde el 20 hasta el 35: 20 24 28 32 21 25 29
33 22 26 30 34 23 27 31 35
Tercer paso: Se cuenta cuántos datos nominales 20 aparecen y por cada uno que aparezca se pone
una “rayita” ( / ). Se hace lo mismo para cada valor: 20 // 24 /// 28 // 32 ///// 21 /// 25 // 29 //// 33 //// 22 //
26 // 30 / 34 23 / 27 // 31 / 35 //
A manera de comprobación, para tener la seguridad de que no se escapó alguno o no se contaron de
más, la suma de todas las “rayitas” ( / ) debe ser igual al número de datos nominales del conjunto
inicial. En este caso existen 36 datos nominales y 36 “rayitas”, lo que significa que el conteo fue
correcto.
9. Distribución de frecuencias por intervalos: Los datos recolectados pueden también organizarse
por intervalos. El ancho de clase o longitud del intervalo es la resta de el límite superior menos el
límite inferior de cada clase o intervalo.
Cuando se trabaja con variables discretas, el ancho de clase o longitud del intervalo es la resta de
el límite superior menos el límite inferior de cada clase o intervalo, mientras que el número de
datos es la resta de el límite superior menos el límite inferior de cada clase o intervalo más 1.
Cuando se trabaja con variables continuas, el ancho de clase o longitud del intervalo es, igual que
antes, la resta de el límite superior menos el límite inferior de cada clase o intervalo, mientras que
el número de datos posibles que pudiera contener el intervalo no es posible conocerlos porque
caben todos los valores intermedios.
10. Ejemplo: ordenar y construir una tabla de frecuencias con cuatro intervalos del siguiente conjunto de datos
recolectados. 24 20 32 32 29 21 21 22 33 30 27 26 23 24 20 25 26 32 28 22 29 29 33 35 31 28 32 35
Solución:
Conviene iniciar de la misma manera que en la organización de frecuencias simple. Entonces se localizan los
números más chico y más grande: son el 20 y el 35 y se hace una lista completa de números desde el 20
hasta el 35. se cuentan cuántos datos nominales aparecen por cada uno y se pone una “rayita” ( / ), de lo que
resulta: 20 // 24 /// 28 // 32 ///// 21 /// 25 // 29 //// 33 //// 22 // 26 // 30 / 34 23 / 27 // 31 / 35 //
Como hay 16 datos nominales y se piden cuatro intervalos, simplemente se dividen, por lo que cada intervalo
incluirá a cuatro datos nominales, como lo muestra la siguiente tabla: Intervalo Frecuencia 𝒇 20 – 23 8 24 – 27
9 28 – 31 8 32 – 35 11 Total: 36 A manera de comprobación, para tener la seguridad de que no se escapó
alguno o no se contaron de más, la suma de todas las “rayitas” ( / ) debe ser igual al número de datos
recolectados del conjunto inicial. En este caso existen 36 datos recolectados y 36 “rayitas”, lo que significa
que el conteo fue correcto. Después, se cuenta cuántos datos nominales existen dentro del conjunto. En este
caso hay 16.
11. TIPOS DE FRECUENCIAS
-Frecuencia Absoluta (f) Es el número de veces que se repite el valor de cada variable. La
suma de frecuencias absolutas es siempre al total de datos observados.
-Frecuencia Relativa (fr) Indica la proporción con que se repite un valor. Es el cociente entre
la frecuencia absoluta y el número total de datos. La suma de las frecuencias relativas es
siempre 1.
- Frecuencia Acumulada (fa) Indica el número de valores que son menores o iguales que el
valor dado. Es la suma de la frecuencia absoluta primera con la segunda, este valor con la
tercera, y así sucesivamente.
12. -Frecuencia Porcentual (f%) Llamada también frecuencia relativa porcentual. Se obtiene
multiplicando la frecuencia relativa por 100. La suma de las frecuencias porcentuales es
siempre 100%. Se calcula así:
-Frecuencia Relativa Acumulada (fra) Es la suma de la frecuencia relativa primera con la
segunda, este valor con la tercera, y así sucesivamente.
- Frecuencia Relativa Acumulada Porcentual (fra%) Indica el número de valores que son
menores o iguales que el valor dado. Se obtiene multiplicando la frecuencia relativa
acumulada por 100. Se calcula así:
13. Otras dos informaciones muy útiles dentro de la etapa de organización de datos es
calcular el porcentaje de cada variable conforme a su frecuencia, lo mismo que su
porcentaje acumulado, ya sea en una distribución de frecuencias simple o por intervalos.
Para calcular el porcentaje basta hacer una regla de tres, en donde el 100% es el
número N de datos recolectados, o sea el total de las frecuencias, esto es: 𝑛 100 = 𝑓 %
donde: 𝑛 = número total de datos recolectados o frecuencia total 𝑓 = frecuencia particular
del dato nominal del que se desea saber su porcentaje % = porcentaje correspondiente
al dato nominal de frecuencia 𝑓.
O bien, despejando, se obtiene que: % = 100𝑓 𝑛
PORCENTAJES Y PORCENTAJES ACUMULADOS
14. Por ejemplo: añadir una columna que exprese los porcentajes de cada dato nominal y otra de
sus porcentajes acumulados. Solución: Para obtener el porcentaje del primer dato 𝑥 = 20 , se
plantea una regla de tres simple, en donde el número total de datos es el 100%: 36 100 = 2
% Donde: % = 100×2 36 % = 5,5 Se hace lo mismo con los demás datos, de manera que la
tabla se completa de la siguiente forma: 𝒙 𝒇 𝒇𝒂 % %𝒂 20 2 2 5.5555 5.5555 21 3 5 8.3333
13.8888 22 2 7 5.5555 19.4443 23 1 8 2.7777 22.2222 24 3 11 8.3333 30.5553 25 2 13
5.5555 36.1108 26 2 15 5.5555 41.6663 27 2 17 5.5555 47.2218 28 2 19 5.5555 52.7773 29
4 23 11.1111 63.8884 30 1 24 2.7777 66.6661 31 1 25 2.7777 69.4438 32 5 30 13.8888
83.3326 33 4 34 11.1111 94.4437 34 0 34 0 94.4437 35 2 36 5.5555 99.9992
Totales: 36 99.9992
15. Cuando los datos contienen una gran cantidad de elementos, para facilitar los cálculos es
necesario agruparlos, a estos grupos se los llama intervalos o clases. Un intervalo es una
serie de números incluidos entre dos extremos, así por ejemplo, el intervalo 40 – 45 está
formado por 40, 41, 42, 43, 44 y 45, siendo 40 el límite inferior, 45 el límite superior, 39,5
límite real inferior (límite inferior disminuido en 5 décimas) y 40,5 el límite real superior
(límite superior aumentado en 5 décimas).
Las reglas generales para formas distribuciones de frecuencias para datos agrupados en
intervalos son:
1) Calcule el Rango (R).- También se llama recorrido o amplitud total. Es la diferencia
entre el valor mayor y el menor de los datos.
REGLAS GENERALES PARA FORMAS DISTRIBUCIONES DE FRECUENCIAS
PARA DATOS AGRUPADOS EN INTERVALOS
16. 2) Seleccione el Número de Intervalos de Clase (ni).- No debe ser menor de 5 y
mayor de 12, ya que un número mayor o menor de clases podría oscurecer
el comportamiento de los datos. Para calcular el número de intervalos se aplica la regla
de Sturges:
Siendo n el tamaño de la muestra
3) Calcule el Ancho del Intervalo (i).- Se obtiene dividiendo el Rango para el número
de intervalos
Cuando el valor de i no es exacto, se debe redondear al valor superior más cercano.
Esto altera el valor de rango por lo que es necesario efectuar un ajuste así:
17. Por ejemplo:
Si una distribución de 40 datos el valor mayor es 41 y el menor es 20 se tiene:
Calculando el Rango se obtiene:
Calculando el número de intervalos se obtiene:
Calculando el ancho se obtiene:
Redondeando se obtiene: i = 4
Calculando el nuevo rango se obtiene:
El exceso de 3 que se tiene en este caso se distribuye entre xmáx y xmín. Por lo general se
agrega al mayor y se quita al menor.
18. Como por ejemplo, se podría agregar 2 al valor mayor y quitar 1 al valor menor,
obteniéndose los siguientes nuevos valores:
O también se podría agregar 1 al valor mayor y quitar 2 al valor menor, obteniéndose
los siguientes nuevos valores:
19. 4) Forme los Intervalos de Clase agregando i-1 al límite inferior de cada clase,
comenzando por el Xmín del rango.
5) Se realiza el Conteo de Datos que cae dentro de cada clase (frecuencia absoluta)
6) Calcule la Marca de Clase (xm).- Es el valor medio de cada clase, se obtiene
sumando los límites superior (Ls) e inferior (Li) del intervalo y dividiendo ésta suma entre 2
7) Calcule las Frecuencias
20. CONCLUSIÓN
Para llevar a cabo una buena organización de datos se deben indagar los
fenómenos, ya que se realiza una investigación a fondo, y ese fenómeno
que se busca debe poseer variables sea cuantitativa o cualitativa y a través
de ellas nos damos cuenta si se debe realizar un análisis estadístico
descriptivo o un análisis estadístico inferencia.