Este documento describe los principios básicos de la organización de datos estadísticos. Explica que los datos pueden ser agrupados o no agrupados, y cómo construir tablas de frecuencia para organizar los datos no agrupados. También describe cómo calcular medidas estadísticas básicas como la media, mediana y moda para datos agrupados y no agrupados. Finalmente, proporciona ejemplos detallados de cómo construir una tabla de frecuencia para organizar un conjunto de datos.
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
organización de los datos estadísticos
1. Republica bolivariana de Venezuela
Ministerio del poder popular para la educación
I.U.P.S Santiago Mariño
Barcelona_Edo_Anzoateguir
ORGANIZACIÓN DE LOS DATOS
Profesora: Amelia vasquez
bachiller :
yunaly garcia
C.I: 27.275.110
2. INTRODUCION
La estadística y la organización de datos se realiza con la intención de
llegar a establecer conclusiones o a obtener resultados, esto implica
estudiar centenares de cifras de cosas, como : objetivos, personas, o
grupos. Por ejemplos un caso extremo que involucra a la estadística es la
realización de un censo, a pesar de la ayuda de procedimientos complejos
diseñados para tal fin, constituye siempre una tarea gigantesca resumir y
describir las enormes cantidades de datos que se generan de los proyectos
de investigación.
Usando los principios mas elementales de la estadística organización de
datos es posible describir las características de los datos con bastante
claridad y precisión.
3. Ordenamientos de datos simples o no agrupados en
tablas y cuadros
DATOS AGRUPADOS Y NO AGRUPADOS
Los datos agrupados y no agrupados se les llaman en estadística a la manera de representar y analizar la
información que has reunido o que dispones.
DATOS NO AGRUPADOS
Datos no agrupados es el conjunto de observaciones que se presentan en su forma original tal y como fueron
recolectados, para obtener información directamente de ellos. Los datos no agrupados es un conjunto de información si
ningún orden que no nos establece relación clara con lo que se pretende desarrollar a lo largo de un problema, esto se
soluciona mediante una tabulación que nos conduce a una tabla de frecuencias.
a. Determinar el rango o recorrido de los datos. Rango = Valor mayor – Valor menor
b. Establecer el número de clases (k) en que se van a agrupar los datos tomando como base para esto la siguiente tabla.
Tamaño de muestra o No. De datos Número de clases
Menos de 50 5 a 7
50 a 99 6 a 10
100 a 250 7 a 12
250 en adelante 10 a 20
4. Datos agrupados
DATOS AGRUPADOS: Aunque las medidas de tendencia central y de dispersión calculadas a partir de una tabla de distribución
de frecuencia no son tan precisas como las calculadas con los datos originales, y en ocasiones no se cuenta con éstos o es
impráctico procesarlos, por lo que deben aplicarse las fórmulas aproximadas correspondientes a la medida que se desee,
utilizando los datos de una tabla de distribución en frecuencias. Media, mediana y moda. La media, la mediana y la moda de
datos agrupados….
Formulas para Datos Agrupados Media Aritmética Donde: k = número de clases xi = marca de clase i fi = frecuencia de la
clase i n = número de datos en la muestra Mediana (Xmed). Donde: Li = límite real inferior de la clase que contiene a la
mediana Fme-1 = sumatoria de las frecuencias anteriores a la clase en donde se encuentra la mediana fme = frec uencia de la
clase en donde se encuentra la mediana A = amplitud real de la clase…
Datos agrupados Es aquella distribución en la que los datos estadisticos se encuentran
ordenados en clase y con la frecuencia de cada clase: Limites de la clase Cada clase esta
delimitada por el limite inferior de la clase y limite superior de la clase Amplitud de clase
Es la diferencia entre el limite superior e inferior de la clase Marca de la clase Es un punto
medio de cada intervalo y es el valor que representa a todo el intervalo para el calculo de
algunos….
5. Ordenamiento de los datos en tablas de frecuencia
Datos
Los datos son los valores de la muestra recogida en el estudio estadístico
Frecuencia absoluta: La frecuencia absoluta (ni) es el número de veces que aparece un determinado valor en un
estudio estadístico. Número de veces que se repite el í-esimo valor de la variable. La suma de las frecuencias
absolutas es igual al número total de datos, que se representa por n
Frecuencia absoluta acumulada
La Frecuencia absoluta acumulada (Ni) es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor
considerado.
N1 = n1
N2 = n1 + n2 = N1 + n2
N3 = n1 + n2 + n3 = N2 + n3
Nk = n.
Se interpreta como el número de observaciones menores o iguales al í-esimo valor de la variable.
6. Ordenamiento de datos en tablas de frecuencias
Frecuencia relativa
La frecuencia relativa (fi) es la proporción de veces que se repite un determinado dato.
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos.
fi = ni/n
La suma de las frecuencias relativas es igual a 1.
Frecuencia relativa acumulada
La frecuencia relativa acumulada (Fi) es el número de observaciones menores o iguales al í-esimo valor de la variable pero en
forma relativa.
F1 = fl
F2 = f1+ f2 = F1 + f2
F3 = f1+ f2 + f3 = F2 + f3
Fk = 1
7. Organización de datos en estadística
La estadística con frecuencia se realiza con la intención de llegar a establecer conclusiones o a obtener resultados, esto
demanda muchas veces estudiar centenares, miles o aun cifras más altas de cosas, obetos, personas o grupos. Por ejemplo un
caso extremo de estudio que involucra a la estadística es la realización de un censo, a pesar de la ayuda de procedimientos
complejos diseñados para tal fin, constituye siempre una tarea gigantesca resumir y describir las enormes cantidades de datos
que se generan de los proyectos de investigación.
Usando los principios más elementales de la estadística descriptiva, es posible describir las características de los datos con
bastante claridad y precisión, de modo que las tendencias o generalidades se puedan descubrir más rápidamente y comunicar
con mayor facilidad. Primero, es menester clarificar que dependiendo del nivel de medición de la variable se posibilitará su
organización.
En el apartado anterior de variables y datos se estableció que los datos podían provenir de variables de tipo categórico o
numérico.
Si es el caso de las primeras, la forma de organizarlas tiene que ver con construir una tabla de frecuencias.
8. Tipos de organización de datos
Datos cuantitativos continuos:
Este tipo de datos cuantitativos se refiere al flujo constante de valores posibles de la variable, estos datos no se restringen a
valores enteros (aunque normalmente son reducidos a valores enteros por aproximación). Los datos cuantitativos continuos se
miden en lugar de contarse. Además tienen entre sus características que pueden dividirse.
Ejemplo:
• Medir la altura de una persona. (Puedes mediar la altura en metros, centímetros y hasta dar una medida en milímetros, es decir,
los datos son continuos.
• Edad (Puedes definir una edad en años, meses y hasta días)
En ocasiones, algunos expertos en investigación deciden por iniciativa o convención (para facilitar el análisis de datos
cuantitativos), agrupar los datos en categorías según sus valores, podrán ser encontrados dentro de ciertos rangos, o bajo un
umbral determinado.
Datos cuantitativos discretos:
Prácticamente hablamos de números enteros, por valores completos. Se cuentan, no se miden.
Ejemplo:
• Número de hijos, adultos o mascotas en su familia.
Son datos discretos, porque se cuentan por números indivisibles: no se puede tener 2,5 hijos, o 1,3 mascotas. Los
datos discretos también puede ser categóricos, como decir si prefieres el color “rojo” o “azul”, o si eres “hombre”
o “mujer”, o si un producto es “bueno” o “malo”.
9. Operaciones de organización de datos
Es la operación estadística, definida como el conjunto de actividades, incluidas las
preparatorias, que conduce a la obtención de resultados estadísticos sobre un
determinado sector, tema o territorio. También se incluyen en el ámbito de esta
definición los trabajos de infraestructura y de normalización estadística que posibilitan
las coordinación, homogeneización e integración de las estadística, así como la
recopilación de los resultados y la confección de síntesis.
Se define como operación estadística, a efectos del inventario, el conjunto de
actividades, incluidas la preparatoria que partiendo de una recogida de datos
individuales conduce a la obtención de resultados estadísticos agregados, en forma de
tablas o de índice, sobre un determinado tema relativo a la realidad demográfica,
social, económica, ecológica entre otros de nación o de un determinado territorio de
ella.
10. Ejemplos de cada organización de datos
Para poder analizar los datos y obtener la información que deseamos a partir de ellos, necesitamos ordenarlos. Los datos en
desorden no nos dicen nada.
La forma común de ordenarlos consiste en construir con ellos la llamada tabla de frecuencia. Esta tabla consiste básicamente en
organizar los datos por grupo, a fin de poder ver:
1.- Que datos representan los valores más bajos y cuáles los más altos.
2.- Y con que frecuencia aparecen.
Procedimiento para elaborar la tabla de frecuencia.
Paso 1: Obtención del rango (R).
Se entiende por rango (R) la diferencia que existe entre el dato mayor (VM) y el menor (Vm) de un conjunto de datos.
R = VM – Vm
Una forma práctica para llevar a cabo este paso es la siguiente:
Los datos se recogen por hileras y por columnas hasta formar un rectángulo.
Ejemplo:
Se desea analizar el tiempo de vida de los focos de las señales direccionales para autos. Para ello, se procede a obtener una muestra
de 30 focos registrando el número de horas que duran encendidos. Los resultados obtenidos se recogen por hileras y por columnas
en la siguiente forma
11. Ejemplos de organización de datos
Tabla de frecuencias
237
290
315
284
261
180
234
284
292
374
285
271
320
192
228
225
295
255
318
358
288
247
305
268
210
232
338
274
279
244
Se detectan en cada hilera el dato menor y el dato mayor, los que se
colocan en dos columnas adicionales al rectángulo.
Menor Mayor
23
7
29
0
31
5
28
4
26
1
18
0
23
4
28
4
29
2
37
4
28
5
27
1
32
0
19
2
22
8
22
5
29
5
25
5
31
8
35
8
28
8
24
7
30
5
26
8
21
0
23
2
33
8
27
4
27
9
24
4
18
0
23
4
25
5
19
2
21
0
28
8
33
8
32
0
31
8
37
4
180 374
Integradas las dos columnas de datos menores y mayores, se identifican el
dato mayor y el dato menor de dichas columnas.
Al dato mayor identificado se le resta el dato menor identificado, siendo el
rango (R) el resultado de esta resta.
R = 374 – 180 = 194
Paso 2: Determinación del número de clases (K) en las que se van a
agrupar los datos.
Se llama clase a cada uno de los subconjuntos en los que se agrupan los
datos.
Para determinar en cuantas clases (K) conviene agrupar los datos, se
acostumbra tomar en cuenta la siguiente norma:
Cantidad de datos (N) Cantidad de clases (K)
Menos de 50 5 a7
50 a 100 6 a 10
100 a 250 7 a 12
Más de 250 10 a 20
En el caso del ejemplo citado, agruparemos los datos en 5 clases, pues la
cantidad de ellos es menor de 50.
12. Paso 3: Determinación de la amplitud (A) de las clases.
Establecido el número de clases en que van a quedar agrupados los datos,
se determina dentro de que amplitud se escogerán los datos para cada clase.
Esto se lleva a cabo, primero, dividiendo el rango (R) obtenido del conjunto
de datos entre el número establecido de clases.
A = R/K
En nuestro ejemplo: A= 194/5 = 38.8
Cuando se manejan datos enteros y el resultado de R/K incluye cifras
decimales, éstas se suprimen y el resultado se redondea elevándolo en una
unidad. Cuando se manejan datos que incluyen un decimal y el resultado incluye
dos o más cifras decimales, esta cantidad se redondea en una única cifra decimal,
la inmediata superior al primer decimal expresado en el resultado; y así
sucesivamente.
Por ejemplo, para un cuadro de datos con números enteros
38 25 27
Si R/K = 7.24 entonces A =8;
Para un cuadro de datos con números que estén expresados en décimas.
1.2 1.4 2.8
Si R/K = 0.323 entonces A =0.4;
La unidad mínima decimal manejada en este ejemplo es la décima.
Para un conjunto de datos que estén expresados en centésimas.
8.75 7.69 9.23
Si R/K = 0.2566 entonces A =0.26;
La unidad mínima decimal manejada en este ejemplo es la centésima.
Para el siguiente cuadro tenemos un valor de R/K en las mismas unidades
de los datos.
11.6 17.9 18.1
Si R/K = 1.3 entonces A =1.3;
Aplicando lo anterior a nuestro ejemplo, la cifra 38.8 se redondea a 39.
A = 39
13. Conclusión
La estadística provino desde antes de Cristo en el país de Egipto, Persia, babilonia desde que Moisés levanto un
censo del pueblo y cuando a avanzado, primer censo en América fue llevado a cabo por los Incas y como muchos
matemáticos, filósofos, teólogos, han experimentado y aplicado la estadística hasta hoy en día que la seguimos
utilizando y aplicando para la sociedad, ya que es un potente auxiliar de muchas ciencias y actividades humanas:
sociología, sicología, geografía humana, economía, etc.
Los conceptos antes mencionados han sido analizados e investigados de tal manera de hacer más fácil su
comprensión y entendimientos ya que la estadística es la ciencia que trata de entender, organizar y tomar decisiones
que estén de acuerdo con los análisis efectuados
Es recomendable tomar en cuenta que la estadística es muy importante en la vida social y laboral del hombre ya que
generaliza información.
Es una herramienta indispensable para la toma de decisiones.
También es ampliamente empleada para mostrar los aspectos cuantitativos de una situación
14. Bibliografía
http://elibrary-data.imf.org/FindDataReports.aspx?d=33061&e=169393 [fecha de consulta: mayo de 2012].
http://www.gestiopolis.com/recursos/experto/catsexp/pagans/eco/44/estadistica.htmQUESADA Víctor Y
VERGARA, Juan.Estadística básica con aplicaciones en Ms Excel. Edición electrónica gratuita. Texto completo en
www.eumed.net/libros/2007a/239/
Enciclopedia libre Wikipedia (2010) Estadística Descriptiva. Texto Completo en:
http://es.wikipedia.org/wiki/Estad%C3%ADstica_descriptiva