RETO MES DE ABRIL .............................docx
organización de los datos
1. Republica Bolivariana De Venezuela
Ministerio Del Poder Popular Para La Educación
I.U.P Santiago Mariño Sede Barcelona
Profesora: Amelia Vásquez
Bachiller:
Yunaly
García
Organización de los
datos estadísticos
2. Introducción
La estadística y la organización de datos se realiza con la intención de llegar a
establecer conclusiones o a obtener resultados, esto implica estudiar centenares de
cifras de cosas, como : objetivos, personas, o grupos. Por ejemplos un caso extremo
que involucra a la estadística es la realización de un censo, a pesar de la ayuda de
procedimientos complejos diseñados para tal fin, constituye siempre una tarea
gigantesca resumir y describir las enormes cantidades de datos que se generan de los
proyectos de investigación.
Usando los principios mas elementales de la estadística organización de datos es
posible describir las características de los datos con bastante claridad y precisión.
3. Ordenamientos de datos simples o no agrupados en tablas y cuadros.
Es el procedimiento en el cual se agrupan los registros en orden definido, con el fin de
facilitar la búsqueda de datos ordenados en secuencia. El cual puede ser numéricos,
alfabéticos o incluso alfanumérico, ascendente o descendentes, el cual puede ser
numérico, alfabético o incluso alfanumérico, ascendente o descendentes.Porque se le llama datos agrupados y no agrupados
DATOS AGRUPADOS Y NO AGRUPADOS
Los datos agrupados y no agrupados se les
llaman en estadística a la manera de
representar y analizar la información que
has reunido o que dispones.
DATOS NO AGRUPADOS
Datos no agrupados es el conjunto de
observaciones que se presentan en su forma
original tal y como fueron recolectados, para
obtener información directamente de ellos. Los
datos no agrupados es un conjunto de
información si ningún orden que no nos
establece relación clara con lo que se pretende
desarrollar a lo largo de un problema, esto se
soluciona mediante una tabulación que nos
conduce a una tabla de frecuencias.
a. Determinar el rango o recorrido de los
datos. Rango = Valor mayor – Valor menor
b. Establecer el número de clases (k) en que se
van a agrupar los datos tomando como base
para esto la siguiente tabla.
Tamaño de muestra o No. De datos Número de
clases
Menos de 50 5 a 7
4. Datos agrupados
Datos agrupados es aquella distribución en la que los datos estadísticos se encuentran
ordenados en clase y con la frecuencia de cada clase: limites de las clase cada clase esta
delimitada por el limite inferior de la clase y limite superior de la clase amplitud de clase es la
diferencia entre el limite superior de la clase de marca es un punto medio de cada intervalo y es
el valor que se representa a todos los intervalos para el calculo de algunos.
DATOS AGRUPADOS: Aunque las medidas de tendencia central y de dispersión calculadas a partir de
una tabla de distribución de frecuencia no son tan precisas como las calculadas con los datos
originales, y en ocasiones no se cuenta con éstos o es impráctico procesarlos, por lo que deben
aplicarse las fórmulas aproximadas correspondientes a la medida que se desee, utilizando los datos
de una tabla de distribución en frecuencias. Media, mediana y moda. La media, la mediana y la moda
de datos agrupados….
Formulas para Datos Agrupados Media Aritmética Donde: k = número de clases xi = marca de clase i
fi = frecuencia de la clase i n = número de datos en la muestra Mediana (Xmed). Donde: Li = límite
real inferior de la clase que contiene a la mediana Fme-1 = sumatoria de las frecuencias anteriores a
la clase en donde se encuentra la mediana fme = frec uencia de la clase en donde se encuentra la
mediana A = amplitud real de la clase…
5. Ordenamiento de los datos en tablas de frecuencia
Datos
Los datos son los valores de la muestra recogida en el estudio estadístico
Frecuencia absoluta: La frecuencia absoluta (ni) es el número de veces que aparece
un determinado valor en un estudio estadístico. Número de veces que se repite el
í-esimo valor de la variable. La suma de las frecuencias absolutas es igual al
número total de datos, que se representa por n
Frecuencia absoluta acumulada
La Frecuencia absoluta acumulada (Ni) es la suma de las frecuencias absolutas de
todos los valores inferiores o iguales al valor considerado.
N1 = n1
N2 = n1 + n2 = N1 + n2
N3 = n1 + n2 + n3 = N2 + n3
Nk = n.
Se interpreta como el número de observaciones menores o iguales al í-esimo valor
de la variable.
6. Frecuencia relativa
La frecuencia relativa (fi) es la proporción de veces que se repite un determinado
dato.
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado
valor y el número total de datos.
fi = ni/n
La suma de las frecuencias relativas es igual a 1.
Frecuencia relativa acumulada
La frecuencia relativa acumulada (Fi) es el número de observaciones menores o
iguales al í-esimo valor de la variable pero en forma relativa.
F1 = fl
F2 = f1+ f2 = F1 + f2
F3 = f1+ f2 + f3 = F2 + f3
Fk = 1
7. Ordenamientos de datos en tablas de clase y frecuencias
Los datos son colecciones de cualquier cantidad de observaciones relacionadas. Una colección de
datos se conoce como conjunto de datos y una sola observación es un punto de dato. Para que los
datos sean útiles, necesitamos organizar nuestras observaciones, de modo que podamos distinguir
patrones y llegar a conclusiones lógicas.
La frecuencia absoluta: es el número de veces que aparece un determinado valor en un estudio estadístico.
Se representa por Fabs.
La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.
fab1 + fab2 + fab3 +...+fabn =N
Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o
sumatoria. Σfab=N
Veamos un ejemplo: En una Tabla de Distribución de Frecuencias, de 5 clases, se tienen los siguientes valores
de frecuencias absolutas:
CLASES Fab
Clase 1--------------10
Clase 2--------------20
Clase 3--------------25
Clase 4--------------08
Clase 5--------------02
el calculo de N( suma de frecuencias absolutas) es:
8. La frecuencia relativa: es el cociente entre la frecuencia absoluta de un determinado valor y el
número total de datos.
Su formula es: La suma de las frecuencias relativas es igual a 1.
Ejemplo: Si se desea calcular la frecuencia relativa de la
Clase 1, de la Tabla de Distribución de Frecuencia anterior,
esta se haría:
Frecuencia Relativa porcentual: Se puede expresar en tantos por ciento y se representa por %Fr
En ambas formulas, N representa la suma de las frecuencias
absolutas, tal como se planteo en párrafos anteriores.
Ejemplo: Si se desea calcular la la Frecuencia Relativa Porcentual para la Clase 1
anterior, esta se haría de la siguiente manera:
La frecuencia acumulada: es la suma de las frecuencias absolutas de todos los valores inferiores o
iguales al valor considerado.
Se representa por Fac. Ejemplo: La frecuencia Acumulada de la Clase 2, para la Tabla
anterior seria:Fac. Clase 2=10+20
=30 y la Fac. de la Clase 3 seria: Fac. Clase 3=10+20+25=55
o mas bien
Fac. Clase 3=30 + 25
=55
Este ultimo procedimiento es el que realmente se emplea por ser mas
practico
9. La frecuencia relativa acumulada: de cada clase, es la suma de las frecuencias relativas de la
clase actual y las frecuencias relativas anteriores. Se puede expresar en tantos por ciento. Se
representa por %Fracum.
El intervalo, conocido también como rango, amplitud o ancho de clase, puede determinarse
como la diferencia entre el limite inferior de la clase siguiente y el limite inferior de la clase
actual. También puede determinarse como la diferencia entre el limite superior y el inferior de
cada clase mas la unidad de variación de los datos.
Unidad de variación:
Un concepto muy importante en este punto es el de la Unidad de Variación. El cual se debe
entender como la mínima diferencia que puede presentarse entre dos datos del conjunto que
se analiza.
Pasos para la elaboración la tabla de distribución y frecuencias:
1.-Recopilación de los Datos a analizar
2.-Ordenamiento de los datos de menor a mayor o de mayor a menor.
3.-Se establece el numero de clases
4.-Se calcula el ancho de clase exacto de cada intervalo.
5.-Se ajusta el valor del ancho de clase.
6.-Identificación de los limites de clase o de los intervalos de clase nominales.
7.-Se realiza el conteo de los datos.
FRECUENCIA ACUMULADA
La Frecuencia acumulada de cierta n clase, corresponde a la sumatoria de los valores de las
Frecuencias Absolutas abajo del Limite Real superior de la clase n contemplada.
Nos disponemos ahora a calcular la Frecuencia Acumulada. Para esto se emplea la formula
10. Definir, elementos y tipos de graficas:
Es el conjunto de todos los elementos a los que se somete a un estudio estadístico. Resume las
propiedades de una población y se basa en la teoría de las probabilidades. Es un conjunto
representativo de la población de referencia, el número de individuos de una muestra es menor que
el de la población
Tipos de gráficas: Existen muy diversos tipos de gráficas, generalmente aplicándose
unas u otras en función de lo que se pretenda representar o simplemente de las
preferencias del autor. A continuación indicamos algunas de las más conocidas y
comunes.1. Gráfico de barras: El más conocido y utilizado de todos los tipos de gráficos es el
gráfico o diagrama de barras. En éste, se presentan los datos en forma de barras
contenidas en dos ejes cartesianos (coordenada y abscisa) que indican los diferentes
valores. El aspecto visual que nos indica los datos es la longitud de dichas barras, no
siendo importante su grosor.
Generalmente se emplea para representar la frecuencia de diferentes condiciones o
variables discretas (por ejemplo la frecuencia de los diferentes colores del iris en una
muestra determinada, que solo pueden ser unos valores concretos). Únicamente se
observa una variable en las abscisas, y las frecuencias en las coordenadas.
11. 2. Gráfico circular o por sectores: El también muy habitual gráfico en forma de “quesito”, en este
caso la representación de los datos se lleva a cabo mediante la división de un círculo en tantas partes
como valores de la variable investigada y teniendo cada parte un tamaño proporcional a su
frecuencia dentro del total de los datos. Cada sector va a representar un valor de la variable con la
que se trabaja.
Este tipo de gráfico o diagrama es habitual cuando se está mostrando la proporción de casos dentro
del total, utilizando para representarlo valores porcentuales (el porcentaje de cada valor).
3. Histograma: Aunque a simple vista muy semejante al gráfico de barras,
el histograma es uno de los tipos de gráfica que a nivel estadístico resulta
más importante y fiable. En esta ocasión, también se utilizan barras para
indicar a través de ejes cartesianos la frecuencia de determinados valores,
pero en vez de limitarse a establecer la frecuencia de un valor concreto de
la variable evaluada refleja todo un intervalo. Se observa pues un rango de
valores, que además podrían llegar a reflejar intervalos de diferentes
longitudes.
Ello permite observar no solo la frecuencia sino también la dispersión de un
continuo de valores, lo que a su vez puede ayudar a inferir la probabilidad.
Generalmente se utiliza ante variables continuas, como el tiempo.
4. Gráfico de líneas: En este tipo de gráfico se emplean líneas para
delimitar el valor de una variable dependiente respecto a otra
independiente. También puede usarse para comparar los valores de una
misma variable o de diferentes investigaciones utilizando el mismo gráfico
(usando diferentes líneas). Es usual que se emplee para observar la
evolución de una variable a través del tiempo.
Un ejemplo claro de este tipo de gráficos son los polígonos de frecuencias.
Su funcionamiento es prácticamente idéntico al de los histogramas aunque
utilizando puntos en vez de barras, con la excepción de que permite
establecer la pendiente entre dos de dichos puntos y la comparación entre
12. 8. Gráfico de dispersión: El gráfico de dispersión o gráfico xy es
un tipo de gráfico en el cual mediante los ejes cartesianos se
representa en forma de puntos todos los datos obtenidos mediante
la observación. Los ejes x e y muestran cada uno los valores de una
variable dependiente y otra independiente o dos variables de la que
se esté observando si presentan algún tipo de relación.
Los puntos representados el valor reflejado en cada observación, lo
que a nivel visual dejará ver una nube de puntos a través de los
cuales podemos observar el nivel de dispersión de los datos.
Se puede observar si existe o no una relación entre las variables
mediante el cálculo. Es el procedimiento que se suele usar, por
ejemplo, para establecer la existencia de rectas de regresión lineal
que permita determinar si hay relación entre variables e incluso el
tipo de relación existente.9. Gráfico de caja y bigotes: Los gráficos de caja son uno de los tipos de
gráficas que tienden a utilizarse de cara a observar la dispersión de los datos
y cómo éstos agrupan sus valores. Se parte del cálculo de los cuartiles, los
cuales son los valores que permiten dividir los datos en cuatro partes iguales.
Así, podemos encontrar un total de tres cuartiles (el segundo de los cuales se
corresponderían con la mediana de los datos) que van a configurar la “caja “
en cuestión. Los llamados bigotes serían la representación gráfica de los
valores extremos.
Este gráfico es útil a la hora de evaluar intervalos, así como de observar el
nivel de dispersión de los datos a partir de los valores de los cuartiles y los
valores extremos.
13. 10. Gráfico de áreas: En este tipo de gráfico se observa, de manera semejante lo que ocurre con
los gráficos de líneas, la relación entre variable dependiente e independiente. Inicialmente se hace
una línea que une los puntos que marcan los diferentes valores de la variable medida, pero también
se incluye todo lo situado por debajo: este tipo de gráfica nos permite ver la acumulación (un punto
determinado incluye a los situados por debajo).
11. Pictograma: Se entiende por pictograma a un gráfico en el que, en vez de
representar los datos a partir de elementos abstractos como barras o círculos, se
emplean elementos propios del tema que se está investigando. De este modo se
hace más visual. Sin embargo, su funcionamiento es semejante al del gráfico de
barras, representando frecuencias de la misma manera
12. Cartograma: Este gráfico resulta de utilidad en el terreno de la
epidemiología, indicando las zonas o áreas geográficas en las que aparece con
mayor o menor frecuencia un determinado valor de una variable. Las frecuencias
o rangos de frecuencias se indican mediante el uso del color (requiriéndose una
leyenda para comprenderse) o el tamaño.
14. conclusión
Para llevar a cabo una buena organización de datos se deben indagar los fenómenos, ya que se
realiza una investigación a fondo, y ese fenómeno que se busca debe poseer variables sea
cuantitativa o cualitativa y a través de ellas nos damos cuenta si se debe realizar un análisis
estadístico descriptivo o un análisis estadístico inferencial. Un análisis estadístico descriptivo es
un análisis de los datos obtenidos en una muestra (n) y como su nombre lo indica describen y
resumen las observaciones obtenidas sobre un fenómeno, un suceso o un hecho; y el análisis
estadístico inferencial consiste en llegar a obtener conclusiones o generalizaciones que
sobrepasan los límites de los conocimientos aportados por un conjunto de datos. Es decir que, la
recolección de los datos puede inducir una investigación por muestreo o mediante el diseño
experimental, dando como origen datos muéstrales y datos experimentales. Es preciso señalar
que el objetivo principal de la organización de los datos es indicar las propiedades de los mismos
conociendo además sus particularidades.
15. Bibliografía
Martínez-González, M.A.; Faulin, F.J. y Sánchez, A. (2006). Bioestadística amigable, 2ª
ed. Díaz de Santos, Madrid.
https://www.lifeder.com/ejemplos-variables-cualitativas-cuantitativas
https://es.slideshare.net/anthonymaule/guia-organizacin-de-datos
ww.wikillerato.org/Organización_de_los_datos.html
https://www.questionpro.com/es/cualitativa-vs-cuantitativa.html