1. Se presentan los conceptos básicos de la organización y representación gráfica de datos estadísticos, incluyendo la distribución de frecuencias, intervalos de clase, frecuencias absolutas y relativas, histogramas y polígonos de frecuencia.
2. Se explican los conceptos de frecuencia acumulada y su representación gráfica mediante una ojiva.
3. Se describen diferentes formas que pueden tomar las curvas de frecuencia y su relación con la simetría y sesgo de los datos.
2. Son los datos recolectados que aún no se han
organizado. Por ejemplo, las estaturas de 100
estudiantes tomados de la lista alfabética de
la universidad.
3. Se llama a lo datos numéricos en bruto
dispuestos en orden creciente o decreciente
de magnitud.
A la diferencia del número mayor y el número
menor se le conoce como el RANGO DE
DATOS. Por ejemplo, si la estatura mayor de
los estudiantes es de 74(pulgadas - in) y la
menor es de 60 in, el rango es 74-60 = 14 in
4. Al organizar una gran cantidad de datos en
bruto, suele resultar útil distribuirlos en
CLASES o CATEGORÍAS y determinar la
cantidad de datos que pertenece a cada clase,
esta cantidad se le conoce como la
FRECUENCIA DE LA CLASE.
A la disposición tabular de los datos en clases
con sus respectivas frecuencias se le conoce
como DISTRIBUCIÓN DE FRECUENCIAS o
TABLA DE FRECUENCIAS
5. La siguiente tabla es una distribución
de frecuencias de las estaturas de 100
estudiantes de la Universidad.
Estatura
(in)
Cantidades de
estudianres
60-62
63-65
66-68
69-71
72-74
5
18
42
27
8
Total 100
A los datos organizados
y resumidos en la
distribución de frecuencias
de les llama datos
agrupados
6. Al símbolo que representa la clase, como
60-62 se le conoce como intervalo de clase
A los números de los extremos, 60 y 62 se
les conoce como límites de clase
El número menor (60) es el límite inferior de
la clase
El número mayor (62) es el límite superior de
la clase.
Un intervalo de clase que no indique el límite
de clase superior o el límite de clase inferior
se conoce como intervalo de clase abierto,
por ejemplo: personas que sean de “65 años
o mayores”
7. Si las estaturas se registran a la pulgada más
cercana, el intervalo de clase 60-62
comprende todas las mediciones desde 59.5
hasta 62.5 in. Estos números son las
fronteras de clase o los límites de clase
reales, el menor (59.5) el la frontera inferior
de la clase y el número mayor (62.5) es la
frontera superior de la clase.
8. Las fronteras de clase se obtienen sumando
el límite superior de un intervalo de clase al
límite inferior del intervalo de clase inmediato
superior y dividiendo entre 2.
Algunas veces, las fronteras de clase se usan
para representar las clases. Por ejemplo, las
clases de la tabla del ejemplo pueden
indicarse como 59.5-62-5, 62.5-65.5
9. Es la diferencia entre sus fronteras superior e
inferior y se le conoce también como
amplitud de clase, tamaño de clase o longitud
de clase. Si en una distribución de frecuencias
todos los intervalos de clase tienen la misma
amplitud, esta clase común se denota c.
c es igual a la diferencia entre dos límites
inferiores de clases sucesivas o entre dos
límites superiores de clases sucesivas. Por
ejemplo, en los datos de la tabla, el intervalo
de clase es c = 62.5-59.5 = 65.5-62.5 = 3
10. Es el punto medio del intervalo de clase y se
obtiene sumando los límites de clase inferior
y superior y dividiendo entre 2. Así, la marca
de clase del intervalo 60-62 es (60+62)/2 =
61, a la marca de clase se le conoce también
como punto medio de clase.
11. 1. En el conjunto de los datos en bruto, se
determina el número mayor y el número menor y
se halla, así, el rango (la diferencia entre los
números mayor y menor).
2. Se divide el rango en una cantidad adecuado de
intervalos de clase de una misma amplitud. Si
esto no es posible, se usan intervalos de clase de
diferentes amplitudes o intervalos de clase
abiertos. La cantidad de intervalos suele ser de 5
a 20.
3. Se de termina la cantidad de observaciones que
caen dentro de cada intervalo de clase, es decir,
se encuentran las frecuencias de clase.
12. Los histogramas y los polígonos de
frecuencia son dos representaciones gráficas
de las distribuciones de frecuencias.
13. Consiste en un conjunto de rectángulos que
tienen: a) sus bases sobre un eje horizontal
(el eje x), con sus centros coincidiendo con
sus marcas de clase, y b) áreas
proporcionales a las frecuencias de clase
15. Es una gráfica de línea que presenta las
frecuencias de la clase graficadas contra las
marcas de clase
16. El polígono de frecuencias se ancla con sus extremos, 58 y 76
Polígono de frecuencias de las estaturas de los estudiantes.
17. Es la frecuencia de la clase dividida entre la suma
de las frecuencias de todas las clases y
generalmente se expresa como porcentaje. Por
ejemplo la frecuencia relativa de la clase 66-68
es 42/100 = 42%, no olvidar que la suma de las
frecuencias relativas de todas las clases es 1 o
100%.
Si a la tabla del ejemplo las frecuencias se
sustituyen por frecuencias relativas, la tabla que
se obtiene es una distribución de frecuencias
relativas, distribución porcentual o tabla de
frecuencias relativas.
18. Las representaciones gráficas de las
distribuciones de frecuencias se obtienen a
partir de los histogramas o polígonos de
frecuencia, cambiando únicamente, en la
escala vertical, las frecuencias por las
frecuencias relativas y conservando la gráfica
exactamente igual. A estas gráficas se las
llama histogramas de frecuencias relativas y
polígonos de frecuencias relativas
respectivamente.
19. A la suma de todas las frecuencias menores
que la frontera superior de un intervalo de
clase dado se le llama frecuencia acumulada
hasta ese intervalo de clase inclusive. Por
ejemplo, en la tabla la frecuencia acumulada
hasta el intervalo de clase 66-68 inclusive es
5+18+42=65, lo que significa que 65
estudiantes tienen una estatura menor a 68.5
in.
20. A una tabla en la que se presentan las
frecuencias acumuladas se le llama
distribución de frecuencias acumuladas o
simplemente distribución acumulada.
21. Estatura in Cantidad de estudiantes
Menos de 59.5
Menos de 62.5
Menos de 65.5
Menos de 68.5
Menos de 71.5
Menos de 74.5
0
5
23
65
92
100
Tabla distribución acumulada. Para la distribución de las estaturas
de los estudiantes.
22. Una gráfica que muestra las frecuencias
acumuladas menores de cada frontera
superior de clase respecto a cada frontera
superior de clase se le conoce como gráfica
de frecuencias acumuladas u ojiva.
23. Es la frecuencia acumulada dividida entre la
suma de todas las frecuencias (frecuencia
total). Por ejemplo, la frecuencia acumulada
relativa de las estaturas menores que 68.5 es
65/100=0.65 o 65%, lo que significa que el
65% de los estudiantes tienen estaturas
menores a 68.5 in
Si en la tabla anterior colocamos las
frecuencias acumuladas relativas en lugar de
las frecuencias acumuladas, se obtiene una
distribución de frecuencias acumuladas
relativas y una gráfica de frecuencias
acumuladas relativas u ojiva porcentual.
24. Cuando se tienen poblaciones grandes puede
esperarse que los polígonos de frecuencias,
o los polígonos de frecuencias relativas,
correspondientes a estas poblaciones estén
formados por una gran cantidad de
pequeños segmentos de recta de manera que
sus formas se aproximen a las de unas
curvas, a las cuales se les llama curvas de
frecuencias o curvas de frecuencias relativas,
respectivamente.
A las curvas de frecuencias se les llama
polígonos de frecuencias suavizados.
25.
26. Las curvas simétricas o en forma de campana
se caracterizan porque las observaciones
equidistantes del máximo central tienen la
misma frecuencia.
Las curvas que tienen colas hacia la izquierda
se dice que son sesgadas hacia la izquierda.
La cantidad de años que viven hombres y
mujeres son sesgadas hacia la izquierda,
pocos jóvenes mueren, la mayoría muere
entre los 60 y 80 años.
27. Las curvas que tienen colas hacia la derecha
se dice que son sesgadas hacia la derecha.
Las edades a las que se casan tanto hombres
como mujeres son sesgadas hacia la derecha,
la mayoría se casa entre 20 y 30 años y pocos
a los 40, 50, 60, 70 o más.
Las curvas que tienen aproximadamente las
mismas frecuencias para todos sus valores se
dice que son curvas distribuidas
uniformemente, por ejemplo las máquinas
dispensadoras de refresco.
28. Las curvas de frecuencias en forma de J o en
forma de J inversa son curvas en las que el
máximo se presenta en uno de sus
extremos.
Las curvas de frecuencias en forma de U son
curvas que tienen un máximo en cada
extremo y un mínimo en medio
Las curvas bimodales son curvas que tienen
dos máximos
Las curvas multimodales tienen más de dos
máximos