Este documento presenta un resumen de estadística descriptiva sobre frecuencias de datos. Incluye tablas y ejemplos para explicar conceptos como frecuencias absolutas, relativas, acumuladas y relativas acumuladas. También incluye ejercicios resueltos en R para construir tablas de frecuencias y gráficos a partir de datos no agrupados sobre temas como turismo y formación de microempresarios.
15. FRECUENCIAS:
Para comprender el concepto de frecuencia partimos de una situación real que a diario
sucede en las aulas de clase con un grupo de estudiantes de educación primaria.
Un Profesor de geografía tiene registrado en su informe de logros la
información de 20 estudiantes con los siguientes resultados.
E S A S D I A S E D
A I S E D A S A D I
Los datos de los logros obtenidos se pueden registrar en la siguiente tabla.
La tabla muestra en forma organizada los resultados de los logros y la cantidad de
estudiantes que alcanzaron una determinada valoración. Al respecto podemos decir:
4 estudiantes obtuvieron D en geografía
3 estudiantes obtuvieron I en geografía
5 estudiantes obtuvieron A en geografía
5 estudiantes obtuvieron S en geografía
3 estudiantes obtuvieron E en geografía
Logros No de estudiantes
D
I
A
S
E
4
3
5
5
3
16. CLASES DE FRECUENCIAS
FRECUENCIA ABSOLUTAS: (f)
Resultan del conteo directo, de los datos que se repiten en una distribución. La suma
de todas las frecuencias absolutas es el tamaño de la muestra.
fi = n
f = f1 + f2 + f3 + ... + fn = n; n es el tamaño de la muestra.
Para nuestro ejemplo la tabla de frecuencias absolutas quedaría.
Logros f
D
I
A
S
E
4
3
5
5
3
20
Algunos datos de esta tabla tienen la siguiente lectura:
3 Estudiantes reaprobaron el examen con una valoración de I (Insuficiente)
5 Estudiantes aprobaron el examen con una valoración de A (Aceptable)
3 Estudiantes aprobaron el examen con una valoración de E (Excelente)
FRECUENCIAS ACUMULADAS:(F)
Se obtiene de la acumulación sucesiva de las frecuencias absolutas. El último dato
acumulado es el tamaño de la muestra.
Su cálculo se obtiene así:
F1 = 4
F2 = f1+f2 = 4 + 3 =7
F3 = f1 + f2 +f3 =4 + 3 + 5 = 12
F4 = f1 + f2 + f3 + f4 = 4 + 3 + 5 + 5 = 17
F5 = f1 + f2 + f3 + f4 + f5 = 4 + 3 + 5 + 5 + 3 = 20
En una tabla de frecuencias se observaría así:
17. Logros f F
D
I
A
S
E
4
3
5
5
3
4
7
12
17
20
20
Algunos datos de esta tabla para las frecuencias acumuladas tienen la siguiente
lectura:
12 Estudiantes reprobaron el examen con una valoración inferior a A
7 Estudiantes presentan valoraciones inferiores a A.
FRECUENCIA ABSOLUTA RELATIVA: (h)
Corresponde a una porción de distribución. Se obtiene dividiendo la frecuencia
absoluta de cada dato entre el total de elementos que conforman la muestra.
n
f
hi
La suma de todas las frecuencias relativas representa al 100% de la población y
equivale a 1 (Uno).
h = 100% = 1
En nuestro ejemplo de referencia.
h1 = 4 / 20 = 0.2 = 20%
h2 = 3 /20 = 0.15 = 15%
h3 = 5 /20 = 0.25 = 25%
h4 = 5 /20 = 0.25 = 25%
h5 = 3/20 =0.15 = 15%
En una tabla de frecuencias se observaría así:
18. Logros f F h
D
I
A
S
E
4
3
5
5
3
4
7
12
17
20
0.2
0.15
0.25
0.25
0.15
20 1
Algunos datos de esta tabla tienen la siguiente lectura:
El 15% de los Estudiantes reaprobaron el examen con una valoración de I
(Insuficiente)
El 25% de los Estudiantes aprobaron el examen con una valoración de A (Aceptable)
El 15% de los Estudiantes aprobaron el examen con una valoración de E (Excelente)
FRECUENCIAS RELATIVA ACUMULADAS: (H).
Se obtiene de la acumulación sucesiva de las frecuencias relativas. El último dato
acumulado es el 100% de la muestra.
Su cálculo se obtiene así:
H1 = 0.2
H2 = h1+h2 = 0.2 + 0.15 =0.35
H3 = h1 + h2 +h3 =0.2 + 0.15 + 0.25 = 0.6
H4 = h1 + h2 + h3 + h4 = 0.2 + 0.15 + 0.25 + 0.25 = 0.85
H5 = h1 + h2 + h3 + h4 + h5 = 0.2 + 0.15 + 0.25 + 0.25 + 0.15 = 1
El último dato acumulado equivale al 100% de la muestra. En una tabla de frecuencias
se observaría así:
Logros f F h H
D
I
A
S
E
4
3
5
5
3
4
7
12
17
20
0.2
0.15
0.25
0.25
0.15
0.2
0.35
0.6
0.85
1
20 1
19. Algunos datos de esta tabla para las frecuencias relativas acumuladas tienen la
siguiente lectura:
El 60% de los estudiantes reprobaron el examen con una valoración inferior a A
El 35% de los estudiantes presentan valoraciones inferiores a A.
EJEMPLO DE APLICACIÓN:
La siguiente distribución de datos representa los salarios de 40 trabajadores de un
colegio privado de la ciudad de Villavicencio en donde se requiere que el docente
trabaje bajo la figura de docente catedrático. Para el caso se asigna un valor por la
hora trabajada de acuerdo a un grado de escalafón emitido el ministerio de educación
nacional.
Los valores de los salarios corresponden en miles de pesos.
30 25 20 40 28
35 40 25 45 20
40 30 15 30 25
20 50 50 50 30
50 15 30 45 40
15 20 28 35 40
30 15 20 45 50
15 10 20 28 30
La siguiente tabla muestra los datos organizados con su respectiva frecuencia. La
interpretación de algunos datos queda como tarea para el estudiante.
SALARIOS
(En miles de $)
f F h H
10 1 1 0,025 0,025
15 5 6 0,125 0,15
20 6 12 0,15 0,3
25 3 15 0,075 0,375
28 3 18 0,075 0,45
30 7 25 0,175 0,625
35 2 27 0,05 0,675
40 5 32 0,125 0,8
45 3 35 0,075 0,875
50 5 40 0,125 1
40 1
20. Solución compendio #2
EJERCICIOS DE APLICACIÓN:
1. En un estudio relacionado con el turismo en el Meta se realizó la siguiente
pregunta
Cuál es el principal motivo por el cual usted visita al departamento del Meta?
Las opciones se clasifican así:
Se aplicó la pregunta a 100 turistas y se obtuvieron los siguientes resultados
1 4 4 2 5 3 3
2 4 5 1 6 2 3
2 6 1 1 6 3 4
2 6 2 1 6 3 2
3 6 2 1 3 4 1
3 6 2 1 3 6 2
3 6 3 4 3 6 3
5 3 3 4 5 6 3
5 3 3 4 5 5 3
5 3 4 4 5 5 6
1 3 4 4 4 4
21. 1 3 1 4 4 4
1 2 1 5 4 3
1 2 1 5 3 2
4 2 5 5 3 2
Elabore en R una tabla de frecuencias para la información obtenida.
barplot(f,col=c(2,3,4,5,6,7),names.arg=c(" "),main="DIAGRAMA DE TURISMO",
ylab="TURISTAS",xlab=" ")
legend(5,25,c("calorhumano","clima","descanso","diversion","gastronomia","paisaje"),fill =
c(2,3,4,5,6,7))
barplot(f,space=5,col="pink",ylim=c(0,25),ylab="f",main="Gráficode Líneas:turismo")
> abline(h=0)
26. SOLUCION COMPENDIO #4
GRAFICAS PARA DATOS NO AGRUPADOS
Códigos en R Resultados
Ingresando datos:
datos=c(200,1
90,150,148,152,158,100
,174,187,188,160,178,1
53,151,128,137,174,199
,103,168,188,127,150,1
30,175)
[1] 200 190 150 148 152 158 100 174
187 188 160 178 153 151 128 137 174
199 103
[20] 168 188 127 150 130 175
Calculando el rango:
Rang= max(datos)-
min(datos)
> Rang
[1] 100
Calculando el número de
intervalos
m=round(1+3.3*log10(25
)) La función Round, redondea
al entero más cercano.
> m
[1] 6
Longitud del intervalo:
C=Rang/m
> C
[1] 16.66667
Este resultado se redondea al entero más cercano, por
exceso en este caso 17.
Redefinir=102-100=2
2 Xmin-1=99
Xmax +1=201
Ahora le damos forma a los
intervalos
intervalos=cut(datos,
Intervalos
[1] (184,201] (184,201] (133,150]
(133,150] (150,167] (150,167]
27. breaks=c(99,116,133,15
0,167,184,201))
(99,116] (167,184] (184,201]
(184,201] (150,167] (167,184]
[13] (150,167] (150,167] (116,133]
(133,150] (167,184] (184,201]
(99,116] (167,184] (184,201]
(116,133] (133,150] (116,133]
[25] (167,184]
Levels: (99,116] (116,133] (133,150]
(150,167] (167,184] (184,201
Ahora se forma las frecuencias
absolutas
f=table(intervalos)
f
intervalos
(99,116] (116,133] (133,150]
(150,167] (167,184] (184,201]
2 3 4 5
5 6
Calculando el número de
elementos de la muestra
n=sum(f)
>> n
[1] 25
Construimos las frecuencias
absolutas
h
h=f/n
h
intervalos
(99,116] (116,133] (133,150]
(150,167] (167,184] (184,201]
8 12 16 20
20 24
Construyendo frecuencias
absolutas acumuladas
F=cumsum(f)
F
(99,116] (116,133] (133,150]
(150,167] (167,184] (184,201]
2 5 9 14
19 25
Construyendo las frecuencias
relativas acumuladas.
H=cumsum(h)
H
(99,116] (116,133] (133,150]
(150,167] (167,184] (184,201]
8 20 36 56
76 100
28. Ahora se arman la tabla de
frecuencias
cbind(f,h,F,H)
f h F H
(99,116] 2 8 2 8
(116,133] 3 12 5 20
(133,150] 4 16 9 36
(150,167] 5 20 14 56
(167,184] 5 20 19 76
(184,201] 6 24 25 100
Construyendo marcas de clase
LimSup=c(116,133,150,167,18
4,201)
LimInf=c(99,116,133,150,167
,184)
Marca= (LimSup+LimInf)/2
Marca
[1] 107.5 124.5 141.5 158.5 175.5
192.5
La tabla con las frecuencias y la
marca de clase
tabla=cbind(f,Marca,h,F,H)
f Marca h F H
(99,116] 2 107.5 8 2 8
(116,133] 3 124.5 12 5 20
(133,150] 4 141.5 16 9 36
(150,167] 5 158.5 20 14 56
(167,184] 5 175.5 20 19 76
(184,201] 6 192.5 24 25 100
29.
30.
31. Tallerde Aplicación:
Basándose enlosanterioresprocedimientosconstruirintervalos y gráficos para los siguientes
datos que corresponden a la edad de 50 microempresarios de la ciudad de Villavicencio
48 39 35 29 30
38 42 37 40 38
22 37 34 55 48
35 50 36 48 42
53 35 38 38 35
40 50 23 32 45
35 42 59 28 38
34 38 44 46 23
40 48 34 30 35
43 32 36 32 46