Este documento presenta tres temas clave de estadística: 1) distribución de frecuencias, que organiza datos en una tabla mostrando las frecuencias y frecuencias acumuladas; 2) distribución de frecuencias por intervalos, que agrupa datos en clases para facilitar el análisis; y 3) tablas de contingencia, que relaciona variables cualitativas o cuantitativas mostrando frecuencias relativas para analizar la relación entre ellas. El documento provee ejemplos ilustrativos de cada tem
1. UNIVERSIDAD SANTO TOMAS
FACULTAD DE NEGOCIOS INTERNACIONALES
ESTADISTICA
GUIA DE CLASE
I – 2011.
A. DISTRIBUCION DE FRECUENCIAS
En esta tabla, se relacionan los resultados que toma la variable junto con sus frecuencias. La
primera columna incluye los resultados delas variables ordenados de menor a mayor, la segunda
columna es la frecuencia relativa (fi), es decir, el número de veces que se repite el dato, la tercera
columna es la frecuencia acumulada (Fi) que reúne los datos a medida que avanzan los valores de la
variable, la cuarta columna es la frecuencia relativa (hi), es la misma frecuencia absoluta pero en
términos porcentuales (%), se obtiene del cociente de la respectiva frecuencia sobre el total de
datos, y la última columna es la frecuencia relativa acumulada (Hi) que se obtiene sumando las
respectivas frecuencias relativas de cada valor de la variable.
El jefe de cartera de una empresa, recolecta información acerca del número diario de facturas
vencidas durante los últimos 31 días y encuentra lo siguiente:
1 1 0 1 2 1 3 2 3 2 1 2 3 2
2 3 3 2 0 2 1 2 3 2 2 1 3 0
0 1 3
La forma en la que se presentan estos datos no dicen nada, para ello hay que organizarlos en una
tabla de distribución de frecuencias que se muestra a continuación:
Número de Frecuencia Frecuencia F. relativa
facturas Días acumulada relativa acumulada
vencidas Fi hi Hi
0 4 4 13% 13%
1 8 12 26% 39%
2 11 23 35% 74%
3 8 31 26% 100%
Total 31 100%
2. Algunas conclusiones que se pueden obtener al mirar la tabla son por ejemplo: hubo 4 días que no
se venció ninguna factura, el 26% de los días se vencieron 3 facturas.
B. DISTRIBUCION DE FRECUENCIAS POR INTERVALOS
El gerente de la cadena de almacenes ABC Ltda pide recolectar y agrupar los datos sobre el número
de clientes semanales que compran en ellos. Los datos corresponden a las últimas 50 semanas y
aparecen a continuación:
68 71 77 83 79 72 74 57 67 69 50 60 70
66 76 70 84 59 75 94 65 72 85 79 71 83
77 73 78 93 95 78 81 79 90 83 80 84 91
101 86 93 92 102 80 69
Sin embargo, con estos datos en bruto, es improbable que el gerente pueda obtener información
útil y significativa respecto a las compras de los clientes. Los datos no están organizados y es difícil
llegar a una conclusión significativa, simplemente revisando una serie de números anotados en el
papel. Es preciso agrupar y presentar los datos de manera concisa y reveladora para facilitar el
acceso a la información que contienen.
Una distribución de frecuencias por intervalos ordenará los datos si estos se pueden dividir en
clases y se registrará el número de observaciones en cada clase.
Para determinar el número recomendado de intervalos utilizamos la siguiente fórmula:
2c ≥ n en donde n es el número de observaciones y c el número de intervalos.
Para nuestro ejemplo n=50 así que 2 ≥ 50
c
Despejando c, lo cual puede hacerse fácilmente con una calculadora se encuentra que 26 = 64. Esta
regla sugiere que se recomiendan 6 clases o intervalos ya que 26 = 64 y 64 ≥ 50.
El intervalo de cada clase o el ancho de cada rango lo obtenemos de la siguiente forma:
IC = Límite superior (dato mayor) – límite inferior (dato menor)
Número deseado de clases
En nuestro caso, ya determinamos el número de intervalos que fueron 6, ahora aplicamos la
formula anterior para determinar el número de unidades que deben ir en cada uno de los
intervalos: IC = 102 – 50 = 8,7
6
3. Como nuestra variable es discreta, es decir, no pueden existir 8,7 clientes, entonces aproximamos
al entero más cercano que es 9. Es decir, cada uno de nuestros intervalos tendrá 9 unidades.
De esta forma, nuestra tabla quedará de la siguiente forma:
Número de Semanas Frecuencia Frecuencia
clientes (frecuencia) acumulada relativa
50 a 59 3 3 6%
60 a 69 7 10 14%
70 a 79 18 28 36%
80 a 89 12 40 24%
90 a 99 8 48 16%
100 a 109 2 50 4%
Total 50 100%
Con base en esta tabla, es más sencillo describir la situación; por ejemplo, podríamos decir que
hubo 3 semanas que compraron de 50 a 59 clientes, el 16% de las semanas compraron de 90 a 99
clientes.
Ahora bien, queda abierta una pregunta que usted deberá responder después de conceptualizar y
si es el caso, hacer una aplicación.
¿Será que el ancho de cada uno de los intervalos, es el mismo cuando la
variable es cuantitativa continua?
4. C. TABLAS DE CONTIGENCIA
Estas tablas, se utilzan generalmente, cuando se quiere relacionar información de dos variables,
bien sean cuantitativas discretas o continuas o bien sean cualitativas, es decir, las variables a
relacionar, no necesariamente deben ser de igual naturaleza.
Tenga en cuenta, que una tabla de contingencia, es una tabla que resume la información en
términos de frecuencias relativas (%), NO absolutas.
Veamos el siguiente ejemplo.
CANTIDAD EXPORTADA
CONTINENTE DESTINO Entre Entre Entre Mayores TOTAL
DE LA EXPORTACION 0 - 5 ton 5 - 10 ton 10 - 15 ton a 15 ton
Europa 5 5 1 0 11
América 10 6 5 6 27
Asia 0 0 5 0 5
Africa 5 5 2 1 13
Oceanía 3 0 1 0 4
TOTAL 23 16 14 7 60
Observe, que las variables relacionadas, una es cualitativa y la otra es cuantitativa continua. Sin
embargo, aún falta convertir cada una de las frecuencias absolutas en frecuencias relativas, esto se
obtiene, dividiendo cada una de las fi sobre el total de datos: fi/n.
CANTIDAD EXPORTADA
CONTINENTE DESTINO Entre Entre Entre Mayores TOTAL
DE LA EXPORTACION 0 - 5 ton 5 - 10 ton 10 - 15 ton a 15 ton
Europa 5/40 5/60 1/60 0 11/60
5. América 10/60 6/60 5/60 6/60 27/60
Asia 0 0 5/50 0 5/60
Africa 5/60 5/60 2/60 1/60 13/60
Oceanía 3/60 0 1/60 0 4/60
TOTAL 23/60 16/60 14/60 7/60 60
Para hallar cada uno de los valores, simplemente dividimos las frecuencias que toma la intersección
de cada una de las dos variables y lo dividimos para nuestro caso, sobre 60 que es el total de datos
(n). La tabla que obtenemos finalmente, es la siguiente:
CANTIDAD EXPORTADA
CONTINENTE DESTINO Entre Entre Entre Mayores TOTAL
DE LA EXPORTACION 0 - 5 ton 5 - 10 ton 10 - 15 ton a 15 ton
Europa 8% 8% 2% 0% 18%
América 17% 10% 8% 10% 45%
Asia 0% 0% 8% 0% 8%
Africa 8% 8% 3% 2% 22%
Oceanía 5% 0% 2% 0% 7%
TOTAL 38% 27% 23% 12% 100%
Usted ya puede concluir observando los valores en la tabla.