1. Construcción una distribuciones de frecuencias y su representación gráfica
(Miguel Pinzón Bello)
Aspectos teóricos
Una tabla estadística es probablemente el medio más sencillo para resumir y presentar conjunto de datos. Se puede
utilizar para todo tipo de datos.
Distribución de frecuencias
Un tipo de tabla comúnmente utilizado para interpretar datos se denomina “Tabla o distribución de frecuencias”. Una
distribución de frecuencias es un arreglo o agrupación que se hace con los datos en categorías o intervalos. Dicho de
otra manera, una distribución de frecuencias consiste en una lista de las categorías o intervalos de la variable junto con
el número y % de casos que cae dentro de cada uno de ellos. Se puede elaborar con datos cualitativos, discretos o
continuos.
1. Distribución de frecuencias de variables cualitativas (Variables cualitativas o categóricas)
Distribución de frecuencias para el caso de las variables Cualitativas (datos categóricos) consiste en un conjunto de
clases o categorías con la cantidad de elementos (Frecuencia) y porcentaje (%) de elementos que corresponden a
cada una.
La estructura de una tabla de frecuencias cualitativa es la siguiente:
Titulo
Categorías Frecuencias %
A
B
.
.
.
.
.
.
.
.
.
Totales n 100.0
Toda tabla de frecuencias se acompaña de un gráfico. En el caso de datos categóricos las gráficas pueden ser:
Grafico circular, gráfico de columnas o gráfico de barras.
2. Tablas de contingencia
Para analizar la relación de dependencia o independencia entre dos variables cualitativas nominales o factores, es
necesario estudiar su distribución conjunta o tabla de contingencia.
La tabla de contingencia es una tabla de doble entrada, donde en cada casilla figurará el número de casos o
individuos que poseen un nivel de uno de los factores o características analizadas y otro nivel del otro factor
analizado. La estructura de una tabla de contingencia es:
Categorías del atributo A
Ai
Categorías del atributo B
B.j
Totales de filas
B1 B2 BL ni.
A1 n12 n12 n1j n1.
A2 n12 n12 n1j n2.
A3 n12 n12 n1j n2.
AK n12 n12 n1j n2.
Totales de columnas ni. n.1 n.2 n.L n
Donde
n = número total de observaciones o casos en estudio
nij = número de observaciones que tienen el atributo i y j
ni. = número de individuos que tie nen el atributo i (marginal i)
n.j = número de individuos que tienen el atributo j (marginal j)
2. La tabla de contingencia se define por el número de atributos o variables que se analizan conjuntamente y el
número de modalidades o niveles de los mismos.
El grafico apropiado para representar la información una contenida en una tabla de contingencia puede ser una tabla
de columnas agrupadas o barras proporcionales.
3. Distribución de frecuencias de variables discretas
Las variables discretas se restringen solo a valores específicos – a menudo valores enteros- no se permiten valores
intermedios.
Una distribución de frecuencias de una variable discreta consiste en identificar los diferentes valores que toma la
variable xi
y disponerlos en forma creciente. Posteriormente se cuenta tanto el número como el porcentaje de
elementos que toman cada valor específico de la variable. El número absoluto de elementos que toma un valor xi
,
se denomina frecuencia absoluta y se representa con f i
; el porcentaje de elementos que toman un valor xi
se
conoce con el nombre de frecuencia relativa y se representa con el símbolo 100
*
hi
. Dichas frecuencias se
calculan mediante la siguiente fórmula:
100
*
n
f
h i
i
La estructura de una Tabla de frecuencias discretas es la siguiente:
Titulo
Valores de la variable
xi
Frecuencias absolutas
f i
Frecuencias relativas
hi
Frecuencias porcentuales
100
*
hi
x1 f 1 h1
100
*
1
h
x2 f 2 h2
100
*
2
h
x3 f 3 h3
100
*
3
h
.
.
.
.
.
.
.
.
.
.
.
.
xk f k hk
100
*
hk
Totales n 00
,
1 0
,
100
Una distribución de frecuencias discreta se representa mediante dos gráficos: El histograma y el polígono de
frecuencias.
El histograma es un gráfico que muestra los valores más frecuentes y los valores menos frecuentes. El
histograma de una distribución discreta corresponde a un gráfico de bastones que se pinta con los valores xi
ubicados en el eje horizontal y las frecuencias o los porcentajes dispuestos en el eje vertical. El histograma del
El polígono de frecuencias es un gráfico que muestra la forma de la distribución. Recuerde que la forma de una
distribución puede ser: Simétrica, asimétrica hacia la izquierda o asimétrica hacia la derecha. El polígono de
frecuencias de una distribución discreta es un gráfico de línea que se dibuja ubicando los valores xi
en el eje
horizontal y las frecuencias o los porcentajes en el eje vertical.
4. Distribución de frecuencias de variables continuas
3. Una distribución de frecuencias con datos continuos consiste en dividir el rango o recorrido (R) de la variable en (K)
partes llamados intervalos, y luego contar, tanto el número absoluto, como el % de elementos que se clasifica en
cada uno de ellos.
Los pasos para construir una distribución de frecuencias con datos continuos son:
Paso 1: Determinar el rango o recorrido de la variable. R = Valor máximo – Valor mínimo.
Paso 2: Determinar el número de intervalos que se van a emplear. Dicho número se representa mediante la letra K
y se determina mediante la siguiente formula de STURGES: 1
322
,
3
*
)
(
n
Log
K
Paso 3: Calcular la amplitud de intervalo (ancho de cada intervalo). Dicha amplitud se representa con C , y se
calcula aplicando la siguiente fórmula:
K
R
C
Paso 4: Formar los intervalos. Un intervalo tiene un límite inferior Li
y un límite superior Ls
.
El límite inferior del primer intervalo es igual al valor mínimo que toma la variable y el límite superior es
igual a límite inferior más C . El límite inferior del segundo intervalo es igual al límite superior del primero,
y su límite superior igual al límite inferior más C , y así sucesivamente. Recuerde que todo
C
L
L i
s
, y que el valor del límite superior del último intervalo es igual o superior al valor máximo
que toma la variable. Es preciso recordar que los intervalos son cerrados por la izquierda y abiertos
por la derecha. Son Intervalos semiabiertos.
Paso 5: Realizar la tabulación o conteo. En este paso se toma cada dato y se clasifica en el intervalo
correspondiente.
Paso 6: Determinación de las frecuencias absolutas y las frecuencias relativas.
Las frecuencias absolutas se representan mediante f i
e indican el número de elementos que se
clasifican el i-ésimo intervalo. Estas frecuencias se obtienen mediante el conteo. Dichas frecuencias son
números enteros y positivos; la suma de todas ellas es igual a tamaño de la muestra .
n Es decir:
n
f
f
f
f k
.....
3
2
1
Las frecuencias relativas o porcentuales se representan mediante el símbolo 100
*
hi
y se determinan
mediante la siguiente fórmula: .
100
*
n
f
h i
i
Es preciso recordar que la suma de todas ellas es
igual a 100%.
Paso 7: Determinar los puntos medios o marcas de clase xi
. La fórmula para calcular estos valores es:
.
2
L
L
x s
i
i
La estructura de una distribución continua es la siguiente:
Titulo
Límites de los
intervalos
L
L s
i
Frecuencias absolutas
f i
Frecuencias relativas
hi
Frecuencias
porcentuales
100
*
hi
Puntos medios o
marcas de clase
xi
f 1 h1
100
*
1
h x1
f 2 h2
100
*
2
h x2
f 3 h3
100
*
3
h x3
. . . . .
4. .
.
.
.
.
.
.
.
.
.
f k hk
100
*
hk xk
Totales n 00
,
1 0
,
100
Representación gráfica de una distribución de frecuencias
Una distribución de frecuencias se representa mediante dos gráficos: El histograma y el polígono de frecuencias.
El histograma es un gráfico que muestra los valores más frecuentes y los valores menos frecuentes. El histograma
de una distribución de frecuencias es un gráfico de barras verticales (columnas) que se construye ubicando sobre el
eje horizontal los valores de los límites inferiores y superiores, y en el eje vertical las frecuencias absolutas o relativas
(porcentuales). Recuerde que un histograma se usa para determinar los valores que se presentan con mayor o
menor frecuencia.
El polígono de frecuencias es un gráfico que muestra la forma de la distribución. El polígono de frecuencias de
una distribución es un gráfico de línea que se pinta ubicando sobre el eje horizontal los puntos medios o marcas de
clase xi
, y en el eje vertical las frecuencias absolutas o las frecuencias relativas. Recuerde que un polígono de
frecuencias se utiliza para estudiar la forma de la distribución. La forma de una distribución puede ser: Simétrica,
asimétrica hacia la izquierda o asimétrica hacia la derecha.