UNIVERSIDAD UCEM
T AB U L A C I Ó N D E
D A T O S
E S T A D Í S T I C O S
DOCENTE: DANIELA YGLESIAS CUBERO
2.
La tabulación dedatos es el proceso mediante el
cual se toman los diferentes valores o atributos de
la variable y se ubican en una columna, según el
criterio de ordenación definido por el investigador,
y al frente de cada valor o atributo se coloca la
frecuencia.
¿ Q U É E S ?
3.
C U AN D O S E T R A T A D E V A R I A B L E S
C U A L I TAT I VA S . . .
Nivel de escolaridad
Se recomienda seguir un patrón con
orden cronológico, alfabético o con
nivel jerárquico y
, posteriormente, se
realiza el conteo.
4.
C U AN D O S E T R A T A D E V A R I A B L E S
C U A N T I T A T I V A S D I S C R E TA S . . .
Se emplean escalas numéricas y se
ordena en forma creciente.
Número de hijos de un grupo
de personas
5.
C U AN D O . . . .
los datos son numerosos o corresponden
a la variable cuantitativa continua, la
ordenación en forma creciente ya no es
funcional y
, por lo tanto, se deben
agrupar los datos en intervalos, mediante
el siguiente procedimiento
Calcular rango o recorrido.
Número de intervalos o
clase.
Amplitud del intervalo
de
clase.
Límites de los
intervalos.
Tabulación.
6.
Se define comola variación numérica de
la variable, es el recorrido que toma la variable desde el valor más
pequeño hasta el valor más alto. Se calcula mediante la siguiente
ecuación:
R A N G O O R E C O R R I D O (R)
7.
R A NG O O R E C O R R I D O (R)
Tiempo recorrido en minutos por un grupo de personas para realizar una actividad.
8.
V A LO R M Á S A L T O
Tiempo recorrido en minutos por un grupo de personas para realizar una actividad.
9.
V A LO R M Á S B A J O
Tiempo recorrido en minutos por un grupo de personas para realizar una actividad.
10.
R A NG O O R E C O R R I D O
Límite superior = Ls = 75
min Límite inferior = Li = 45
min
Rango = R = [75 - 45] = 3 0
minutos
11.
El número deintervalos (m( se define de forma convencional, procurando
mantenerse entre 5 y 2 0 intervalos o clases.
Sin embargo, para evitar caer en los extremos, es posible obtener una
aproximación usando la siguiente fórmula:
N Ú M E R O D E I N T E R V A L O S O
C L A S E S
n = número total de datos
En caso de que se analice la totalidad de elementos de la población se representa
con N.
12.
E J EM P L O
Tiempo recorrido en minutos por un grupo de personas para realizar una actividad.
n=50
13.
N Ú ME R O D E I N T E R V A L O S O
C L A S E S
m = 1 + 3,3 * log
(50(
m = 1 + 3,3 * 1,6989
m = 1 + 5,60637
m = 6,60637
Es posible construir de 6
ó 7 intervalos,
Pero lo vamos a definir en
el paso siguiente, al
calcular la amplitud del
intervalo.
14.
A M PL I T U D D E L I N T E R V A L O D E
C L A S E (C)
Para el cálculo de la amplitud del intervalo se toma el cociente
entre la amplitud del rango (AR) y el número de intervalos (m) que
se considere más adecuado, teniendo en cuenta que este resultado
(C) debe ser una cantidad exacta.
15.
A M PL I T U D D E L I N T E R V A L O D E
C L A S E (C)
Rango = 3 0
Si m = 6, la amplitud del intervalo es C =
30/6, C = 5 minutos
Si m = 7, la amplitud del intervalo es C = 30/7,
C = 4,285714286... minutos
En este caso se recomienda usar 6 intervalos (m = 6(, con una amplitud de 5 minutos (C = 5(.
Si la amplitud del intervalo (C( no es exacta con ninguno de los dos valores arrojados por la fórmula, el número de intervalos
se puede incrementar hasta hacer la división exacta.
16.
L Í MI T E S D E L O S I N T E R V A L O S
Al construir los intervalos, cada uno de ellos está determinado por
dos extremos: límite inferior (li) y límite superior (ls).
Para el primer intervalo, el límite inferior es igual al límite inferior
del rango Li y el límite superior de este intervalo se conforma
sumando la amplitud (C) al límite inferior.
El segundo intervalo parte del límite superior del primer intervalo
y se le suma la amplitud para obtener el límite superior. Este
proceso se repite para el total de intervalos en los cuales se
agrupó el conjunto de datos.
17.
L Í MI T E S D E L O S I N T E R V A L O S
Importante: en el primer intervalo se toma el límite inferior y el superior, es decir cerrado en
ambos extremos [45 – 50].
En los demás intervalos no toman el extremo inferior, pero sí toman el superior, o sea abierto en extremo
inferior y cerrado en el extremo superior (50 – 55]. De esta forma se da continuidad a los valores
asumidos por la variable.
18.
5
9
1
2
1
1
7
6
T A BU L A C I Ó N
Luego de construir los intervalos, se procede al conteo o
frecuencia de la información, ubicando cada dato en el
intervalo al cual corresponde,
M A RC A D E C L A S E O P U N T O
M E D I O
Es el valor representativo para cada intervalo. Se
calcula promediando el límite inferior y superior en cada
intervalo.
22.
M A RC A D E C L A S E O P U N T O
M E D I O
Es importante resaltar que la marca de clase al pasar de un intervalo
a otro, aumenta la misma cantidad del intervalo C.