1. Republica Bolivariana De Venezuela
Ministerio Del Poder Popular Para La Educación
Superior
Instituto universitario Politécnico Santiago Mariño
Bachiller:
Yorgelis Bolívar
CI. 26.958.681
Sección ‘cv’
Barcelona 26 de Junio de 2016
2. *
* Los datos de una investigación
se pueden agrupar de dos
formas diferentes. Si estos
datos no son muy numerosos;
es decir, no más de 30
observaciones, se debe
utilizar una tabla de
distribución de frecuencias
para datos no agrupados. Si
por el contrario, las
observaciones de la
investigación son muy
numerosas, entonces, se debe
utilizar una tabla de
distribución de frecuencias
para datos agrupados.
3. *
Para aprender cómo elaborar
una tabla de distribución de
frecuencias para datos no
agrupados, vamos a tomar
como ejemplo los datos de
ventas a crédito (en miles)
que otorgó un comercio a
cuatro clientes. Estos son
los siguientes:
25, 50, 50, 25, 50, 75, 50,
25, 100, 25, 75, 50, 50,
75, 50, 25,
A cada uno de estos valores
lo denominamos
observación y a la suma de
estas observaciones le
llamamos total de
observaciones,
simbolizándose por N. Por
tanto, el total de
observaciones es “N=16”.
Ahora contemos la
cantidad de veces que
aparece cada observación.
Así determinamos que 25
aparece cinco veces, 50
aparece siete veces, 75
aparece tres veces y 100,
aparece una sola vez.
Una vez realizado este
conteo se procede a
elaborar la tabla,
quedando dicha tabla de la
forma siguiente:
4. *
Para aprender cómo elaborar una tabla de distribución de frecuencias para datos
agrupados, vamos a tomar como ejemplo, los datos de ventas (en millones) de treinta
representantes de ventas recolectadas durante un mes por una empresa agrícola
productora de arroz.
10, 13, 12, 10,12, 8, 4, 518,19, 19, 22, 18, 22, 23, 22, 19, 28, 24, 23, 27, 30, 29, 30,
30, 29, 30, 29, 17, 15,
El primer paso que hay que dar es organizar los datos. En estadística estos se pueden
ordenar de forma ascendente o de forma descendente. Voy a ordenar en forma
ascendente.
4, 5, 8, 15, 117, 10,10,12.12,13,, 18,18, 19, 19,19, 22,22,22, 23, 23, 24,24,28,
29,29,29,29,30, 30,30,30
El segundo paso a dar es determinar el rango o amplitud de la serie de datos. Esta se
determina restando del valor máximo el valor mínimo, del conjunto de datos. Por tanto:
Rango (R)
R= Valor máximo-Valor mínimo
R= 30-4
R= 26
El tercer paso a realizar es determinar la amplitud del intervalo de clases.
5. El cuarto y último paso a dar es
determinar la cantidad de intervalo de
clase. Para esto, vamos a utilizar la
formula siguiente: C. I. C. = R/A.I.C.
Sustituyende valores obtenidos
anteriormente, tenemos:
La cantidad de clase ha dado 6, esto
significa que la tabla contendrá seis
clases o categorías. En tanto que la
amplitud de clase ha dado 5, esto
significa que el tamaño de intervalo de
la clase serán de una anchura de 5.
Ahora para llevar los datos a la tabla,
determinemos los límites de cada
clase. Para esto, tomemos el valor
mínimo de las observaciones, que en
este caso es 4 y partiendo de 4 cuatro
vamos sumándole el tamaño de
intervalo de clase que es 5. Por tanto:
Limites inferiores (Li):
4, 4+5=9, 9+5=14, 14+5=19, 1
9+5=24 y 24+5=29
Paramos la sumatoria en 6 clases; ya
que, esta es la cantidad de clase
necesarias, según los cálculos
anteriores.
Ahora para determinar los
limites superiores vamos a
tomar el tamaño de intervalo
de clase, que en nuestro caso
es 5 y le restamos 1, por
tanto: 5 – 1 = 4. Ahora se toma
cada uno de los límites
inferiores y le sumamos 4. Asi
tendremos:
Limites superiores (Ls):
4+4=8, 9+4=13, 14+4=18,
19+4=23, 24+4=28, 29+4=
33.
6. . De esta forma tenemos nuestra primera columna, conformada
por los límites inferiores y por los límites superiores.
Finalmente, contemos la cantidad de valores que hay contenidos
en cada clase o categoría comprendida entre los limites. De 4 a 8
hay tres, de 9 a 13 hay cinco, de 14 a 18 hay cuatro, de 19 a 23
hay ocho, de 24 a 28 hay tres y de 29 a 33 hay 7.
4, 5, 8, 15, 17, 10, 10, 12, 12, 13, 18, 18,19, 19, 19,22, 22, 22,
23,23, 24, 27, 28, 29, 29, 29, 30, 30, 30, 30,
Una vez realizado este conteo se procede a elaborar la tabla,
quedando dicha tabla de la forma siguiente:
7. *
Los intervalos de
clase se emplean si
las variables toman
un número grande de
valores o la variable es
continua.
Se agrupan los valores e
n intervalos que tengan
la misma
amplitud denominados c
lases. A cada clase se le
asigna su frecuencia
correspondiente.
*Límites de la clase
Cada clase está delimitada por
el límite inferior de la clase y
el límite superior de la clase.
*Amplitud de la clase
La amplitud de la clase es
la diferencia entre el límite
superior e inferior de la clase.
*Marca de clase
La marca de clase es el punto
medio de cada intervalo y es
el valor que representa a todo
el intervalo para elcálculo de
algunos parámetros.
8. *
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34,
29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11,
13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41,
48, 15, 32, 13.
1º se localizan los valores menor y mayor de
la distribución. En este caso son 3 y 48.
2º Se restan y se busca un número entero un
poco mayor que la diferencia y que sea
divisible por el número de intervalos de
queramos poner.
Es conveniente que el número de intervalos
oscile entre 6 y 15.
En este caso, 48 - 3 = 45, incrementamos el
número hasta 50 : 5 = 10 intervalos.
Se forman los intervalos teniendo presente
que el límite inferior de una clase pertenece
al intervalo, pero el límite superior no
pertenece intervalo, se cuenta en el siguiente
intervalo.
9. * *Frencuencia simple y acumulada
La distribución de frecuencias puede ser simple o
agrupada.
La distribución de frecuencias simple es una tabla que
se construye con base en los siguientes datos: clase o
variable (valores numéricos) en orden descendente o
ascendente, tabulaciones o marcas de recuento y
frecuencia.
La distribución de frecuencias agrupadas o acumulada
es una tabla que contiene las columnas siguientes:
intervalo de clase, puntos medios, tabulación
frecuencias y frecuencias agrupadas. EJEMPLO B:
Se preguntó a un grupo de 35 alumnos su estatura en
cm.
La regla de Sturges,
propuesta por Herbert
Sturges en 1926, es una
regla práctica acerca del
número de clases que
deben considerar al
elaborarse un histograma.1
Este número viene dado
por la siguiente expresión:
donde M es
el tamaño de la muestra.
Que puede pasarse
a logaritmo base 10 de la
siguiente forma
siendo N la
cantidad de datos.
El valor de c (número de
clases) es común
redondearlo al entero más
cercano
10. *
Media aritmética: La media es el
valor promedio de la distribución.
Mediana: Es el valor que ocupa el lugar
central de todos los datos cuando éstos
están ordenados de menor a mayor. Es
decir divide a la serie en dos partes
iguales en la que el 50% de los datos
están por debajo de la Md y el otro 50%
está por encima de ella.
La mediana se representa por Md.
La mediana se puede hallar sólo
para variables cuantitativas.
Cálculo de la mediana
1 Ordenamos los datos de menor a
mayor.
2 Si la serie tiene un número
impar de medidas la mediana es
la puntuación central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6 Md= 5
3 Si la serie tiene un número
par de puntuaciones la mediana es
la media entre las
dos puntuaciones centrales.
7, 8, 9, 10, 11, 12 Md= 9.5
Cálculo de la mediana para datos
agrupados
La mediana se encuentra en
el intervalo donde la frecuencia
acumulada llega hasta la mitad de
la suma de las frecuencias
absolutas.
Es decir tenemos que buscar el
intervalo en el que se encuentre
el 50% de los datos.
11. *Ejemplo
Calcular la mediana de una
distribución estadística que
viene dada por la siguiente
tabla:
Clases fi Fac
72 - 74 8 100
69 - 71 27 92
66 - 68 42 65
63 - 65 18 23
60 - 62 5 5
100
El procedimiento es igual
al utilizado para calcular el
Percentil cincuenta
(Pc 50). para ello debemos
determinar el 50% de los
datos.
el 50% de los 100 datos es
50, entonces debemos
hallar la puntuación que
deja por debajo de ella al
50 % de los datos (el otro
50% está por encima)
12. * Moda: La moda es el valor que más
se repite en una distribución.
MODA (PARA DATOS NO AGRUPADOS)
La moda es el valor que tiene mayor
frecuencia absoluta.
Se representa por Mo.
Se puede hallar la moda para variables
cualitativas y cuantitativas.
Hallar la moda de la serie de datos:
Xi: 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
Si en un grupo hay dos o varias
puntuaciones con la misma
frecuencia y esa frecuencia es la
máxima, la distribución es bimodal, si
son tres las que mas se repiten será
trimodal y cuando se mayo a cuatro el
número de Mo, generalizaremos
diciendo que es multimodal o
polimodal, es decir, que tiene varias
modas.
Yi: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9,
9 Mo= 1, 5, 9 (trimodal)
Nota: Cuando todas
las puntuaciones de un grupo tienen
la misma frecuencia, no hay moda.
Zi: 2, 2, 3, 3, 6, 6, 9, 9
*Cálculo de la moda para datos
agrupados
Debemos considerar que todos los intervalos
tienen la misma amplitud. Por tal motivo y
para efectos de nuestro curso,
consideraremos que la Mo es el punto medio
(xi) del intervalo que presente la mayor
frecuencia. considerando también el caso en
que la mayor frecuencia puede presentarse
en mas de un intervalo (como ocurría para los
datos no agrupados) en cuyo caso una
distribución pudiera presentar mas de una
mida.
Clases fi
72 - 73 8
69 - 71 27
66 - 68 42
63 - 65 18
60 - 62 5
100
El intervalo en el que se encuentra
la mayor frecuencia es en 66 -
68, donde fi es 42, para determinar
la moda de esta distribución será
necesario calcular el punto medio
de ese intervalo:
Xi = (66 + 68) / 2 = 67
Xi =67
por tanto, la moda de esta
distribución es Mo = 67
13. *aplicación de la
mediana
La mediana se usa cuando los
valores extremos de los datos
no son confiables. Por ejemplo
si tengo valores de un
velocímetro de automóvil
(que es un medidor analógico,
no digital) por su diseño, los
valores extremos no son
confiables. Si marca que voy a
5 Km/h seguro que está mal, si
marca 250 Km/h (suponiendo
que alcance esa velocidad) la
velocidad verdadera seguro
que no es esa.
Si uso la media aritmética
(que es una medida que
aprovecha todos los valores)
obtendré un valor errado. En
cambio si uso la mediana
como medida de tendencia
central o posición, el valor
será confiable
*Aplicación de la moda
MODA: Es el dato que más
se repite en la cuenta. Si
existen dos datos que se
repite un numero igual de
veces entonces el conjunto
será bimodal. Ejemplo:
Numero de personas en
distintos carros en una
carretera: En estadística la
moda es el valor que
cuenta con una mayor
frecuencia en una
distribución de datos
14. *
* MEDIA ARITMÉTICA.(X) Cuando se tienen distribuciones de frecuencia y siempre
que el valor del intervalo de clase sea constante, es decir, el mismo en cada
una de las clases, se puede calcular la Media a través del Método de los desvíos
unitarios o Abreviado; Igualmente se puede utilizar el Método directo.
* METODO ABREVIADO. Pasos para calcular la Media Aritmética: 1.- Se elige una
media aritmética supuesta (Xa), la cual es el valor del punto medio de una de
las clases; Aunque puede tomarse el punto medio de cualquiera de las clases y
obtener el mismo resultado, por facilidad en el cálculo se acostumbra a elegir
el de la clase de mayor frecuencia o el de aquella que esté ubicada hacia en el
centro de la escala.
Ejemplo
Se anexa una columna fiX en la cual se colocan los productos entre la frecuencias
fi y la desviación X correspondiente.
.- Se suman algebraicamente los valores de la columna fiX.
.- Se reemplazan los valores obtenidos en la fórmula: X = Xa + EfiX. i N
EJEMPLO: CLASE fi x fix 66-68 1 6 6 63-65 2 5 10 60-62 4 4 16 57-59 4 3 12 54-56 5
2 10 51-53 7 1 7 x = 49 + 2.05 48-50 8 0 0 45-47 5 -1 -5 x = 51.05 42-44 3 -2 -6 39-
41 2
El puntaje medio es: 51.05 36-38 1 -4 -4 33-35 2 -5 -10
15. *METODO DIRECTO. (Método largo) Pasos para calcular la media
aritmética, usando éste método:
1.- Se elabora una columna con los puntos medios xi de cada clase.
2.- En otra columna se escribe el producto entre las frecuencias y el
punto medio de cada clase (fi.xi)
3.- Se obtiene la sumatoria de los valores de la columna fi.xi
4.- Se reemplazan los valores obtenidos en la fórmula siguiente: E
EJEMPLO: CLASE fi xi fixi 66-68 1 67 67 63-65 2 64 128 60-62 4 61 244
57-59 4 58 232 x= 2246 54-56 5 55 275 44 51-53 7 52 364 x = 51.05 48-
50 8 49 392 45-47 5 46 230 42-44 3 43 129 39-41 2 40 80 36-38 1 37 37
33-35 2 34 68 N=44 Efixi= 2246
Para calcular la mediana a partir de un conjunto de datos que han sido
organizados previamente en una tabla de distribución de frecuencias,
se procede de la siguiente manera:
1.- Se anexa a la tabla dada una columna fa de frecuencias
acumuladas.
16. 2.- Se divide entre 2 el número total de casos, obteniendo
N/2.Es decir, se determina el número de casos que han de
estar por debajo y por encima de la mediana.(En la tabla del
ejemplo que usaremos, N=38 por lo tanto N/2= 38/2= 19.
Luego, la mediana es el valor que deja 19 observaciones tanto
por debajo como por encima de él.
3.- Se identifica en la columna fa, un valor que sea igual o
inmediato superior a N/2; En ésta clase está la mediana.(En la
tabla del ejemplo dado, en la columna fa, el valor 24 es
inmediato superior a 19 por lo cual, la clase 90-94 contiene a
la mediana.)
4.- Se identifica la frecuencia acumulada fa de la clase
anterior a la que contiene a la mediana. ( En el ejemplo, 14 es
la frecuencia acumulada de la clase 85-89 que precede a 90-
94 que contiene a la mediana.)
5.- Se identifica la frecuencia fi de la clase que contiene a la
mediana. En el ejemplo ésta es 10
. 6.- Se identifica el límite real inferior de la clase que
contiene a la mediana. En el ejemplo, éste es 89.5.
7.- Se reemplazan éstos valores en la fórmula