1. República Bolivariana de Venezuela
Ministerio del Poder Popular para la Educación
Superior
Instituto Universitario Politécnico “Santiago Mariño”
Sede – Barcelona
Nombre
Booz Gonzalez C.I 26293477
Profesor
Pedro Beltrán
Sección CV
2. Una tabla de frecuencia está formada por las categorías o valores de una variable y
sus frecuencias correspondientes. Esta tabla es lo mismo que una distribución de
frecuencias. Esta tabla se crea por medio de la tabulación y agrupación, la cual es un
método sencillo como lo habíamos empezado a ver en la tabla de datos, Se realiza el
mismo procedimiento de tabulación anteriormente descrito si el número de valores
observados para la variable, se trabaja con una sola variable, descontando los
repetidos son pequeños, si existen repetidos la frecuencia f es el número de
repeticiones de un valor de X dado, Sin embargo, cuando el conjunto de datos es
mayor, resulta laborioso trabajar directamente con los valores individuales observados
y entonces se lleva a cabo, por lo general, algún tipo de agrupación como paso
preliminar, antes de iniciar cualquier otro tratamiento de los datos.
Ejemplo: agrupar en una tabla 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 5
X 1 2 3 4 5
F 2 4 3 1 1 S 11
3. Son divisiones o categorías en las cuales se agrupan un conjunto de datos ordenados
con características comunes. En otras palabras, son fraccionamientos del rango o
recorrido de la serie de valores para reunir los datos que presentan valores
comprendidos entre dos limites.
Para organizar los valores de la serie de datos hay que determinar un número de
clases que sea conveniente. En otras palabras, que ese número de intervalos no
origine un número pequeño de clases ni muy grande. Un número de clases pequeño
puede ocultar la naturaleza natural de los valores y un número muy alto puede
provocar demasiados detalles como para observar alguna información de gran utilidad
en la investigación.
Es el espacio comprendido entre 2 limites ( superior e inferior) esta
magnitud es obtenida como.
Magnitud del intervalo =
4. Para calcular el tamaño de clase es necesario calcular primeramente el número de
clases utilizando la regla de Sturges y después se obtiene el tamaño de clase
dividiendo el rango entre el número de clases.
No. De clases (Regla de Sturges): 1 + 3.332 log N
Frecuencia Simple
Frecuencia absoluta de un valor de la variable estadística X, es el número de veces
que aparece ese valor en el estudio. Se suele denotar por Fi a la frecuencia absoluta
del valor X = xi de la variable X. Dada una muestra de N elementos, la suma de todas
las frecuencias absolutas debe dar el total de la muestra estudiada N.
Frecuencia relativa: (fi), es el cociente entre la frecuencia absoluta y el tamaño de la
muestra (N). Es decir:
siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en una
distribución de frecuencias. Si multiplicamos la frecuencia relativa por 100
obtendremos el porcentaje o tanto por ciento (pi).
5. Frecuencia absoluta acumulada: (Ni), se refiere al total de las frecuencias
absolutas para todos los eventos iguales o anteriores que un cierto valor, en una
lista ordenada de eventos.
Frecuencia relativa acumulada: (Fi), es el cociente entre la frecuencia absoluta
acumulada y el total de la muestra.
Ejemplo: supongamos que las calificaciones de un estudiante de secundaria fueran
las siguientes:
18, 13, 12, 14, 11, 08, 12, 15, 05, 20, 18, 14, 15, 11, 10, 10, 11, 13. Entonces:
La frecuencia absoluta de 11 es 3, pues 11 aparece 3 veces.
La frecuencia relativa de 11 es 0.17, porque corresponde a la división 3/18 ( 3 de las
veces que aparece de las 18 notas que aparecen en total).
La frecuencia absoluta acumulada para el valor 11 es 7, porque hay 7 valores
menores o iguales a 11.
La frecuencia relativa acumulada para el valor 11 es 0.38, porque corresponde a la
división 7/18 (frecuencia absoluta acumulada dividida entre el número total de
muestras).
6. Al describir grupos de diferentes observaciones, con frecuencia es conveniente
resumir la información con un solo número. Este número que, para tal fin, suele
situarse hacia el centro de la distribución de datos se denomina medida o
parámetro de tendencia central o de centralización. Cuando se hace referencia
únicamente a la posición de estos parámetros dentro de la distribución,
independientemente de que ésta esté más o menos centrada, se habla de estas
medidas como medidas de posición.1 En este caso se incluyen también los
cuantiles entre estas medidas.
Entre las medidas de tendencia central tenemos:
• Media aritmética
• Media ponderada
• Media geométrica
• Media armónica
• Mediana
• Moda
Se debe tener en cuenta que existen variables cualitativas y variables
cuantitativas, por lo que las medidas de posición o medidas de tendencia se usan
de acuerdo al tipo de variable que se está observando, en este caso se observan
variables cuantitativas.
7. Aún y cuando existen varias media, la media aritmética es la mas frecuentemente
utilizada en Estadística. La media aritmética, es la suma de las puntuaciones o
valores originales dividida entre el número de ellas.
Ejemplo:
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
8. La mediana (Md) es una medida de posición que divide a la serie de valores en
dos partes iguales, un cincuenta por ciento que es mayor o igual a esta y otro
cincuenta por ciento que es menor o igual que ella. Es por lo tanto, un parámetro
que esta en el medio del ordenamiento o arreglo de los datos organizados,
entonces, la mediana divide la distribución en una forma tal que a cada lado de la
misma queda un número igual de datos.
Para encontrar la mediana en una serie de datos no agrupados, lo primero que
se hace es ordenar los datos en una forma creciente o decreciente y luego se
ubica la posición que esta ocupa en esa serie de datos; para ello hay que
determinar si la serie de datos es par o impar, luego el número que se obtiene
indica el lugar o posición que ocupa la mediana en la serie de valores, luego la
mediana será el número que ocupe el lugar de lo posición encontrada.
9. La moda es la medida de posición que indica la magnitud del valor que se presenta
con más frecuencia en una serie de datos; es pues, el valor de la variable que más
se repite en un conjunto de datos. De las medias de posición la moda es la que se
determina con mayor facilidad, ya que se puede obtener por una simple observación
de los datos en estudio, puesto que la moda es el dato que se observa con mayor
frecuencia. La moda se designa con las letras Mo.
Cálculo de la moda para datos agrupados
1º Todos los intervalos tienen la misma amplitud.
Li es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.
También se utiliza otra fórmula de la moda que da un valor aproximado de ésta:
10. Mediana:
Para datos que contienen 1 o 2 valores sumamente grandes o muy pequeños, la
media aritmética puede no ser representativa. El punto central puede describirse
mejor utilizando una medida de tendencia central denominada mediana.
Mediana: Punto medio de los valores después de ordenarlos de menor a mayor, o de
mayor a menor. Se tiene que 50% de las observaciones se encuentran por arriba de
la mediana y 50% por debajo de ella.
Las propiedades de la mediana son:
Es única, sólo existe una mediana para un conjunto de datos.
No se ve afectada por valores muy grandes o muy pequeños.
Puede calcularse para una distribución de frecuencias con una clase de extremo
abierto, si la medina no se encuentra en una clase de tal extremo.
Puede obtenerse para datos de nivel de razón, de intervalo y ordinal(excepto para el
nominal).
11. Moda:
El valor de la observación que aparece con más frecuencia.
Puede determinarse para todos los niveles de datos: nominal, ordinal, de intervalo y
de razón. No se ve afectada por valores muy altos o muy bajos. Al igual que la
mediana, puede utilizarse como medida de tendencia central para distribuciones con
clases de extremo abierto.
Desventajas de la moda:
Para muchos conjuntos de datos no hay valor modal porque ningún valor aparece
más de una vez.
Para algunos conjuntos de datos hay más de una moda (bimodal = que tiene dos
modas).
12. Cálculo de la moda para datos agrupados
Debemos considerar que todos los intervalos tienen la misma amplitud. Por tal motivo y para efectos de
nuestro curso, consideraremos que la Mo es el punto medio (xi) del intervalo que presente la mayor
frecuencia. considerando también el caso en que la mayor frecuencia puede presentarse en mas de un
intervalo (como ocurría para los datos no agrupados) en cuyo caso una distribución pudiera presentar
mas de una mida.
El intervalo en el que se encuentra la mayor frecuencia es en 66 -
68, donde fi es 42, para determinar la moda de esta distribución
será necesario calcular el punto medio de ese intervalo:
Xi = (66 + 68) / 2 = 67
Xi =67
por tanto, la moda de esta distribución es Mo = 67
13. Cálculo de la mediana
1° Ordenamos los datos de menor a mayor.
- La mediana de un conjunto con un número impar de datos es, una vez ordenados los
datos, el dato que ocupa el lugar central.
Ejemplo:
Calcular la mediana del conjunto de datos: - También podemos usar la siguiente fórmula
para determinar la posición del dato central:
(n + 1) /2 = mediana datos impares.
Ejemplo:
Calcular la mediana del conjunto de datos: