1. Definición de Estadística
La Estadí stica trata del recuento, ordenación y clasificación de los
datos obtenidos por las observaciones, para poder hacer comparaciones y
sacar conclusiones.
Un estudio estadístico consta de las siguientes fases:
Recogida de datos.
Organización y representación de datos.
Análisis de datos.
Obtención de conclusiones.
Co nce p t o s d e Es t a d í s t i ca
Población
Una población es el conjunto de todos los elementos a los que se
somete a un estudio estadístico.
Individuo
Un individuo o unidad estadística es cada uno de los elementos
que componen la población.
Muestra
Una muestra es un conjunto representativo de la población de
referencia, el número de individuos de una muestra es menor que el de la
población.
Muestreo
El muestreo es la reunión de datos que se desea estudiar,
obtenidos de una proporción reducida y representativa de la población.
Valor
Un valor es cada uno de los distintos resultados que se pueden
obtener en un estudio estadístico. Si lanzamos una moneda al aire 5
veces obtenemos dos valores: cara y cruz.
Dato
Un dato es cada uno de los valores que se ha obtenido al realizar un
estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5
datos: cara, cara, cruz, cara, cruz.
Tablas estadísticas
Son utilizadas para organizar los datos. Según el número de observaciones
y según el recorrido de la variable estadística (mayor valor menos el menor
valor), tenemos los siguientes tipos de tablas estadísticas:
Tablas Tipo I: Cuando el tamaño de la muestra y el recorrido de la variable
son pequeños, por ejemplo si tenemos una muestra de las edades de 5
personas, por lo que no hay que hacer nada especial simplemente anotarlas
de manera ordenada en filas o columnas.
Ejemplo
Variable: "Edad de los 5 miembros de una familia"
Valores observados: 5, 8, 16, 38, 45
Tablas Tipo II: Cuando el tamaño de la muestra es grande y el recorrido de
la variable es pequeño, por lo que hay valores de la variable que se repiten.
Ejemplo
Si preguntamos el número de personas activas que hay en 50 familias
obtenemos la siguiente tabla:
2. 2 1 2 2 1 2 4 2 1 1
2 3 2 1 1 1 3 4 2 2
2 2 1 2 1 1 1 3 2 2
3 2 3 1 2 4 2 1 4 1
1 3 4 3 2 2 2 1 3 3
Podemos observar que la variable toma valores comprendidos entre 1 y 4,
por lo que precisaremos una tabla en la que resumamos estos datos
quedando la siguiente tabla:
Personas activas Nº de familias
1 16
2 20
3 9
4 5
Total 50
Tablas Tipo III: Se utilizan cuando el tamaño de la muestra y el recorrido de
la variable son grandes, por lo que será necesario agrupar en intervalos los
valores de la variable. También obligatorio usarla cuando la variable sea
cuantitativa continua.
Ejemplo
Si a un grupo de 30 alumnos les preguntamos el dinero que en ese
momento tienen ahorrado, nos encontramos con los siguientes datos:
450 1152 250 300 175 80 25 2680 605 785
1595 2300 5000 1200 100 5 180 200 675 500
375 1500 205 985 185 125 315 425 560 1100
La variable estadística tiene un recorrido muy grande, (Mayor valor - Menor
valor = 5000 - 5 = 4995), por lo que sí queremos hacer una tabla con estos
datos tendremos que tomar intervalos. Para decidir la amplitud de los
intervalos, necesitaremos decidir ¿cuántos intervalos queremos?.
Normalmente se suele trabajar con no más de 10 o 12 intervalos.
Por lo que tomaremos intervalos de amplitud 500
Debemos tener en cuenta las siguientes consideraciones:
Tomar pocos intervalos implica que la "pérdida de información" sea mayor.
Los intervalos serán siempre Cerrados por la izquierda y Abiertos por la
Derecha [Li-1 , Li).
Con estas recomendaciones tendremos la siguiente tabla:
3. Intervalo Nº de alumnos
[0,500) 16
[500,1000) 6
[1000,1500) 3
[1500,2000) 2
[2000,2500) 1
[2500,3000) 1
[3000,3500) 0
[3500,4000) 0
[4000,4500) 0
[4500,5000) 0
[5000,5500) 1
Tablas de frecuencias
Ahora iremos añadiendo más columnas según los cálculos y la información
que necesitemos. Podemos ir completando la tabla con las frecuencias, que
definimos a continuación:
Frecuencia absoluta. Es el número de veces que aparece cualquier valor
de la variable. Se representa por fi. En algunos libros de texto nos la
encontraremos representada por ni.
Frecuencia absoluta acumulada. Es la suma de la frecuencia absoluta de
un valor de la variable con todos los anteriores. Se representa por Fi.
Frecuencia relativa. Es el cociente entre la frecuencia absoluta y el número
de datos (N). Se representa por hi. En algunos libros de texto nos la
encontraremos representada por ri. Al multiplicarla por 100 obtenemos el
porcentaje de individuos que presentan esta característica.
Frecuencia relativa acumulada. Es la suma de la frecuencia relativa de un
valor de la variable con todos los anteriores. También se puede definir como
el cociente entre la frecuencia absoluta acumulada y el número total de
datos. Se representa por Hi.
Media aritmética
En matemáticas y estadística, la media aritmética (también llamada promedio o
simplemente media) de un conjunto finito de números, es igual a la suma de todos sus
valores dividida entre el número de sumandos.
Expresada de forma más intuitiva, podemos decir que la media (aritmética) es la
cantidad total de la variable distribuida a partes iguales entre cada observación.
Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen en
sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes
iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la
información de una distribución (dinero en el bolsillo) suponiendo que cada observación
(persona) tuviera la misma cantidad de la variable.
También la media aritmética puede ser denominada como centro de gravedad de una
distribución, el cual no está necesariamente en la mitad.
Una de las limitaciones de la media aritmética es que se trata de una medida muy
sensible a los valores extremos; valores muy altos tienden a aumentarla mientras que
4. valores muy bajos tienden a reducirla, lo que implica que puede dejar de ser
representativa de la población.
Definición
Dados los nnúmeros , la media aritmética se define simplemente
como:
Por ejemplo, la media aritmética de 8, 5 y -1 es igual a:
Se utiliza la letra X con una barra horizontal sobre el símbolo para representar la media
de una muestra ( ), mientras que la letra µ (mi) se usa para la media aritmética de una
población, es decir, el valor esperado de una variable.
http://www.vitutor.com/estadistica/descriptiva/a_9.html; mediana
http://www.vitutor.net/2/11/moda_media.html; moda