1. Q
Historia de la Estadística
Se cree que los orígenes de la estadística están ligados al
antiguo Egipto y a los censos chinos hace unos 4000
años, aproximadamente.
Desde esa época, diversos estados realizaron estudios
sobre algunas características de sus poblaciones, sus
riquezas, posesiones, etc.
En 1662, John Graunt, un mercader Inglés, publicó un
libro sobre los nacimientos y defunciones ocurridos en
Londres; el libro tenia conclusiones acerca de ciertos
aspectos relacionados con estos acontecimientos. Esta
obra es considerada como el punto de partida de la
estadística moderna.
2. La palabra estadística comenzó a usarse en el siglo
XVIII, en Alemania, en relación a estudios donde
los grandes números, que representaban datos,
eran de importancia para el estado. Sin embargo, la
estadística moderna se desarrolló en el siglo XX a
partir de los estudios de Karl Pearson.
Hoy la estadística tiene gran importancia, no sólo
por que presenta información, sino que además
permite inferir y y predecir lo que va a ocurrir, y
por lo tanto, es una herramienta fundamental a la
hora de tomar decisiones de importancia.
Historia de la Estadística
3. Conceptos Básicos
En muchas ocasiones, para llevar
a cabo una investigación se hacen
encuestas, las cuales son dirigidas
a una muestra representativa de la
población. Para comprender mejor
este tipo de estudios es importante
que conozcas los siguientes
términos básicos:
4. POBLACION
Es un conjunto de personas, eventos o cosas de las
cuales se desea hacer un estudio, y tienen una
característica en común.
MUESTRA
Es un subconjunto cualquiera de la población; es
importante escoger la muestra en forma aleatoria (al
azar), pues así se logra que sea representativa y se
puedan obtener conclusiones más afines acerca de las
características de la población.
5. Para estudiar alguna característica especifica
de la población se pueden definir los
siguientes tipos de variables:
VARIABLES CUALITATIVAS
Relacionadas con características no numéricas
de un individuo.
por ejemplo: Atributos de una persona
Estado civil de una persona
Estrato
Gustos - hobies
6. VARIABLES CUANTITATIVAS
Relacionadas con las características
numéricas del individuo.
Las variables cuantitativas se dividen en:
Discretas (aquellas que no admiten otro valor
entre 2 valores distintos y consecutivos) o
Continuas (aquellas que pueden tomar una
infinidad de valores entre dos de ellos).
7. EN UNA INVESTIGACION SE RECOLECTA
LA INFORMACION
Al ordenar datos muy numerosos, es usual agruparlos en clases o
categorías. Al determinar cuantos pertenecen a cada clase, establecemos
la frecuencia. Construimos así una tabla de datos llamada Tabla de
frecuencias.
EJEMPLO
Los siguientes datos corresponden a las notas obtenidas por un curso
de 24 alumnos en un trabajo de matemática:
4.2 5.0 5.6 5.0
3.2 4.2 5.6 6.0 2.8
3.9 4.2 4.2 50 50
3.9 3.9 3.2 3.2 4.2
5.6 6.0 6.0 3.2 6.0
8. Ordenemos estos datos en la siguiente tabla:
Nota Frecuencia
Absoluta (f i)
Frecuencia
Relativa (h i)
Frecuencia
relativa
porcentual (%)
2.8 1 1/24 4.2
3.2 4 4/24 16.7
3.9 3 3/24 12.5
4.2 5 5/24 20.8
5.0 4 4/24 16.7
5.6 3 3/24 12.5
6.0 4 4/24 16.7
9. La FRECUENCIA ABSOLUTA de una clase es el numero de
datos que forma dicha clase
La FRECUENCIA RELATIVA corresponde a la razón entre la
frecuencia absoluta y el total de datos, la cual se puede
expresar mediante el uso de porcentajes.
10. Tabla de frecuencia de datos
agrupados
En ocasiones, el agrupar los datos en intervalos, nos
puede ayudar para realizar un mejor análisis de ellos.
Consideremos los siguientes datos, expresados en
metros, correspondientes a las estaturas de 80
estudiantes de cuarto año de educación media.
12. Para construir una tabla de frecuencias para datos
agrupados, determinamos el tamaño de cada intervalo,
dividiendo el valor del rango por la cantidad de intervalos
que se desea obtener.
Importante recordar:
El rango, está dado por la diferencia
entre el máximo y el mínimo valor de la
variable.
El tamaño del intervalo se aproxima al
impar más cercano.
13. RANGO
Mide la amplitud de los valores de la
muestra y se calcula por diferencia entre
el valor más elevado y el valor más bajo
que se presenta en la agrupación de
datos utilizados para realizar el análisis
objeto de estudio.
Notamos que la estatura mayor es 1,93 m
y la estatura menor es 1,63m; El rango es
de 0,30m = 30cm. Formaremos 9
intervalos. Para calcular el tamaño de cada
uno dividimos 30 / 9 = 3,33 ≈ 4. si no da
entero, lo aproximamos.
14. EL TAMAÑO DEL INTERVALO SE CALCULA ASI:
En nuestro ejercicio: √80= 8,94≈9, éste debe ser
el número de intervalos.
15. Intervalos Frecuencia
Absoluta
1,63 – 1,65
1,66 – 1,69
1,70 – 1,73
1,74 – 1,77
1,78 – 1,81
1,82 – 1,84
1,85 – 1,87
1,88 – 1,90
1,91 – 1,93
Total : 80
Notamos que la estatura mayor es 1,93 m y la estatura menor
es 1,63m; El rango es de 0,30m = 30 cm. Formaremos 9
intervalos. Para calcular el tamaño de cada uno dividimos 30 :
9 = 3,33≈3. si no da entero, lo aproximamos.
16. EJEMPLO
Los siguientes datos corresponden a las notas obtenidas por un curso
de 50 alumnos en un trabajo de matemática:
4.2 5.0 5.6 8.0 3.6
3.2 4.2 5.6 6.0 2.8
3.9 4.2 4.2 50 50
3.9 3.9 3.2 3.2 4.2
5.6 1.0 6.0 3.2 1.0
4.2 5.0 5.6 5.0 3.6
8.2 4.2 5.6 6.0 2.8
3.9 4.2 4.2 50 50
3.9 3.9 3.2 3.2 2.2
1.6 6.0 6.0 3.2 9.0
17. MARCA DE CLASE
La marca de clase es el punto
medio de cada intervalo.
La marca de clase es el valor que representa a
todo el intervalo para el cálculo de
algunos parámetros como la media aritmética o
la desviación típica.
Ejemplo : 163-193 = 30 / 2 = 15
18. MEDIDAS DE TENDENCIA
CENTRAL
• Las medidas de tendencia central tienen
como objetivo el sintetizar los datos en
un valor representativo, las medidas de
dispersión nos dicen hasta que punto
estas medidas de tendencia central son
representativas como síntesis de la
información.
19. MEDIDAS DE TENDENCIA CENTRAL
MEDIA: Media aritmética, es la que se obtiene sumando los datos y
dividiéndolos por el número de ellos.
Se aplica por ejemplo para resumir el número de pacientes promedio que se
atiende en un turno.
Otro ejemplo, es el número promedio de controles prenatales que tiene una
gestante.
Considérense los siguientes datos: 3, 8, 4, 10, 6, 2. Se pide:
1. Calcular su media.
2. Si los todos los datos anteriores los multiplicamos por 3, cúal será la
nueva media.
2. A un conjunto de 5 números cuya media es 7.31 se le añaden los números
4.47 y 10.15. ¿Cuál es la media del nuevo conjunto de números?
21. MEDIDAS DE TENDENCIA CENTRAL
MEDIANA: Corresponde al percentil 50%. Es decir, la mediana divide a la
población exactamente en dos. Por ejemplo el número mediana de hijos en el
centro de salud “X” es dos hijos. Otro ejemplo es el número mediana de
atenciones por paciente en un consultorio.
1 Ordenamos los datos de menor a mayor.
2 Si la serie tiene un número impar de medidas la mediana es
la puntuación central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5
3 Si la serie tiene un número par de puntuaciones la mediana es
la media entre las dos puntuaciones centrales.
7, 8, 9, 10, 11, 12Me= 9.5
25. MEDIDAS DE TENDENCIA CENTRAL
MODA: Valor o (valores) que aparece(n) con mayor frecuencia. Una
distribución unimodal tiene una sola moda y una distribución bimodal tiene dos.
Útil como medida resumen para las variables nominales. Por ejemplo, el color del
uniforme quirúrgico en sala de operaciones es el verde; por lo tanto es la moda
en colores del uniforme quirúrgico.
La moda es el valor que tiene mayor frecuencia absoluta.
Se representa por Mo.
Se puede hallar la moda para variables cualitativas y cuantitativas.
Hallar la moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y
esa frecuencia es la máxima, la distribución esbimodal o multimodal, es
decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma
frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
28. EJERCICIO
El número de diás necesarios por 10 equipos de trabajadores para
terminar 10 instalaciones de iguales características han sido: 21, 32,
15, 59, 60, 61, 64, 60, 71, y 80 días. Calcular la media, mediana,
moda. SOLUCIÓN:
La media: suma de todos los valores de una variable dividida entre
el número total de datos de los que se dispone:
La mediana: es el valor que deja a la mitad de los datos por encima
de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de
mayor a menor observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
Como quiera que en este ejemplo el número de observaciones es par
(10 individuos), los dos valores que se encuentran en el medio son 60
y 60. Si realizamos el cálculo de la media de estos dos valores nos dará
a su vez 60, que es el valor de la mediana.
La moda: el valor de la variable que presenta una mayor frecuencia
es 60
29.
30. EL TAMAÑO DEL INTERVALO SE CALCULA ASI:
En nuestro ejercicio: √100= 10, éste debe ser el
número de intervalos.
31. MEDIDAS DE TENDENCIA CENTRAL PARA
DATOS AGRUPADOS
LRC: Límites Reales de Clase. (Inferior- Superior)
Xi = Marca de Clase
fi = Frecuecia Absoluta
fa. = Frecuencia Acumulada
f rel% = Frecuencia Relativa %
Frel%ac=Frecuencia Relativa porcentual acumulada
22905
37. MEDIDAS DE TENDENCIA CENTRAL
PARA DATOS AGRUPADOS
MODA
Li es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la
clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la
clase modal
ai es la amplitud de la clase.
42. MEDIDAS DE DISPERSION
• Las medidas de dispersión cuantifican la
separación, la dispersión, la variabilidad de los
valores de la distribución respecto al valor
central. Distinguimos entre medidas de
dispersión:
• Absolutas, que no son comparables entre
diferentes muestras
• Relativas que nos permitirán comparar varias
muestras.
44. MEDIDAS DE DISPERSION
DESVIACION MEDIA.
La desviación media es la media aritmética de los valores absolutos de las
desviaciones respecto a la media
La desviación media se representa por
45. MEDIDAS DE DISPERSION
DESVIACION MEDIA PARA DATOS AGRUPADOS:
Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la
desviación media es:
47. VARIANZA
Mide la distancia existente entre los valores de la serie y la media.
Sumatoria de las diferencias al cuadrado entre 1 valor y la Media
por el número de veces que se ha repetido cada valor, la
Sumatoria se divide por el tamaño de la muestra.
MEDIDAS DE DISPERSION
49. MEDIDAS DE DISPERSION
VARIANZA
Propiedades de la varianza
1 La varianza será siempre un valor positivo o cero, en el caso de
que las puntuaciones sean iguales.
2 Si a todos los valores de la variable se
les suma un número la varianza no varía.
3 Si todos los valores de la variable se multiplican por
un número la varianza queda multiplicada por el cuadrado de
dicho número.
4 Si tenemos varias distribuciones con la misma media y conocemos
sus respectivas varianzas se puede calcular la varianza total
51. MEDIDAS DE DISPERSION
DESVIACION TIPICA
La desviación típica es la raíz cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los cuadrados de las
puntuaciones de desviación.
La desviación típica se representa por σ
52. MEDIDAS DE DISPERSION
Propiedades de la desviación típica
1 La desviación típica será siempre un valor positivo o cero, en el caso de que
las puntuaciones sean iguales.
2 Si a todos los valores de la variable se les suma un número la desviación
típica no varía.
3 Si todos los valores de la variable se multiplican por un número la desviación
típica queda multiplicada por dicho número.
4 Si tenemos varias distribuciones con la misma media y conocemos sus
respectivas desviaciones típicas se puede calcular la desviación típica total.
53. MEDIDAS DE DISPERSION
COEFICIENTE DE VARIACION
COEFICIENTE DE VARIACION DE PEARSON
El coeficiente de variación es la relación entre la desviación típica de una
muestra y su media.
El coeficiente de variación se suele expresar en porcentajes:
El coeficiente de variación permite comparar las dispersiones de dos
distribuciones distintas, siempre que sus medias sean positivas.
Se calcula para cada una de las distribuciones y los valores que se obtienen se
comparan entre sí.
La mayor dispersión corresponderá al valor del coeficiente de variación mayor.