1. Javier García Molleja
Clases basadas en Estadística
Matemática con Aplicaciones (7ª Ed.),
D.D. Wackerly, W. Mendenhall III, R.L.
Scheaffer, CENGAGE Learning, 2008
1. Estadística
2. Introducción
Por norma general existen fenómenos que se
desencadenan de manera parecida pero cuyo
resultado no siempre es el mismo, sino más bien
parecido.
Mejor que quedarnos con un resultado es
trabajar con el conjunto de resultados para inferir
algún comportamiento que rija dicho fenómeno.
La estadística es una rama de la ciencia que trata
con información y cuyo objetivo es lograr
inferencias.
3. Introducción
Al conjunto de todos los datos recopilados se le
llama población.
Todo subconjunto de la población se denomina
muestra.
Muchas veces es imposible trabajar con la
población en su totalidad (gran cantidad de datos
o que aún no se han dado –como pacientes de
una determinada enfermedad-), luego se hace
importante seleccionar una buena muestra y que
sea representativa (grado de bondad).
Se requiere además un buen marco teórico para
que las predicciones y resultados se asemejen a
la realidad.
4. Introducción
La estadística se puede aplicar en múltiples
campos: política, finanzas, ciencias aplicadas,
arte…
La meta de la estadística es lograr hacer una
inferencia acerca de la población a partir de la
información dada por una muestra que posea un
alto grado de bondad.
5. Métodos gráficos
Para trabajar estadísticamente hace falta idear
un buen método y saber qué información
necesitamos precisamente para hacer una
inferencia.
En primer lugar se necesita identificar qué
variables son independientes entre sí y cuáles
son dependientes.
Conviene poder representar en cierto grado la
información facilitada.
Así, podemos ver la población como una
distribución de mediciones que va a depender de
los valores ofrecidos por las variables
independientes.
6. Métodos gráficos
Un histograma es una representación de una
distribución de frecuencia relativa.
Los histogramas están conformados por varios
rectángulos de igual base (llamados clases) y de
una altura en función de la frecuencia de valores
(fracción relativa respecto al total) que caen
dentro de las separaciones llevadas a cabo.
7. Métodos gráficos
Un histograma depende de los criterios de quien
los haga. Por norma general:
Una medición no puede caer justo en la frontera
entre dos rectángulos
Todos los intervalos han de tener el mismo ancho y,
dependiendo de la cantidad total de datos, ser de 5
a 20 en total
8. Métodos gráficos
El área de cada rectángulo es proporcional a la
fracción del número total de mediciones que caen
en este.
Pensemos que tomamos al azar una medición de
toda la población. Podemos pensar en la
probabilidad de que caiga en uno u otro
rectángulo.
Evidentemente, mientras más grande sea el
rectángulo más probable será que haya sido
elegido uno de los datos que contiene.
Por consiguiente, el área bajo el histograma (y
que abarque uno o varios rectángulos) nos da la
probabilidad de encontrar una medición, ya sea
de la población o de la muestra.
10. Métodos numéricos
Si bien los histogramas dan información valiosa,
son poco adecuados para intentar hacer una
inferencia.
Necesitamos conocer datos más precisos para
esto. Además, esto nos ayudará a conocer la
bondad de la muestra.
Las medidas descriptivas numéricas nos
permiten aplicar ciertas propiedades
matemáticas.
Un elemento muy útil es la media aritmética
muestral:
11. Métodos numéricos
Por norma general la media aritmética
poblacional, m no es conocida.
Si bien nos da información relevante, la media no
describe el conjunto de mediciones.
Algo que nos puede ayudar para caracterizar la
distribución es saber si los datos están muy cerca
o muy lejos de la media.
Esto se consigue utilizando la varianza muestral:
13. Métodos numéricos
A veces el divisor es n-1 y no n. Esta es la
corrección de Bessel, más útil para realizar
inferencias poblacionales.
La varianza poblacional, s2 en principio no es
conocida.
A mayor valor de varianza, mayor dispersión de
los datos con respecto la media (más lejos de
esta).
Con la varianza podemos comparar la desviación
de valores entre dos conjuntos diferentes.
Para conocer la desviación de un único conjunto
de datos hay que recurrir a la desviación típica (o
14. Métodos numéricos
Muchas distribuciones de datos de la vida real
tienen forma de campana o montículo.
Esto recibe el nombre de distribución normal.
Las curvas normales (o casi normales) obedecen
que
15. Métodos numéricos
Otros conceptos útiles son:
Moda: valor más repetido entre los datos de una
muestra.
Mediana: valor central de la muestra. No tiene, en
principio, por qué coincidir con la media.
16. Javier García Molleja
Ejercicios basados en Estadística
Matemática con Aplicaciones (7ª Ed.), D.D.
Wackerly, W. Mendenhall III, R.L. Scheaffer,
CENGAGE Learning, 2008
Problemas de Estadística