Este documento presenta conceptos básicos sobre estimación estadística, incluyendo definiciones de población, muestra, parámetro, estimador, estadístico, estimación, tipos de estimación, intervalos de confianza y error de intervalos de confianza. Explica que la estimación estadística se utiliza para inferir las características de una población a partir de una muestra.
2. CONCEPTOS BÁSICOS
POBLACIÓN: Conjunto de elementos sobre los que se observa un carácter
común. Se representa con la letra N.
MUESTRA: Conjunto de unidades de una población. Cuanto más significativa
sea,
mejor será la muestra. Se representa con la letra n.
UNIDAD DE MUESTREO: Está formada por uno o más elementos de la
población.
El total de unidades de muestreo constituyen la población. Estas unidades son
disjuntas entre sí y cada elemento de la población pertenece a una unidad de
muestreo.
3. PARÁMETRO: Es un resumen numérico de alguna variable observada de la
población. Los parámetros normales que se estudian son:
- La media poblacional: X
- Total poblacional: X
- Proporción: P
ESTIMADOR: Un estimador θ* de un parámetro θ, es un estadístico que se
emplea para conocer el parámetro θ desconocido.
ESTADÍSTICO: Es una función de los valores de la muestra. Es una variable
aleatoria, cuyos valores dependen de la muestra seleccionada. Su distribución
de probabilidad, se conoce como “Distribución muestral del estadístico”.
4. ESTIMACIÓN: Este término indica que a partir de lo observado en una muestra
(un
resumen estadístico con las medidas que conocemos de Descriptiva) se extrapola
o
generaliza dicho resultado muestral a la población total, de modo que lo estimado
es el valor generalizado a la población. Consiste en la búsqueda del valor de los
parámetros poblacionales objeto de estudio
5. TIPOS DE ESTIMACIÓN ESTADÍSTICA
Estimador eficiente
Dado todo estimador insesgado, el estimador más eficiente es aquel que tenga la
varianza más pequeña.
6. Estimador consistente
Un estimador es consistente si, a medida que “n” aumenta, el valor del estadístico
se aproxima al valor del parámetro.
Estimador suficiente
Un estimador es suficiente si ningún otro estimador puede proporcionar más
información sobre el parámetro.
Sesgo de un estimador
No siempre se puede encontrar un estimador insesgado para calcular cierto
parámetro. Así pues, puede que nuestro estimador tenga sesgo. Que un estimador
tenga sesgo no quiere decir que no sea válido. Simplemente, quiere decirnos que
no se ajusta todo lo bien que estadísticamente nos gustaría.
𝐸 𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 = 𝐸[𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 𝑋1, 𝑋2, … , 𝑋𝑛 ] = 𝑃𝑎𝑟á𝑚𝑒𝑡𝑟𝑜 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑜 + 𝑆𝑒𝑠𝑔𝑜
7. Insesgado
Un estimador insesgado es aquel cuya esperanza matemática coincide con el
valor del parámetro que se desea estimar. En caso de no coincidir se dice que el
estimador tiene sesgo.
𝐸 𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 = 𝐸[𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 𝑋1, 𝑋2, … , 𝑋𝑛 ] = 𝑃𝑎𝑟á𝑚𝑒𝑡𝑟𝑜 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑜
La media de todas las estimaciones que puede realizar el estimador para cada
muestra diferente, es igual al parámetro. Por ejemplo, si tenemos 30 muestras
diferentes, lo normal es que en cada muestra el estimador (aunque sea por poco)
ofrezca valores diferentes. Si realizamos la media de los 30 valores del estimador
en las 30 muestras diferentes, entonces el estimador debe arrojar un valor igual al
verdadero valor del parámetro.
Un ejemplo de estimador insesgado lo encontramos en el estimador media.
8. INTERVALOS DE CONFIANZA
Un intervalo de confianza nos va a permitir calcular dos valores alrededor de una
media muestral (uno superior y otro inferior). Estos valores van a acotar
un rango dentro del cual, con una determinada probabilidad, se va a localizar el
parámetro poblacional.
Un intervalo de confianza es una técnica de estimación utilizada en inferencia
estadística que permite acotar un par o varios pares de valores, dentro de los
cuales se encontrará la estimación puntual buscada (con una determinada
probabilidad).
El intervalo de confianza nos sirve para dar una estimación puntual del parámetro
poblacional, si nos va a servir para hacernos una idea aproximada de cuál podría
ser el verdadero de este. Nos permite acotar entre dos valores en dónde se
encontrará la media de la población.
9. Factores de los que depende un intervalo de confianza
El cálculo de un intervalo de confianza depende principalmente de los siguientes
factores:
• Tamaño de la muestra seleccionada: Dependiendo de la cantidad de datos que se
hayan utilizado para calcular el valor muestral, este se acercará más o menos al
verdadero parámetro poblacional.
• Nivel de confianza: Nos va a informar en qué porcentaje de casos nuestra
estimación acierta. Los niveles habituales son el 95% y el 99%.
• Margen de error de nuestra estimación: Este se denomina como alfa y nos
informa de la probabilidad que existe de que el valor poblacional esté fuera de
nuestro intervalo.
• Lo estimado en la muestra (media, varianza, diferencia de medias…): De esto va
a depender el estadístico pivote para el cálculo del intervalo.
10. El nivel de confianza es simétrico
%
Nivel de
confianza
−𝑧𝑎
2
𝑧𝑎
2
11. ERROR DE INTERVALOS DE CONFIANZA
Para un intervalo de confianza bilateral, el margen de error es la distancia desde el
estadístico estimado hasta cada el valor del intervalo de confianza. Cuando un
intervalo de confianza es simétrico, el margen de error es la mitad del ancho del
intervalo de confianza.
13. Ejemplo
En una escuela se toma una muestra de 50
estudiantes. Los estudiantes se someten a un
examen de conocimientos de los cuales 40 alumnos
aprobaron el examen.
¿Cuál es el estimado del intervalo para la proporción
poblacional para un nivel de confianza de 95%?