ÉTICA, NATURALEZA Y SOCIEDADES_3RO_3ER TRIMESTRE.pdf
Estimación
1. 12/05/2015
ESTIMACIÓN DE PARÁMETROS
La estimación de parámetros junto con las pruebas de hipótesis
es la base de la inferencia estadística.
El proceso de estimación estadística consiste en determinar el
valor de un parámetro de la población, a partir de la información
proporcionada por una muestra.
ESTIMADOR: Cualquier estadístico (estadística) utilizado para
estimar un parámetro de la población.
Es una regla que expresa como calcular la estimación,
basándose en la información de la muestra.
𝑿 =
𝒊=𝟏
𝒏
𝒙𝒊
𝒏
2. ESTIMADOR PUNTUAL: Un estimador puntual de un
parámetro es cualquier estadística que nos permita, a partir de
los datos muestrales, obtener valores aproximados del
parámetro.
Ejemplos:
1. La media muestral, 𝑿, se utiliza para estimar el valor del
parámetro μ, la media poblacional.
Supongamos que deseamos estimar el peso promedio de las estudiantes de
IV semestre de Trabajo Social de la Corporación. Para ello seleccionamos una
muestra aleatoria de n estudiantes.
Supongamos que la muestra fue de 10 estudiantes y sus pesos respectivos,
en kilogramos, son:
64 55 49 55 50 42 50 58 55 41
𝒙 = 𝟓𝟏, 𝟗 𝒌𝒈.
3. 2. La varianza muestral, 𝑺 𝟐 , se utiliza para estimar 𝛔 𝟐 , la
varianza poblacional
Para este ejemplo, 𝑿 = 𝒊=𝟏
𝒏
𝒙 𝒊
𝒏
, es la estadística o estimador y el
valor particular obtenido de la muestra seleccionada, 𝒙 =
𝟓𝟏, 𝟗 𝒌𝒈, es la estimación del peso promedio de la población de
estudiantes de IV semestre de Trabajo Social de la Corporación.
En este caso, 𝑺 =
𝒊=𝟏
𝒏 (𝒙 𝒊− 𝒙 ) 𝟐
𝒏−𝟏
, es el estimador y el valor
particular obtenido con los datos de la muestra de tamaño 10
estudiantes, 𝒔 = 𝟕, 𝟎𝟑 𝒌𝒈 , es la estimación.
4. 3. La proporción muestral 𝑷 , se utiliza para estimar la
proporción poblacional P.
Suponga que en «CECAR» se desea conocer la opinión de los estudiantes
acerca de la decisión del procurador de destituir al alcalde de Bogotá. De 120
estudiantes consultados, 90 estuvieron en contra de tal decisión. Estime la
proporción de estudiantes en CECAR que están a favor de la decisión del
procurador Ordoñez.
𝒑 =
𝒙
𝒏
, donde n= 120 estudiantes, es el tamaño de la muestra y
x = 30 , es el número de estudiantes que están a favor de la
medida.
𝒑 =
𝟑𝟎
𝟏𝟐𝟎
= 0,25
Esto indica que sólo el 25% de los estudiantes de CECAR está a
favor de la medida.
5. ESTIMACIÓN POR INTERVALO:
Una estimación por intervalo describe un intervalo de valores dentro del cual es
posible que esté el valor de un parámetro de población.
El procedimiento para obtener una estimación por intervalo de un parámetro,
requiere de un estimador puntual del parámetro y de la distribución de
probabilidad de dicho estimador.
Debemos encontrar 𝜃1y 𝜃2, a partir de la distribución muestral del estimador 𝜃
, tales que:
𝑷( 𝜽 𝟏 < 𝜽 < 𝜽 𝟐) = 𝟏 − 𝜶
(𝟏 − 𝜶) , es la probabilidad de seleccionar una muestra que produzca un
intervalo que contenga al parámetro 𝜃 y se llama nivel de confianza. Indica
que tanta confianza tenemos de que la estimación por intervalo contenga al
parámetro de población.
𝟎 < 𝛂 < 𝟏
𝛉 𝟏 y 𝛉 𝟐 , se llaman límites de confianza,
inferior y superior, respectivamente.
6. INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL (µ)
Para 𝜶 ∈ (𝟎, 𝟏) , el intervalo ( 𝜽 𝟏 < 𝜽 < 𝜽 𝟐) , es un estimador por intervalo del
𝟏 − 𝜶 𝟏𝟎𝟎% de confianza del parámetro desconocido 𝜽.
Esto implica, que si se extraen muestras repetidamente de la población y se
calculan los intervalos para cada muestra, entonces, el 1 − 𝛼 100% de los
intervalos calculados contendrá el valor del parámetro desconocido.
El intervalo ( 𝑿 − 𝒁 𝜶
𝟐
𝝈
𝒏
< 𝝁 < 𝑿 + 𝒁 𝜶
𝟐
𝝈
𝒏
) es un intervalo
del 𝟏 − 𝜶 𝟏𝟎𝟎% de confianza para µ.
𝒁 𝜶
𝟐
, es el valor de Z a la derecha del cual se tiene un área de 𝜶
𝟐
𝜽 𝟏 = 𝑿 − 𝒁 𝜶
𝟐
𝝈
𝒏
es el límite de confianza inferior.
𝜽 𝟐 = 𝑿 + 𝒁 𝜶
𝟐
𝝈
𝒏
es el límite de confianza superior.
7. La expresión del intervalo de confianza para la media poblacional μ es válida
siempre y cuando se cumpla lo siguiente:
La población (infinita) tiene distribución normal.
La varianza poblacional, 𝝈 𝟐 , es conocida.
Si la muestra es lo suficientemente grande ( 𝒏 ≥ 𝟑𝟎), no importa que la
distribución de la población no sea normal o desconocida y que la varianza
poblacional no se conozca, en ese caso se usa la varianza estimada, 𝑺 𝟐
.
En el caso de una población finita, de tamaño N, se debe verificar el uso o
no del factor de corrección. En caso afirmativo, el intervalo de confianza
está dado por:
( 𝑿 − 𝒁 𝜶
𝟐
𝝈
𝒏
𝑵−𝒏
𝑵−𝟏
< 𝝁 < 𝑿 + 𝒁 𝜶
𝟐
𝝈
𝒏
𝑵−𝒏
𝑵−𝟏
)
Si la población muestreada
tiene distribución normal y
además la varianza poblacional
es conocida, entonces no
importa que tamaño tenga la
muestra.
8. ¿QUÉ PASA SI LA VARIANZA POBLACIONAL, σ, ES DESCONOCIDA Y EL
TAMAÑO DE LA MUESTRA ES PEQUEÑO (𝒏 < 𝟑𝟎)?
En tal caso, no se puede usar la distribución normal como distribución de
muestreo para el cálculo del intervalo de confianza, se debe usar la distribución
t de Student, siempre y cuando la distribución de la población muestreada sea
normal.
El intervalo 𝟏 − 𝜶 𝟏𝟎𝟎% de confianza para μ es:
( 𝑿 − 𝒕 𝜶
𝟐
𝒔
𝒏
< 𝝁 < 𝑿 + 𝒕 𝜶
𝟐
𝒔
𝒏
)
𝒕 𝜶
𝟐
, es el valor de 𝒕 =
𝑿−𝝁
𝒔
𝒏
a la derecha del cual se tiene un área de 𝜶
𝟐 en
la distribución t de Student con (𝒏 − 𝟏) grados de libertad.
Si la población es finita, de tamaño N, se debe considerar el uso del factor
de corrección para poblaciones finitas.
9. INTERVALO DE CONFIANZA PARA LA PROPORCIÓN POBLACIONAL (P)
La proporción muestral 𝑷 =
𝒙
𝒏
, donde x representa el número de éxitos en n
intentos, se utiliza como la estimación puntual del parámetro P.
Un intervalo aproximado de 𝟏 − 𝜶 𝟏𝟎𝟎% de confianza para el parámetro
binomial P está dado por:
( 𝑷 − 𝒁 𝜶
𝟐
𝒑 𝒒
𝒏
< 𝑷 < 𝑷 + 𝒁 𝜶
𝟐
𝒑 𝒒
𝒏
)
Este procedimiento es válido cuando se cumple alguna de las siguientes
condiciones:
𝒏 ≥ 𝟑𝟎
𝒏 𝒑 ≥ 𝟓 y 𝒏 𝒒 ≥ 𝟓
Si la población es finita, de tamaño N, se debe considerar el uso del factor
de corrección para poblaciones finitas.
10. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE DOS MEDIAS POBLACIONALES
(𝜇1 − 𝜇2)
Si 𝑿 𝟏 y 𝑿 𝟐 son las medias de muestras aleatorias independientes de tamaños
𝒏 𝟏 y 𝒏 𝟐 de poblaciones, ambas con distribución normal ,y con varianzas
conocidas 𝝈 𝟏
𝟐
y 𝝈 𝟐
𝟐
, respectivamente, un intervalo de 𝟏 − 𝜶 𝟏𝟎𝟎% de
confianza para (𝝁 𝟏 − 𝝁 𝟐) está dado por:
𝑿 𝟏 − 𝑿 𝟐 − 𝒁 𝜶
𝟐
𝝈 𝟏
𝟐
𝒏 𝟏
+
𝝈 𝟐
𝟐
𝒏 𝟐
< 𝝁 𝟏 − 𝝁 𝟐 < 𝑿 𝟏 − 𝑿 𝟐 + 𝒁 𝜶
𝟐
𝝈 𝟏
𝟐
𝒏 𝟏
+
𝝈 𝟐
𝟐
𝒏 𝟐
𝒁 𝜶
𝟐
es el valor de la variable 𝒁 =
𝑿 𝟏− 𝑿 𝟐 −(𝝁 𝟏−𝝁 𝟐)
𝝈 𝟏
𝟐
𝒏 𝟏
+
𝝈 𝟐
𝟐
𝒏 𝟐
que deja un área de 𝜶
𝟐 a la
derecha de la distribución normal.
Se pueden utilizar las varianzas muestrales 𝑺 𝟏
𝟐
y 𝑺 𝟐
𝟐
para estimar 𝝈 𝟏
𝟐
y 𝝈 𝟐
𝟐
,
cuando se desconocen estos parámetros, siempre que los tamaños de muestra
𝒏 𝟏 y 𝒏 𝟐 sean lo suficientemente grandes.
11. Si las varianzas poblacionales 𝝈 𝟏
𝟐
y 𝝈 𝟐
𝟐
son desconocidas e iguales, 𝝈 𝟏
𝟐
= 𝝈 𝟐
𝟐
y los
tamaños de muestra 𝒏 𝟏 y 𝒏 𝟐, extraídas de poblaciones normales, son pequeños,
𝒏 𝟏 < 𝟑𝟎 y 𝒏 𝟐 < 𝟑𝟎, un intervalo 1 − 𝛼 100% de confianza para 𝝁 𝟏 − 𝝁 𝟐 está
dado por:
𝑿 𝟏 − 𝑿 𝟐 ± 𝒕 𝒏 𝟏+𝒏 𝟐−𝟐 ; 𝜶
𝟐
𝑺 𝒑
𝟏
𝒏 𝟏
+
𝟏
𝒏 𝟐
Donde 𝑺 𝒑 =
𝒏 𝟏−𝟏 𝑺 𝟏
𝟐+(𝒏 𝟐−𝟏)𝑺 𝟐
𝟐
𝒏 𝟏+𝒏 𝟐−𝟐
y 𝒕(𝒏 𝟏+𝒏 𝟐−𝟐); 𝜶
𝟐
es el valor de la variable t de
Student con 𝑣 = 𝑛1 + 𝑛2 − 2 grados de libertad y que deja un área de 𝜶
𝟐 a la
derecha de la distribución t de Student.
12. INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS PROPORCIONES POBLACIONALES
( 𝑃1 − 𝑃2)
Un intervalo de 1 − 𝛼 100% de confianza para 𝑃1 − 𝑃2 está dado por:
𝑷 𝟏 − 𝑷 𝟐 − 𝒁 𝜶
𝟐
𝒑 𝟏 𝒒 𝟏
𝒏 𝟏
+
𝒑 𝟐 𝒒 𝟐
𝒏 𝟐
< 𝑷 𝟏 − 𝑷 𝟐 < 𝑷 𝟏 − 𝑷 𝟐 + 𝒁 𝜶
𝟐
𝒑 𝟏 𝒒 𝟏
𝒏 𝟏
+
𝒑 𝟐 𝒒 𝟐
𝒏 𝟐
La validez de este procedimiento está sujeto al cumplimiento de por lo menos una
de las siguientes dos condiciones:
Los tamaños de muestras deben ser grandes: 𝒏 𝟏 ≥ 𝟑𝟎 y 𝒏 𝟐 ≥ 𝟑𝟎
𝒏 𝟏 𝒑 𝟏 ≥ 𝟓 ; 𝒏 𝟐 𝒑 𝟐 ≥ 𝟓 ; 𝒏 𝟏 𝒒 𝟏 ≥ 𝟓 ; 𝒏 𝟐 𝒒 𝟐 ≥ 𝟓
𝒁 𝜶
𝟐
es el valor de la variable Z que deja un área de 𝜶
𝟐 a la derecha de
la distribución normal.
El proceso de estimación implica calcular, a partir de los datos de una muestra, alguna estadística que se ofrece como una aproximación del parámetro correspondiente de la población de la cual fue extraída la muestra.
Cuando es pequeño y se cree que la proporción desconocida P se acerca a cero o a uno, el procedimiento establecido para el intervalo de confianza NO es confiable y, por lo tanto, no debe ser utilizado.