2. Intervalos de confianza
Se llama intervalo de confianza a un par de números entre los
cuales se estima que estará cierto valor desconocido con una
determinada probabilidad de acierto. Formalmente, estos
números determinan un intervalo, que se calcula a partir de
datos de una muestra, y el valor desconocido es un
parámetro poblacional. La probabilidad de éxito en la
estimación se representa con 1 - α y se denomina nivel de
confianza. En estas circunstancias, α es el llamado error
aleatorio o nivel de significación, esto es, una medida de las
posibilidades de fallar en la estimación mediante tal intervalo.
El nivel de confianza y la amplitud del intervalo varían
conjuntamente, de forma que un intervalo más amplio tendrá
más posibilidades de acierto (mayor nivel de confianza),
mientras que para un intervalo más pequeño, que ofrece una
estimación más precisa, aumentan sus posibilidades de error.
En el contexto de estimar un parámetro poblacional, un
intervalo de confianza es un rango de valores (calculado en
una muestra) en el cual se encuentra el verdadero valor del
parámetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del parámetro se
encuentre en el intervalo construido se denomina nivel de
confianza, y se denota 1-. La probabilidad de equivocarnos
se llama nivel de significancia y se simboliza. Generalmente
se construyen intervalos con confianza 1-=95% (o
significancia =5%). Menos frecuentes son los intervalos con
=10% o sigma =1%.Para construir un intervalo de confianza,
se puede comprobar que la distribución Normal Estándar
cumple 1
3. P(-1.96 < z < 1.96) = 0.95
(lo anterior se puede comprobar con una tabla de
probabilidades o un programa computacional que calcule
probabilidades normales).
Luego, si una variable X tiene distribución N( , ), entonces el
95% de las veces se cumple:
Despejando en la ecuación se tiene:
El resultado es un intervalo que incluye al el 95% de las
veces. Es decir, es un intervalo de confianza al 95% para la
media cuando la variable X es normal y es conocido.
ESTIMACIÓN DE INTERVALO.-
Una estimación de Intervalo, describe un intervalo de valores
dentro del cual es posible que este un parámetro de
población.
Dentro de sus características encontramos:
¯ Dentro de las estimaciones de Intervalo, se maneja un
4. Concepto adicional, que implica la incertidumbre que
acompañara dicha estimación.
Una afirmación acerca del intervalo dentro del cual es
probable que este la media de población desconocida.
¯ Para proporcionar dicha afirmación, se necesita encontrar el
error estándar de la media.
Para explicarlo mejor nos apoyaremos en el siguiente
ejemplo:
Suponga que el director de investigaciones de mercado de
una fábrica de refacciones automotrices necesita hacer una
estimación de la vida promedio de las baterías para automóvil
que su compañía produce. Se selecciona una muestra
aleatoria de 200 baterías, se registro en nombre de los
propietarios de los automóviles y su dirección, de la misma
manera se entrevisto a estas personas con respecto a la
duración de la batería de su automóvil. Después de realizar la
aplicación de la formula de la media de la muestra, tenemos
como resultado: 36 meses de vida promedio.
Si se utiliza la estimación puntual de la media de la muestra
como el mejor estimador de la media de la población µ se
informaría que la vida media de las baterías de la empresa es
de 36 meses.
Pero supongamos que el director también conocer acerca de
la incertidumbre que probablemente acompañara a la
estimación, es decir una afirmación acerca del intervalo
dentro de lo cual es posible que este la media de la población
desconocida.
5. Eso se determina calculando el error estándar De la media.
Para esto se utiliza la formula de cálculo de error estándar de
la media:
Supongamos que previamente se hizo el cálculo de la
desviación estándar de las 200 baterías, y se ha determinado
que es de 10 meses. Utilizando dicho dato y la formula que
indicamos en el recuadro anterior. Resultaría así.
Ahora se puede concluir que la estimación de la vida útil de
un las baterías de la compañía es de 36 meses, y el error
estándar que acompaña a dicha estimación es .707. En otras
palabras, la vida útil real para todas las baterías puede estar
en alguna parte de esta estimación de intervalo comprendida
entre 35.293 y 36.707 meses.
NIVEL DE CONFIANZA.-
En la estadística la probabilidad que asociamos o
relacionamos con una estimación de intervalo es conocida
como Nivel de Confianza.
Que tanta confianza tenemos que la estimación que hicimos
de un intervalo, incluya la mayor parte de la muestra, es decir
los casos analizados.
LIMITES DE CONFIANZA.-
A menudo el intervalo de confianza se expresa en términos
de errores estándar, más que con valores numéricos. De la
siguiente forma.
6. x ± 1.64 σ x en la que:
x + 1.64 σ x = limite superior del intervalo.
x - 1.64 σ x = limite inferior del intervalo.
A estos límites se les conoce como limites de Confianza del
intervalo de Confianza.
Prueba de Hipótesis
Una prueba de hipótesis consiste en contrastar dos hipótesis
estadísticas. Tal contraste involucra la toma de decisión
acerca de las hipótesis. La decisión consiste en rechazar o no
una hipótesis en favor de la otra. Una hipótesis estadística se
denota por “H” y son dos:
- Ho: hipótesis nula
- H1: hipótesis alternativa
La hipótesis nula “Ho”
Se refiere siempre a un valor especifico del parámetro de la
población, no a una estadística de muestra. La letra H
significa hipótesis y el subíndice cero no hay diferencia. Por lo
general hay un “no” en la hipótesis nula que indica que “no
hay cambio” Podemos rechazar o aceptar Ho.
Por lo tanto la hipótesis nula es una afirmación que no se
rechaza a menos que los datos muestrales proporcionen
7. evidencia convincente de que es falsa. El planteamiento de la
hipótesis nula siempre contiene un signo de igualdad con
respecto al valor especificado del parámetro.
- La hipótesis alternativa “H1”
Es cualquier hipótesis que difiera de la hipótesis nula. Es una
afirmación que se acepta si los datos muestrales
proporcionan evidencia suficiente de que la hipótesis nula es
falsa. Se le conoce también como la hipótesis de
investigación. El planteamiento de la hipótesis alternativa
nunca contiene un signo de igualdad con respecto al valor
especificado del parámetro.
Nivel de significancia
Probabilidad de rechazar la hipótesis nula cuando es
verdadera. Se le denota mediante la letra griega α, también
es denominada como nivel de riesgo, este término es mas
adecuado ya que se corre el riesgo de rechazar la hipótesis
nula, cuando en realidad es verdadera.
La distribución de muestreo de la estadística de prueba se
divide en dos regiones, una región de rechazo (conocida
como región crítica) y una región de no rechazo
(aceptación). Si la estadística de prueba cae dentro de la
región de aceptación, no se puede rechazar la hipótesis nula.
Estos valores no son tan improbables de presentarse si la
8. hipótesis nula es falsa. El valor crítico separa la región de no
rechazo de la de rechazo.
Errores tipo I y II
Error tipo l se presenta si la hipótesis nula Ho es rechazada
cuando es verdadera y debía ser aceptada. La probabilidad
de cometer un error tipo I se denomina con la letra alfa α
Un error tipo II, se denota con la letra griega β se presenta si
la hipótesis nula es aceptada cuando de hecho es falsa y
debía ser rechazada.
3. Estadístico de prueba
Valor determinado a partir de la información muestral, que se
utiliza para determinar si se rechaza la hipótesis nula., existen
muchos estadísticos de prueba para nuestro caso
utilizaremos los estadísticos z y t. La elección de uno de estos
depende de la cantidad de muestras que se toman, si las
muestras son iguales a 30 o mas se utiliza el estadístico z, en
caso contrario se utiliza el estadístico t.
Tipos de prueba
9. 4. Formular la regla de decisión
Se establece las condiciones específicas en la que se
rechaza la hipótesis nula y las condiciones en que no se
rechaza la hipótesis nula. La región de rechazo define la
ubicación de todos los valores que son tan grandes o tan
pequeños, que la probabilidad de que se presenten bajo la
suposición de que la hipótesis nula es verdadera, es muy
remota
Distribución muestral del valor estadístico z, con prueba de
una cola a la derecha
Valor critico: Es el punto de división entre la región en la que
se rechaza la hipótesis nula y la región en la que no se
rechaza la hipótesis nula.
5. Tomar una decisión.
En este último paso de la prueba de hipótesis, se calcula el
estadístico de prueba, se compara con el valor crítico y se
10. toma la decisión de rechazar o no la hipótesis nula. Tenga
presente que en una prueba de hipótesis solo se puede tomar
una de dos decisiones: aceptar o rechazar la hipótesis nula.
Debe subrayarse que siempre existe la posibilidad de
rechazar la hipótesis nula cuando no debería haberse
rechazado (error tipo I ). También existe la posibilidad de que
la hipótesis nula se acepte cuando debería haberse
rechazado