Este documento trata sobre estimación estadística e intervalos de confianza. Explica conceptos como población, muestra, parámetro, estimador, estadístico e intervalos de confianza para medias, diferencias entre medias, proporciones y diferencias entre proporciones. Proporciona fórmulas para calcular intervalos de confianza en diferentes situaciones y ejemplos numéricos de su aplicación.
Pruebas de bondad de ajuste y pruebas no parametricasAlez Escandón
UNIDAD 4.- PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO PARAMETRICAS
4.1 Bondad de ajuste.
4.1.1 Análisis Ji-Cuadrada.
4.1.2 Prueba de independencia.
4.1.3 Prueba de la bondad del ajuste.
4.1.4 Tablas de contingencia.
4.2 Pruebas no paramétricas.
4.2.1 Escala de medición.
4.2.2 Métodos estadísticos contra no paramétricos.
4.2.3 Prueba de Kolmogorov – Smirnov.
4.2.4 Prueba de Anderson – Darling.
4.2.5 Prueba de Ryan – Joiner.
4.2.6 Prueba de Shappiro – Wilk.
Pruebas de bondad de ajuste y pruebas no parametricasAlez Escandón
UNIDAD 4.- PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO PARAMETRICAS
4.1 Bondad de ajuste.
4.1.1 Análisis Ji-Cuadrada.
4.1.2 Prueba de independencia.
4.1.3 Prueba de la bondad del ajuste.
4.1.4 Tablas de contingencia.
4.2 Pruebas no paramétricas.
4.2.1 Escala de medición.
4.2.2 Métodos estadísticos contra no paramétricos.
4.2.3 Prueba de Kolmogorov – Smirnov.
4.2.4 Prueba de Anderson – Darling.
4.2.5 Prueba de Ryan – Joiner.
4.2.6 Prueba de Shappiro – Wilk.
Se refiere al procedimiento empleado para obtener una o más muestras de una población. Este se realiza una vez que se ha establecido un marco muestral representativo de la población, luego se procede a la selección de los elementos de la muestra aunque hay muchos diseños de la muestra.
Distribuciones Muestrales y Estimación de los Parámetros de una Poblaciónjosegonzalez1606
Distribuciones Muestrales y Estimación de los Parámetros de una Población
Integrantes:
José González C.I: 28.576.187 Marcell Girardi C.I: 24. 491.579 Yulianny Marcano C.I: 26. 385.075 Alejandro Brito C.I: 24.947.747 José Pereira C.I: 28.095. 315
Portafolio final comunicación y expresión ll - ivan alarcon .pptxivandavidalarconcata
Los muros paramétricos son una herramienta poderosa en el diseño arquitectónico que ofrece diversas ventajas, tanto en el proceso creativo como en la ejecución del proyecto.
Los atletas olímpicos de la antigüedad participaban en los juegos movidos por el afán de
gloria, pero sobre todo por las suculentas recompensas que obtendrían si ganaban..
Es una presentación desde el punto de vista histórico, escultórico y pictórico, gracias a la
cual podemos apreciar a través del tiempo como el arte ha contribuido a la historia de
los olímpicos.
1. 1
Ingeniería en Gestión Empresarial
Luis Daniel Herrera Barrios
Unidad II
“INFERENCIA ESTADÍSTICA: ESTIMACIÓN”
Blanca Estefanía De la O Mondragón
11570120
Zihuatanejo Gro. A 24 de Febrero Del 2013
2. 2
UNIDAD II. INFERENCIA ESTADÍSTICA: ESTIMACIÓN
Introducción 3
2.1 Conceptos básicos. 4
2.2 Distribuciones de muestreo. 5
2.3 Estimación puntual. 6
2.4 Estimación de intervalo. 7
2.5 Intervalos de confianza para medias. 8
2.6 Intervalos de confianza para diferencia entre medias. 9
2.7 Intervalos de confianza para proporciones. 11
2.8 Intervalos de confianza para diferencias entre proporciones. 12
2.9 Intervalos de confianza para varianzas. 15
2.10 Intervalos de confianza para razones de dos varianzas. 16
Bibliografía 18
CONTENIDO
3. 3
A la inferencia estadística le interesa sacar conclusiones de un gran número de
acontecimientos (población), fundándose en las observaciones de una parte de los
mismos (muestra).
La estadística nos proporciona herramientas que formalizan y uniforman los
procedimientos para sacar conclusiones siempre que las muestras seleccionadas sean
representativas de la población que han sido extraídas. Esta representatividad permite
extender los valores que describen a las muestras (estadísticos), tales como la media, la
desviación típica, un coeficiente de correlación, a la población correspondiente, es decir,
la media o la desviación típica (estadísticos) pueden tomarse como estimadores de los
parámetros μ y σ, valores que caracterizan a la población.
Los estadísticos, valores obtenidos en la muestra, son, pues, estimadores de los
parámetros correspondientes (valores de la población).
I N T R O D U C C I Ó N
4. 4
2.1 Conceptos básicos.
POBLACIÓN: Conjunto de elementos sobre los que se observa un carácter común. Se
representa con la letra N.
MUESTRA: Conjunto de unidades de una población. Cuanto más significativa sea, mejor
será la muestra. Se representa con la letra n.
UNIDAD DE MUESTREO: Está formada por uno o más elementos de la población. El total
de unidades de muestreo constituyen la población. Estas unidades son disjuntas entre sí y
cada elemento de la población pertenece a una unidad de muestreo.
PARÁMETRO: Es un resumen numérico de alguna variable observada de la población. Los
parámetros normales que se estudian son:
- La media poblacional: x
- Total poblacional: X
- Proporción: P
ESTIMADOR: Un estimador θ
*
de un parámetro θ, es un estadístico que se emplea para
conocer el parámetro θ desconocido.
ESTADÍSTICO: Es una función de los valores de la muestra. Es una variable aleatoria, cuyos
valores dependen de la muestra seleccionada. Su distribución de probabilidad, se conoce
como “Distribución muestral del estadístico”.
ESTIMACIÓN: Este término indica que a partir de lo observado en una muestra (un
resumen estadístico con las medidas que conocemos de Descriptiva) se extrapola o
generaliza dicho resultado muestral a la población total, de modo que lo estimado es el
valor generalizado a la población. Consiste en la búsqueda del valor de los parámetros
poblacionales objeto de estudio. Puede ser puntual o por intervalo de confianza:
Puntual: cuando buscamos un valor concreto.
Intervalo de confianza: cuando determinamos un intervalo, dentro del cual se
supone que va a estar el valor del parámetro que se busca con una cierta
probabilidad.
5. 5
CONTRATE DE HIPÓTESIS: Consiste en determinar si es aceptable, partiendo de datos
muéstrales, que la característica o el parámetro poblacional estudiado tome un
determinado valor o esté dentro de unos determinados valores.
NIVEL DE CONFIANZA: Indica la proporción de veces que acertaríamos al afirmar que el
parámetro θ está dentro del intervalo al seleccionar muchas muestras.
2.2 Distribuciones de muestreo.
La inferencia estadística es el proceso que permite hacer inferencias (predicciones,
suposiciones, …) acerca de los parámetros de la población a partir de los estimadores
obtenidos con una muestra. Utiliza como base el muestreo aleatorio simple.
La distribución muestral de un estimador es la distribución de la probabilidad de la
variable que recoge los distintos valores del estimador obtenidos al analizar diferentes
muestras.
Una población con cualquier distribución de frecuencias, que tiene una µ y σ concretas,
tiene una distribución muestral de la x (las medias de infinitas muestras obtenidas de
dicha población):
Con una media igual a la media de la población
Una desviación estándar, denominada error típico o estándar, igual a σ, desviación
estándar de la población, dividida entre la raíz cuadrada del tamaño de la muestra,
n:
y sigue una distribución normal (si n es suficientemente grande).
Ejemplo:
Población:
Distribución muestral x:
Histograma de x en 1000 muestras de 11
elementos.
6. 6
2.3 Estimación puntual.
Con la estimación puntual se estima el valor del parámetro poblacional desconocido, a
partir de una muestra. Para cada muestra se tendrá un valor que estima el parámetro.
Esta estimación no es muy útil si desconocemos el grado de aproximación de la estimación
al parámetro.
Un estimador de un parámetro poblacional es una función de los datos muéstrales. En
pocas palabras, es una fórmula que depende de los valores obtenidos de una muestra,
para realizar estimaciones. Lo que se pretende obtener es el valor exacto de un
parámetro. Por ejemplo, si se pretende estimar la talla media de un determinado grupo
de individuos, puede extraerse una muestra y ofrecer como estimación puntual la talla
media de los individuos de la muestra.
La media de la muestra puede ser un estimador de la media de la población, la
cuasivarianza muestral es un buen estimador de la varianza poblacional y el total muestral
es un buen estimador del total poblacional.
Por tanto, una definición más matemática de un estimador y las propiedades que debe de
cumplir un estimador para ser bueno.
Sea X1......Xn, una m.a.s. de tamaño n, decimos que es un estimador θ* de un parámetro
θ si el estadístico que se emplea para conocer dicho parámetro desconocido es este.
Propiedades deseables de un estimador
Las propiedades o criterios para seleccionar un buen estimador son los siguientes:
A) Insesgadez: Diremos que un estimador θ* de un parámetro θ es insesgado si su
esperanza coincide con el verdadero valor del parámetro.
En el caso de que no coincidan, diremos que el estimador es sesgado.
B) Eficiencia: Dados dos estimadores θ1* y θ2* para un mismo parámetro θ, se dice que
θ1* es más eficiente que θ2* si:
7. 7
C) Suficiencia: Se dice que un estimador de un parámetro es suficiente cuando para su
cálculo utiliza toda la información de la muestra.
D) Consistencia: Decimos que un estimador θ* de un parámetro θ es consistente si la
distribución del estimador tiende a concentrarse en un cierto punto cuando el tamaño de
la muestra tiende a infinito.
Métodos para obtener estimadores
El demostrar que un cierto estimador cumple estas propiedades puede ser complicado en
determinadas ocasiones. Existen varios métodos que nos van a permitir obtener los
estimadores puntuales. Los más importantes son:
MÉTODO DE LOS MOMENTOS: se basa en que los momentos poblacionales y se
estiman mediante los momentos muéstrales. Suelen dar estimadores consistentes.
MÉTODO DE MÍNIMOS CUADRADOS: consiste en obtener un estimador que hace
mínima una determinada función.
MÉTODO DE MÁXIMA VEROSIMILITUD: consiste en tomar como parámetro
poblacional el valor de la muestra que sea más probable, es decir, que tenga
mayor probabilidad. Se suelen obtener estimadores consistentes y eficientes. Es el
más utilizado.
La probabilidad de que la media muestral sea igual a la media poblacional es cero,
, es decir, que será bastante complicado obtener un estimador puntual, por
ello se utiliza más el Intervalo de Confianza y el Contraste de Hipótesis.
2.4 Estimación de intervalo.
Es deseable conocer un método que nos permita saber donde se encuentra el parámetro
con un cierto grado de certeza. Este método va a ser la determinación de un intervalo
donde estará el parámetro con un nivel de confianza.
Estimación de intervalo expresa la amplitud dentro de la cual probablemente se encuentra
un parámetro poblacional.
8. 8
El intervalo se construye a partir de una muestra, entonces, para cada muestra se tendrá
un intervalo distinto. Llamaremos al error que se permite al dar el intervalo y el nivel de
confianza será 1- . Un intervalo tiene un nivel de confianza 1- cuando el 100·(1- )% de
los intervalos que se construyen para el parámetro lo contienen.
Es deseable para un intervalo de confianza que tenga la menor amplitud posible, esta
amplitud dependerá de:
El tamaño de la muestra, mientras mayor sea el tamaño mejor será la estimación,
aunque se incurre en un aumento de costes
Nivel de confianza, si se pide mayor nivel de confianza, el intervalo será mayor.
2.5 Intervalos de confianza para medias.
En los capítulos anteriores se estudio el estadístico
Como estimador de la media poblacional , y si se considera una muestra grande ,
extraida de una población con conocida, entonces del teorema del limite central
y en consecuencia donde
Por lo que
De donde el intervalo de confianza de dos lados para la media con un nivel de confianza
de , cuando la muestra es grande es:
9. 9
Y los límites son:
El valor se obtiene de tablas de distribución normal estándar de forma que
Al denotar a z como es una notación común en estadística, pero no esta
completamente generalizada.
Cuando la muestra es pequeña (n < 30) y la población tiene una distribución normal con
variancia conocida, entonces puede emplearse.
2.6 Intervalos de confianza para diferencia entre medias.
Para construir intervalos de confianza para la diferencia de medias poblacionales se hace
uso de la distribución en el muestreo de la diferencia de medias muéstrales.
Se sabe que si son variables aleatorias independientes,
entonces:
Y por tanto, si las distribuciones de la variables son normales, cualesquiera que sean los
tamaños muéstrales, se verificara que
10. 10
También se sabe que para muestras independientes se puede asegurar que la distribución
de la diferencia de medias muéstrales es si las
distribuciones de las variables son normales.
Si se conocen las varianzas poblacionales
Y a partir del intervalo de probabilidad con para la diferencia de medias muéstrales se
construye el intervalo de confianza con coeficiente de confianza (1- ) para la diferencia
de medias poblacionales:
Si no se conocen las varianzas poblacionales pero se pueden suponer iguales
Siempre que y las muestras sean independientes la distribución
de la diferencia de medias muéstrales es
.
Si las varianzas poblacionales se pueden suponer iguales se estima la varianza común por
y en este caso la distribución del estadístico no
es normal sino y por ello, el intervalo de confianza, con coeficiente de confianza
1- será en este caso
Si no se conocen las varianzas poblaciones y no se pueden suponer iguales
11. 11
Si las varianzas poblacionales no se pueden suponer iguales, se estiman por las
cuasivarianzas de las muestras correspondientes, y es este caso el estadístico
sigue una distribución t de Student con g grados de libertad, siendo el
numero natural mas próximo a
El intervalo de confianza será:
.
2.7 Intervalos de confianza para proporciones.
Si se toma una muestra de tamaño n de una población muy grande (o infinita), y X
observaciones pertenecen a la clase de interés, entonces es un estimador puntual
de la proporción de la población que pertenece a la clase en cuestión, y la distribución de
muestreo es
Donde
Y p y n son los parámetros de la distribución binomial.
Utilizando el estimador y aproximando la cantidad p(1-p) mediante su
estimador puntual se obtiene el intervalo de confianza de dos lados con un
coeficiente para la proporción p es
…..(3.7)
Ejemplo
12. 12
En una muestra al azar de 60 secciones de tubo en una planta química, 8 de ellos
mostraron señales de corrosión seria. Construir un intervalo de confianza del 95 % para la
proporción de los tramos de tubo con corrosión seria.
Resolución
Utilizando la formula (3.7), con de tablas, y recordando que , se
tiene:
Finalmente:
2.8 Intervalos de confianza para diferencias entre proporciones.
Si dos muestras independientes de tamaño se extraen de poblaciones infinitas
con distribuciones binomiales, X representa el numero de observaciones de la primera
muestra que corresponden a la clase en cuestión, entonces la distribución de muestreo
para la diferencia de proporciones esta dada por
Donde
De la definición se obtiene el intervalo de confianza de dos lados para la diferencia de
proporciones, con un nivel de confianza de ( , el cual es
…(3.8)
Ejemplo
Dos grupos de 80 pacientes tomaron parte en un experimento en el cual un grupo recibió
píldoras que contenían un antialérgico, mientras que al otro grupo se le administro un
placebo, es decir, una píldora sin droga alguna. En el grupo que recibió el medicamento 23
exhibieron síntomas alérgicos, mientras que en el otro grupo 41 los exhibieron. Obtener
un intervalo de confianza del 99% para la diferencia entre las proporciones.
13. 13
Tópicos especiales:
Intervalo de confianza para la diferencia de medias, casos especiales.
Existen algunos casos especiales para los intervalos de confianza de diferencia de medias.
El primero de ellos es cuando se tienen datos apareados, o en pares, es decir, las muestras
aleatorias no son independientes y tienen el mismo tamaño. El segundo de ellos, que
queda un poco más allá del objetivo del presente curso, se tiene cuando las muestras son
pequeñas, independientes, con distribuciones aproximadamente normales con varianzas
desconocidas y diferentes.
Datos en pares
Cuando se observan datos en pares y se espera que exista una fuerte correlación entre
cada pareja de datos, se debe generar una nueva variable aleatoria para construir el
intervalo de confianza.
Sea la variable aleatoria , donde i =1, 2, … , n, entonces:
14. 14
Y el intervalo se puede generar mediante:
Variancias diferentes muestras pequeñas
Cuando el problema consiste en encontrar una estimación por intervalos para diferencia
de medias , las muestras son pequeñas, las poblaciones son aproximadamente
normales y las varianzas desconocidas no pueden considerarse iguales, entonces no existe
un estadístico exacto para el problema; sin embargo, algunos autores han encontrado
muy buenas aproximaciones utilizando el estadístico:
el cual tiene una distribución aproximadamente t, con v grados de libertad, los cuales se
aproximan mediante:
O bien mediante
Puesto que v difícilmente es entero se aproxima al entero más cercano.
15. 15
El intervalo de confianza de dos lados queda entonces:
2.9 Intervalos de confianza para varianzas.
Si X es una v.a. con distribución normal con media y varianza desconocidas, entonces
el estadístico empleado es
Donde
Utilizando el estadístico se obtiene el intervalo de confianza de dos lados con un
coeficiente de confianza de para , el cual es
Ejemplo:
Considerese los siguientes datos:
8.2 8.28 8.24
8.23 8.21 8.25
8.24 8.23 8.24
8.25 8.2 8.26
8.19 8.23 8.26
Obtener:
a) Un intervalo de confianza de dos lados del 95% para .
b) Un intervalo de confianza inferior del 95% para
c) Un intervalo de confianza superior de 95% para
16. 16
Resolución
De los datos de la tabla se obtiene
a) Sustituyendo en
De tablas
Por lo que
b) Para un intervalo inferior
De tablas
Entonces
c) Para un intervalo superior
De tablas
Entonces
2.10 Intervalos de confianza para razones de dos varianzas.
Si X y Y son vv.aa. independientes con distribuciones normales con medidas
desconocidas y variancias desconocidas, respectivamente, entonces el estadístico
empleado es
17. 17
Donde
Utilizando el estadístico se obtiene el intervalo de confianza de dos lados con un
coeficiente de confianza de para la relación de las variancias , el cual es
18. 18
Hines, William W. y Montgomery, Douglas C., et al.- Probabilidad y Estadística para
Ingeniería y Administración, Cuarta Edición..-CECSA.- México, 2004.
María Teresa González.- Estadística Aplicada una Visión Instrumental, Díaz de
Santos.- España, 2009.
Scheaffer, Richard L y McClave, James T. Probabilidad y Estadística para Ingeniería.-
Grupo Editorial Iberoamérica.- México 1993.
Canavos, George C.- Probabilidad y Estadística Aplicaciones Y Métodos.- McGraw-
Hill.- México, 1988.
BIBLIOGRAFÍA