2.1 Inferencia Estadistica.
Integrantes:
Jesus Felix Limon Cortes 15100549
Pedro Abraham Moreno Diaz 15100559
Jorge Sifuentes Castillo 15100591
Juan Eduardo Valle Velazquez 15100596
Luis Alejandro Puente Velazquez 15100573
Introducción a la
Inferencia Estadística
¿Que es la inferencia estadística?
La inferencia estadística es el conjunto de métodos y técnicas que permiten
inferir, a partir de la información empírica proporcionada por una muestra,
cual es el comportamiento de una determinada población con un riesgo de
error medible en términos de probabilidad.
En pocas palabras la inferencia estadística se ocupa de predecir y sacar
conclusiones sobre una población tomando como base una muestra, es
decir una parte de dicha población.
También es denominada Estadística Inductiva o
Inferencia Inductiva ya que es un procedimiento para
generar nuevo conocimiento científico.
¿Que es la inferencia estadística?
La inferencia estadística es el conjunto de métodos y técnicas que permiten
inferir, a partir de la información empírica proporcionada por una muestra,
cual es el comportamiento de una determinada población con un riesgo de
error medible en términos de probabilidad.
En pocas palabras la inferencia estadística se ocupa de predecir y sacar
conclusiones sobre una población tomando como base una muestra, es
decir una parte de dicha población.
También es denominada Estadística Inductiva o
Inferencia Inductiva ya que es un procedimiento para
generar nuevo conocimiento científico.
A partir de una población
se extrae una muestra por
algunos de los métodos
existentes, con la que se
generan datos numéricos
que se van a utilizar para
generar estadísticos con
los que realizar
estimaciones o
contrastes poblacionales.
Inferencia estadistica
Los métodos básicos de la estadística inferencial son la
estimación y el contraste de hipótesis. Ambas se apoyan
en cantidades o datos estadísticos calculados a partir de
las observaciones en una muestra.
En ambos casos se
trata de generalizar la
información obtenida
en una muestra a una
población.
Estas técnicas exigen
que la muestra sea
aleatoria.
Un fabricante de medicinas afirma que una nueva vacuna contra el catarro
desarrollada por su compañía tiene una efectividad del 95%, esto es, en promedio
95 de cada 100 personas que emplean la vacuna, pasarán el invierno sin
contagiarse de catarro. Como resulta imposible probar la vacuna en todas las
personas, consideremos que 40 personas han recibido la vacuna, y que de las 40,
35 no se contagiaron de catarro.Vemos que si la información del fabricante es
correcta se esperaría que 38 personas (40 x 0.95 = 38) pasarán el invierno sin
catarro.
Puesto que el número observado es 35, lo cual es inferior al número
esperado, ¿debería rechazarse la afirmación del fabricante en base a la
evidencia? El proceso de decisión de rechazar o no la afirmación es un
problema de inferencia estadística.
¿para que la inferencia estadística?
Población: es el conjunto de individuos sobre
los que realizamos un estudio estadístico.
Muestra: es un subconjunto de una población.
La muestra debe de representar bien a la
población para que los datos a inferir sean
correctos.
Parámetro: es la cantidad numérica calculada
sobre una población.Intenta resumir toda la
información que hay en la población en unos
pocos números.
Estadístico: es la cantidad numérica calculada
sobre una muestra que resume su información
sobre algún aspecto. Si un estadístico de usa
para aproximar un parámetro también se le
suele llamar estimador.
Normalmente nos interesa saber un parámetro,
pero dada la dificultad que conlleva estudiar a
toda la población calculamos un estimador
sobre una muestra y confiamos que sean
próximos.
Conceptos
Muestreo
Dado que en la mayoría de las ocasiones no es posible contar con los datos
completos de una población, es habitual que tengamos que manejarnos con
muestras, de modo que es importante saber elegir bien una muestra de la
población.
Si la muestra está mal elegida, diremos que no es representativa. En este caso, se
pueden producir errores imprevistos denominados sesgos.
Es importante la muestra sea elegida de forma
aleatoria.
Básicamente hay dos tipos de muestreos:
1. Muestreo no probabilístico: la muestra se elige mediante determinados
criterios subjetivos.
1. Muestreo probabilístico: Cuando la muestra se elige al azar. En este caso
podemos distinguir varios tipos:
a) Muestreo aleatorio simple:
Aquel en el que cada individuo de la población tiene las mismas posibilidades de salir
en la muestra.
Ejemplo:
En una escuela de 600 alumnos elegimos un alumno al azar y su probabilidad de
elegirlo sería de 1/600. Lo devolvemos a la población y se elige otro con las misma
probabilidad de ser elegido 1/600, y asi hasta sacar a 20 alumnos.
Notemos que si no devolvieramos al alumno, entonces, la probabilidad de escoger al
2º alumno sería de 1/599, y ya no todos tendrían la misma probabilidad de ser
elegidos. El problema es que entonces permitimos que se puedan repetir individuos.
b) Muestreo sistemático:
En el que se elige un individuo al azar y a partir de él, a intervalos constantes, se eligen
los demás hasta completar la muestra.
Ejemplo:
De 600 alumnos hemos de elegir 20 alumnos, es decir, 1 de cada 30, se procede asi:
Se ordenan los alumnos y se enumeran, se elige uno al azar, por ejemplo el alumno
27, y luego los demás se eligen a partir de este a intervalos de 30 alumnos. Entonces
escogemos por tanto a los alumnos:
27,57,87,117,147,177,207,237,267,297,327,357,387,417,447,477,507,537,567,597 y el
alumno 627 ya es otra vez el 27.
c) Muestreo estratificado:
Se divide la población en clases o estratos y se escoge, aleatoriamente, un número de
individuos de cada estrato proporcional al número de componentes de cada estrato.
Ejemplo:
De 600 alumnos, para que la muestra sea representativa, lo mejor seria conocer
cuántos alumnos de cada curso hay: 200 alumnos de 3º, 150 de 4º, 150 de 1º de
Bachillerato y 100 de 2º de Bachillerato.
Como de 600 en total hemos de elegir a 20, de 200 de 3º hemos de elegir x:
20/600 = x/200 → x = 4000/600 =6.6 ≈ 7 alumnos de 3º
De igual manera podemos calcular los alumnos correspondientes a los demás
cursos:
20/600 = y/150 → y = 3000/600 = 5 alumnos de 4º
20/600 = z/150 → z = 3000/600 = 5 alumnos de 1º de bachillerato
20/600 = t/100 → t = 2000/600 =3.3 alumnos de 2º de bachillerato
De modo que en nuestra muestra de 20 alumnos; 7 son de 3º, 5 de 4 º, 5 de 1 º y 3 de
2 º.
Para la elección de cada alumno dentro de cada curso, utilizamos el muestreo
aleatorio simple.
d) Muestreo por conglomerados:
Aquí, en lugar de elegir individuos directamente, se eligen unidades más amplias
donde se clasifican los elementos de la población, llamados conglomerados.
Los conglomerados deben ser tan heterogéneos como la población a estudiar, para
que la represente bien.
No debemos confundir estrato y conglomerado. Un estrato es homogéneo (sus
elementos tienen las mismas características), mientras que un conglomerado
es heterogéneo (debe representar bien a la población).
Ejemplo:
Supongamos que queremos extraer una muestra aleatoria de los estudiantes
universitarios del país. Se necesitaria una lista con todos ellos para poder realizar
algún muestreo del tipo de los 3 anteriores, lo cual es muy dificil de conseguir.
Sin embargo, los estudiantes están clasificados por Universidades, Facultades y
Clases. Podemos seleccionar en una primera etapa algunas Universidades,
después algunas facultades al azar, dentro de las facultades algunas clases y
dentro de las clases, algunos estudiantes por muestreo aleatorio simple.
Los conglomerados en cada etapa serían las diferentes Universidades, las
diferentes facultades y los diferentes clases.
Ejercicio 1…
En una población de 1500 jóvenes, 7500 adultos y 1000 ancianos, se hace una
encuesta a 200 personas para conocer sus actividades de ocio preferidas. Si se
utiliza un muestreo estratificado, ¿que tamaño muestral corresponde a cada
estrato?.
Ejercicio 2…
Suponga que estamos investigando sobre el porcentaje de alumnos que trabajan
de una población de 20 alumnos de la universidad de talca.
Elija una muestra aleatoria simple de tamaño muestral de tamaño n=8 de esta
población.
Estimación
Una estimación estadística es un proceso mediante el cual establecemos qué
valor debe tener un parámetro según deducciones que realizamos a partir de
estadísticos. En otras palabras, estimar es establecer conclusiones sobre
características poblacionales a partir de resultados muestrales.
La estimación se divide en:
Estimación puntual
Estimación de intervalos de confianza
Estimación Puntual
Estimación mediante un solo valor de los parametros de una distribución.
La estimación puntual consiste en utilizar el valor de un estadístico para inferir el
par´ametro de una población.
❖Usamos la media muestral X¯ para estimar la media de una población µ.
❖Usamos la proporción de una muestra ˆp para estimar la proporción
poblacional p.
Propiedades deseables de los estimadores puntuales
Básicamente para que un estimador sea bueno, se desea que la varianza del
estimador sea lo más pequeña posible, mientras que la distribución de muestreo
debe concentrarse alrededor del valor del parámetro.
Estimadores Insesgados (Centrados): Se dice que la estadística = H(X 1, X 2,..., X
n ) es un estimador insesgado del parámetro, si. Es decir, si los valores del
estimador se centran alrededor del parámetro en cuestión.
Estimadores Consistentes: Si un estimador es consistente, converge en
probabilidad al valor del parámetro que está intentando
estimar conforme el tamaño de la muestra crece. Esto
implica que la varianza de un estimador consistente
disminuye conforme n crece.
Estimadores Eficientes (Insesgados de Varianza Mínima): El hecho de que un
estimador sea centrado no garantiza que sus realizaciones caigan cerca del valor
del parámetro, hace falta además que tenga la varianza pequeña.
La varianza de un estimador insesgado es la cantidad más
importante para decidir qué tan bueno es el estimador
para estimar el parámetro.
Estimación de la Media Poblacional: La media muestral es un estimador centrado
y consistente de la media poblacional. Este resultado es válido sin importar la
distribución de probabilidad de la población de interés, siempre y cuando la
varianza tenga un valor finito.
Estimación puntual Estimación de la Proporción: Tenemos una población dividida
en dos subconjuntos, en función de una característica determinada, de forma que
la proporción de la población que posee la característica es p, y la de los que no la
poseen es 1-p. Tratamos de estimar el valor de p. El estadístico dado por la
expresión siguiente, es un estimador centrado y consistente de la proporción
poblacional.
Estimación de la Varianza Poblacional: Cuando se desconoce la media poblacional,
debemos sustituir este parámetro por su estimador muestral, y el estimador a usar para la
varianza poblacional, que es centrado o insesgado sin importar cuál sea la distribución de la
población de interés, es la cuasivarianza muestral S^(2).
Ejemplo:
Se han anotado las calificaciones de los exámenes de recuperación de
matemáticas de los alumnos de un colegio. Las notas de 15 de ellos son: 4.8, 5.3,
6.2, 3.1, 5.4, 7.2, 8.4, 6.5, 7, 7.2, 0.5, 5.2, 6.8, 7.8, 4.2;
Además 9 de estos alumnos eran chicas. Determina un estimador puntual para:
A.La nota media de la población
B.La proporción de alumnas que se presentan a la recuperación.
Estimación de la Varianza Poblacional:
Salario mensual y participación en el programa de adiestramiento para
una muestra aleatoria simple de 6 personas.
Formula:
S^(2)= (6){[(320)^2]+[(420)^2]+[(428)^2]+[(430)^2]+[(380)^2]+[(510)^2]} - (320+420+428+430+380+510)^2
6(6-1)
S^(2)=(6)(102,400+176,400+183,184+184,900+144,400+260,100) - (2,488)^2
6(5)
S^(2)=(6,308,304) - (6,190,144)
30
S^(2)=118,160
30
S^(2)=3,938.6666

inferencia estadistica

  • 1.
    2.1 Inferencia Estadistica. Integrantes: JesusFelix Limon Cortes 15100549 Pedro Abraham Moreno Diaz 15100559 Jorge Sifuentes Castillo 15100591 Juan Eduardo Valle Velazquez 15100596 Luis Alejandro Puente Velazquez 15100573
  • 2.
  • 3.
    ¿Que es lainferencia estadística? La inferencia estadística es el conjunto de métodos y técnicas que permiten inferir, a partir de la información empírica proporcionada por una muestra, cual es el comportamiento de una determinada población con un riesgo de error medible en términos de probabilidad. En pocas palabras la inferencia estadística se ocupa de predecir y sacar conclusiones sobre una población tomando como base una muestra, es decir una parte de dicha población. También es denominada Estadística Inductiva o Inferencia Inductiva ya que es un procedimiento para generar nuevo conocimiento científico.
  • 4.
    ¿Que es lainferencia estadística? La inferencia estadística es el conjunto de métodos y técnicas que permiten inferir, a partir de la información empírica proporcionada por una muestra, cual es el comportamiento de una determinada población con un riesgo de error medible en términos de probabilidad. En pocas palabras la inferencia estadística se ocupa de predecir y sacar conclusiones sobre una población tomando como base una muestra, es decir una parte de dicha población. También es denominada Estadística Inductiva o Inferencia Inductiva ya que es un procedimiento para generar nuevo conocimiento científico.
  • 5.
    A partir deuna población se extrae una muestra por algunos de los métodos existentes, con la que se generan datos numéricos que se van a utilizar para generar estadísticos con los que realizar estimaciones o contrastes poblacionales.
  • 6.
    Inferencia estadistica Los métodosbásicos de la estadística inferencial son la estimación y el contraste de hipótesis. Ambas se apoyan en cantidades o datos estadísticos calculados a partir de las observaciones en una muestra. En ambos casos se trata de generalizar la información obtenida en una muestra a una población. Estas técnicas exigen que la muestra sea aleatoria.
  • 7.
    Un fabricante demedicinas afirma que una nueva vacuna contra el catarro desarrollada por su compañía tiene una efectividad del 95%, esto es, en promedio 95 de cada 100 personas que emplean la vacuna, pasarán el invierno sin contagiarse de catarro. Como resulta imposible probar la vacuna en todas las personas, consideremos que 40 personas han recibido la vacuna, y que de las 40, 35 no se contagiaron de catarro.Vemos que si la información del fabricante es correcta se esperaría que 38 personas (40 x 0.95 = 38) pasarán el invierno sin catarro. Puesto que el número observado es 35, lo cual es inferior al número esperado, ¿debería rechazarse la afirmación del fabricante en base a la evidencia? El proceso de decisión de rechazar o no la afirmación es un problema de inferencia estadística. ¿para que la inferencia estadística?
  • 8.
    Población: es elconjunto de individuos sobre los que realizamos un estudio estadístico. Muestra: es un subconjunto de una población. La muestra debe de representar bien a la población para que los datos a inferir sean correctos. Parámetro: es la cantidad numérica calculada sobre una población.Intenta resumir toda la información que hay en la población en unos pocos números. Estadístico: es la cantidad numérica calculada sobre una muestra que resume su información sobre algún aspecto. Si un estadístico de usa para aproximar un parámetro también se le suele llamar estimador. Normalmente nos interesa saber un parámetro, pero dada la dificultad que conlleva estudiar a toda la población calculamos un estimador sobre una muestra y confiamos que sean próximos. Conceptos
  • 9.
    Muestreo Dado que enla mayoría de las ocasiones no es posible contar con los datos completos de una población, es habitual que tengamos que manejarnos con muestras, de modo que es importante saber elegir bien una muestra de la población. Si la muestra está mal elegida, diremos que no es representativa. En este caso, se pueden producir errores imprevistos denominados sesgos. Es importante la muestra sea elegida de forma aleatoria.
  • 10.
    Básicamente hay dostipos de muestreos: 1. Muestreo no probabilístico: la muestra se elige mediante determinados criterios subjetivos. 1. Muestreo probabilístico: Cuando la muestra se elige al azar. En este caso podemos distinguir varios tipos:
  • 11.
    a) Muestreo aleatoriosimple: Aquel en el que cada individuo de la población tiene las mismas posibilidades de salir en la muestra. Ejemplo: En una escuela de 600 alumnos elegimos un alumno al azar y su probabilidad de elegirlo sería de 1/600. Lo devolvemos a la población y se elige otro con las misma probabilidad de ser elegido 1/600, y asi hasta sacar a 20 alumnos. Notemos que si no devolvieramos al alumno, entonces, la probabilidad de escoger al 2º alumno sería de 1/599, y ya no todos tendrían la misma probabilidad de ser elegidos. El problema es que entonces permitimos que se puedan repetir individuos.
  • 12.
    b) Muestreo sistemático: Enel que se elige un individuo al azar y a partir de él, a intervalos constantes, se eligen los demás hasta completar la muestra. Ejemplo: De 600 alumnos hemos de elegir 20 alumnos, es decir, 1 de cada 30, se procede asi: Se ordenan los alumnos y se enumeran, se elige uno al azar, por ejemplo el alumno 27, y luego los demás se eligen a partir de este a intervalos de 30 alumnos. Entonces escogemos por tanto a los alumnos: 27,57,87,117,147,177,207,237,267,297,327,357,387,417,447,477,507,537,567,597 y el alumno 627 ya es otra vez el 27.
  • 13.
    c) Muestreo estratificado: Sedivide la población en clases o estratos y se escoge, aleatoriamente, un número de individuos de cada estrato proporcional al número de componentes de cada estrato. Ejemplo: De 600 alumnos, para que la muestra sea representativa, lo mejor seria conocer cuántos alumnos de cada curso hay: 200 alumnos de 3º, 150 de 4º, 150 de 1º de Bachillerato y 100 de 2º de Bachillerato. Como de 600 en total hemos de elegir a 20, de 200 de 3º hemos de elegir x: 20/600 = x/200 → x = 4000/600 =6.6 ≈ 7 alumnos de 3º
  • 14.
    De igual manerapodemos calcular los alumnos correspondientes a los demás cursos: 20/600 = y/150 → y = 3000/600 = 5 alumnos de 4º 20/600 = z/150 → z = 3000/600 = 5 alumnos de 1º de bachillerato 20/600 = t/100 → t = 2000/600 =3.3 alumnos de 2º de bachillerato De modo que en nuestra muestra de 20 alumnos; 7 son de 3º, 5 de 4 º, 5 de 1 º y 3 de 2 º. Para la elección de cada alumno dentro de cada curso, utilizamos el muestreo aleatorio simple.
  • 15.
    d) Muestreo porconglomerados: Aquí, en lugar de elegir individuos directamente, se eligen unidades más amplias donde se clasifican los elementos de la población, llamados conglomerados. Los conglomerados deben ser tan heterogéneos como la población a estudiar, para que la represente bien. No debemos confundir estrato y conglomerado. Un estrato es homogéneo (sus elementos tienen las mismas características), mientras que un conglomerado es heterogéneo (debe representar bien a la población).
  • 16.
    Ejemplo: Supongamos que queremosextraer una muestra aleatoria de los estudiantes universitarios del país. Se necesitaria una lista con todos ellos para poder realizar algún muestreo del tipo de los 3 anteriores, lo cual es muy dificil de conseguir. Sin embargo, los estudiantes están clasificados por Universidades, Facultades y Clases. Podemos seleccionar en una primera etapa algunas Universidades, después algunas facultades al azar, dentro de las facultades algunas clases y dentro de las clases, algunos estudiantes por muestreo aleatorio simple. Los conglomerados en cada etapa serían las diferentes Universidades, las diferentes facultades y los diferentes clases.
  • 17.
    Ejercicio 1… En unapoblación de 1500 jóvenes, 7500 adultos y 1000 ancianos, se hace una encuesta a 200 personas para conocer sus actividades de ocio preferidas. Si se utiliza un muestreo estratificado, ¿que tamaño muestral corresponde a cada estrato?.
  • 18.
    Ejercicio 2… Suponga queestamos investigando sobre el porcentaje de alumnos que trabajan de una población de 20 alumnos de la universidad de talca.
  • 19.
    Elija una muestraaleatoria simple de tamaño muestral de tamaño n=8 de esta población.
  • 20.
    Estimación Una estimación estadísticaes un proceso mediante el cual establecemos qué valor debe tener un parámetro según deducciones que realizamos a partir de estadísticos. En otras palabras, estimar es establecer conclusiones sobre características poblacionales a partir de resultados muestrales. La estimación se divide en: Estimación puntual Estimación de intervalos de confianza
  • 21.
    Estimación Puntual Estimación medianteun solo valor de los parametros de una distribución. La estimación puntual consiste en utilizar el valor de un estadístico para inferir el par´ametro de una población. ❖Usamos la media muestral X¯ para estimar la media de una población µ. ❖Usamos la proporción de una muestra ˆp para estimar la proporción poblacional p.
  • 22.
    Propiedades deseables delos estimadores puntuales Básicamente para que un estimador sea bueno, se desea que la varianza del estimador sea lo más pequeña posible, mientras que la distribución de muestreo debe concentrarse alrededor del valor del parámetro. Estimadores Insesgados (Centrados): Se dice que la estadística = H(X 1, X 2,..., X n ) es un estimador insesgado del parámetro, si. Es decir, si los valores del estimador se centran alrededor del parámetro en cuestión.
  • 23.
    Estimadores Consistentes: Siun estimador es consistente, converge en probabilidad al valor del parámetro que está intentando estimar conforme el tamaño de la muestra crece. Esto implica que la varianza de un estimador consistente disminuye conforme n crece. Estimadores Eficientes (Insesgados de Varianza Mínima): El hecho de que un estimador sea centrado no garantiza que sus realizaciones caigan cerca del valor del parámetro, hace falta además que tenga la varianza pequeña.
  • 24.
    La varianza deun estimador insesgado es la cantidad más importante para decidir qué tan bueno es el estimador para estimar el parámetro. Estimación de la Media Poblacional: La media muestral es un estimador centrado y consistente de la media poblacional. Este resultado es válido sin importar la distribución de probabilidad de la población de interés, siempre y cuando la varianza tenga un valor finito.
  • 25.
    Estimación puntual Estimaciónde la Proporción: Tenemos una población dividida en dos subconjuntos, en función de una característica determinada, de forma que la proporción de la población que posee la característica es p, y la de los que no la poseen es 1-p. Tratamos de estimar el valor de p. El estadístico dado por la expresión siguiente, es un estimador centrado y consistente de la proporción poblacional. Estimación de la Varianza Poblacional: Cuando se desconoce la media poblacional, debemos sustituir este parámetro por su estimador muestral, y el estimador a usar para la varianza poblacional, que es centrado o insesgado sin importar cuál sea la distribución de la población de interés, es la cuasivarianza muestral S^(2).
  • 26.
    Ejemplo: Se han anotadolas calificaciones de los exámenes de recuperación de matemáticas de los alumnos de un colegio. Las notas de 15 de ellos son: 4.8, 5.3, 6.2, 3.1, 5.4, 7.2, 8.4, 6.5, 7, 7.2, 0.5, 5.2, 6.8, 7.8, 4.2; Además 9 de estos alumnos eran chicas. Determina un estimador puntual para: A.La nota media de la población B.La proporción de alumnas que se presentan a la recuperación.
  • 27.
    Estimación de laVarianza Poblacional: Salario mensual y participación en el programa de adiestramiento para una muestra aleatoria simple de 6 personas. Formula: S^(2)= (6){[(320)^2]+[(420)^2]+[(428)^2]+[(430)^2]+[(380)^2]+[(510)^2]} - (320+420+428+430+380+510)^2 6(6-1) S^(2)=(6)(102,400+176,400+183,184+184,900+144,400+260,100) - (2,488)^2 6(5) S^(2)=(6,308,304) - (6,190,144) 30 S^(2)=118,160 30 S^(2)=3,938.6666