SlideShare una empresa de Scribd logo
1 de 125
MÉTODOS ESTATÍSTICOS
    E NUMÉRICOS

          UNIDADE 10

 ESTIMACIÓN DE PARÁMETROS


                     ÍNDICE
   IES Isidro Parga Pondal. Departamento de matemáticas
CONTIDOS

Tipos de estimación.
Estimación puntual.
Características dos estimadores puntuais.
Estimadores puntuais: media mostral e proporción mostral.
Intervalo de confianza.
Intervalo de confianza para a media dunha poboación normal da que
  se coñece a varianza.
Intervalo de confianza para a media dunha poboación normal da que
  non se coñece a varianza.
Intervalo de confianza para a proporción.
Intervalo de confianza para a diferenza de medias.
Intervalo de confianza para a varianza dunha poboación normal.
Erro máximo admisible.
Tamaño da mostra para a estimación da media e da proporción.



              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
Introdución

Observa estes tres problemas, correspondentes a situacións
parecidas pero moi distintas:

 Problema 1:                                               X

 A media de idade das alumnas e alumnos que se presentan á selectividade
é de 18.1 anos; e unha desviación típica de 0.5 anos. Eliximos ao azar unha
mostra de 80 alumnos/as, cal é a probabilidade de que a media de idade da
mostra estea entre 17.9 e 18.3?
 Sabemos:                                                Queremos saber:
 A media μ da poboación, que é 18.1                      A media X dunha mostra.
                                                         p(17.9< X <18.3)?


  Coñecemos a poboación e pretendemos deducir o comportamento das
mostras. Isto viuse no tema anterior baseándonos no teorema central do
límite.

                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
Introdución

 Problema 2:
 A idade media dunha mostra de 80 alumnos/as que se presentan a
selectividade é de 18.1 anos. Cal é a probabilidade de que a media de todos
os alumnos que se presentan á selectividade estea entre 17.9 e 18.3 anos?



Sabemos:                                               Queremos saber:
A media X dunha mostra:
        X                         X   =18.1            A media μ da poboación.
                                                      p(17.9<μ<18.3)?


 Coñecemos unha mostra, e pretendemos deducir aspectos da poboación.
Pretendemos inferir ou estimar o valor da media poboacional a partir do
valor da media mostral. Este é o tema da presente unidade.



                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
Introdución

 Problema 3:
 Está admitido como certo que a idade media dos alumnos/as que se
presentan á selectividade é de 18.1. Para comprobalo tomouse unha mostra
de 80 alumnos/as que se presentan á selectividade e calculouse a súa
media, obtendo 18.3. É razoable admitir como válida a hipótese inicial de
que μ=18.1?

Sabemos:                                               Queremos saber:
A media dunha mostra: X =18.3                          É admisible a afirmación de que a
                                                      media da poboación é μ=18.1?


 Temos unha afirmación ou hipótese, pero sen garantías de certeza. Para
contrastalo, tomamos unha mostra, e a partir do resultado desta, decidimos
se a hipótese é ou non é admisible.
 Este problema corresponde á chamada teoría da decisión ou contraste
de hipótese que veremos na seguinte unidade
                IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
Introdución

Nota :
Ao traballar con mostras, hai que diferenciar
entre:
Os parámetros observados na mostra,
chamados parámetros estatísticos ou
simplemente estatísticos.
Os parámetros reais correspondentes á
poboación, chamados parámetros poboacionais
ou simplemente parámetros.


              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
Introdución

  Estimación de Parámetros
                                                                                                                       Parámetros:
  Parámetros poboacionais e Estatísticos Mostrais
                                                                                        H to r m d laP b c n
                                                                                         is g a a e   o la io
                                                                                                                        Media (µ )
                                                                             10
                                                                              6

                                                                             10
                                                                              4
                                                                                                                       Varianza(σ 2)
                                                                             10
                                                                              2


        Datos


                                                                 re u n ia
                                                                             10
                                                                              0
                                                                                                                       Desv. Est. (σ )




                                                                F cec
                                                                             80


(Poboación de Interese)                                                      6

                                                                             4
                                                                              0

                                                                              0                                             Etc.
                                                                             20

                                                                              0
                                                                              -4          -2         0
                                                                                                   C ss
                                                                                                    la e
                                                                                                           2    4
                                                                                                                      Inferencias
                                                                              Histograma de la Muestra

      Mostraxe                                             16                                                         Estatísticos:
                                                           14

                                                           12                                                       Termo medio( X )
                                              Frecuencia




                                                           10


         Mostras
                                                           8                                                    Varianza mostral(S2)
                                                           6

                                                           4
                                                                                                                Desv. Est. mostral(S)
                                                           2

                                                           0
                                                           -4                      -2        0
                                                                                          Clases
                                                                                                      2    4              Etc.
                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Tipos de estimación


                           Puntual:
                           Trátase de estimar un parámetro da poboación a
                          partir dun estatístico obtido dunha mostra dela,
                          dando un único valor como aproximación do
                          parámetro poboacional.


 Tipos de                  Por intervalos de confianza:
estimación:                A partir dunha mostra aleatoria de tamaño n
                          podemos estimar o valor dun parámetro da
                          poboación dando un intervalo dentro do cal
                          confiamos que estea o parámetro, intervalo de
                          confianza, e calculando a probabilidade de que tal
                          cousa ocorra; a dita probabilidade chamámoslle
                          nivel de confianza.

              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Estimación puntual

Estimación puntual:

 Ao estimar un parámetro poboacional por estimación puntual
 poden considerarse, en principio, varios estatísticos.

 Exemplo:
 Para estimar a media poboacional μ podemos utilizar a media
 mostral x, pero tamén outros estatísticos, como mediana, moda...

 Debemos, polo tanto, facer un estudo para saber que estatístico
 proporciona unha estimación máis fiable do parámetro
 poboacional.


               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Estimación puntual

 Para controlar a fiabilidade da estimación proporcionada por un
 estatístico, definimos o concepto de estimador:

 Chamamos estimador S dun parámetro poboacional λ a unha
 variable aleatoria que a cada unha das mostras dun certo tamaño n
 da poboación asócialle o valor dun estatístico dado con valores
 aproximados ao parámetro poboacional λ que desexamos estimar.




               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Estimación puntual


Exemplo:
 Nun edificio viven 6 nenos de idades:

Nenos     Celia            Raquel              María               Alex                Marta                Xoán

Idades    5                7                   8                   6                   1                    8




                  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Estimación puntual

 Podemos polo tanto coñecer a idade media da poboación de nenos
 do edificio que sería:

              μ =(5+7+8+6+1+8)/6=5.83

 Pero un veciño do edificio non coñece as idades de todos os nenos
 así que decide estimar cal é a idade media dos nenos do edificio
 preguntándolle a idade a tres dos nenos e calculando a media de
 idade de dita mostra.

 O parámetro media poboacional intenta estimarse mediante un
 estatístico dunha mostra de tres elementos que é a media
 mostral.

 Pero, o valor obtido deste xeito, realmente se aproxima á media
 poboacional?

               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Estimación puntual

       Para controlar a fiabilidade da estimación, recorremos ao estudo do seguinte
       estimador:
       Experimento aleatorio = obtención dunha mostra de tamaño 3.
       Definimos unha variable aleatoria que a cada mostra de tres nenos asígnalle a idade
       media da mostra.
       X =idade media mostral dunha mostra de tamaño 3
Mos      Celia    Celia    Celia    Celia    Celia   Celia   Celia   Celia  Celia  Celia
tras    Raquel e Raquel e Raquel e Raquel e María e María e María e Alex e Alex e Marta e
        María    Alex     Marta Xoán        Alex    Marta Xoán      Marta Xoán    Xoán

 x       6.67      6        4.33         6.67          6.33         4.33          7            4.33          6.33    4.67


Mos Raquel Raquel Raquel Raquel Raquel Raquel María María María Alex
tras María e María e María e Alex e Alex e Marta e Alex e Alex e Marta e Marta e
     Alex    Marta   Xoán    Marta Xoán    Xoán    Marta Xoán Xoán Xoán

 x       7       5.33      7.67          4.67           7             5.33          5            7.33         5.67   5

                        IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Estimación puntual

                                                    xi                       p( X =xi)
                                                    4.33                     3/20
 Trátase dunha variable                             4.67                     2/20
aleatoria discreta coa                              5                        2/20
seguinte función masa de                            5.33                     2/20
probabilidade                                       5.67                     1/20
                                                    6                        1/20
                                                    6.33                     2/20
                                                    6.67                     2/20
                                                    7                        3/20
                                                    7.33                     1/20



            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

 Nun estimador considéranse desexables as seguintes
 características:

•     Ausencia de nesgo
•     Eficiencia
•     Consistencia

 para considerar fiable a estimación correspondente.




            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

Ausencia de nesgo
 Observa as seguintes figuras onde se representa o valor real do parámetro
 poboacional a estimar λ e os valores que toman certos estimadores                                           f(x)=8



 correspondentes a certos tamaños de mostra e a certos estatísticos que
                                                                                                             f(x)=4
                                                                                                             f(x)=0
                                                                                                             Serie 1


 poderiamos empregar.
                                                                                                             Serie 2




                                                   λ




                                                   λ




                                                   λ
                   IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

 No primeiro caso os valores do estimador están arredor de λ mentres no
 segundo caso a maior parte son maiores λ e no terceiro son
 maioritariamente menores ca λ.

 A nós interésanos que os valores do estimador se repartan ao redor de λ,
 coma no primeiro caso. Isto dáse cando a súa esperanza está próxima ao
 valor de λ e cando isto sucede dise que o estimador é non esguellado.

Dise que un estimador S dun parámetro λ é non esguellado se a
súa esperanza μS coincide con λ.

Se μS< λ , dise que ten nesgo negativo (caso 3)

Se μS> λ , dise que ten nesgo positivo (caso 2)




                IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

 Exemplo:
  Lembrades o exemplo de estimador que puxemos ?
 Fixádevos no valor da idade media da poboación de
nenos do edificio e nos valores que toma o estimador X                                                                  f(x)=0
                                                                                                                        Serie 1




que son as idades medias das mostras de tres
                                                                                                                        Serie 2




elementos que podemos tomar nesta poboación.
 Pensades que é ou non esguellado?


    4.2   4.4   4.6   4.8      5    5.2   5.4   5.6   5.8    6    6.2   6.4   6.6   6.8    7    7.2   7.4   7.6   7.8
                                                        λ




                            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

 Se no noso exemplo calculamos a esperanza do
 estimador X obtemos:


   μX = ∑ xi ⋅ pi =
         i

             3           2      2           2           1       1
   = 4.33 ⋅    + 4.67 ⋅    +5⋅    + 5.33 ⋅    + 5.67 ⋅    + 6⋅    +
            20          20     20          20          20      20
             2           2      3           1           1
   + 6.33 ⋅    + 6.67 ⋅    +7⋅    + 7.33 ⋅    + 7.67 ⋅    =
            20          20     20          20          20
   = 5.83 = idade media dos nenos do edificio



                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

Eficiencia dun estimador
Pero observa agora os valores que toman estes dous estimadores                                          f(x)=8


non esguellados do mesmo parámetro poboacional λ.                                                       f(x)=4
                                                                                                        Serie 1




Cal cres ti que deberiamos empregar se queremos un resultado
                                                                                                        Serie 2




fiable?.

                                                 λ




                                                 λ


              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

 Loxicamente nos quedariamos co segundo, pois os
 valores que toma o estatístico están máis concentrados
 arredor de λ.

 Isto ocorre cando a desviación típica do estimador é
 menor; e dise que dito estimador é máis eficiente.


 De entre dous estimadores, dicimos que é
 máis eficiente o que ten menor varianza ou
 desviación típica.

            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

Exemplo:
Os 4 fillos dunha familia estudan 1,2,3,4 horas diarias
respectivamente. Se desexásemos estimar o nº medio de horas de
estudo diario dos nenos desta familia mediante unha mostra de
tamaño 3, que estimador dos dous seguintes é máis eficiente?

X =media mostral dunha mostra de tamaño3
Me=mediana dunha mostra de tamaño 3.




              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

As posibles mostra de tamaño 3
daríannos os seguintes resultados:

Calculemos as esperanzas destas                              Mostras                      x                 Me
variables aleatorias (estimadores)
para ver se teñen ou non nesgo
                                                             (1,2,3)                  2                     2
  μX = (2 + 2.33 + 2.67 + 3)/4 = 2.5
  μMe = (2 + 2 + 3 + 3)/4 = 2.5                              (1,2,4)                  2.33                  2
O nº medio de horas de estudo da
poboación formada polos 4 nenos                              (1,3,4)                  2.67                  3
era:
     μ = (1 + 2 + 3 + 4)/4 = 2.5                             (2,3,4)                  3                     3
Como μ = μX = μMe
 ambos estimadores son non
esguellados.


                  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

Cal é máis eficiente?

 Pois aquel que teña menor varianza.
 Ao calculalas podemos ver que a media mostral ten unha
varianza máis baixa polo que é un estimador máis
eficiente que a mediana.

                                1          1          1      1
  σ X = ∑ xi ⋅ pi − x = 22 ⋅
    2        2
                                  + 2.332 ⋅ + 2.67 2 ⋅ + 32 ⋅ − 2.52 = 0.13
         i                      4          4          4      4
      2      1      1
  σ Me = 22 ⋅ + 32 ⋅ − 2.52 = 0.25
             2      2



                  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

Consistencia dun estimador
 Intuitivamente canto maior é a mostra elixida, máis
 próxima debería estar a estimación realizada dun
 parámetro ao valor real do parámetro.


 Dicimos que un estimador é consistente se a
 probabilidade de que estean moi próximos a
 estimación e o parámetro poboacional
 aumenta e tende a 1 ao incrementarse o
 tamaño da mostra.

            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais


Conclusión:
Un estimador é bo se é non esguellado, o
máis eficiente posible e consistente.




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Estimadores puntuais: media mostral e
proporción mostral
 A elección do estimador máis axeitado en cada caso excede o nivel deste
 curso.

 Abondará con saber:
•A media poboacional μ aproxímase pola media mostral x A mediana
                                                        .
 tamén é un estimador non esguellado para a media poboacional pero menos
 eficiente que a media mostral.
•A varianza poboacional σ2 aproxímase pola cuasivarianza mostral ŝ2 que
 se define como:
                                 ˆ2 = n ⋅ s2
                                 s
                                     n −1
 Parece que o estimador máis adecuado debería ser a varianza mostral,
 pero pode demostrarse que non é así.
•A proporción poboacional aproxímase por a proporción mostral.
•A diferenza de medias de dúas poboaciones μ1-μ2 aproxímase pola
 diferenza de medias mostráis x1 − x 2


                IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Estimadores puntuais: media mostral e
proporción mostral

 Exemplo 1:
 Das 25 aulas dun centro educativo escolléronse 5 ao
chou, e contouse o número de alumnos da clase,
obténdose os seguintes resultados: 33, 27, 19, 34, 30.
Estima o número total de alumnos do centro.




             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Estimadores puntuais: media mostral e
proporción mostral

Solución:
Estimaríamos o nº medio de alumnos por aula no
centro escolar calculando o nº medio de
alumnos nas 5 aulas que se tomaron como
mostra.
Como a media mostral da (33+27+19+34+30)/5=
28,6 consideramos que o nº medio de alumnos
por aula no centro escolar é 28.6 e, polo tanto,
estimariamos que o número total de alumnos no
centro escolar é de 25·28,6=715 alumnos


           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Estimadores puntuais: media mostral e
proporción mostral




Exemplo 2:
Entre os estudantes dunha cidade escolléronse
150 ao azar e preguntóuselles se estaban de
acordo co actual sistema de acceso á
universidade. 40 responderon que si. Estímese
a proporción de alumnos de dita cidade que
están de acordo co sistema de acceso á
universidade.
           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Estimadores puntuais: media mostral e
proporción mostral

Solución:
A proporción mostral é un bo estimador da
proporción poboacional, así que calculamos a
proporción de alumnos da mostra que
responderon afirmativamente e considerámola
como proporción poboacional.

 40 de 150 é un 26,67%
 Estimamos que un 26,67% da poboación está de
 acordo co sistema de acceso á universidade.

           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

A estimación puntual serve de pouco mentres
descoñezamos cal é o grao de aproximación entre o
estatístico mostral e o parámetro poboacional.
A estimación puntual non nos indica o erro cometido
en dita estimación.
O razoable na práctica é incluír, xunto á estimación
puntual do parámetro, un certo intervalo numérico
que mida a marxe de erro que, de acordo coas
observacións mostrais, poda ter dita estimación.
A idea de intervalo de confianza é propór un rango de
valores entre os que posiblemente se encontre o
verdadeiro valor do parámetro.


            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

 Por este motivo recórrese á estimación                                                  por
 intervalos.

 A partir dunha mostra de tamaño n podemos estimar o
 valor dun parámetro da poboación do seguinte modo:

  Dando un intervalo dentro do cal confiamos que estea
 o parámetro, chamado intervalo de confianza.

•Calculando a probabilidade de que tal cousa ocorra. A
 dita probabilidade chámaselle nivel de confianza que se
 nomea como p=1-α sendo α o nivel de significación.

            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

 Supoñamos que para estimar unha media poboacional μ
 tomamos unha mostra de tamaño n e a partir dela
 construímos un intervalo de confianza ao 90% para μ. É
 dicir, o nivel de confianza é 0,9 e o nivel de
 significación 0,1.

No intervalo calculado pode ou non estar realmente μ.

Nin sequera podemos dicir que μ está no intervalo
calculado cunha probabilidade do 90%.

Só podemos falar de que o intervalo contén a μ cunha
confianza do 90%. Que significa entón nivel de
confianza do 90%?

            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

 Se construímos moitos intervalos de confianza para μ cun nivel de confianza do
 90%

                                  μ




 O 90% de ditos intervalos de confianza conterán a media poboacional.




                  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza




Nota:
 Como polo xeral só vamos a dispór dunha
 mostra, temos que contar (por exemplo cun
 90% de confianza) que a mostra que temos
 pertence ao grupo das mostras boas (as que nos
 dan unha estimación do intervalo que contén o
 verdadeiro valor do parámetro).


            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

 Para o cálculo de intervalos de confianza é importante
 coñecer que é un intervalo característico e como
 calculalo

Intervalos característicos :
 Se unha variable aleatoria X ten unha distribución de
 esperanza ou media μ, chámase intervalo característico
 correspondente a unha probabilidade p a un intervalo
 centrado na media (μ-k, μ+k) tal que a probabilidade de
 que X pertenza a dito intervalo é p

                  p(μ-k < X < μ+k)=p


             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

Intervalos característicos en distribucións N(0,1)
Exemplo:
  Calcula o intervalo característico dunha variable
aleatoria Z que segue unha distribución normal N(0,1)
correspondente á probabilidade p=0.9.

 Trátase de atopar un intervalo centrado na media μ=0 e
 polo tanto da forma (-k, k) que conteña unha
 probabilidade de 0.9.

 Fóra do intervalo haberá unha probabilidade de
 1-p=1-0.9=0.1. Como o intervalo é simétrico , a área ou
 probabilidade de cada “cola” é de 0.1/2=0.05

             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza.
                                                                                                         y                                                                          f(x)=(1/sqr(2*pi))*e^-(x^2/2)
                                                                                                0.034
                                                                                                                                                                                    Relleno 2
                                                                                                                                                                                    Relleno 3
                                                                                                0.032                                                                               Relleno 4
                                                                                                                                                                                    x(t)=-1.65 , y(t)=t
                                                                                                                                                                                    x(t)=1.65 , y(t)=t
                                                                                                 0.03


                                                                                                0.028


                                                                                                0.026              N(0,1)
                                                                                                0.024


                                                                                                0.022


                                                                                                 0.02


                                                                                                0.018


                                                                                                0.016


                                                                                                0.014


                                                                                                0.012


                                                                                                 0.01


                                                                                                0.008
                                                                                                                     p(-k<z<k)=p=1-α=0,9

                                                                                                0.006


                                                                                                0.004

                                                                                                                                                               p(z>k)=(1-p)/2=α/2=0.05
         p(z<-k)=(1-p)/2=α/2=0.05                                                               0.002

                                                                                                                                                                                                               x
 -2.8   -2.6   -2.4   -2.2   -2   -1.8    -1.6   -1.4   -1.2   -1   -0.8   -0.6   -0.4   -0.2                0.2     0.4    0.6   0.8   1   1.2   1.4   1.6   1.8   2   2.2   2.4          2.6           2.8
                                         -k                                                     -0.002                                                    k
                                                                                                -0.004
                                                                                                                                   p(z≤k)=p+(1-p)/2=1-α+α/2=0.95

                                          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

      Vemos , entón, que
p(Z≤k)=0.95

      E recorremos á
táboa da distribución
N(0,1) para atopar o valor
de k correspondente á
probabilidade 0.95

 K é un valor entre 1.64 e
1.65; polo que tomamos o
punto medio 1.645
             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

 O intervalo característico para unha variable aleatoria
 Z que segue unha distribución normal N(0,1)
 correspondente a unha probabilidade p= 0.9 sería:

                           (-1.645, 1.645)

 Diremos que k=1.645 é o valor crítico correspondente a
 p=0.9.
 Habitualmente desígnase a probabilidade p mediante 1-
 α. O valor crítico correspondente denomínase zα/2
 téndose as desigualdades:

      p(Z> zα/2 )=α/2                                     p(-zα/2 <Z< zα/2 )=1-α

             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

Intervalos característicos en distribucións N(μ,σ)
Sexa X unha variable aleatoria que segue unha
distribución N(μ,σ).
Desexamos encontrar un intervalo centrado na media μ,
(μ-k, μ+k) tal que p(μ-k<X<μ+k)=p=1-α. É dicir, un
intervalo no que estea o (1-α).100% dos individuos da
poboación.

 Se X é N(μ,σ) entón Z=(X-μ)/σ é N(0,1).
 Calculariamos o intervalo característico para Z
 correspondente a p=1-α que sería (-zα/2 , zα/2 ) .
 Polo tanto:
       p(-zα/2 <Z< zα/2 )=p (-zα/2 < (X-μ)/σ < zα/2 )=p=1-α

              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

 Multiplicando toda a desigualdade pola desviación típica σ e
 sumando a toda a desigualdade a esperanza ou media μ temos:
       p(μ- zα/2 ·σ < X < μ+ zα/2 ·σ )=p=1-α

 O intervalo característico será :
                (μ- zα/2 ·σ , μ+ zα/2 ·σ )
 Exemplo:
 Calcula o intervalo característico para unha distribución N(3,2)
 correspondente a unha probabilidade p=1-α=0.9.

 Calculariamos o valor crítico para a N(0,1) correspondente a unha
 probabilidade 0.9 . zα/2 =1.645
 O intervalo característico sería (3-1.645·2, 3+1.645·2) =
(-0.29 , 6.29)


               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

O método pivotal para o cálculo de intervalos de confianza
Fixado un nivel de confianza p=1-α (0 < p < 1), o procedemento xeral
para a construción dun intervalo de confianza ao nivel
p=1-α para un parámetro de interese λ desenvólvese de acordo co
seguinte mecanismo:

1 Elección do estatístico pivotal:
 Elíxese un estatístico que dependa só do parámetro que se desexa
 estimar e cuxa distribución sexa coñecida T.

2 Formulación do enunciado probabilístico:
 Preséntase un enunciado probabilístico tendo en conta a distribución
 de probabilidade do estatístico elixido na etapa anterior e o valor
 p=1-α fixado como nivel de confianza, é dicir, determínanse
 constantes a e b tales que:
               P (a < T < b) = p=1-α
 ou dito doutro xeito, calcúlase un intervalo característico de T para
 unha probabilidade p.
                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

3 Transformación do enunciado probabilístico:

 Se é posible despexar da expresión anterior, transfórmase o
 enunciado probabilístico noutros equivalentes, mediante
 operacións aritméticas, ata chegar a unha expresión na que o
 parámetro de interese figure só no centro da desigualdade.
 Dependendo das operacións aritméticas a realizar podemos obter:

              P (T-1(a)< λ < T-1(b))= p=1-α
              P (T-1(b)< λ < T-1(a))= p=1-α


 Calculando o valor do estimador T nun caso concreto e sustituíndo
 este dato no intervalo probabilístico construído anteriormente
 obtense o intervalo de confianza para λ con un nivel de confianza
 p=1-α.


               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza

 Método pivotal aplicado ao cálculo dun
 intervalo de confianza para a media dunha
 poboación normal con varianza coñecida

Caso xeral.
X variable aleatoria que segue unha N(μ,σ),
μ descoñecida.
Para estimar μ tomamos unha mostra de tamaño
n, n≥30 e calculamos a media mostral
Como calcular un intervalo de confianza para
μ ó p·100%= (1-α)·100%?
          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
1 Elección do estatístico pivotal :
Sabemos polo teorema central do límite que X = media mostral dunha
                                              σ 
mostra de tamaño n segue unha distribución N μ,      se a poboación
                                                 n
partida X é normal ou se o tamaño das mostras é n ≥ 30 .
2 Formulació n do enunciado probabilístico :
Intentemos calcular un intervalo característico nesta distribución con probabilidade
p = 1 - α.
p(c1 < X < c2 ) = p = 1 − α
Tipificamos para pasar a unha normalN(0, 1).
                      
  c1 − μ X − μ c2 − μ 
p       <     <        = p =1−α
  σ       σ     σ     
      n     n      n
Calculamos o intervalo característico da normal N(0,1) para unha probabilidade p = 1 - α.
Para isto calculamos o valor crítico zα para esta probabilidade p = 1 - α.
                                                 2


                        IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
    Temos entón
    c1 − μ              c2 − μ
           = −zα e             = zα
     σ          2        σ          2
        n                   n
                σ                     σ
    c1 = −zα ⋅     + μ e c2 = zα ⋅       +μ
            2    n                2    n
    e polo tanto

     (           )
    p c1 < X < c2 = p = 1 − α ⇒
                                
                              p − zα ⋅
                                        σ
                                         n
                                           + μ < X < zα ⋅
                                                          σ
                                                           n
                                                                
                                                             + μ = p = 1 − α
                                    2                 2        
    3 Transform ación do enunciado probabilístico :
    E facendo as seguintes operacións na desigualdade : restar μ, restar X
    e multiplicar por − 1 , chegamos a :
               σ                 σ 
    p X − zα ⋅    < μ < X + zα ⋅    = p =1−α
            2   n             2   n
    Substituímos X polo valor concreto obtido da mostra e temos que
    o intervalo de confianza ao p ⋅ 100% = ( 1 - α ) ⋅ 100% para μ será :
              σ             σ 
     x − zα ⋅    , x + zα ⋅   
           2   n         2   n

                     IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza

Conclusión:
Deséxase estimar a media, μ, dunha poboación con
desviación típica, σ, coñecida.
Para isto recórrese a unha mostra de tamaño n na que
se obtén unha media mostral, x.
 Se a poboación de partida é normal ou se o tamaño da
 mostra é n≥30, entón o intervalo de confianza de μ cun
 nivel de confianza de p·100%= (1-α)·100% é:
                        σ             σ 
               x − zα ⋅    , x + zα ⋅   
                     2   n         2   n
 sendo zα/2 o valor crítico nunha N(0,1) correspondente a
 unha probabilidade p=1-α
             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza

 Vexamos o feito nun exemplo concreto:
 Os estudantes de bacharelato de Galicia dormen un
 número de horas diarias que se distribúe segundo unha
 lei normal de media μ descoñecida e de desviación
 típica 3. A partir dunha mostra de tamaño 30 obtívose
 unha media mostral igual a 7 horas.

 Obtén un intervalo de confianza ao 90% para a media
 de horas de sono, μ.




            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Partimos da seguinte situación:
 Poboación: Alumnos de bacharelato de Galicia.
 Variable aleatoria:
 X=nº de horas diarias de sono dun alumno de bacharelato de
 Galicia, que segue unha distribución normal de media μ
 descoñecida e desviación típica 3; N(μ,3).

 Desexamos estimar a media poboacional μ para o que tomamos
 unha mostra de tamaño 30 e calculamos o estatístico media
 mostral, que sabemos é un estimador non esguellado da media
 poboacional, obtendo x =7.

 Pero non desexamos facer unha estimación puntual senón dar un
 intervalo de confianza ao 90% para a media poboacional μ.




              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Empregaremos o método pivotal

Polo Teorema Central do Límite:
 Como X segue unha distribución normal N(μ,3), a
 variable aleatoria X que a cada unha desas mostras asígnalle a súa
 media mostral
               mi-------› xi
 segue unha distribución normal de media μ e desviación típica
 3/√30=0,55. N(μ,0´55).

 Primeiro trataremos de atopar un intervalo carácterístico (c1,c2)
 desta distribución normal N(μ,0,55) tal que
                       p(c1< X<c2)=0.9.




               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza

 Para poder atopar dito intervalo temos que tipificar
 para poder traballar ca N(0,1) que é a única tabulada.
 Se X segue unha distribución N(μ,0.55), a variable
 aleatoria Z=(X-μ)/0.55 segue unha distribución N(0,1):




              c1 − μ X − μ c2 − μ 
            p                     
              0.55 < 0.55 < 0.55  = 0.9
                                  




            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
                                                                                                         y                                                                       f(x)=(1/sqr(2*pi))*e^-(x^2/2)



 Lembremos como se calcula un intervalo característico da N(0,1)
                                                                                                0.034
                                                                                                                                                                                 Relleno 2
                                                                                                                                                                                 Relleno 3
                                                                                                0.032                                                                            Relleno 4



para unha probabilidade p=1-α=0.9.
                                                                                                                                                                                 x(t)=-1.65 , y(t)=t
                                                                                                                                                                                 x(t)=1.65 , y(t)=t
                                                                                                 0.03



 Trátase de atopar un intervalo de forma (-k,k) tal que p(-k<z<k)=p=                            0.028


                                        N(0,1)
 =1-α=0.9
                                                                                                0.026


                                                                                                0.024


                                                                                                0.022


                                                                                                 0.02


                                                                                                0.018


                                                                                                0.016


                                                                                                0.014


                                                                                                0.012


                                                                                                 0.01


                                                                                                0.008
                                                                                                                   p(-k<z<k)=p=1-α=0,9

                                                                                                0.006


                                                                                                0.004

                                                                                                                                                            p(z>k)=(1-p)/2=α/2=0.05
         p(z<-k)=(1-p)/2=α/2=0.05                                                               0.002

                                                                                                                                                                                                            x
 -2.8   -2.6   -2.4   -2.2   -2   -1.8    -1.6   -1.4   -1.2   -1   -0.8   -0.6   -0.4   -0.2                0.2   0.4   0.6   0.8   1   1.2   1.4   1.6   1.8   2   2.2   2.4          2.6           2.8
                                         -k                                                     -0.002                                                 k
                                                                                                -0.004
                                                                                                                                p(z≤k)=p+(1-p)/2=1-α+α/2=0.95
                                          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza

 Empregamos as táboas da N(0,1) para
calcular o valor de k tamén nomeado
como zα/2 tal que p(Z≤k)=p(Z< zα/2 )=0.95.

 Atopamos que é un valor intermedio
entre 1.64 e 1.65 polo que tomamos
1.645.

 K= zα/2=1.645 chámase valor crítico
correspondente á probabilidade p=1-
α=0.9.


 Polo tanto o intervalo característico
sería :
                    (-1.645,1.645)




                    IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Volvendo ao problema orixinal
  c1 − μ X − μ c2 − μ 
p                     
  0.55 < 0.55 < 0.55  = 0.9
                      
c1 − μ
       = −1.645 c1 = −1.645 ⋅ 0.55 + μ
0.55
c2 − μ
       = 1.645 c2 = 1.645 ⋅ 0.55 + μ
0.55
E como :

p(c1 < X < c2 ) = 0.9
p(μ − 1.645 ⋅ 0.55 < X < μ + 1.645 ⋅ 0.55) = 0.9
pero a min "interésame un intervalo para estimar μ".
Como o consigo?
                    IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza

  Restando μ á desigualdade :
  p(-1.645 ⋅ 0.55 < X - μ < 1.645 ⋅ 0.55) = 0.9
  Restando X á desigualdade :
  p(-1.645 ⋅ 0.55 - X < -μ < 1.645 ⋅ 0.55 - X) = 0.9
  Multiplicando a desigualdade por - 1 :
  p(1.645 ⋅ 0.55 + X > μ > −1.645 ⋅ 0.55 + X) = 0.9
  p(X - 1.645 ⋅ 0.55 < μ < X + 1.645 ⋅ 0.55) = 0.9
  Como temos unha mostra cun resultado da media mostral x = 7 substituímos
  obtendo :
  p(7 - 1.645 ⋅ 0.55 < μ < 7 + 1.645 ⋅ 0.55) = 0.9
  p(6.09525 < μ < 7.90475) = 0.9
  Poderiamos concluír que : O nº medio de horas de sono dos estudantes
   de bacharelato de Galicia está no intervalo
  (6.09525, 7.90475) cun nivel de confianza do 90%.


                      IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza

Outra maneira de enfocalo:
X variable aleatoria que segue unha N(μ,σ), μ descoñecida.
Para estimar μ tomamos unha mostra de tamaño n, n≥30 e
calculamos a media mostral
Como calcular un intervalo de confianza para μ ao p·100%=
(1-α)·100%?.
       Pensemos en x como unha estimación puntual de μ.
       Entón X segue unha distribución normal N(x, σ      )
                                                        n
       Calculamos , entón, un intervalo característico para esta distribución
       correspondente a unha probabilidade p = 1 − α.
       Dito intervalo sería :
                      σ             σ 
             x − zα ⋅    , x + zα ⋅   
                   2   n         2   n
       Dito intervalo considérase o intervalo de confianza para μ ó p ⋅ 100% =
       = (1 − α) ⋅ 100%.

                   IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza

Exemplo 2:
Co fin de investigar o cociente de intelixencia medio
dunha poboación estudiantil , pasouse unha proba a 200
estudantes. A media mostral foi de 64 puntos. Por
outra banda, sábese por estudos anteriores que o
cociente intelectual na poboación distribúese
normalmente cunha desviación típica poboacional de 9.3
puntos.
Acha un intervalo de confianza para
a media poboacional do cociente de
intelixencia ao nivel de confianza
do 92%.

            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza

SOLUCIÓN
X = cociente intelectual dun estudante
segue unha distribución normal N( μ,9.3)
Tomamos x como estimación puntual de μ
X segue unha distribución N(64, 9.3)
E como consecuencia
X = media dunha mostra de tamaño 200
                               9.3
segue unha distribución N(64,       ) = N(64, 0.66)
                               200
Calculemos un intervalo característico para esta distribución con
probabilidade 0.92
p(c1 < X < c2 ) = 0.92

                    IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
 poboación normal da que se coñece a varianza
Tipificamos
  c − 64 X − 64 c2 − 64 
p 1                     
  0.66 < 0.66 < 0.66  = 0.92
                        
E traballamo s cunha N(0,1)
Buscamos o valor crítico zα para p = 1 − α = 0.92
                               2

Se dentro do intervalo característico
hai unha probabilidade 0.92, fóra hai
α = 0.08, e, en cada " cola" 0.04; polo tanto :
p(Z ≤ zα ) = 0.96
        2

Buscamos na táboa obtendo zα = 1.75
                                    2

Polo tanto :
c1 − 64             c − 64
        = −1.75 e 2        = 1.75
 0.66                0.66
c1 = 64 − 1.75 ⋅ 0.66 = 62.8
c2 = 64 + 1.75 ⋅ 0.66 = 65.2
O intervalo de confianza buscado é ( 62.8, 65.2)

                          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
 Tamén o podes resolver simplemente empregando a fórmula, unha
 vez sabes de onde se obtén.

 Exemplo 3:
 Un nadador obtén os seguintes tempos, en minutos, en 10 probas
 cronometradas polo seu adestrador:
41.48   42.34   41.95      41.86         41.60         42.04         41.81         42.18         41.72      42.26

 Obter un intervalo de confianza para a marca media desta proba
 cun 95% de confianza, supoñendo que se coñece por outras probas
 que ditas marcas deste nadador seguen unha
 distribución normal con desviación típica de
 0.3 minutos.




                  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Solución:
Neste caso pídese un intervalo de confianza para a marca media
desta proba para dito nadador (μ) sabendo que as súas marcas
seguen unha normal con desviación típica σ=0.3 minutos.
A mostra coa que contamos é de tamaño n=10.
O intervalo de confianza será:

                            σ             σ 
                   x − zα ⋅    , x + zα ⋅   
                         2   n         2   n

 sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha
 probabilidade p=1-α=0.95




               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
 Calculamos zα/2 , o valor crítico
para unha distribución N(0,1)
correspondente a unha
probabilidade p=1-α = 0.95

 Fóra do intervalo
característico queda α=0.05 e
en cada cola α/2=0.025.

Polo tanto p(Z≤ zα/2)=0.975

E zα/2=1.96




                IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
 poboación normal da que se coñece a varianza

Calculamos x
     41.48 + 42.34 + 41.95 + 41.86 + 41.60 + 42.04 + 41.81 + 42.18 + 41.72 + 42.26
x=                                                                                 =
                                          10
  419.24
=          = 41.924
     10
e o intervalo de confianza ao 95% quedaría :
          σ              σ 
 x − zα ⋅    , x + zα ⋅    =
       2   n         2    n
                  0.3                    0.3 
 41.924 − 1.96 ⋅       , 41.924 + 1.96 ⋅     =
                    10                    10 
= ( 41.738, 42.11)




                      IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza



 Na seguinte páxina de internet tes unha
 aplicación onde se calculan este tipo de
 intervalos de confianza.
  http://www.catedu.es/
 matematicas_blecua/bacmat
 /temario/bac2/mas2_estima1.htm


          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

 Intervalo de confianza para a media dunha
 poboación normal da que “non” se coñece a varianza.

Hai que ter en conta:
Na maioría das ocasións nas que se realiza unha
investigación estatística a varianza poboacional σ é un
parámetro tan descoñecido como a media poboacional µ

A cuasivarianza mostral   2     n        ∑ i     i                                   (x − x )       2
                                                                                                          ⋅f
                           s =       ⋅ s2 = i
é un bo estimador de σ2 .       n −1          n −1
Estimaremos a desviación típica poboacional mediante
ŝ=√ŝ2.


            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza




Distinguiremos dous casos:
Se a mostra é pequena n < 30
Se a mostra é grande n ≥ 30




          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
Se a mostra é pequena n < 30:

 Empregando o método do pivote

 1 Elección do estatístico pivotal:

 Fariamos unha estimación puntual da varianza poboacional mediante a
 cuasivarianza mostral.
 Pero a distribución correspondente a X non é unha N(μ,ŝ/√n) polo que ao
 tipificala non obtemos unha N(0,1).

 Gosset estudou esta variable aleatoria como estimador para calcular
 intervalos de confianza para a media poboacional µ dunha poboación
 normal con σ2 descoñecida :
                                                      X −μ
                                            tn −1   =
                                                      sˆ
                                                         n
 E segue unha distribución chamada t de student con n-1 graos de
 liberdade.
                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

 A distribución t de Student
con n-1 graos de liberdade ten
unha función de densidade
cunha forma “parecida” a unha
N(0,1) sendo centrada no 0 e
tendo simetría par.
 Esta distribución está
tabulada.
 Calcular un intervalo
característico desta
distribución faise de xeito
similar a como se fai na N(0,1).




                IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza


 2 Formulación do enunciado probabilístico:
 Calculariamos o intervalo característico dunha t de student con
 n-1 graos de liberdade correspondente a unha probabilidade p=1-
 α. Buscariamos na táboa o valor c tal que:
                          1−p       α
     p( tn −1 < c ) = p +     =1−α+
                           2        2
     Temos un intervalo característico ( −c, c) da t de student
     con n - 1 graos de liberdade que cumpre :
                                             
                                     X −μ    
    p( − c < tn −1   < c ) = p − c <      < c = p = 1 − α
                                     sˆ      
                                        n    

                      IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza


3 Transformación do enunciado probabilístico:

  Facendo operacións na desigualdade
  (multiplicar por s , restar X, multiplicar por − 1)
                   ˆ
                     n

  p X − c ⋅ s
   
             ˆ   < μ < X + c⋅ s  = p = 1− α
                              ˆ
                                 
              n                n
  O intervalo de confianza para μ ao p ⋅ 100% = ( 1 − α ) ⋅ 100% será :
          ˆ ,X + c⋅ s 
   X − c⋅ s
                     ˆ 
            n         n


               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

 Se a mostra é grande n ≥ 30
 Entón a t de student con n-1 graos de liberdade, tn-1 ,
 aseméllase cada vez máis a unha N(0,1) . Polo que se
 traballa directamente coa N(0,1) para obter o intervalo
 característico con probabilidade p=1-α.
 A partir de aquí o problema resólvese igual chegando ao
 intervalo:

                         s
                          ˆ             s 
                                        ˆ
                x − zα ⋅
                            , x + zα ⋅   
                      2   n         2   n
                                          


            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
Conclusión:
 Deséxase estimar a media, μ, dunha poboación normal con desviación
 típica, σ, descoñecida.
 Para isto recórrese a unha mostra de tamaño n na que se obtén unha
 media mostral, x.
 Primeiro estímase puntualmente a desviación típica empregando ŝ=√ŝ2
 sendo ŝ2 a cuasivarianza mostral.

• Se o tamaño da mostra é n<30, entón o intervalo de confianza de μ cun
 nivel de confianza de p·100%= (1-α)·100% é:

                                   s
                                    ˆ          s 
                                               ˆ
                            x − c⋅
                                      ,x + c⋅   
                                    n          n
                                                 

 sendo c o valor crítico nunha t de student con n-1 graos de liberdade
 correspondente a unha probabilidade p=1-α


                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza


Se o tamaño da mostra é n≥30, entón o intervalo de
confianza de μ cun nivel de confianza de p·100% =
(1-α)·100% é:
                     s
                      ˆ            s 
                                   ˆ
            x − zα ⋅
                       , x + zα ⋅   
                  2  n         2  n

 sendo zα/2 o valor crítico nunha N(0,1) correspondente a
 unha probabilidade p=1-α



             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

Exemplo1:
Nunha multinacional de servicios modifícase a
aplicación informática de xestión. Os tempos (en horas)
que tardaron 15 traballadores elixidos ao azar en
adaptarse ao novo sistema foron os seguintes:
3.3, 2.9, 4.3, 2.6, 3.2, 4.1, 4.9, 2.8, 5.5, 5.3, 3.6, 3, 3.5,
2.9, 4.7
Determina un intervalo de confianza ao 95% para o
tempo medio de adaptación de todos os empregados da
empresa.



             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

Solución:
Neste caso pídese un intervalo de confianza para o
tempo medio de adaptación de todos os empregados(μ)
sendo a desviación típica σ descoñecida, que
estimaremos puntualmente por ŝ.
A mostra coa que contamos é de tamaño n=15<30; polo
tanto, o intervalo de confianza será:

             s
              ˆ         s  
                        ˆ             s
                                      ˆ          s 
                                                 ˆ
      x − c⋅
               ,x + c⋅    = x − c⋅
                                       ,x + c⋅    
             n         n           15         15 
                                                    


 sendo c o valor crítico para unha distribución t de
 student con n-1=14 graos de liberdade correspondente
 a unha probabilidade p=1-α=0.95
              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
                                                                      xi                      (xi − x)2
Calculamos x :                                                        3.3                   0.2209
    3.3 + 2.9 + ... + 4.7                                             2.9                   0.7569
x=                        =                                           4.3                   0.2809
            15                                                        2.6                   1.3689
  56.6                                                                3.2                   0.3249
=       = 3.77 horas                                                  4.1                   0.1089
   15                                                                 4.9                   1.2769
Calculamos s :
             ˆ                                                        2.8                   0.9409
                                                                      5.5                   2.9929
                ∑ (x − x )
                                  2
                                      ⋅f                              5.3                   2.3409
       n                i               i
                                                                      3.6                   0.0289
s2 =
ˆ         ⋅ s2 = i                                                    3                     0.5929
     n −1          n −1
                                                                      3.5                   0.0729
ˆ 12.9295 = 0.92
s2 =                                                                  2.9                   0.7569
         14                                                           4.7                   0.8649
                                                                                            12.9295
s = 0.92 = 0.96 horas
ˆ

                  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

 Calculamos c, o valor crítico
para unha distribución t de
student con n-1=14 graos de
liberdade correspondente a
unha probabilidade p=1-α = 0.95

 Buscamos os graos de liberdade
en vertical (14) e a
probabilidade p en horizontal
0.95.

C=1.761



               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

O intervalo de confianza será:
           sˆ         s  
                        ˆ               s
                                        ˆ           s 
                                                     ˆ
   x − c⋅
              ,x + c⋅     = x − c⋅
                                         ,x + c⋅     =
            n          n             15          15 
                                                       
                     0.96                   0.96 
   =  3.77 − 1.761 ⋅       , 3.77 + 1.761 ⋅       =
                       15                     15 
   = ( 3.33, 4.21)


O tempo medio de adaptación
está entre 3.33 horas e 4.21 horas
cun nivel de confianza dun 95%
                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

Exemplo 2:
Para analizar o peso duns botes de conserva,
tómase unha mostra de tamaño 32. Os pesos en
quilogramos obtidos son:
   0.97   0.99        1.01           0.98            0.99           1.00            0.98              0.98
   1.00   1.02        0.97           0.97            0.99           0.99            0.99              0.96
   0.98   1.00        0.99           1.01            1.00           1.00            0.98              0.99
   0.99   0.98        0.97           0.97            1.01           0.96            1.03              0.92


 Calcula o intervalo de confianza ao 95% para o
 peso medio dos botes.
            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza




          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza


Solución:
Neste caso pídese un intervalo de confianza para o
peso medio en quilogramos duns botes de conserva(μ)
sendo a desviación típica σ descoñecida, que
estimaremos puntualmente por ŝ.
A mostra coa que contamos é de tamaño n=32>30; polo
tanto, o intervalo de confianza será:
                           s
                            ˆ             s 
                                          ˆ
                  x − zα ⋅
                              , x + zα ⋅   
                        2   n         2  n
 sendo zα/2 o valor crítico nunha N(0,1) correspondente a
 unha probabilidade p=1-α=0.95

             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

Calculamos x :                               xi            fi       xi ·fi          (xi − x)2              (xi − x)2 ·f i
     ∑x ⋅f
         i   i
                   31.57                     0.92          1        0.92             0.004489                   0.004489
x=   i
                 =       =                   0.96          2        1.92             0.000729                   0.001458
      N             32
= 0.987 Kg                                   0.97          5        4.85             0.000289                   0.001445
Calculamos s :
           ˆ                                 0.98          6        5.88             0.000049                   0.000294

                   ∑ (x − x)
                                 2           0.99          8        7.92             0.000009                   0.000072
                                     ⋅f
       n           i                   i
                                             1             5        5                0.000169                   0.000845
s =
ˆ2
          ⋅s = i
            2

     n −1          n −1                      1.01          3        3.03             0.000529                   0.001587
     0.013128
s2 =
ˆ              = 0.00042                     1.02          1        1.02             0.001089                   0.001089
         31
                                             1.03          1        1.03             0.001849                   0.001849
s = 0.00042 = 0.206 Kg
ˆ
                                                           32       31.57                                       0.013128


                      IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

 Calculamos zα/2 , o valor crítico
para unha distribución N(0,1)
correspondente a unha
probabilidade p=1-α = 0.95

 Fóra do intervalo
característico queda α=0.05 e
en cada cola α/2=0.025.

Polo tanto p(Z≤ zα/2)=0.975

E zα/2=1.96



                IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

O intervalo de confianza será:
                s
                 ˆ             s 
                                ˆ
       x − zα ⋅
                   , x + zα ⋅    =
             2   n         2   n
                       0.206                  0.206 
       0.987 − 1.96 ⋅         ,0.987 + 1.96 ⋅       =
                          32                    32 
      ( 0.916,1.058)
O peso medio dos botes
de conserva está entre
0.916 Kg e 1.058 Kg cun
nivel de confianza do 95%

             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Intervalo de confianza para a proporción




 Intervalo de confianza para a
 proporción.
 Desexamos atopar un intervalo de confianza
 cun nivel de confianza do p’·100%=(1-α)·100%
 para a proporción p poboacional de certa
 característica C.



           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Intervalo de confianza para a proporción

 O método pivotal
 1 Elección do estatístico pivotal:

 Para iso recórrese a unha mostra de tamaño n, na que se obtén
 unha proporción mostral pr.
 Se x é o número de éxitos nas n probas, entón o estimador é:
                       Pr=X/n
 X=nº de éxitos, en principio, corresponde a unha distribución
 binomial B(n,p)
 p=probabilidade de éxito , μ=np e σ=√npq.

 Pero se np>5 e nq>5 dita binomial aproxímase por unha normal
 N(np,√npq) .

 E neste caso Pr=x/n segue unha distribución normal
 N(np/n, √npq/n)=N(p,√(pq/n))=N(p,√(p(1-p)/n)
               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Intervalo de confianza para a proporción

2 Formulación do enunciado probabilístico:
 Trataremos de atopar un intervalo característico do estimador que conteña unha
 probabilidade p’=1-α e p(c1<Pr<c2)=p’=1-α, Tipificamos a normal, para traballar cunha
 N(0,1)                              
                                                     
            c −p       Pr − p      c −p
         p 1        <           < 2                   = p'= 1 − α
           p(1 - p)   p(1 - p )   p( 1 - p )         
                                                     
              n          n            n              
         Buscamos na táboa da N(0,1) o valor crítico para p'= 1 − α
                                  α
         p(Z ≤ zα/2 ) = 1 − α +
                                  2
         Entón :
           c1 − p                      c2 − p
                       = −zα/2 e                   = zα/2
           p(1 - p )                   p( 1 - p)
              n                            n
                           p(1 - p )                         p(1 - p )
         c1 = p − zα/2 ⋅               e c2 = p + zα/2 ⋅
                              n                                 n
         Polo tanto :
                                         p(1 - p )                   p(1 - p )     
         p(c1 < Pr < c2 ) = p p − zα/2 ⋅
                                                   < Pr < p + zα/2 ⋅                = p'= 1 − α
                                                                                    
                                            n                           n          
                         IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Intervalo de confianza para a proporción

3 Transformación do enunciado probabilístico:
Facendo as operacións seguintes na desigualdade conseguimos que p quede no
 medio:
         Restar p :
                    p(1 - p)                   p( 1 - p)   
         p − zα/2 ⋅
                             < Pr - p < zα/2 ⋅              = p'= 1 − α
                                                            
                       n                           n       
         Restar Pr :
                    p(1 - p)                    p(1 - p)      
         p − zα/2 ⋅
                             − Pr < -p < zα/2 ⋅          − Pr  = p'= 1 − α
                                                               
                       n                           n          
         Multiplicar por − 1 :
                  p( 1 - p)                    p( 1 - p)      
         p zα/2 ⋅
                            + Pr > p > −zα/2 ⋅           + Pr  = p'= 1 − α
                                                               
                      n                            n          
                       p(1 - p)                   p( 1 - p) 
         p Pr - zα/2 ⋅
                                < p < Pr + zα/2 ⋅            = p'= 1 − α
                          n                           n    
         Sustituindo Pr polo valor concreto obtido da mostra, o mesmo que p, que non é coñecido
         obtemos como intervalo de confianza ao nivel de confianza dun p'⋅100% = ( 1 − α ) ⋅ 100% :
                      pr(1 - pr)               pr( 1 - pr )   
          pr - zα/2 ⋅            , pr + zα/2 ⋅                
                          n                         n         
                                                              
                      IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Intervalo de confianza para a proporción

Conclusión:
 Deséxase estimar a proporción p , de individuos cunha
 certa característica que hai nunha poboación. Para iso
 recórrese a unha mostra de tamaño n, na que se obtén
 unha proporción mostral pr.
 O intervalo de confianza de p cun nivel de confianza
 p’·100%=(1-α)·100% é:

                           pr( 1 - pr )               pr(1 - pr ) 
               pr - zα/2 ⋅              , pr + zα/2 ⋅             
                                n                         n       
                                                                  


 sendo zα/2 o valor crítico nunha N(0,1) correspondente a
 unha probabilidade p’=1-α

             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Intervalo de confianza para a proporción

Exemplo:

 Para estudar a proporción
de estudantes que
practicaban football,
tómase unha mostra de
tamaño 300. O resultado
obtido é que o practican
210. Calcula o intervalo de
confianza para a
proporción p cun nivel de
confianza do 98%.


             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Intervalo de confianza para a proporción


 Queremos estimar a proporción de estudantes que practican
 football, polo que tomamos unha mostra de tamaño n=300,
 obtendo unha proporción mostral pr=210/300=0.7 (70%).
 Sabemos que o intervalo de confianza para unha proporción p cun
 nivel de confianza do 98% é:
                        pr( 1 - pr )               pr( 1 - pr )            
            pr - zα/2 ⋅              , pr + zα/2 ⋅                         
                             n                          n                  
                                                                           
 sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha
 probabilidade 0.98




                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Intervalo de confianza para a proporción

 Calculamos zα/2 , o valor crítico
para unha distribución N(0,1)
correspondente a unha
probabilidade p’=1-α = 0.98

 Fóra do intervalo
característico queda α=0.02 e
en cada cola α/2=0.01

Polo tanto p(Z≤ zα/2)=0.99

 zα/2 está entre 2.32 e 2.33,
tomaremos 2.325



                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Intervalo de confianza para a proporción



          O intervalo de confianza
  para a proporción de estudantes
  que xogan ao fútbol cun nivel de
  confianza dun 98% será:
               pr( 1 - pr)                  pr(1 - pr ) 
   pr - zα/2 ⋅             , pr + zα/2 ⋅                =
                    n                           n       
                                                        
                     0.7 ⋅ ( 1 − 0.7 )                     0.7 ⋅ ( 1 − 0.7 )   
   0.7 − 2.325 ⋅                       , 0.7 + 2.325 ⋅                         =
                          300                                  300             
                                                                               
  ( 0.64, 0.76)


         O intervalo está entre
  un 64% e un 76%


                               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
9. Intervalo de confianza para a diferenza de
medias

Intervalo de confianza para a diferenza de medias.
 Desexamos atopar un intervalo de confianza cun nivel de confianza do
 p·100% = (1-α)·100% para a diferenza de medias
 μ1-μ2 de dúas poboacións sendo as desviacións típicas de ditas poboacións
 coñecidas σ1 e σ2.

O método pivotal
 1 Elección do estatístico pivotal:

 Para iso recórrese a dúas mostras de tamaños n1 e n2, nas que se
                                   x
 obteñen dúas medias mostrais x1 e 2 .Empregaremos como
 estimador :
                                            X1 − X2
 A distribución desta variable viuse que correspondía a unha normal
    N(μ1-μ2, √(σ12/ n1 + σ22/ n2 )) se as poboacións iniciais eran
 normais ou se o tamaño das mostras é maior de 30
                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
9. Intervalo de confianza para a diferenza de
medias
2 Formulación do enunciado probabilístico:
 Trataremos de atopar un intervalo característico do estimador que conteña unha
 probabilidade p=1-α
           (                      )
          p c1 < X1 − X2 < c2 = p = 1 − α
          Tipificamos para traballar coa N(0,1)
                                                                       
                                                                       
            c1 − ( μ1 − μ2 ) (X1 − X2 ) − ( μ1 − μ2 ) c2 − ( μ1 − μ2 ) 
          p                 <                        <                  = p'= 1 − α
            σ1 + σ 2                σ12 σ2               σ12 σ2 
                  2      2                    2                    2

            n                           +                     +
                 1     n2           n1 n2                n1 n2        
                                                                                                                 α
          Buscamos na táboa da N(0,1) o valor crítico para p = 1 − α; p(Z ≤ zα/2 ) = 1 − α +
                                                                                                                 2
          Entón :
          c1 − ( μ1 − μ2 )               c2 − ( μ1 − μ2 )
                             = −zα/2 e                      = zα/2
               σ
               2
                   σ  2
                                            σ12 σ2
                                                 2
               1
                 +    2
                                               +
               n1 n2                        n1 n2
                                      σ12 σ2
                                           2
                                                                              σ12 σ2
                                                                                   2
          c1 = ( μ1 − μ2 ) − zα/2 ⋅      +      e c2 = ( μ1 − μ2 ) + zα/2 ⋅      +
                                      n1 n2                                   n1 n2
          Polo tanto :
                                                         σ2 σ2                                  σ2 σ2 
          p(c1 < X1 − X2 < c2 ) = p ( μ1 − μ2 ) − zα/2 ⋅ 1 + 2 < X1 − X2 < ( μ1 − μ2 ) + zα/2 ⋅ 1 + 2  = p = 1 − α
                                                         n1 n2                                  n1 n2 
                                                                                                      
                              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
9. Intervalo de confianza para a diferenza de
medias
3 Transformación do enunciado probabilístico
     Facendo operacións na desigualdade conseguimos que μ1 − μ2quede no medio
     Restar μ1 − μ2 :
                σ2 σ2                                    σ2 σ2 
     p − zα/2 ⋅ 1 + 2 < (X1 − X2 ) − (μ1 − μ2 ) < zα/2 ⋅ 1 + 2  = p = 1 − α
                n1 n2                                    n1 n2 
                                                               
     Restar X1 − X2 :
                                                                     
       − z ⋅ σ1 + σ2 − (X − X ) < −(μ − μ ) < z ⋅ σ1 + σ2 − (X − X )  = p = 1 − α
                2    2                               2   2
     p
       α/2 n1 n2          1  2       1   2     α/2
                                                    n1 n2
                                                               1   2
                                                                      
                                                                     
     Multiplicar por − 1 :
              σ2 σ2                                     σ2 σ2             
     p zα/2 ⋅ 1 + 2 + (X1 − X2 ) > (μ1 − μ2 > −zα/2 ⋅ 1 + 2 + (X1 − X2 )  = p = 1 − α
              n1 n2                                     n1 n2             
                                                                          
                           σ2 σ2                                 σ2 σ2 
     p (X1 − X2 ) − zα/2 ⋅ 1 + 2 < μ1 − μ2 < (X1 − X2 ) + zα/2 ⋅ 1 + 2  = p = 1 − α
                           n1 n2                                 n1 n2 
                                                                       
     Substituíndo X1 − X2 polo valor concreto obtido da mostra,
     obtemos como intervalo de confianza ao nivel de confianza dun p ⋅ 100% = ( 1 − α ) ⋅ 100% :
                                                         2 
      ( x − x ) − z ⋅ σ1 + σ 2 , ( x − x ) + z ⋅ σ 1 + σ 2 
                         2    2                     2

      1 2          α/2
                        n1 n2
                                     1   2     α/2
                                                   n1 n2 
                                                           
                        IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
9. Intervalo de confianza para a diferenza de
medias
Conclusión:
 Deséxase estimar a diferenza de medias μ1-μ2 de dúas poboacións con desviacións
 típicas, σ1 e σ2, , coñecidas .
 Para isto recórrese a dúas mostras de tamaños n1 e n2 nas que se obteñen dúas
 medias mostrais.

 Entón, o intervalo de confianza de μ1-μ2 cun nivel de confianza de p·100%= (1-
 α)·100% é:
                              σ12 σ2
                                    2
                                                          σ12 σ2 
                                                               2
              (x − x ) − z ⋅     + , (x1 − x2 ) + zα/2 ⋅    +   
              1     2     α/2
                               n1 n2                      n1 n2 
                                                                

 sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha probabilidade p=1-α



 Se as desviacións típicas, σ1 e σ2, , non fosen coñecidas, pero o tamaño das dúas
 mostras fose maior de 30 tomariamos no lugar das varianzas poboacionais, as
 cuasivarianzas mostrais, ŝ1 e ŝ2 .


                   IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
9. Intervalo de confianza para a diferenza de
medias

Exemplo:
O tempo en minutos que tardan en reparar certo tipo
de avaría nun taller A segue unha distribución normal
con desviación típica de 25 minutos; mentres nun taller
B a desviación típica é de 30 minutos. Nunha mostra de
10 reparacións dese tipo de avaría no taller A o tempo
medio foi de 80 minutos, mentres que nunha mostra de
15 reparacións en B a media foi de 75 minutos.

 Calcula o intervalo de confianza para a diferenza de
 tempos medios, cun nivel de significación α do 1%.



             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
9. Intervalo de confianza para a diferenza de
medias
Solución:
Neste caso pídese un intervalo de confianza para a diferenza de
tempos medios de reparación dun tipo de avaría entre dous
talleres A e B (μ1-μ2 ) sabendo que o tempo de reparación deste
tipo de avaría segue nos dous talleres unha distribución normal
con desviacións típicas σ1=25 minutos e σ2=30 minutos
respectivamente.
As mostra coas que contamos son de tamaños n1=10 e n2=15;
obténdose nelas tempos medios mostrais de 80 minutos e 75
minutos respectivamente.
Polo tanto, o intervalo de confianza será:
                         σ12 σ2
                               2
                                                     σ12 σ2 
                                                          2
         (x − x ) − z ⋅     + , (x1 − x2 ) + zα/2 ⋅    +   
           1   2     α/2
                          n1 n2                      n1 n2 
                                                           
 sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha
 probabilidade p=1-α=1-0.1=0.99

               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
9. Intervalo de confianza para a diferenza
de medias
 Calculamos zα/2 , o valor crítico
para unha distribución N(0,1)
correspondente a unha
probabilidade p=1-α = 0.99

 Fóra do intervalo
característico queda α=0.01 e en
cada cola α/2=0.005

Polo tanto p(Z≤ zα/2)=0.995

 zα/2 está entre 2.57 e 2.58,
tomaremos 2.575



                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
9. Intervalo de confianza para a diferenza de
medias

O intervalo de confianza para a diferenza de medias quedaría :
                 σ12 σ2
                       2
                                             σ12 σ2 
                                                  2
 (x − x ) − z ⋅     + , (x1 − x2 ) + zα/2 ⋅    +   =
   1   2     α/2
                  n1 n2                      n1 n2 
                                                   
                     252 302                       252 302 
 (80 − 75) − 2.575 ⋅    +    , (80 − 75) + 2.575 ⋅    +    =
                     10   15                       10   15 
                                                           
( − 23.5, 33.5)




                IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
10. Intervalo de confianza para a varianza

 Intervalo de confianza para a varianza dunha distribución
 normal .
 Desexamos atopar un intervalo de confianza cun nivel de confianza do p·100%=(1-
 α)·100% para a varianza σ2 dunha poboación normal.

O método pivotal
 1 Elección do estatístico pivotal:

 Para iso recórrese a unha mostra de tamaño n, na que se obtén a
 cuasivarianza mostral ŝ .
 Empregaremos como estimador
                                            ˆ
                                    n − 1 ⋅ S2     (           )
                                                           σ2
 Polo Teorema de Fisher sabemos que dita variable aleatoria segue unha
 distribución chi-cadrado con n-1 graos de liberdade
 No seguinte enlace podes observar a forma que ten a función de
 densidade de dita distribución.


                  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
10. Intervalo de confianza para a varianza

2 Formulación do enunciado probabilístico:
Trataremos de atopar un intervalo do estimador que
conteña unha probabilidade p=1-α e que deixe a cada
lado (dúas colas) unha probabilidade (1-p)/2=α/2
   
  p c1 <
          (n − 1) ⋅ S2 < c  = p = 1 - α
                    ˆ
                           
             σ2
                          2
                          
  Buscamos na táboa da chi - cadrado con n - 1 graos de liberdade os valores
  c e c que deixan á súa esquerda probabilidades
   1 2
      1−p α        1−p      α
   de    =    e p+      =1−
       2   2        2       2
  respectivamente.




                          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
10. Intervalo de confianza para a varianza

3 Transformación do enunciado probabilístico
 Facendo as operacións seguintes na desigualdade conseguimos que σ2 quede no
 medio:

      c1 < ( n − 1) ⋅ S < c2  = p = 1 - α
                      ˆ2     
    p
                σ2           
                             
                             c1      ˆ
                                     S2      c 
    Dividir por n - 1 : p         < 2 < 2  = p =1−α
                             n -1 σ        n -1 
                                                
                ˆ          c1       1       c2      
    Dividir por S2 :p             < 2<
                      (n - 1) ⋅ S2 σ
                                                      = p =1−α
                                 ˆ                ˆ2 
                                        (n - 1) ⋅ S 
                     
    Ao inverter as fraccións as desigualdades dan a volta :
                 ˆ
      (n - 1) ⋅ S2                ˆ
                         (n - 1) ⋅ S2                             ˆ
                                                        (n - 1) ⋅ S2                ˆ
                                                                           (n - 1) ⋅ S2 
    p              >σ >
                       2               = p =1−α ;    p              <σ <
                                                                        2                = p =1−α
           c1                c2                            c2                c1      
                                                                                     
                      ˆ
    Substituíndo S2 polo valor concreto obtido da mostra,
    obtemos como intervalo de confianza ao nivel de confianza dun p ⋅ 100% = ( 1 − α ) ⋅ 100% :
                ˆ            ˆ
     (n - 1) ⋅ S2 (n - 1) ⋅ S2 
                 ,             
          c2           c1      
                               

                          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
10.estimacióndeparámetros
10.estimacióndeparámetros
10.estimacióndeparámetros
10.estimacióndeparámetros
10.estimacióndeparámetros
10.estimacióndeparámetros
10.estimacióndeparámetros
10.estimacióndeparámetros
10.estimacióndeparámetros
10.estimacióndeparámetros
10.estimacióndeparámetros
10.estimacióndeparámetros
10.estimacióndeparámetros
10.estimacióndeparámetros
10.estimacióndeparámetros
10.estimacióndeparámetros
10.estimacióndeparámetros
10.estimacióndeparámetros
10.estimacióndeparámetros

Más contenido relacionado

Destacado

Procedimientos de limpieza de dispositivos
Procedimientos de limpieza de dispositivosProcedimientos de limpieza de dispositivos
Procedimientos de limpieza de dispositivosLluvia Lopez Velazquez
 
Repositorios de Datos para comunidades científicas.
Repositorios de Datos para comunidades científicas. Repositorios de Datos para comunidades científicas.
Repositorios de Datos para comunidades científicas. Rodrigo Torrens
 
C:\documents and settings\pc\escritorio\presentación1
C:\documents and settings\pc\escritorio\presentación1C:\documents and settings\pc\escritorio\presentación1
C:\documents and settings\pc\escritorio\presentación1sofialabebe
 
Ksi generacion net
Ksi generacion netKsi generacion net
Ksi generacion netykatiuska
 
Manual statgraphics de Chemo
Manual statgraphics de ChemoManual statgraphics de Chemo
Manual statgraphics de ChemoSergioPlascencia
 
Sistemas!!
Sistemas!!Sistemas!!
Sistemas!!fabio623
 
Dia Internet Segura
Dia Internet SeguraDia Internet Segura
Dia Internet Segurajacquelineld
 
Nota de apoio a presidente da OAB
Nota de apoio a presidente da OABNota de apoio a presidente da OAB
Nota de apoio a presidente da OABPortal NE10
 
Técnica de Revisión y Evaluación de Programas
Técnica de Revisión y Evaluación de ProgramasTécnica de Revisión y Evaluación de Programas
Técnica de Revisión y Evaluación de ProgramasReyes Campos
 
Herramientas basicas
Herramientas basicasHerramientas basicas
Herramientas basicasgeraldine1013
 
Mapas conceptuales
Mapas conceptualesMapas conceptuales
Mapas conceptualesEric Galindo
 
Articulo vero
Articulo veroArticulo vero
Articulo verodarias33
 
How high heels and fishnet have driven internet innovation final
How high heels and fishnet have driven internet innovation   finalHow high heels and fishnet have driven internet innovation   final
How high heels and fishnet have driven internet innovation finalThe345Muddler
 

Destacado (19)

Procedimientos de limpieza de dispositivos
Procedimientos de limpieza de dispositivosProcedimientos de limpieza de dispositivos
Procedimientos de limpieza de dispositivos
 
แนวข้อสอบ พระราชบัญญัติสภาตำบลและองค์การบริหารส่วนตำบล พ.ศ. 2537 แก้ไขเพิ่มเต...
แนวข้อสอบ พระราชบัญญัติสภาตำบลและองค์การบริหารส่วนตำบล พ.ศ. 2537 แก้ไขเพิ่มเต...แนวข้อสอบ พระราชบัญญัติสภาตำบลและองค์การบริหารส่วนตำบล พ.ศ. 2537 แก้ไขเพิ่มเต...
แนวข้อสอบ พระราชบัญญัติสภาตำบลและองค์การบริหารส่วนตำบล พ.ศ. 2537 แก้ไขเพิ่มเต...
 
Ejintconfianza
EjintconfianzaEjintconfianza
Ejintconfianza
 
Repositorios de Datos para comunidades científicas.
Repositorios de Datos para comunidades científicas. Repositorios de Datos para comunidades científicas.
Repositorios de Datos para comunidades científicas.
 
La planificación
La planificaciónLa planificación
La planificación
 
Child id theftreport2012
Child id theftreport2012Child id theftreport2012
Child id theftreport2012
 
C:\documents and settings\pc\escritorio\presentación1
C:\documents and settings\pc\escritorio\presentación1C:\documents and settings\pc\escritorio\presentación1
C:\documents and settings\pc\escritorio\presentación1
 
Ksi generacion net
Ksi generacion netKsi generacion net
Ksi generacion net
 
Manual statgraphics de Chemo
Manual statgraphics de ChemoManual statgraphics de Chemo
Manual statgraphics de Chemo
 
Sistemas!!
Sistemas!!Sistemas!!
Sistemas!!
 
Dia Internet Segura
Dia Internet SeguraDia Internet Segura
Dia Internet Segura
 
Nota de apoio a presidente da OAB
Nota de apoio a presidente da OABNota de apoio a presidente da OAB
Nota de apoio a presidente da OAB
 
Técnica de Revisión y Evaluación de Programas
Técnica de Revisión y Evaluación de ProgramasTécnica de Revisión y Evaluación de Programas
Técnica de Revisión y Evaluación de Programas
 
Herramientas basicas
Herramientas basicasHerramientas basicas
Herramientas basicas
 
Tema v
Tema vTema v
Tema v
 
Trabajo final portafolio
Trabajo final portafolioTrabajo final portafolio
Trabajo final portafolio
 
Mapas conceptuales
Mapas conceptualesMapas conceptuales
Mapas conceptuales
 
Articulo vero
Articulo veroArticulo vero
Articulo vero
 
How high heels and fishnet have driven internet innovation final
How high heels and fishnet have driven internet innovation   finalHow high heels and fishnet have driven internet innovation   final
How high heels and fishnet have driven internet innovation final
 

Más de German Mendez

Aula mentor. Oferta formativa 2012
Aula mentor. Oferta formativa 2012Aula mentor. Oferta formativa 2012
Aula mentor. Oferta formativa 2012German Mendez
 
7.variablesaleatoriasdiscretas.distribuciónbinomial
7.variablesaleatoriasdiscretas.distribuciónbinomial7.variablesaleatoriasdiscretas.distribuciónbinomial
7.variablesaleatoriasdiscretas.distribuciónbinomialGerman Mendez
 
11.contrastedehipóteses
11.contrastedehipóteses11.contrastedehipóteses
11.contrastedehipótesesGerman Mendez
 
8.distribuciónscontinuas.distribuciónnormal
8.distribuciónscontinuas.distribuciónnormal8.distribuciónscontinuas.distribuciónnormal
8.distribuciónscontinuas.distribuciónnormalGerman Mendez
 
6.probabilidadecondicionada
6.probabilidadecondicionada6.probabilidadecondicionada
6.probabilidadecondicionadaGerman Mendez
 
5.cálculodeprobabilidades
5.cálculodeprobabilidades5.cálculodeprobabilidades
5.cálculodeprobabilidadesGerman Mendez
 
4.técnicasdereconto
4.técnicasdereconto4.técnicasdereconto
4.técnicasderecontoGerman Mendez
 
3.distribuciónsbidimensionais
3.distribuciónsbidimensionais3.distribuciónsbidimensionais
3.distribuciónsbidimensionaisGerman Mendez
 
2.medidasdecentralizacióneposición
2.medidasdecentralizacióneposición2.medidasdecentralizacióneposición
2.medidasdecentralizacióneposiciónGerman Mendez
 
1.iniciaciónáestatística
1.iniciaciónáestatística1.iniciaciónáestatística
1.iniciaciónáestatísticaGerman Mendez
 

Más de German Mendez (14)

Aula mentor. Oferta formativa 2012
Aula mentor. Oferta formativa 2012Aula mentor. Oferta formativa 2012
Aula mentor. Oferta formativa 2012
 
7.variablesaleatoriasdiscretas.distribuciónbinomial
7.variablesaleatoriasdiscretas.distribuciónbinomial7.variablesaleatoriasdiscretas.distribuciónbinomial
7.variablesaleatoriasdiscretas.distribuciónbinomial
 
Anexo i
Anexo iAnexo i
Anexo i
 
Anexo ii
Anexo iiAnexo ii
Anexo ii
 
11.contrastedehipóteses
11.contrastedehipóteses11.contrastedehipóteses
11.contrastedehipóteses
 
9.mostraxe
9.mostraxe9.mostraxe
9.mostraxe
 
8.distribuciónscontinuas.distribuciónnormal
8.distribuciónscontinuas.distribuciónnormal8.distribuciónscontinuas.distribuciónnormal
8.distribuciónscontinuas.distribuciónnormal
 
6.probabilidadecondicionada
6.probabilidadecondicionada6.probabilidadecondicionada
6.probabilidadecondicionada
 
5.cálculodeprobabilidades
5.cálculodeprobabilidades5.cálculodeprobabilidades
5.cálculodeprobabilidades
 
4.técnicasdereconto
4.técnicasdereconto4.técnicasdereconto
4.técnicasdereconto
 
3.distribuciónsbidimensionais
3.distribuciónsbidimensionais3.distribuciónsbidimensionais
3.distribuciónsbidimensionais
 
2.medidasdecentralizacióneposición
2.medidasdecentralizacióneposición2.medidasdecentralizacióneposición
2.medidasdecentralizacióneposición
 
1.iniciaciónáestatística
1.iniciaciónáestatística1.iniciaciónáestatística
1.iniciaciónáestatística
 
Indice
IndiceIndice
Indice
 

10.estimacióndeparámetros

  • 1. MÉTODOS ESTATÍSTICOS E NUMÉRICOS UNIDADE 10 ESTIMACIÓN DE PARÁMETROS ÍNDICE IES Isidro Parga Pondal. Departamento de matemáticas
  • 2. CONTIDOS Tipos de estimación. Estimación puntual. Características dos estimadores puntuais. Estimadores puntuais: media mostral e proporción mostral. Intervalo de confianza. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza. Intervalo de confianza para a proporción. Intervalo de confianza para a diferenza de medias. Intervalo de confianza para a varianza dunha poboación normal. Erro máximo admisible. Tamaño da mostra para a estimación da media e da proporción. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 3. Introdución Observa estes tres problemas, correspondentes a situacións parecidas pero moi distintas: Problema 1: X A media de idade das alumnas e alumnos que se presentan á selectividade é de 18.1 anos; e unha desviación típica de 0.5 anos. Eliximos ao azar unha mostra de 80 alumnos/as, cal é a probabilidade de que a media de idade da mostra estea entre 17.9 e 18.3? Sabemos: Queremos saber: A media μ da poboación, que é 18.1 A media X dunha mostra. p(17.9< X <18.3)? Coñecemos a poboación e pretendemos deducir o comportamento das mostras. Isto viuse no tema anterior baseándonos no teorema central do límite. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 4. Introdución Problema 2: A idade media dunha mostra de 80 alumnos/as que se presentan a selectividade é de 18.1 anos. Cal é a probabilidade de que a media de todos os alumnos que se presentan á selectividade estea entre 17.9 e 18.3 anos? Sabemos: Queremos saber: A media X dunha mostra: X X =18.1 A media μ da poboación. p(17.9<μ<18.3)? Coñecemos unha mostra, e pretendemos deducir aspectos da poboación. Pretendemos inferir ou estimar o valor da media poboacional a partir do valor da media mostral. Este é o tema da presente unidade. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 5. Introdución Problema 3: Está admitido como certo que a idade media dos alumnos/as que se presentan á selectividade é de 18.1. Para comprobalo tomouse unha mostra de 80 alumnos/as que se presentan á selectividade e calculouse a súa media, obtendo 18.3. É razoable admitir como válida a hipótese inicial de que μ=18.1? Sabemos: Queremos saber: A media dunha mostra: X =18.3 É admisible a afirmación de que a media da poboación é μ=18.1? Temos unha afirmación ou hipótese, pero sen garantías de certeza. Para contrastalo, tomamos unha mostra, e a partir do resultado desta, decidimos se a hipótese é ou non é admisible. Este problema corresponde á chamada teoría da decisión ou contraste de hipótese que veremos na seguinte unidade IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 6. Introdución Nota : Ao traballar con mostras, hai que diferenciar entre: Os parámetros observados na mostra, chamados parámetros estatísticos ou simplemente estatísticos. Os parámetros reais correspondentes á poboación, chamados parámetros poboacionais ou simplemente parámetros. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 7. Introdución Estimación de Parámetros Parámetros: Parámetros poboacionais e Estatísticos Mostrais H to r m d laP b c n is g a a e o la io Media (µ ) 10 6 10 4 Varianza(σ 2) 10 2 Datos re u n ia 10 0 Desv. Est. (σ ) F cec 80 (Poboación de Interese) 6 4 0 0 Etc. 20 0 -4 -2 0 C ss la e 2 4 Inferencias Histograma de la Muestra Mostraxe 16 Estatísticos: 14 12 Termo medio( X ) Frecuencia 10 Mostras 8 Varianza mostral(S2) 6 4 Desv. Est. mostral(S) 2 0 -4 -2 0 Clases 2 4 Etc. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 8. 1. Tipos de estimación Puntual: Trátase de estimar un parámetro da poboación a partir dun estatístico obtido dunha mostra dela, dando un único valor como aproximación do parámetro poboacional. Tipos de Por intervalos de confianza: estimación: A partir dunha mostra aleatoria de tamaño n podemos estimar o valor dun parámetro da poboación dando un intervalo dentro do cal confiamos que estea o parámetro, intervalo de confianza, e calculando a probabilidade de que tal cousa ocorra; a dita probabilidade chamámoslle nivel de confianza. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 9. 2. Estimación puntual Estimación puntual: Ao estimar un parámetro poboacional por estimación puntual poden considerarse, en principio, varios estatísticos. Exemplo: Para estimar a media poboacional μ podemos utilizar a media mostral x, pero tamén outros estatísticos, como mediana, moda... Debemos, polo tanto, facer un estudo para saber que estatístico proporciona unha estimación máis fiable do parámetro poboacional. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 10. 2. Estimación puntual Para controlar a fiabilidade da estimación proporcionada por un estatístico, definimos o concepto de estimador: Chamamos estimador S dun parámetro poboacional λ a unha variable aleatoria que a cada unha das mostras dun certo tamaño n da poboación asócialle o valor dun estatístico dado con valores aproximados ao parámetro poboacional λ que desexamos estimar. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 11. 2. Estimación puntual Exemplo: Nun edificio viven 6 nenos de idades: Nenos Celia Raquel María Alex Marta Xoán Idades 5 7 8 6 1 8 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 12. 2. Estimación puntual Podemos polo tanto coñecer a idade media da poboación de nenos do edificio que sería: μ =(5+7+8+6+1+8)/6=5.83 Pero un veciño do edificio non coñece as idades de todos os nenos así que decide estimar cal é a idade media dos nenos do edificio preguntándolle a idade a tres dos nenos e calculando a media de idade de dita mostra. O parámetro media poboacional intenta estimarse mediante un estatístico dunha mostra de tres elementos que é a media mostral. Pero, o valor obtido deste xeito, realmente se aproxima á media poboacional? IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 13. 2. Estimación puntual Para controlar a fiabilidade da estimación, recorremos ao estudo do seguinte estimador: Experimento aleatorio = obtención dunha mostra de tamaño 3. Definimos unha variable aleatoria que a cada mostra de tres nenos asígnalle a idade media da mostra. X =idade media mostral dunha mostra de tamaño 3 Mos Celia Celia Celia Celia Celia Celia Celia Celia Celia Celia tras Raquel e Raquel e Raquel e Raquel e María e María e María e Alex e Alex e Marta e María Alex Marta Xoán Alex Marta Xoán Marta Xoán Xoán x 6.67 6 4.33 6.67 6.33 4.33 7 4.33 6.33 4.67 Mos Raquel Raquel Raquel Raquel Raquel Raquel María María María Alex tras María e María e María e Alex e Alex e Marta e Alex e Alex e Marta e Marta e Alex Marta Xoán Marta Xoán Xoán Marta Xoán Xoán Xoán x 7 5.33 7.67 4.67 7 5.33 5 7.33 5.67 5 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 14. 2. Estimación puntual xi p( X =xi) 4.33 3/20 Trátase dunha variable 4.67 2/20 aleatoria discreta coa 5 2/20 seguinte función masa de 5.33 2/20 probabilidade 5.67 1/20 6 1/20 6.33 2/20 6.67 2/20 7 3/20 7.33 1/20 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 15. 3. Características dos estimadores puntuais Nun estimador considéranse desexables as seguintes características: • Ausencia de nesgo • Eficiencia • Consistencia para considerar fiable a estimación correspondente. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 16. 3. Características dos estimadores puntuais Ausencia de nesgo Observa as seguintes figuras onde se representa o valor real do parámetro poboacional a estimar λ e os valores que toman certos estimadores f(x)=8 correspondentes a certos tamaños de mostra e a certos estatísticos que f(x)=4 f(x)=0 Serie 1 poderiamos empregar. Serie 2 λ λ λ IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 17. 3. Características dos estimadores puntuais No primeiro caso os valores do estimador están arredor de λ mentres no segundo caso a maior parte son maiores λ e no terceiro son maioritariamente menores ca λ. A nós interésanos que os valores do estimador se repartan ao redor de λ, coma no primeiro caso. Isto dáse cando a súa esperanza está próxima ao valor de λ e cando isto sucede dise que o estimador é non esguellado. Dise que un estimador S dun parámetro λ é non esguellado se a súa esperanza μS coincide con λ. Se μS< λ , dise que ten nesgo negativo (caso 3) Se μS> λ , dise que ten nesgo positivo (caso 2) IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 18. 3. Características dos estimadores puntuais Exemplo: Lembrades o exemplo de estimador que puxemos ? Fixádevos no valor da idade media da poboación de nenos do edificio e nos valores que toma o estimador X f(x)=0 Serie 1 que son as idades medias das mostras de tres Serie 2 elementos que podemos tomar nesta poboación. Pensades que é ou non esguellado? 4.2 4.4 4.6 4.8 5 5.2 5.4 5.6 5.8 6 6.2 6.4 6.6 6.8 7 7.2 7.4 7.6 7.8 λ IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 19. 3. Características dos estimadores puntuais Se no noso exemplo calculamos a esperanza do estimador X obtemos: μX = ∑ xi ⋅ pi = i 3 2 2 2 1 1 = 4.33 ⋅ + 4.67 ⋅ +5⋅ + 5.33 ⋅ + 5.67 ⋅ + 6⋅ + 20 20 20 20 20 20 2 2 3 1 1 + 6.33 ⋅ + 6.67 ⋅ +7⋅ + 7.33 ⋅ + 7.67 ⋅ = 20 20 20 20 20 = 5.83 = idade media dos nenos do edificio IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 20. 3. Características dos estimadores puntuais Eficiencia dun estimador Pero observa agora os valores que toman estes dous estimadores f(x)=8 non esguellados do mesmo parámetro poboacional λ. f(x)=4 Serie 1 Cal cres ti que deberiamos empregar se queremos un resultado Serie 2 fiable?. λ λ IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 21. 3. Características dos estimadores puntuais Loxicamente nos quedariamos co segundo, pois os valores que toma o estatístico están máis concentrados arredor de λ. Isto ocorre cando a desviación típica do estimador é menor; e dise que dito estimador é máis eficiente. De entre dous estimadores, dicimos que é máis eficiente o que ten menor varianza ou desviación típica. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 22. 3. Características dos estimadores puntuais Exemplo: Os 4 fillos dunha familia estudan 1,2,3,4 horas diarias respectivamente. Se desexásemos estimar o nº medio de horas de estudo diario dos nenos desta familia mediante unha mostra de tamaño 3, que estimador dos dous seguintes é máis eficiente? X =media mostral dunha mostra de tamaño3 Me=mediana dunha mostra de tamaño 3. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 23. 3. Características dos estimadores puntuais As posibles mostra de tamaño 3 daríannos os seguintes resultados: Calculemos as esperanzas destas Mostras x Me variables aleatorias (estimadores) para ver se teñen ou non nesgo (1,2,3) 2 2 μX = (2 + 2.33 + 2.67 + 3)/4 = 2.5 μMe = (2 + 2 + 3 + 3)/4 = 2.5 (1,2,4) 2.33 2 O nº medio de horas de estudo da poboación formada polos 4 nenos (1,3,4) 2.67 3 era: μ = (1 + 2 + 3 + 4)/4 = 2.5 (2,3,4) 3 3 Como μ = μX = μMe ambos estimadores son non esguellados. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 24. 3. Características dos estimadores puntuais Cal é máis eficiente? Pois aquel que teña menor varianza. Ao calculalas podemos ver que a media mostral ten unha varianza máis baixa polo que é un estimador máis eficiente que a mediana. 1 1 1 1 σ X = ∑ xi ⋅ pi − x = 22 ⋅ 2 2 + 2.332 ⋅ + 2.67 2 ⋅ + 32 ⋅ − 2.52 = 0.13 i 4 4 4 4 2 1 1 σ Me = 22 ⋅ + 32 ⋅ − 2.52 = 0.25 2 2 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 25. 3. Características dos estimadores puntuais Consistencia dun estimador Intuitivamente canto maior é a mostra elixida, máis próxima debería estar a estimación realizada dun parámetro ao valor real do parámetro. Dicimos que un estimador é consistente se a probabilidade de que estean moi próximos a estimación e o parámetro poboacional aumenta e tende a 1 ao incrementarse o tamaño da mostra. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 26. 3. Características dos estimadores puntuais Conclusión: Un estimador é bo se é non esguellado, o máis eficiente posible e consistente. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 27. 4. Estimadores puntuais: media mostral e proporción mostral A elección do estimador máis axeitado en cada caso excede o nivel deste curso. Abondará con saber: •A media poboacional μ aproxímase pola media mostral x A mediana . tamén é un estimador non esguellado para a media poboacional pero menos eficiente que a media mostral. •A varianza poboacional σ2 aproxímase pola cuasivarianza mostral ŝ2 que se define como: ˆ2 = n ⋅ s2 s n −1 Parece que o estimador máis adecuado debería ser a varianza mostral, pero pode demostrarse que non é así. •A proporción poboacional aproxímase por a proporción mostral. •A diferenza de medias de dúas poboaciones μ1-μ2 aproxímase pola diferenza de medias mostráis x1 − x 2 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 28. 4. Estimadores puntuais: media mostral e proporción mostral Exemplo 1: Das 25 aulas dun centro educativo escolléronse 5 ao chou, e contouse o número de alumnos da clase, obténdose os seguintes resultados: 33, 27, 19, 34, 30. Estima o número total de alumnos do centro. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 29. 4. Estimadores puntuais: media mostral e proporción mostral Solución: Estimaríamos o nº medio de alumnos por aula no centro escolar calculando o nº medio de alumnos nas 5 aulas que se tomaron como mostra. Como a media mostral da (33+27+19+34+30)/5= 28,6 consideramos que o nº medio de alumnos por aula no centro escolar é 28.6 e, polo tanto, estimariamos que o número total de alumnos no centro escolar é de 25·28,6=715 alumnos IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 30. 4. Estimadores puntuais: media mostral e proporción mostral Exemplo 2: Entre os estudantes dunha cidade escolléronse 150 ao azar e preguntóuselles se estaban de acordo co actual sistema de acceso á universidade. 40 responderon que si. Estímese a proporción de alumnos de dita cidade que están de acordo co sistema de acceso á universidade. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 31. 4. Estimadores puntuais: media mostral e proporción mostral Solución: A proporción mostral é un bo estimador da proporción poboacional, así que calculamos a proporción de alumnos da mostra que responderon afirmativamente e considerámola como proporción poboacional. 40 de 150 é un 26,67% Estimamos que un 26,67% da poboación está de acordo co sistema de acceso á universidade. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 32. 5. Intervalo de confianza A estimación puntual serve de pouco mentres descoñezamos cal é o grao de aproximación entre o estatístico mostral e o parámetro poboacional. A estimación puntual non nos indica o erro cometido en dita estimación. O razoable na práctica é incluír, xunto á estimación puntual do parámetro, un certo intervalo numérico que mida a marxe de erro que, de acordo coas observacións mostrais, poda ter dita estimación. A idea de intervalo de confianza é propór un rango de valores entre os que posiblemente se encontre o verdadeiro valor do parámetro. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 33. 5. Intervalo de confianza Por este motivo recórrese á estimación por intervalos. A partir dunha mostra de tamaño n podemos estimar o valor dun parámetro da poboación do seguinte modo: Dando un intervalo dentro do cal confiamos que estea o parámetro, chamado intervalo de confianza. •Calculando a probabilidade de que tal cousa ocorra. A dita probabilidade chámaselle nivel de confianza que se nomea como p=1-α sendo α o nivel de significación. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 34. 5. Intervalo de confianza Supoñamos que para estimar unha media poboacional μ tomamos unha mostra de tamaño n e a partir dela construímos un intervalo de confianza ao 90% para μ. É dicir, o nivel de confianza é 0,9 e o nivel de significación 0,1. No intervalo calculado pode ou non estar realmente μ. Nin sequera podemos dicir que μ está no intervalo calculado cunha probabilidade do 90%. Só podemos falar de que o intervalo contén a μ cunha confianza do 90%. Que significa entón nivel de confianza do 90%? IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 35. 5. Intervalo de confianza Se construímos moitos intervalos de confianza para μ cun nivel de confianza do 90% μ O 90% de ditos intervalos de confianza conterán a media poboacional. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 36. 5. Intervalo de confianza Nota: Como polo xeral só vamos a dispór dunha mostra, temos que contar (por exemplo cun 90% de confianza) que a mostra que temos pertence ao grupo das mostras boas (as que nos dan unha estimación do intervalo que contén o verdadeiro valor do parámetro). IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 37. 5. Intervalo de confianza Para o cálculo de intervalos de confianza é importante coñecer que é un intervalo característico e como calculalo Intervalos característicos : Se unha variable aleatoria X ten unha distribución de esperanza ou media μ, chámase intervalo característico correspondente a unha probabilidade p a un intervalo centrado na media (μ-k, μ+k) tal que a probabilidade de que X pertenza a dito intervalo é p p(μ-k < X < μ+k)=p IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 38. 5. Intervalo de confianza Intervalos característicos en distribucións N(0,1) Exemplo: Calcula o intervalo característico dunha variable aleatoria Z que segue unha distribución normal N(0,1) correspondente á probabilidade p=0.9. Trátase de atopar un intervalo centrado na media μ=0 e polo tanto da forma (-k, k) que conteña unha probabilidade de 0.9. Fóra do intervalo haberá unha probabilidade de 1-p=1-0.9=0.1. Como o intervalo é simétrico , a área ou probabilidade de cada “cola” é de 0.1/2=0.05 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 39. 5. Intervalo de confianza. y f(x)=(1/sqr(2*pi))*e^-(x^2/2) 0.034 Relleno 2 Relleno 3 0.032 Relleno 4 x(t)=-1.65 , y(t)=t x(t)=1.65 , y(t)=t 0.03 0.028 0.026 N(0,1) 0.024 0.022 0.02 0.018 0.016 0.014 0.012 0.01 0.008 p(-k<z<k)=p=1-α=0,9 0.006 0.004 p(z>k)=(1-p)/2=α/2=0.05 p(z<-k)=(1-p)/2=α/2=0.05 0.002 x -2.8 -2.6 -2.4 -2.2 -2 -1.8 -1.6 -1.4 -1.2 -1 -0.8 -0.6 -0.4 -0.2 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 -k -0.002 k -0.004 p(z≤k)=p+(1-p)/2=1-α+α/2=0.95 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 40. 5. Intervalo de confianza Vemos , entón, que p(Z≤k)=0.95 E recorremos á táboa da distribución N(0,1) para atopar o valor de k correspondente á probabilidade 0.95 K é un valor entre 1.64 e 1.65; polo que tomamos o punto medio 1.645 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 41. 5. Intervalo de confianza O intervalo característico para unha variable aleatoria Z que segue unha distribución normal N(0,1) correspondente a unha probabilidade p= 0.9 sería: (-1.645, 1.645) Diremos que k=1.645 é o valor crítico correspondente a p=0.9. Habitualmente desígnase a probabilidade p mediante 1- α. O valor crítico correspondente denomínase zα/2 téndose as desigualdades: p(Z> zα/2 )=α/2 p(-zα/2 <Z< zα/2 )=1-α IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 42. 5. Intervalo de confianza Intervalos característicos en distribucións N(μ,σ) Sexa X unha variable aleatoria que segue unha distribución N(μ,σ). Desexamos encontrar un intervalo centrado na media μ, (μ-k, μ+k) tal que p(μ-k<X<μ+k)=p=1-α. É dicir, un intervalo no que estea o (1-α).100% dos individuos da poboación. Se X é N(μ,σ) entón Z=(X-μ)/σ é N(0,1). Calculariamos o intervalo característico para Z correspondente a p=1-α que sería (-zα/2 , zα/2 ) . Polo tanto: p(-zα/2 <Z< zα/2 )=p (-zα/2 < (X-μ)/σ < zα/2 )=p=1-α IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 43. 5. Intervalo de confianza Multiplicando toda a desigualdade pola desviación típica σ e sumando a toda a desigualdade a esperanza ou media μ temos: p(μ- zα/2 ·σ < X < μ+ zα/2 ·σ )=p=1-α O intervalo característico será : (μ- zα/2 ·σ , μ+ zα/2 ·σ ) Exemplo: Calcula o intervalo característico para unha distribución N(3,2) correspondente a unha probabilidade p=1-α=0.9. Calculariamos o valor crítico para a N(0,1) correspondente a unha probabilidade 0.9 . zα/2 =1.645 O intervalo característico sería (3-1.645·2, 3+1.645·2) = (-0.29 , 6.29) IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 44. 5. Intervalo de confianza O método pivotal para o cálculo de intervalos de confianza Fixado un nivel de confianza p=1-α (0 < p < 1), o procedemento xeral para a construción dun intervalo de confianza ao nivel p=1-α para un parámetro de interese λ desenvólvese de acordo co seguinte mecanismo: 1 Elección do estatístico pivotal: Elíxese un estatístico que dependa só do parámetro que se desexa estimar e cuxa distribución sexa coñecida T. 2 Formulación do enunciado probabilístico: Preséntase un enunciado probabilístico tendo en conta a distribución de probabilidade do estatístico elixido na etapa anterior e o valor p=1-α fixado como nivel de confianza, é dicir, determínanse constantes a e b tales que: P (a < T < b) = p=1-α ou dito doutro xeito, calcúlase un intervalo característico de T para unha probabilidade p. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 45. 5. Intervalo de confianza 3 Transformación do enunciado probabilístico: Se é posible despexar da expresión anterior, transfórmase o enunciado probabilístico noutros equivalentes, mediante operacións aritméticas, ata chegar a unha expresión na que o parámetro de interese figure só no centro da desigualdade. Dependendo das operacións aritméticas a realizar podemos obter: P (T-1(a)< λ < T-1(b))= p=1-α P (T-1(b)< λ < T-1(a))= p=1-α Calculando o valor do estimador T nun caso concreto e sustituíndo este dato no intervalo probabilístico construído anteriormente obtense o intervalo de confianza para λ con un nivel de confianza p=1-α. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 46. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza Método pivotal aplicado ao cálculo dun intervalo de confianza para a media dunha poboación normal con varianza coñecida Caso xeral. X variable aleatoria que segue unha N(μ,σ), μ descoñecida. Para estimar μ tomamos unha mostra de tamaño n, n≥30 e calculamos a media mostral Como calcular un intervalo de confianza para μ ó p·100%= (1-α)·100%? IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 47. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza 1 Elección do estatístico pivotal : Sabemos polo teorema central do límite que X = media mostral dunha  σ  mostra de tamaño n segue unha distribución N μ,  se a poboación  n partida X é normal ou se o tamaño das mostras é n ≥ 30 . 2 Formulació n do enunciado probabilístico : Intentemos calcular un intervalo característico nesta distribución con probabilidade p = 1 - α. p(c1 < X < c2 ) = p = 1 − α Tipificamos para pasar a unha normalN(0, 1).    c1 − μ X − μ c2 − μ  p < <  = p =1−α  σ σ σ   n n n Calculamos o intervalo característico da normal N(0,1) para unha probabilidade p = 1 - α. Para isto calculamos o valor crítico zα para esta probabilidade p = 1 - α. 2 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 48. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza Temos entón c1 − μ c2 − μ = −zα e = zα σ 2 σ 2 n n σ σ c1 = −zα ⋅ + μ e c2 = zα ⋅ +μ 2 n 2 n e polo tanto ( ) p c1 < X < c2 = p = 1 − α ⇒  p − zα ⋅ σ n + μ < X < zα ⋅ σ n  + μ = p = 1 − α  2 2  3 Transform ación do enunciado probabilístico : E facendo as seguintes operacións na desigualdade : restar μ, restar X e multiplicar por − 1 , chegamos a :  σ σ  p X − zα ⋅ < μ < X + zα ⋅  = p =1−α  2 n 2 n Substituímos X polo valor concreto obtido da mostra e temos que o intervalo de confianza ao p ⋅ 100% = ( 1 - α ) ⋅ 100% para μ será :  σ σ   x − zα ⋅ , x + zα ⋅   2 n 2 n IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 49. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza Conclusión: Deséxase estimar a media, μ, dunha poboación con desviación típica, σ, coñecida. Para isto recórrese a unha mostra de tamaño n na que se obtén unha media mostral, x. Se a poboación de partida é normal ou se o tamaño da mostra é n≥30, entón o intervalo de confianza de μ cun nivel de confianza de p·100%= (1-α)·100% é:  σ σ   x − zα ⋅ , x + zα ⋅   2 n 2 n sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha probabilidade p=1-α IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 50. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza Vexamos o feito nun exemplo concreto: Os estudantes de bacharelato de Galicia dormen un número de horas diarias que se distribúe segundo unha lei normal de media μ descoñecida e de desviación típica 3. A partir dunha mostra de tamaño 30 obtívose unha media mostral igual a 7 horas. Obtén un intervalo de confianza ao 90% para a media de horas de sono, μ. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 51. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza Partimos da seguinte situación: Poboación: Alumnos de bacharelato de Galicia. Variable aleatoria: X=nº de horas diarias de sono dun alumno de bacharelato de Galicia, que segue unha distribución normal de media μ descoñecida e desviación típica 3; N(μ,3). Desexamos estimar a media poboacional μ para o que tomamos unha mostra de tamaño 30 e calculamos o estatístico media mostral, que sabemos é un estimador non esguellado da media poboacional, obtendo x =7. Pero non desexamos facer unha estimación puntual senón dar un intervalo de confianza ao 90% para a media poboacional μ. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 52. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza Empregaremos o método pivotal Polo Teorema Central do Límite: Como X segue unha distribución normal N(μ,3), a variable aleatoria X que a cada unha desas mostras asígnalle a súa media mostral mi-------› xi segue unha distribución normal de media μ e desviación típica 3/√30=0,55. N(μ,0´55). Primeiro trataremos de atopar un intervalo carácterístico (c1,c2) desta distribución normal N(μ,0,55) tal que p(c1< X<c2)=0.9. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 53. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza Para poder atopar dito intervalo temos que tipificar para poder traballar ca N(0,1) que é a única tabulada. Se X segue unha distribución N(μ,0.55), a variable aleatoria Z=(X-μ)/0.55 segue unha distribución N(0,1):  c1 − μ X − μ c2 − μ  p   0.55 < 0.55 < 0.55  = 0.9   IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 54. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza y f(x)=(1/sqr(2*pi))*e^-(x^2/2) Lembremos como se calcula un intervalo característico da N(0,1) 0.034 Relleno 2 Relleno 3 0.032 Relleno 4 para unha probabilidade p=1-α=0.9. x(t)=-1.65 , y(t)=t x(t)=1.65 , y(t)=t 0.03 Trátase de atopar un intervalo de forma (-k,k) tal que p(-k<z<k)=p= 0.028 N(0,1) =1-α=0.9 0.026 0.024 0.022 0.02 0.018 0.016 0.014 0.012 0.01 0.008 p(-k<z<k)=p=1-α=0,9 0.006 0.004 p(z>k)=(1-p)/2=α/2=0.05 p(z<-k)=(1-p)/2=α/2=0.05 0.002 x -2.8 -2.6 -2.4 -2.2 -2 -1.8 -1.6 -1.4 -1.2 -1 -0.8 -0.6 -0.4 -0.2 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 -k -0.002 k -0.004 p(z≤k)=p+(1-p)/2=1-α+α/2=0.95 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 55. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza Empregamos as táboas da N(0,1) para calcular o valor de k tamén nomeado como zα/2 tal que p(Z≤k)=p(Z< zα/2 )=0.95. Atopamos que é un valor intermedio entre 1.64 e 1.65 polo que tomamos 1.645. K= zα/2=1.645 chámase valor crítico correspondente á probabilidade p=1- α=0.9. Polo tanto o intervalo característico sería : (-1.645,1.645) IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 56. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza Volvendo ao problema orixinal  c1 − μ X − μ c2 − μ  p   0.55 < 0.55 < 0.55  = 0.9   c1 − μ = −1.645 c1 = −1.645 ⋅ 0.55 + μ 0.55 c2 − μ = 1.645 c2 = 1.645 ⋅ 0.55 + μ 0.55 E como : p(c1 < X < c2 ) = 0.9 p(μ − 1.645 ⋅ 0.55 < X < μ + 1.645 ⋅ 0.55) = 0.9 pero a min "interésame un intervalo para estimar μ". Como o consigo? IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 57. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza Restando μ á desigualdade : p(-1.645 ⋅ 0.55 < X - μ < 1.645 ⋅ 0.55) = 0.9 Restando X á desigualdade : p(-1.645 ⋅ 0.55 - X < -μ < 1.645 ⋅ 0.55 - X) = 0.9 Multiplicando a desigualdade por - 1 : p(1.645 ⋅ 0.55 + X > μ > −1.645 ⋅ 0.55 + X) = 0.9 p(X - 1.645 ⋅ 0.55 < μ < X + 1.645 ⋅ 0.55) = 0.9 Como temos unha mostra cun resultado da media mostral x = 7 substituímos obtendo : p(7 - 1.645 ⋅ 0.55 < μ < 7 + 1.645 ⋅ 0.55) = 0.9 p(6.09525 < μ < 7.90475) = 0.9 Poderiamos concluír que : O nº medio de horas de sono dos estudantes de bacharelato de Galicia está no intervalo (6.09525, 7.90475) cun nivel de confianza do 90%. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 58. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza Outra maneira de enfocalo: X variable aleatoria que segue unha N(μ,σ), μ descoñecida. Para estimar μ tomamos unha mostra de tamaño n, n≥30 e calculamos a media mostral Como calcular un intervalo de confianza para μ ao p·100%= (1-α)·100%?. Pensemos en x como unha estimación puntual de μ. Entón X segue unha distribución normal N(x, σ ) n Calculamos , entón, un intervalo característico para esta distribución correspondente a unha probabilidade p = 1 − α. Dito intervalo sería :  σ σ   x − zα ⋅ , x + zα ⋅   2 n 2 n Dito intervalo considérase o intervalo de confianza para μ ó p ⋅ 100% = = (1 − α) ⋅ 100%. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 59. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza Exemplo 2: Co fin de investigar o cociente de intelixencia medio dunha poboación estudiantil , pasouse unha proba a 200 estudantes. A media mostral foi de 64 puntos. Por outra banda, sábese por estudos anteriores que o cociente intelectual na poboación distribúese normalmente cunha desviación típica poboacional de 9.3 puntos. Acha un intervalo de confianza para a media poboacional do cociente de intelixencia ao nivel de confianza do 92%. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 60. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza SOLUCIÓN X = cociente intelectual dun estudante segue unha distribución normal N( μ,9.3) Tomamos x como estimación puntual de μ X segue unha distribución N(64, 9.3) E como consecuencia X = media dunha mostra de tamaño 200 9.3 segue unha distribución N(64, ) = N(64, 0.66) 200 Calculemos un intervalo característico para esta distribución con probabilidade 0.92 p(c1 < X < c2 ) = 0.92 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 61. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza Tipificamos  c − 64 X − 64 c2 − 64  p 1   0.66 < 0.66 < 0.66  = 0.92   E traballamo s cunha N(0,1) Buscamos o valor crítico zα para p = 1 − α = 0.92 2 Se dentro do intervalo característico hai unha probabilidade 0.92, fóra hai α = 0.08, e, en cada " cola" 0.04; polo tanto : p(Z ≤ zα ) = 0.96 2 Buscamos na táboa obtendo zα = 1.75 2 Polo tanto : c1 − 64 c − 64 = −1.75 e 2 = 1.75 0.66 0.66 c1 = 64 − 1.75 ⋅ 0.66 = 62.8 c2 = 64 + 1.75 ⋅ 0.66 = 65.2 O intervalo de confianza buscado é ( 62.8, 65.2) IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 62. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza Tamén o podes resolver simplemente empregando a fórmula, unha vez sabes de onde se obtén. Exemplo 3: Un nadador obtén os seguintes tempos, en minutos, en 10 probas cronometradas polo seu adestrador: 41.48 42.34 41.95 41.86 41.60 42.04 41.81 42.18 41.72 42.26 Obter un intervalo de confianza para a marca media desta proba cun 95% de confianza, supoñendo que se coñece por outras probas que ditas marcas deste nadador seguen unha distribución normal con desviación típica de 0.3 minutos. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 63. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza Solución: Neste caso pídese un intervalo de confianza para a marca media desta proba para dito nadador (μ) sabendo que as súas marcas seguen unha normal con desviación típica σ=0.3 minutos. A mostra coa que contamos é de tamaño n=10. O intervalo de confianza será:  σ σ   x − zα ⋅ , x + zα ⋅   2 n 2 n sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha probabilidade p=1-α=0.95 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 64. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza Calculamos zα/2 , o valor crítico para unha distribución N(0,1) correspondente a unha probabilidade p=1-α = 0.95 Fóra do intervalo característico queda α=0.05 e en cada cola α/2=0.025. Polo tanto p(Z≤ zα/2)=0.975 E zα/2=1.96 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 65. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza Calculamos x 41.48 + 42.34 + 41.95 + 41.86 + 41.60 + 42.04 + 41.81 + 42.18 + 41.72 + 42.26 x= = 10 419.24 = = 41.924 10 e o intervalo de confianza ao 95% quedaría :  σ σ   x − zα ⋅ , x + zα ⋅ =  2 n 2 n  0.3 0.3   41.924 − 1.96 ⋅ , 41.924 + 1.96 ⋅ =  10 10  = ( 41.738, 42.11) IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 66. 6. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza Na seguinte páxina de internet tes unha aplicación onde se calculan este tipo de intervalos de confianza. http://www.catedu.es/ matematicas_blecua/bacmat /temario/bac2/mas2_estima1.htm IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 67. 7. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza Intervalo de confianza para a media dunha poboación normal da que “non” se coñece a varianza. Hai que ter en conta: Na maioría das ocasións nas que se realiza unha investigación estatística a varianza poboacional σ é un parámetro tan descoñecido como a media poboacional µ A cuasivarianza mostral 2 n ∑ i i (x − x ) 2 ⋅f s = ⋅ s2 = i é un bo estimador de σ2 . n −1 n −1 Estimaremos a desviación típica poboacional mediante ŝ=√ŝ2. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 68. 7. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza Distinguiremos dous casos: Se a mostra é pequena n < 30 Se a mostra é grande n ≥ 30 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 69. 7. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza Se a mostra é pequena n < 30: Empregando o método do pivote 1 Elección do estatístico pivotal: Fariamos unha estimación puntual da varianza poboacional mediante a cuasivarianza mostral. Pero a distribución correspondente a X non é unha N(μ,ŝ/√n) polo que ao tipificala non obtemos unha N(0,1). Gosset estudou esta variable aleatoria como estimador para calcular intervalos de confianza para a media poboacional µ dunha poboación normal con σ2 descoñecida : X −μ tn −1 = sˆ n E segue unha distribución chamada t de student con n-1 graos de liberdade. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 70. 7. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza A distribución t de Student con n-1 graos de liberdade ten unha función de densidade cunha forma “parecida” a unha N(0,1) sendo centrada no 0 e tendo simetría par. Esta distribución está tabulada. Calcular un intervalo característico desta distribución faise de xeito similar a como se fai na N(0,1). IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 71. 7. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza 2 Formulación do enunciado probabilístico: Calculariamos o intervalo característico dunha t de student con n-1 graos de liberdade correspondente a unha probabilidade p=1- α. Buscariamos na táboa o valor c tal que: 1−p α p( tn −1 < c ) = p + =1−α+ 2 2 Temos un intervalo característico ( −c, c) da t de student con n - 1 graos de liberdade que cumpre :    X −μ  p( − c < tn −1 < c ) = p − c < < c = p = 1 − α  sˆ   n  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 72. 7. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza 3 Transformación do enunciado probabilístico: Facendo operacións na desigualdade (multiplicar por s , restar X, multiplicar por − 1) ˆ n p X − c ⋅ s  ˆ < μ < X + c⋅ s  = p = 1− α ˆ   n n O intervalo de confianza para μ ao p ⋅ 100% = ( 1 − α ) ⋅ 100% será :  ˆ ,X + c⋅ s  X − c⋅ s ˆ   n n IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 73. 7. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza  Se a mostra é grande n ≥ 30 Entón a t de student con n-1 graos de liberdade, tn-1 , aseméllase cada vez máis a unha N(0,1) . Polo que se traballa directamente coa N(0,1) para obter o intervalo característico con probabilidade p=1-α. A partir de aquí o problema resólvese igual chegando ao intervalo:  s ˆ s  ˆ  x − zα ⋅  , x + zα ⋅   2 n 2 n  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 74. 7. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza Conclusión: Deséxase estimar a media, μ, dunha poboación normal con desviación típica, σ, descoñecida. Para isto recórrese a unha mostra de tamaño n na que se obtén unha media mostral, x. Primeiro estímase puntualmente a desviación típica empregando ŝ=√ŝ2 sendo ŝ2 a cuasivarianza mostral. • Se o tamaño da mostra é n<30, entón o intervalo de confianza de μ cun nivel de confianza de p·100%= (1-α)·100% é:  s ˆ s  ˆ x − c⋅  ,x + c⋅   n n  sendo c o valor crítico nunha t de student con n-1 graos de liberdade correspondente a unha probabilidade p=1-α IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 75. 7. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza Se o tamaño da mostra é n≥30, entón o intervalo de confianza de μ cun nivel de confianza de p·100% = (1-α)·100% é:  s ˆ s  ˆ  x − zα ⋅  , x + zα ⋅   2 n 2 n sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha probabilidade p=1-α IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 76. 7. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza Exemplo1: Nunha multinacional de servicios modifícase a aplicación informática de xestión. Os tempos (en horas) que tardaron 15 traballadores elixidos ao azar en adaptarse ao novo sistema foron os seguintes: 3.3, 2.9, 4.3, 2.6, 3.2, 4.1, 4.9, 2.8, 5.5, 5.3, 3.6, 3, 3.5, 2.9, 4.7 Determina un intervalo de confianza ao 95% para o tempo medio de adaptación de todos os empregados da empresa. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 77. 7. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza Solución: Neste caso pídese un intervalo de confianza para o tempo medio de adaptación de todos os empregados(μ) sendo a desviación típica σ descoñecida, que estimaremos puntualmente por ŝ. A mostra coa que contamos é de tamaño n=15<30; polo tanto, o intervalo de confianza será:  s ˆ s   ˆ s ˆ s  ˆ x − c⋅  ,x + c⋅  = x − c⋅   ,x + c⋅   n n  15 15   sendo c o valor crítico para unha distribución t de student con n-1=14 graos de liberdade correspondente a unha probabilidade p=1-α=0.95 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 78. 7. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza xi (xi − x)2 Calculamos x : 3.3 0.2209 3.3 + 2.9 + ... + 4.7 2.9 0.7569 x= = 4.3 0.2809 15 2.6 1.3689 56.6 3.2 0.3249 = = 3.77 horas 4.1 0.1089 15 4.9 1.2769 Calculamos s : ˆ 2.8 0.9409 5.5 2.9929 ∑ (x − x ) 2 ⋅f 5.3 2.3409 n i i 3.6 0.0289 s2 = ˆ ⋅ s2 = i 3 0.5929 n −1 n −1 3.5 0.0729 ˆ 12.9295 = 0.92 s2 = 2.9 0.7569 14 4.7 0.8649 12.9295 s = 0.92 = 0.96 horas ˆ IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 79. 7. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza Calculamos c, o valor crítico para unha distribución t de student con n-1=14 graos de liberdade correspondente a unha probabilidade p=1-α = 0.95 Buscamos os graos de liberdade en vertical (14) e a probabilidade p en horizontal 0.95. C=1.761 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 80. 7. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza O intervalo de confianza será:  sˆ s   ˆ s ˆ s  ˆ x − c⋅  ,x + c⋅  = x − c⋅   ,x + c⋅ =  n n  15 15    0.96 0.96  =  3.77 − 1.761 ⋅ , 3.77 + 1.761 ⋅ =  15 15  = ( 3.33, 4.21) O tempo medio de adaptación está entre 3.33 horas e 4.21 horas cun nivel de confianza dun 95% IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 81. 7. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza Exemplo 2: Para analizar o peso duns botes de conserva, tómase unha mostra de tamaño 32. Os pesos en quilogramos obtidos son: 0.97 0.99 1.01 0.98 0.99 1.00 0.98 0.98 1.00 1.02 0.97 0.97 0.99 0.99 0.99 0.96 0.98 1.00 0.99 1.01 1.00 1.00 0.98 0.99 0.99 0.98 0.97 0.97 1.01 0.96 1.03 0.92 Calcula o intervalo de confianza ao 95% para o peso medio dos botes. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 82. 7. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 83. 7. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza Solución: Neste caso pídese un intervalo de confianza para o peso medio en quilogramos duns botes de conserva(μ) sendo a desviación típica σ descoñecida, que estimaremos puntualmente por ŝ. A mostra coa que contamos é de tamaño n=32>30; polo tanto, o intervalo de confianza será:  s ˆ s  ˆ  x − zα ⋅  , x + zα ⋅   2 n 2 n sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha probabilidade p=1-α=0.95 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 84. 7. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza Calculamos x : xi fi xi ·fi (xi − x)2 (xi − x)2 ·f i ∑x ⋅f i i 31.57 0.92 1 0.92 0.004489 0.004489 x= i = = 0.96 2 1.92 0.000729 0.001458 N 32 = 0.987 Kg 0.97 5 4.85 0.000289 0.001445 Calculamos s : ˆ 0.98 6 5.88 0.000049 0.000294 ∑ (x − x) 2 0.99 8 7.92 0.000009 0.000072 ⋅f n i i 1 5 5 0.000169 0.000845 s = ˆ2 ⋅s = i 2 n −1 n −1 1.01 3 3.03 0.000529 0.001587 0.013128 s2 = ˆ = 0.00042 1.02 1 1.02 0.001089 0.001089 31 1.03 1 1.03 0.001849 0.001849 s = 0.00042 = 0.206 Kg ˆ 32 31.57 0.013128 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 85. 7. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza Calculamos zα/2 , o valor crítico para unha distribución N(0,1) correspondente a unha probabilidade p=1-α = 0.95 Fóra do intervalo característico queda α=0.05 e en cada cola α/2=0.025. Polo tanto p(Z≤ zα/2)=0.975 E zα/2=1.96 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 86. 7. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza O intervalo de confianza será:  s ˆ s  ˆ  x − zα ⋅  , x + zα ⋅ =  2 n 2 n  0.206 0.206   0.987 − 1.96 ⋅ ,0.987 + 1.96 ⋅ =  32 32  ( 0.916,1.058) O peso medio dos botes de conserva está entre 0.916 Kg e 1.058 Kg cun nivel de confianza do 95% IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 87. 8. Intervalo de confianza para a proporción Intervalo de confianza para a proporción. Desexamos atopar un intervalo de confianza cun nivel de confianza do p’·100%=(1-α)·100% para a proporción p poboacional de certa característica C. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 88. 8. Intervalo de confianza para a proporción O método pivotal 1 Elección do estatístico pivotal: Para iso recórrese a unha mostra de tamaño n, na que se obtén unha proporción mostral pr. Se x é o número de éxitos nas n probas, entón o estimador é: Pr=X/n X=nº de éxitos, en principio, corresponde a unha distribución binomial B(n,p) p=probabilidade de éxito , μ=np e σ=√npq. Pero se np>5 e nq>5 dita binomial aproxímase por unha normal N(np,√npq) . E neste caso Pr=x/n segue unha distribución normal N(np/n, √npq/n)=N(p,√(pq/n))=N(p,√(p(1-p)/n) IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 89. 8. Intervalo de confianza para a proporción 2 Formulación do enunciado probabilístico: Trataremos de atopar un intervalo característico do estimador que conteña unha probabilidade p’=1-α e p(c1<Pr<c2)=p’=1-α, Tipificamos a normal, para traballar cunha N(0,1)     c −p Pr − p c −p p 1 < < 2  = p'= 1 − α  p(1 - p) p(1 - p ) p( 1 - p )     n n n  Buscamos na táboa da N(0,1) o valor crítico para p'= 1 − α α p(Z ≤ zα/2 ) = 1 − α + 2 Entón : c1 − p c2 − p = −zα/2 e = zα/2 p(1 - p ) p( 1 - p) n n p(1 - p ) p(1 - p ) c1 = p − zα/2 ⋅ e c2 = p + zα/2 ⋅ n n Polo tanto :  p(1 - p ) p(1 - p )  p(c1 < Pr < c2 ) = p p − zα/2 ⋅  < Pr < p + zα/2 ⋅  = p'= 1 − α   n n  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 90. 8. Intervalo de confianza para a proporción 3 Transformación do enunciado probabilístico: Facendo as operacións seguintes na desigualdade conseguimos que p quede no medio: Restar p :  p(1 - p) p( 1 - p)  p − zα/2 ⋅  < Pr - p < zα/2 ⋅  = p'= 1 − α   n n  Restar Pr :  p(1 - p) p(1 - p)  p − zα/2 ⋅  − Pr < -p < zα/2 ⋅ − Pr  = p'= 1 − α   n n  Multiplicar por − 1 :  p( 1 - p) p( 1 - p)  p zα/2 ⋅  + Pr > p > −zα/2 ⋅ + Pr  = p'= 1 − α   n n   p(1 - p) p( 1 - p)  p Pr - zα/2 ⋅  < p < Pr + zα/2 ⋅  = p'= 1 − α  n n   Sustituindo Pr polo valor concreto obtido da mostra, o mesmo que p, que non é coñecido obtemos como intervalo de confianza ao nivel de confianza dun p'⋅100% = ( 1 − α ) ⋅ 100% :  pr(1 - pr) pr( 1 - pr )   pr - zα/2 ⋅ , pr + zα/2 ⋅   n n    IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 91. 8. Intervalo de confianza para a proporción Conclusión: Deséxase estimar a proporción p , de individuos cunha certa característica que hai nunha poboación. Para iso recórrese a unha mostra de tamaño n, na que se obtén unha proporción mostral pr. O intervalo de confianza de p cun nivel de confianza p’·100%=(1-α)·100% é:  pr( 1 - pr ) pr(1 - pr )   pr - zα/2 ⋅ , pr + zα/2 ⋅   n n    sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha probabilidade p’=1-α IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 92. 8. Intervalo de confianza para a proporción Exemplo: Para estudar a proporción de estudantes que practicaban football, tómase unha mostra de tamaño 300. O resultado obtido é que o practican 210. Calcula o intervalo de confianza para a proporción p cun nivel de confianza do 98%. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 93. 8. Intervalo de confianza para a proporción Queremos estimar a proporción de estudantes que practican football, polo que tomamos unha mostra de tamaño n=300, obtendo unha proporción mostral pr=210/300=0.7 (70%). Sabemos que o intervalo de confianza para unha proporción p cun nivel de confianza do 98% é:  pr( 1 - pr ) pr( 1 - pr )   pr - zα/2 ⋅ , pr + zα/2 ⋅   n n    sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha probabilidade 0.98 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 94. 8. Intervalo de confianza para a proporción Calculamos zα/2 , o valor crítico para unha distribución N(0,1) correspondente a unha probabilidade p’=1-α = 0.98 Fóra do intervalo característico queda α=0.02 e en cada cola α/2=0.01 Polo tanto p(Z≤ zα/2)=0.99 zα/2 está entre 2.32 e 2.33, tomaremos 2.325 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 95. 8. Intervalo de confianza para a proporción O intervalo de confianza para a proporción de estudantes que xogan ao fútbol cun nivel de confianza dun 98% será:  pr( 1 - pr) pr(1 - pr )   pr - zα/2 ⋅ , pr + zα/2 ⋅ =  n n     0.7 ⋅ ( 1 − 0.7 ) 0.7 ⋅ ( 1 − 0.7 )   0.7 − 2.325 ⋅ , 0.7 + 2.325 ⋅ =  300 300    ( 0.64, 0.76) O intervalo está entre un 64% e un 76% IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 96. 9. Intervalo de confianza para a diferenza de medias Intervalo de confianza para a diferenza de medias. Desexamos atopar un intervalo de confianza cun nivel de confianza do p·100% = (1-α)·100% para a diferenza de medias μ1-μ2 de dúas poboacións sendo as desviacións típicas de ditas poboacións coñecidas σ1 e σ2. O método pivotal 1 Elección do estatístico pivotal: Para iso recórrese a dúas mostras de tamaños n1 e n2, nas que se x obteñen dúas medias mostrais x1 e 2 .Empregaremos como estimador : X1 − X2 A distribución desta variable viuse que correspondía a unha normal N(μ1-μ2, √(σ12/ n1 + σ22/ n2 )) se as poboacións iniciais eran normais ou se o tamaño das mostras é maior de 30 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 97. 9. Intervalo de confianza para a diferenza de medias 2 Formulación do enunciado probabilístico: Trataremos de atopar un intervalo característico do estimador que conteña unha probabilidade p=1-α ( ) p c1 < X1 − X2 < c2 = p = 1 − α Tipificamos para traballar coa N(0,1)      c1 − ( μ1 − μ2 ) (X1 − X2 ) − ( μ1 − μ2 ) c2 − ( μ1 − μ2 )  p < <  = p'= 1 − α  σ1 + σ 2 σ12 σ2 σ12 σ2  2 2 2 2  n + +  1 n2 n1 n2 n1 n2   α Buscamos na táboa da N(0,1) o valor crítico para p = 1 − α; p(Z ≤ zα/2 ) = 1 − α + 2 Entón : c1 − ( μ1 − μ2 ) c2 − ( μ1 − μ2 ) = −zα/2 e = zα/2 σ 2 σ 2 σ12 σ2 2 1 + 2 + n1 n2 n1 n2 σ12 σ2 2 σ12 σ2 2 c1 = ( μ1 − μ2 ) − zα/2 ⋅ + e c2 = ( μ1 − μ2 ) + zα/2 ⋅ + n1 n2 n1 n2 Polo tanto :  σ2 σ2 σ2 σ2  p(c1 < X1 − X2 < c2 ) = p ( μ1 − μ2 ) − zα/2 ⋅ 1 + 2 < X1 − X2 < ( μ1 − μ2 ) + zα/2 ⋅ 1 + 2  = p = 1 − α  n1 n2 n1 n2    IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 98. 9. Intervalo de confianza para a diferenza de medias 3 Transformación do enunciado probabilístico Facendo operacións na desigualdade conseguimos que μ1 − μ2quede no medio Restar μ1 − μ2 :  σ2 σ2 σ2 σ2  p − zα/2 ⋅ 1 + 2 < (X1 − X2 ) − (μ1 − μ2 ) < zα/2 ⋅ 1 + 2  = p = 1 − α  n1 n2 n1 n2    Restar X1 − X2 :    − z ⋅ σ1 + σ2 − (X − X ) < −(μ − μ ) < z ⋅ σ1 + σ2 − (X − X )  = p = 1 − α 2 2 2 2 p  α/2 n1 n2 1 2 1 2 α/2 n1 n2 1 2    Multiplicar por − 1 :  σ2 σ2 σ2 σ2  p zα/2 ⋅ 1 + 2 + (X1 − X2 ) > (μ1 − μ2 > −zα/2 ⋅ 1 + 2 + (X1 − X2 )  = p = 1 − α  n1 n2 n1 n2     σ2 σ2 σ2 σ2  p (X1 − X2 ) − zα/2 ⋅ 1 + 2 < μ1 − μ2 < (X1 − X2 ) + zα/2 ⋅ 1 + 2  = p = 1 − α  n1 n2 n1 n2    Substituíndo X1 − X2 polo valor concreto obtido da mostra, obtemos como intervalo de confianza ao nivel de confianza dun p ⋅ 100% = ( 1 − α ) ⋅ 100% :  2   ( x − x ) − z ⋅ σ1 + σ 2 , ( x − x ) + z ⋅ σ 1 + σ 2  2 2 2  1 2 α/2 n1 n2 1 2 α/2 n1 n2    IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 99. 9. Intervalo de confianza para a diferenza de medias Conclusión: Deséxase estimar a diferenza de medias μ1-μ2 de dúas poboacións con desviacións típicas, σ1 e σ2, , coñecidas . Para isto recórrese a dúas mostras de tamaños n1 e n2 nas que se obteñen dúas medias mostrais. Entón, o intervalo de confianza de μ1-μ2 cun nivel de confianza de p·100%= (1- α)·100% é:  σ12 σ2 2 σ12 σ2  2  (x − x ) − z ⋅ + , (x1 − x2 ) + zα/2 ⋅ +   1 2 α/2 n1 n2 n1 n2    sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha probabilidade p=1-α Se as desviacións típicas, σ1 e σ2, , non fosen coñecidas, pero o tamaño das dúas mostras fose maior de 30 tomariamos no lugar das varianzas poboacionais, as cuasivarianzas mostrais, ŝ1 e ŝ2 . IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 100. 9. Intervalo de confianza para a diferenza de medias Exemplo: O tempo en minutos que tardan en reparar certo tipo de avaría nun taller A segue unha distribución normal con desviación típica de 25 minutos; mentres nun taller B a desviación típica é de 30 minutos. Nunha mostra de 10 reparacións dese tipo de avaría no taller A o tempo medio foi de 80 minutos, mentres que nunha mostra de 15 reparacións en B a media foi de 75 minutos. Calcula o intervalo de confianza para a diferenza de tempos medios, cun nivel de significación α do 1%. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 101. 9. Intervalo de confianza para a diferenza de medias Solución: Neste caso pídese un intervalo de confianza para a diferenza de tempos medios de reparación dun tipo de avaría entre dous talleres A e B (μ1-μ2 ) sabendo que o tempo de reparación deste tipo de avaría segue nos dous talleres unha distribución normal con desviacións típicas σ1=25 minutos e σ2=30 minutos respectivamente. As mostra coas que contamos son de tamaños n1=10 e n2=15; obténdose nelas tempos medios mostrais de 80 minutos e 75 minutos respectivamente. Polo tanto, o intervalo de confianza será:  σ12 σ2 2 σ12 σ2  2  (x − x ) − z ⋅ + , (x1 − x2 ) + zα/2 ⋅ +   1 2 α/2 n1 n2 n1 n2    sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha probabilidade p=1-α=1-0.1=0.99 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 102. 9. Intervalo de confianza para a diferenza de medias Calculamos zα/2 , o valor crítico para unha distribución N(0,1) correspondente a unha probabilidade p=1-α = 0.99 Fóra do intervalo característico queda α=0.01 e en cada cola α/2=0.005 Polo tanto p(Z≤ zα/2)=0.995 zα/2 está entre 2.57 e 2.58, tomaremos 2.575 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 103. 9. Intervalo de confianza para a diferenza de medias O intervalo de confianza para a diferenza de medias quedaría :  σ12 σ2 2 σ12 σ2  2  (x − x ) − z ⋅ + , (x1 − x2 ) + zα/2 ⋅ + =  1 2 α/2 n1 n2 n1 n2     252 302 252 302   (80 − 75) − 2.575 ⋅ + , (80 − 75) + 2.575 ⋅ + =  10 15 10 15    ( − 23.5, 33.5) IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 104. 10. Intervalo de confianza para a varianza Intervalo de confianza para a varianza dunha distribución normal . Desexamos atopar un intervalo de confianza cun nivel de confianza do p·100%=(1- α)·100% para a varianza σ2 dunha poboación normal. O método pivotal 1 Elección do estatístico pivotal: Para iso recórrese a unha mostra de tamaño n, na que se obtén a cuasivarianza mostral ŝ . Empregaremos como estimador ˆ n − 1 ⋅ S2 ( ) σ2 Polo Teorema de Fisher sabemos que dita variable aleatoria segue unha distribución chi-cadrado con n-1 graos de liberdade No seguinte enlace podes observar a forma que ten a función de densidade de dita distribución. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 105. 10. Intervalo de confianza para a varianza 2 Formulación do enunciado probabilístico: Trataremos de atopar un intervalo do estimador que conteña unha probabilidade p=1-α e que deixe a cada lado (dúas colas) unha probabilidade (1-p)/2=α/2  p c1 < (n − 1) ⋅ S2 < c  = p = 1 - α ˆ   σ2 2   Buscamos na táboa da chi - cadrado con n - 1 graos de liberdade os valores c e c que deixan á súa esquerda probabilidades 1 2 1−p α 1−p α de = e p+ =1− 2 2 2 2 respectivamente. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 106. 10. Intervalo de confianza para a varianza 3 Transformación do enunciado probabilístico Facendo as operacións seguintes na desigualdade conseguimos que σ2 quede no medio:  c1 < ( n − 1) ⋅ S < c2  = p = 1 - α  ˆ2  p  σ2     c1 ˆ S2 c  Dividir por n - 1 : p  < 2 < 2  = p =1−α  n -1 σ n -1    ˆ  c1 1 c2  Dividir por S2 :p < 2<  (n - 1) ⋅ S2 σ  = p =1−α ˆ ˆ2  (n - 1) ⋅ S   Ao inverter as fraccións as desigualdades dan a volta : ˆ  (n - 1) ⋅ S2 ˆ (n - 1) ⋅ S2  ˆ  (n - 1) ⋅ S2 ˆ (n - 1) ⋅ S2  p >σ > 2  = p =1−α ; p <σ < 2  = p =1−α  c1 c2   c2 c1      ˆ Substituíndo S2 polo valor concreto obtido da mostra, obtemos como intervalo de confianza ao nivel de confianza dun p ⋅ 100% = ( 1 − α ) ⋅ 100% : ˆ ˆ  (n - 1) ⋅ S2 (n - 1) ⋅ S2   ,   c2 c1    IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.