1. MÉTODOS ESTATÍSTICOS
E NUMÉRICOS
UNIDADE 10
ESTIMACIÓN DE PARÁMETROS
ÍNDICE
IES Isidro Parga Pondal. Departamento de matemáticas
2. CONTIDOS
Tipos de estimación.
Estimación puntual.
Características dos estimadores puntuais.
Estimadores puntuais: media mostral e proporción mostral.
Intervalo de confianza.
Intervalo de confianza para a media dunha poboación normal da que
se coñece a varianza.
Intervalo de confianza para a media dunha poboación normal da que
non se coñece a varianza.
Intervalo de confianza para a proporción.
Intervalo de confianza para a diferenza de medias.
Intervalo de confianza para a varianza dunha poboación normal.
Erro máximo admisible.
Tamaño da mostra para a estimación da media e da proporción.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Introdución
Observa estes tres problemas, correspondentes a situacións
parecidas pero moi distintas:
Problema 1: X
A media de idade das alumnas e alumnos que se presentan á selectividade
é de 18.1 anos; e unha desviación típica de 0.5 anos. Eliximos ao azar unha
mostra de 80 alumnos/as, cal é a probabilidade de que a media de idade da
mostra estea entre 17.9 e 18.3?
Sabemos: Queremos saber:
A media μ da poboación, que é 18.1 A media X dunha mostra.
p(17.9< X <18.3)?
Coñecemos a poboación e pretendemos deducir o comportamento das
mostras. Isto viuse no tema anterior baseándonos no teorema central do
límite.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Introdución
Problema 2:
A idade media dunha mostra de 80 alumnos/as que se presentan a
selectividade é de 18.1 anos. Cal é a probabilidade de que a media de todos
os alumnos que se presentan á selectividade estea entre 17.9 e 18.3 anos?
Sabemos: Queremos saber:
A media X dunha mostra:
X X =18.1 A media μ da poboación.
p(17.9<μ<18.3)?
Coñecemos unha mostra, e pretendemos deducir aspectos da poboación.
Pretendemos inferir ou estimar o valor da media poboacional a partir do
valor da media mostral. Este é o tema da presente unidade.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Introdución
Problema 3:
Está admitido como certo que a idade media dos alumnos/as que se
presentan á selectividade é de 18.1. Para comprobalo tomouse unha mostra
de 80 alumnos/as que se presentan á selectividade e calculouse a súa
media, obtendo 18.3. É razoable admitir como válida a hipótese inicial de
que μ=18.1?
Sabemos: Queremos saber:
A media dunha mostra: X =18.3 É admisible a afirmación de que a
media da poboación é μ=18.1?
Temos unha afirmación ou hipótese, pero sen garantías de certeza. Para
contrastalo, tomamos unha mostra, e a partir do resultado desta, decidimos
se a hipótese é ou non é admisible.
Este problema corresponde á chamada teoría da decisión ou contraste
de hipótese que veremos na seguinte unidade
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Introdución
Nota :
Ao traballar con mostras, hai que diferenciar
entre:
Os parámetros observados na mostra,
chamados parámetros estatísticos ou
simplemente estatísticos.
Os parámetros reais correspondentes á
poboación, chamados parámetros poboacionais
ou simplemente parámetros.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Introdución
Estimación de Parámetros
Parámetros:
Parámetros poboacionais e Estatísticos Mostrais
H to r m d laP b c n
is g a a e o la io
Media (µ )
10
6
10
4
Varianza(σ 2)
10
2
Datos
re u n ia
10
0
Desv. Est. (σ )
F cec
80
(Poboación de Interese) 6
4
0
0 Etc.
20
0
-4 -2 0
C ss
la e
2 4
Inferencias
Histograma de la Muestra
Mostraxe 16 Estatísticos:
14
12 Termo medio( X )
Frecuencia
10
Mostras
8 Varianza mostral(S2)
6
4
Desv. Est. mostral(S)
2
0
-4 -2 0
Clases
2 4 Etc.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. 1. Tipos de estimación
Puntual:
Trátase de estimar un parámetro da poboación a
partir dun estatístico obtido dunha mostra dela,
dando un único valor como aproximación do
parámetro poboacional.
Tipos de Por intervalos de confianza:
estimación: A partir dunha mostra aleatoria de tamaño n
podemos estimar o valor dun parámetro da
poboación dando un intervalo dentro do cal
confiamos que estea o parámetro, intervalo de
confianza, e calculando a probabilidade de que tal
cousa ocorra; a dita probabilidade chamámoslle
nivel de confianza.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
9. 2. Estimación puntual
Estimación puntual:
Ao estimar un parámetro poboacional por estimación puntual
poden considerarse, en principio, varios estatísticos.
Exemplo:
Para estimar a media poboacional μ podemos utilizar a media
mostral x, pero tamén outros estatísticos, como mediana, moda...
Debemos, polo tanto, facer un estudo para saber que estatístico
proporciona unha estimación máis fiable do parámetro
poboacional.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
10. 2. Estimación puntual
Para controlar a fiabilidade da estimación proporcionada por un
estatístico, definimos o concepto de estimador:
Chamamos estimador S dun parámetro poboacional λ a unha
variable aleatoria que a cada unha das mostras dun certo tamaño n
da poboación asócialle o valor dun estatístico dado con valores
aproximados ao parámetro poboacional λ que desexamos estimar.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
11. 2. Estimación puntual
Exemplo:
Nun edificio viven 6 nenos de idades:
Nenos Celia Raquel María Alex Marta Xoán
Idades 5 7 8 6 1 8
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
12. 2. Estimación puntual
Podemos polo tanto coñecer a idade media da poboación de nenos
do edificio que sería:
μ =(5+7+8+6+1+8)/6=5.83
Pero un veciño do edificio non coñece as idades de todos os nenos
así que decide estimar cal é a idade media dos nenos do edificio
preguntándolle a idade a tres dos nenos e calculando a media de
idade de dita mostra.
O parámetro media poboacional intenta estimarse mediante un
estatístico dunha mostra de tres elementos que é a media
mostral.
Pero, o valor obtido deste xeito, realmente se aproxima á media
poboacional?
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
13. 2. Estimación puntual
Para controlar a fiabilidade da estimación, recorremos ao estudo do seguinte
estimador:
Experimento aleatorio = obtención dunha mostra de tamaño 3.
Definimos unha variable aleatoria que a cada mostra de tres nenos asígnalle a idade
media da mostra.
X =idade media mostral dunha mostra de tamaño 3
Mos Celia Celia Celia Celia Celia Celia Celia Celia Celia Celia
tras Raquel e Raquel e Raquel e Raquel e María e María e María e Alex e Alex e Marta e
María Alex Marta Xoán Alex Marta Xoán Marta Xoán Xoán
x 6.67 6 4.33 6.67 6.33 4.33 7 4.33 6.33 4.67
Mos Raquel Raquel Raquel Raquel Raquel Raquel María María María Alex
tras María e María e María e Alex e Alex e Marta e Alex e Alex e Marta e Marta e
Alex Marta Xoán Marta Xoán Xoán Marta Xoán Xoán Xoán
x 7 5.33 7.67 4.67 7 5.33 5 7.33 5.67 5
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
14. 2. Estimación puntual
xi p( X =xi)
4.33 3/20
Trátase dunha variable 4.67 2/20
aleatoria discreta coa 5 2/20
seguinte función masa de 5.33 2/20
probabilidade 5.67 1/20
6 1/20
6.33 2/20
6.67 2/20
7 3/20
7.33 1/20
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
15. 3. Características dos estimadores puntuais
Nun estimador considéranse desexables as seguintes
características:
• Ausencia de nesgo
• Eficiencia
• Consistencia
para considerar fiable a estimación correspondente.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
16. 3. Características dos estimadores puntuais
Ausencia de nesgo
Observa as seguintes figuras onde se representa o valor real do parámetro
poboacional a estimar λ e os valores que toman certos estimadores f(x)=8
correspondentes a certos tamaños de mostra e a certos estatísticos que
f(x)=4
f(x)=0
Serie 1
poderiamos empregar.
Serie 2
λ
λ
λ
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
17. 3. Características dos estimadores puntuais
No primeiro caso os valores do estimador están arredor de λ mentres no
segundo caso a maior parte son maiores λ e no terceiro son
maioritariamente menores ca λ.
A nós interésanos que os valores do estimador se repartan ao redor de λ,
coma no primeiro caso. Isto dáse cando a súa esperanza está próxima ao
valor de λ e cando isto sucede dise que o estimador é non esguellado.
Dise que un estimador S dun parámetro λ é non esguellado se a
súa esperanza μS coincide con λ.
Se μS< λ , dise que ten nesgo negativo (caso 3)
Se μS> λ , dise que ten nesgo positivo (caso 2)
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
18. 3. Características dos estimadores puntuais
Exemplo:
Lembrades o exemplo de estimador que puxemos ?
Fixádevos no valor da idade media da poboación de
nenos do edificio e nos valores que toma o estimador X f(x)=0
Serie 1
que son as idades medias das mostras de tres
Serie 2
elementos que podemos tomar nesta poboación.
Pensades que é ou non esguellado?
4.2 4.4 4.6 4.8 5 5.2 5.4 5.6 5.8 6 6.2 6.4 6.6 6.8 7 7.2 7.4 7.6 7.8
λ
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
19. 3. Características dos estimadores puntuais
Se no noso exemplo calculamos a esperanza do
estimador X obtemos:
μX = ∑ xi ⋅ pi =
i
3 2 2 2 1 1
= 4.33 ⋅ + 4.67 ⋅ +5⋅ + 5.33 ⋅ + 5.67 ⋅ + 6⋅ +
20 20 20 20 20 20
2 2 3 1 1
+ 6.33 ⋅ + 6.67 ⋅ +7⋅ + 7.33 ⋅ + 7.67 ⋅ =
20 20 20 20 20
= 5.83 = idade media dos nenos do edificio
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
20. 3. Características dos estimadores puntuais
Eficiencia dun estimador
Pero observa agora os valores que toman estes dous estimadores f(x)=8
non esguellados do mesmo parámetro poboacional λ. f(x)=4
Serie 1
Cal cres ti que deberiamos empregar se queremos un resultado
Serie 2
fiable?.
λ
λ
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
21. 3. Características dos estimadores puntuais
Loxicamente nos quedariamos co segundo, pois os
valores que toma o estatístico están máis concentrados
arredor de λ.
Isto ocorre cando a desviación típica do estimador é
menor; e dise que dito estimador é máis eficiente.
De entre dous estimadores, dicimos que é
máis eficiente o que ten menor varianza ou
desviación típica.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
22. 3. Características dos estimadores puntuais
Exemplo:
Os 4 fillos dunha familia estudan 1,2,3,4 horas diarias
respectivamente. Se desexásemos estimar o nº medio de horas de
estudo diario dos nenos desta familia mediante unha mostra de
tamaño 3, que estimador dos dous seguintes é máis eficiente?
X =media mostral dunha mostra de tamaño3
Me=mediana dunha mostra de tamaño 3.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
23. 3. Características dos estimadores puntuais
As posibles mostra de tamaño 3
daríannos os seguintes resultados:
Calculemos as esperanzas destas Mostras x Me
variables aleatorias (estimadores)
para ver se teñen ou non nesgo
(1,2,3) 2 2
μX = (2 + 2.33 + 2.67 + 3)/4 = 2.5
μMe = (2 + 2 + 3 + 3)/4 = 2.5 (1,2,4) 2.33 2
O nº medio de horas de estudo da
poboación formada polos 4 nenos (1,3,4) 2.67 3
era:
μ = (1 + 2 + 3 + 4)/4 = 2.5 (2,3,4) 3 3
Como μ = μX = μMe
ambos estimadores son non
esguellados.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
24. 3. Características dos estimadores puntuais
Cal é máis eficiente?
Pois aquel que teña menor varianza.
Ao calculalas podemos ver que a media mostral ten unha
varianza máis baixa polo que é un estimador máis
eficiente que a mediana.
1 1 1 1
σ X = ∑ xi ⋅ pi − x = 22 ⋅
2 2
+ 2.332 ⋅ + 2.67 2 ⋅ + 32 ⋅ − 2.52 = 0.13
i 4 4 4 4
2 1 1
σ Me = 22 ⋅ + 32 ⋅ − 2.52 = 0.25
2 2
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
25. 3. Características dos estimadores puntuais
Consistencia dun estimador
Intuitivamente canto maior é a mostra elixida, máis
próxima debería estar a estimación realizada dun
parámetro ao valor real do parámetro.
Dicimos que un estimador é consistente se a
probabilidade de que estean moi próximos a
estimación e o parámetro poboacional
aumenta e tende a 1 ao incrementarse o
tamaño da mostra.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
26. 3. Características dos estimadores puntuais
Conclusión:
Un estimador é bo se é non esguellado, o
máis eficiente posible e consistente.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
27. 4. Estimadores puntuais: media mostral e
proporción mostral
A elección do estimador máis axeitado en cada caso excede o nivel deste
curso.
Abondará con saber:
•A media poboacional μ aproxímase pola media mostral x A mediana
.
tamén é un estimador non esguellado para a media poboacional pero menos
eficiente que a media mostral.
•A varianza poboacional σ2 aproxímase pola cuasivarianza mostral ŝ2 que
se define como:
ˆ2 = n ⋅ s2
s
n −1
Parece que o estimador máis adecuado debería ser a varianza mostral,
pero pode demostrarse que non é así.
•A proporción poboacional aproxímase por a proporción mostral.
•A diferenza de medias de dúas poboaciones μ1-μ2 aproxímase pola
diferenza de medias mostráis x1 − x 2
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
28. 4. Estimadores puntuais: media mostral e
proporción mostral
Exemplo 1:
Das 25 aulas dun centro educativo escolléronse 5 ao
chou, e contouse o número de alumnos da clase,
obténdose os seguintes resultados: 33, 27, 19, 34, 30.
Estima o número total de alumnos do centro.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
29. 4. Estimadores puntuais: media mostral e
proporción mostral
Solución:
Estimaríamos o nº medio de alumnos por aula no
centro escolar calculando o nº medio de
alumnos nas 5 aulas que se tomaron como
mostra.
Como a media mostral da (33+27+19+34+30)/5=
28,6 consideramos que o nº medio de alumnos
por aula no centro escolar é 28.6 e, polo tanto,
estimariamos que o número total de alumnos no
centro escolar é de 25·28,6=715 alumnos
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
30. 4. Estimadores puntuais: media mostral e
proporción mostral
Exemplo 2:
Entre os estudantes dunha cidade escolléronse
150 ao azar e preguntóuselles se estaban de
acordo co actual sistema de acceso á
universidade. 40 responderon que si. Estímese
a proporción de alumnos de dita cidade que
están de acordo co sistema de acceso á
universidade.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
31. 4. Estimadores puntuais: media mostral e
proporción mostral
Solución:
A proporción mostral é un bo estimador da
proporción poboacional, así que calculamos a
proporción de alumnos da mostra que
responderon afirmativamente e considerámola
como proporción poboacional.
40 de 150 é un 26,67%
Estimamos que un 26,67% da poboación está de
acordo co sistema de acceso á universidade.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
32. 5. Intervalo de confianza
A estimación puntual serve de pouco mentres
descoñezamos cal é o grao de aproximación entre o
estatístico mostral e o parámetro poboacional.
A estimación puntual non nos indica o erro cometido
en dita estimación.
O razoable na práctica é incluír, xunto á estimación
puntual do parámetro, un certo intervalo numérico
que mida a marxe de erro que, de acordo coas
observacións mostrais, poda ter dita estimación.
A idea de intervalo de confianza é propór un rango de
valores entre os que posiblemente se encontre o
verdadeiro valor do parámetro.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
33. 5. Intervalo de confianza
Por este motivo recórrese á estimación por
intervalos.
A partir dunha mostra de tamaño n podemos estimar o
valor dun parámetro da poboación do seguinte modo:
Dando un intervalo dentro do cal confiamos que estea
o parámetro, chamado intervalo de confianza.
•Calculando a probabilidade de que tal cousa ocorra. A
dita probabilidade chámaselle nivel de confianza que se
nomea como p=1-α sendo α o nivel de significación.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
34. 5. Intervalo de confianza
Supoñamos que para estimar unha media poboacional μ
tomamos unha mostra de tamaño n e a partir dela
construímos un intervalo de confianza ao 90% para μ. É
dicir, o nivel de confianza é 0,9 e o nivel de
significación 0,1.
No intervalo calculado pode ou non estar realmente μ.
Nin sequera podemos dicir que μ está no intervalo
calculado cunha probabilidade do 90%.
Só podemos falar de que o intervalo contén a μ cunha
confianza do 90%. Que significa entón nivel de
confianza do 90%?
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
35. 5. Intervalo de confianza
Se construímos moitos intervalos de confianza para μ cun nivel de confianza do
90%
μ
O 90% de ditos intervalos de confianza conterán a media poboacional.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
36. 5. Intervalo de confianza
Nota:
Como polo xeral só vamos a dispór dunha
mostra, temos que contar (por exemplo cun
90% de confianza) que a mostra que temos
pertence ao grupo das mostras boas (as que nos
dan unha estimación do intervalo que contén o
verdadeiro valor do parámetro).
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
37. 5. Intervalo de confianza
Para o cálculo de intervalos de confianza é importante
coñecer que é un intervalo característico e como
calculalo
Intervalos característicos :
Se unha variable aleatoria X ten unha distribución de
esperanza ou media μ, chámase intervalo característico
correspondente a unha probabilidade p a un intervalo
centrado na media (μ-k, μ+k) tal que a probabilidade de
que X pertenza a dito intervalo é p
p(μ-k < X < μ+k)=p
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
38. 5. Intervalo de confianza
Intervalos característicos en distribucións N(0,1)
Exemplo:
Calcula o intervalo característico dunha variable
aleatoria Z que segue unha distribución normal N(0,1)
correspondente á probabilidade p=0.9.
Trátase de atopar un intervalo centrado na media μ=0 e
polo tanto da forma (-k, k) que conteña unha
probabilidade de 0.9.
Fóra do intervalo haberá unha probabilidade de
1-p=1-0.9=0.1. Como o intervalo é simétrico , a área ou
probabilidade de cada “cola” é de 0.1/2=0.05
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
40. 5. Intervalo de confianza
Vemos , entón, que
p(Z≤k)=0.95
E recorremos á
táboa da distribución
N(0,1) para atopar o valor
de k correspondente á
probabilidade 0.95
K é un valor entre 1.64 e
1.65; polo que tomamos o
punto medio 1.645
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
41. 5. Intervalo de confianza
O intervalo característico para unha variable aleatoria
Z que segue unha distribución normal N(0,1)
correspondente a unha probabilidade p= 0.9 sería:
(-1.645, 1.645)
Diremos que k=1.645 é o valor crítico correspondente a
p=0.9.
Habitualmente desígnase a probabilidade p mediante 1-
α. O valor crítico correspondente denomínase zα/2
téndose as desigualdades:
p(Z> zα/2 )=α/2 p(-zα/2 <Z< zα/2 )=1-α
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
42. 5. Intervalo de confianza
Intervalos característicos en distribucións N(μ,σ)
Sexa X unha variable aleatoria que segue unha
distribución N(μ,σ).
Desexamos encontrar un intervalo centrado na media μ,
(μ-k, μ+k) tal que p(μ-k<X<μ+k)=p=1-α. É dicir, un
intervalo no que estea o (1-α).100% dos individuos da
poboación.
Se X é N(μ,σ) entón Z=(X-μ)/σ é N(0,1).
Calculariamos o intervalo característico para Z
correspondente a p=1-α que sería (-zα/2 , zα/2 ) .
Polo tanto:
p(-zα/2 <Z< zα/2 )=p (-zα/2 < (X-μ)/σ < zα/2 )=p=1-α
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
43. 5. Intervalo de confianza
Multiplicando toda a desigualdade pola desviación típica σ e
sumando a toda a desigualdade a esperanza ou media μ temos:
p(μ- zα/2 ·σ < X < μ+ zα/2 ·σ )=p=1-α
O intervalo característico será :
(μ- zα/2 ·σ , μ+ zα/2 ·σ )
Exemplo:
Calcula o intervalo característico para unha distribución N(3,2)
correspondente a unha probabilidade p=1-α=0.9.
Calculariamos o valor crítico para a N(0,1) correspondente a unha
probabilidade 0.9 . zα/2 =1.645
O intervalo característico sería (3-1.645·2, 3+1.645·2) =
(-0.29 , 6.29)
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
44. 5. Intervalo de confianza
O método pivotal para o cálculo de intervalos de confianza
Fixado un nivel de confianza p=1-α (0 < p < 1), o procedemento xeral
para a construción dun intervalo de confianza ao nivel
p=1-α para un parámetro de interese λ desenvólvese de acordo co
seguinte mecanismo:
1 Elección do estatístico pivotal:
Elíxese un estatístico que dependa só do parámetro que se desexa
estimar e cuxa distribución sexa coñecida T.
2 Formulación do enunciado probabilístico:
Preséntase un enunciado probabilístico tendo en conta a distribución
de probabilidade do estatístico elixido na etapa anterior e o valor
p=1-α fixado como nivel de confianza, é dicir, determínanse
constantes a e b tales que:
P (a < T < b) = p=1-α
ou dito doutro xeito, calcúlase un intervalo característico de T para
unha probabilidade p.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
45. 5. Intervalo de confianza
3 Transformación do enunciado probabilístico:
Se é posible despexar da expresión anterior, transfórmase o
enunciado probabilístico noutros equivalentes, mediante
operacións aritméticas, ata chegar a unha expresión na que o
parámetro de interese figure só no centro da desigualdade.
Dependendo das operacións aritméticas a realizar podemos obter:
P (T-1(a)< λ < T-1(b))= p=1-α
P (T-1(b)< λ < T-1(a))= p=1-α
Calculando o valor do estimador T nun caso concreto e sustituíndo
este dato no intervalo probabilístico construído anteriormente
obtense o intervalo de confianza para λ con un nivel de confianza
p=1-α.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
46. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Método pivotal aplicado ao cálculo dun
intervalo de confianza para a media dunha
poboación normal con varianza coñecida
Caso xeral.
X variable aleatoria que segue unha N(μ,σ),
μ descoñecida.
Para estimar μ tomamos unha mostra de tamaño
n, n≥30 e calculamos a media mostral
Como calcular un intervalo de confianza para
μ ó p·100%= (1-α)·100%?
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
47. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
1 Elección do estatístico pivotal :
Sabemos polo teorema central do límite que X = media mostral dunha
σ
mostra de tamaño n segue unha distribución N μ, se a poboación
n
partida X é normal ou se o tamaño das mostras é n ≥ 30 .
2 Formulació n do enunciado probabilístico :
Intentemos calcular un intervalo característico nesta distribución con probabilidade
p = 1 - α.
p(c1 < X < c2 ) = p = 1 − α
Tipificamos para pasar a unha normalN(0, 1).
c1 − μ X − μ c2 − μ
p < < = p =1−α
σ σ σ
n n n
Calculamos o intervalo característico da normal N(0,1) para unha probabilidade p = 1 - α.
Para isto calculamos o valor crítico zα para esta probabilidade p = 1 - α.
2
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
48. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Temos entón
c1 − μ c2 − μ
= −zα e = zα
σ 2 σ 2
n n
σ σ
c1 = −zα ⋅ + μ e c2 = zα ⋅ +μ
2 n 2 n
e polo tanto
( )
p c1 < X < c2 = p = 1 − α ⇒
p − zα ⋅
σ
n
+ μ < X < zα ⋅
σ
n
+ μ = p = 1 − α
2 2
3 Transform ación do enunciado probabilístico :
E facendo as seguintes operacións na desigualdade : restar μ, restar X
e multiplicar por − 1 , chegamos a :
σ σ
p X − zα ⋅ < μ < X + zα ⋅ = p =1−α
2 n 2 n
Substituímos X polo valor concreto obtido da mostra e temos que
o intervalo de confianza ao p ⋅ 100% = ( 1 - α ) ⋅ 100% para μ será :
σ σ
x − zα ⋅ , x + zα ⋅
2 n 2 n
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
49. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Conclusión:
Deséxase estimar a media, μ, dunha poboación con
desviación típica, σ, coñecida.
Para isto recórrese a unha mostra de tamaño n na que
se obtén unha media mostral, x.
Se a poboación de partida é normal ou se o tamaño da
mostra é n≥30, entón o intervalo de confianza de μ cun
nivel de confianza de p·100%= (1-α)·100% é:
σ σ
x − zα ⋅ , x + zα ⋅
2 n 2 n
sendo zα/2 o valor crítico nunha N(0,1) correspondente a
unha probabilidade p=1-α
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
50. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Vexamos o feito nun exemplo concreto:
Os estudantes de bacharelato de Galicia dormen un
número de horas diarias que se distribúe segundo unha
lei normal de media μ descoñecida e de desviación
típica 3. A partir dunha mostra de tamaño 30 obtívose
unha media mostral igual a 7 horas.
Obtén un intervalo de confianza ao 90% para a media
de horas de sono, μ.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
51. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Partimos da seguinte situación:
Poboación: Alumnos de bacharelato de Galicia.
Variable aleatoria:
X=nº de horas diarias de sono dun alumno de bacharelato de
Galicia, que segue unha distribución normal de media μ
descoñecida e desviación típica 3; N(μ,3).
Desexamos estimar a media poboacional μ para o que tomamos
unha mostra de tamaño 30 e calculamos o estatístico media
mostral, que sabemos é un estimador non esguellado da media
poboacional, obtendo x =7.
Pero non desexamos facer unha estimación puntual senón dar un
intervalo de confianza ao 90% para a media poboacional μ.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
52. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Empregaremos o método pivotal
Polo Teorema Central do Límite:
Como X segue unha distribución normal N(μ,3), a
variable aleatoria X que a cada unha desas mostras asígnalle a súa
media mostral
mi-------› xi
segue unha distribución normal de media μ e desviación típica
3/√30=0,55. N(μ,0´55).
Primeiro trataremos de atopar un intervalo carácterístico (c1,c2)
desta distribución normal N(μ,0,55) tal que
p(c1< X<c2)=0.9.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
53. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Para poder atopar dito intervalo temos que tipificar
para poder traballar ca N(0,1) que é a única tabulada.
Se X segue unha distribución N(μ,0.55), a variable
aleatoria Z=(X-μ)/0.55 segue unha distribución N(0,1):
c1 − μ X − μ c2 − μ
p
0.55 < 0.55 < 0.55 = 0.9
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
54. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
y f(x)=(1/sqr(2*pi))*e^-(x^2/2)
Lembremos como se calcula un intervalo característico da N(0,1)
0.034
Relleno 2
Relleno 3
0.032 Relleno 4
para unha probabilidade p=1-α=0.9.
x(t)=-1.65 , y(t)=t
x(t)=1.65 , y(t)=t
0.03
Trátase de atopar un intervalo de forma (-k,k) tal que p(-k<z<k)=p= 0.028
N(0,1)
=1-α=0.9
0.026
0.024
0.022
0.02
0.018
0.016
0.014
0.012
0.01
0.008
p(-k<z<k)=p=1-α=0,9
0.006
0.004
p(z>k)=(1-p)/2=α/2=0.05
p(z<-k)=(1-p)/2=α/2=0.05 0.002
x
-2.8 -2.6 -2.4 -2.2 -2 -1.8 -1.6 -1.4 -1.2 -1 -0.8 -0.6 -0.4 -0.2 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8
-k -0.002 k
-0.004
p(z≤k)=p+(1-p)/2=1-α+α/2=0.95
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
55. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Empregamos as táboas da N(0,1) para
calcular o valor de k tamén nomeado
como zα/2 tal que p(Z≤k)=p(Z< zα/2 )=0.95.
Atopamos que é un valor intermedio
entre 1.64 e 1.65 polo que tomamos
1.645.
K= zα/2=1.645 chámase valor crítico
correspondente á probabilidade p=1-
α=0.9.
Polo tanto o intervalo característico
sería :
(-1.645,1.645)
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
56. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Volvendo ao problema orixinal
c1 − μ X − μ c2 − μ
p
0.55 < 0.55 < 0.55 = 0.9
c1 − μ
= −1.645 c1 = −1.645 ⋅ 0.55 + μ
0.55
c2 − μ
= 1.645 c2 = 1.645 ⋅ 0.55 + μ
0.55
E como :
p(c1 < X < c2 ) = 0.9
p(μ − 1.645 ⋅ 0.55 < X < μ + 1.645 ⋅ 0.55) = 0.9
pero a min "interésame un intervalo para estimar μ".
Como o consigo?
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
57. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Restando μ á desigualdade :
p(-1.645 ⋅ 0.55 < X - μ < 1.645 ⋅ 0.55) = 0.9
Restando X á desigualdade :
p(-1.645 ⋅ 0.55 - X < -μ < 1.645 ⋅ 0.55 - X) = 0.9
Multiplicando a desigualdade por - 1 :
p(1.645 ⋅ 0.55 + X > μ > −1.645 ⋅ 0.55 + X) = 0.9
p(X - 1.645 ⋅ 0.55 < μ < X + 1.645 ⋅ 0.55) = 0.9
Como temos unha mostra cun resultado da media mostral x = 7 substituímos
obtendo :
p(7 - 1.645 ⋅ 0.55 < μ < 7 + 1.645 ⋅ 0.55) = 0.9
p(6.09525 < μ < 7.90475) = 0.9
Poderiamos concluír que : O nº medio de horas de sono dos estudantes
de bacharelato de Galicia está no intervalo
(6.09525, 7.90475) cun nivel de confianza do 90%.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
58. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Outra maneira de enfocalo:
X variable aleatoria que segue unha N(μ,σ), μ descoñecida.
Para estimar μ tomamos unha mostra de tamaño n, n≥30 e
calculamos a media mostral
Como calcular un intervalo de confianza para μ ao p·100%=
(1-α)·100%?.
Pensemos en x como unha estimación puntual de μ.
Entón X segue unha distribución normal N(x, σ )
n
Calculamos , entón, un intervalo característico para esta distribución
correspondente a unha probabilidade p = 1 − α.
Dito intervalo sería :
σ σ
x − zα ⋅ , x + zα ⋅
2 n 2 n
Dito intervalo considérase o intervalo de confianza para μ ó p ⋅ 100% =
= (1 − α) ⋅ 100%.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
59. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Exemplo 2:
Co fin de investigar o cociente de intelixencia medio
dunha poboación estudiantil , pasouse unha proba a 200
estudantes. A media mostral foi de 64 puntos. Por
outra banda, sábese por estudos anteriores que o
cociente intelectual na poboación distribúese
normalmente cunha desviación típica poboacional de 9.3
puntos.
Acha un intervalo de confianza para
a media poboacional do cociente de
intelixencia ao nivel de confianza
do 92%.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
60. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
SOLUCIÓN
X = cociente intelectual dun estudante
segue unha distribución normal N( μ,9.3)
Tomamos x como estimación puntual de μ
X segue unha distribución N(64, 9.3)
E como consecuencia
X = media dunha mostra de tamaño 200
9.3
segue unha distribución N(64, ) = N(64, 0.66)
200
Calculemos un intervalo característico para esta distribución con
probabilidade 0.92
p(c1 < X < c2 ) = 0.92
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
61. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Tipificamos
c − 64 X − 64 c2 − 64
p 1
0.66 < 0.66 < 0.66 = 0.92
E traballamo s cunha N(0,1)
Buscamos o valor crítico zα para p = 1 − α = 0.92
2
Se dentro do intervalo característico
hai unha probabilidade 0.92, fóra hai
α = 0.08, e, en cada " cola" 0.04; polo tanto :
p(Z ≤ zα ) = 0.96
2
Buscamos na táboa obtendo zα = 1.75
2
Polo tanto :
c1 − 64 c − 64
= −1.75 e 2 = 1.75
0.66 0.66
c1 = 64 − 1.75 ⋅ 0.66 = 62.8
c2 = 64 + 1.75 ⋅ 0.66 = 65.2
O intervalo de confianza buscado é ( 62.8, 65.2)
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
62. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Tamén o podes resolver simplemente empregando a fórmula, unha
vez sabes de onde se obtén.
Exemplo 3:
Un nadador obtén os seguintes tempos, en minutos, en 10 probas
cronometradas polo seu adestrador:
41.48 42.34 41.95 41.86 41.60 42.04 41.81 42.18 41.72 42.26
Obter un intervalo de confianza para a marca media desta proba
cun 95% de confianza, supoñendo que se coñece por outras probas
que ditas marcas deste nadador seguen unha
distribución normal con desviación típica de
0.3 minutos.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
63. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Solución:
Neste caso pídese un intervalo de confianza para a marca media
desta proba para dito nadador (μ) sabendo que as súas marcas
seguen unha normal con desviación típica σ=0.3 minutos.
A mostra coa que contamos é de tamaño n=10.
O intervalo de confianza será:
σ σ
x − zα ⋅ , x + zα ⋅
2 n 2 n
sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha
probabilidade p=1-α=0.95
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
64. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Calculamos zα/2 , o valor crítico
para unha distribución N(0,1)
correspondente a unha
probabilidade p=1-α = 0.95
Fóra do intervalo
característico queda α=0.05 e
en cada cola α/2=0.025.
Polo tanto p(Z≤ zα/2)=0.975
E zα/2=1.96
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
65. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Calculamos x
41.48 + 42.34 + 41.95 + 41.86 + 41.60 + 42.04 + 41.81 + 42.18 + 41.72 + 42.26
x= =
10
419.24
= = 41.924
10
e o intervalo de confianza ao 95% quedaría :
σ σ
x − zα ⋅ , x + zα ⋅ =
2 n 2 n
0.3 0.3
41.924 − 1.96 ⋅ , 41.924 + 1.96 ⋅ =
10 10
= ( 41.738, 42.11)
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
66. 6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Na seguinte páxina de internet tes unha
aplicación onde se calculan este tipo de
intervalos de confianza.
http://www.catedu.es/
matematicas_blecua/bacmat
/temario/bac2/mas2_estima1.htm
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
67. 7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
Intervalo de confianza para a media dunha
poboación normal da que “non” se coñece a varianza.
Hai que ter en conta:
Na maioría das ocasións nas que se realiza unha
investigación estatística a varianza poboacional σ é un
parámetro tan descoñecido como a media poboacional µ
A cuasivarianza mostral 2 n ∑ i i (x − x ) 2
⋅f
s = ⋅ s2 = i
é un bo estimador de σ2 . n −1 n −1
Estimaremos a desviación típica poboacional mediante
ŝ=√ŝ2.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
68. 7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
Distinguiremos dous casos:
Se a mostra é pequena n < 30
Se a mostra é grande n ≥ 30
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
69. 7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
Se a mostra é pequena n < 30:
Empregando o método do pivote
1 Elección do estatístico pivotal:
Fariamos unha estimación puntual da varianza poboacional mediante a
cuasivarianza mostral.
Pero a distribución correspondente a X non é unha N(μ,ŝ/√n) polo que ao
tipificala non obtemos unha N(0,1).
Gosset estudou esta variable aleatoria como estimador para calcular
intervalos de confianza para a media poboacional µ dunha poboación
normal con σ2 descoñecida :
X −μ
tn −1 =
sˆ
n
E segue unha distribución chamada t de student con n-1 graos de
liberdade.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
70. 7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
A distribución t de Student
con n-1 graos de liberdade ten
unha función de densidade
cunha forma “parecida” a unha
N(0,1) sendo centrada no 0 e
tendo simetría par.
Esta distribución está
tabulada.
Calcular un intervalo
característico desta
distribución faise de xeito
similar a como se fai na N(0,1).
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
71. 7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
2 Formulación do enunciado probabilístico:
Calculariamos o intervalo característico dunha t de student con
n-1 graos de liberdade correspondente a unha probabilidade p=1-
α. Buscariamos na táboa o valor c tal que:
1−p α
p( tn −1 < c ) = p + =1−α+
2 2
Temos un intervalo característico ( −c, c) da t de student
con n - 1 graos de liberdade que cumpre :
X −μ
p( − c < tn −1 < c ) = p − c < < c = p = 1 − α
sˆ
n
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
72. 7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
3 Transformación do enunciado probabilístico:
Facendo operacións na desigualdade
(multiplicar por s , restar X, multiplicar por − 1)
ˆ
n
p X − c ⋅ s
ˆ < μ < X + c⋅ s = p = 1− α
ˆ
n n
O intervalo de confianza para μ ao p ⋅ 100% = ( 1 − α ) ⋅ 100% será :
ˆ ,X + c⋅ s
X − c⋅ s
ˆ
n n
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
73. 7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
Se a mostra é grande n ≥ 30
Entón a t de student con n-1 graos de liberdade, tn-1 ,
aseméllase cada vez máis a unha N(0,1) . Polo que se
traballa directamente coa N(0,1) para obter o intervalo
característico con probabilidade p=1-α.
A partir de aquí o problema resólvese igual chegando ao
intervalo:
s
ˆ s
ˆ
x − zα ⋅
, x + zα ⋅
2 n 2 n
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
74. 7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
Conclusión:
Deséxase estimar a media, μ, dunha poboación normal con desviación
típica, σ, descoñecida.
Para isto recórrese a unha mostra de tamaño n na que se obtén unha
media mostral, x.
Primeiro estímase puntualmente a desviación típica empregando ŝ=√ŝ2
sendo ŝ2 a cuasivarianza mostral.
• Se o tamaño da mostra é n<30, entón o intervalo de confianza de μ cun
nivel de confianza de p·100%= (1-α)·100% é:
s
ˆ s
ˆ
x − c⋅
,x + c⋅
n n
sendo c o valor crítico nunha t de student con n-1 graos de liberdade
correspondente a unha probabilidade p=1-α
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
75. 7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
Se o tamaño da mostra é n≥30, entón o intervalo de
confianza de μ cun nivel de confianza de p·100% =
(1-α)·100% é:
s
ˆ s
ˆ
x − zα ⋅
, x + zα ⋅
2 n 2 n
sendo zα/2 o valor crítico nunha N(0,1) correspondente a
unha probabilidade p=1-α
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
76. 7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
Exemplo1:
Nunha multinacional de servicios modifícase a
aplicación informática de xestión. Os tempos (en horas)
que tardaron 15 traballadores elixidos ao azar en
adaptarse ao novo sistema foron os seguintes:
3.3, 2.9, 4.3, 2.6, 3.2, 4.1, 4.9, 2.8, 5.5, 5.3, 3.6, 3, 3.5,
2.9, 4.7
Determina un intervalo de confianza ao 95% para o
tempo medio de adaptación de todos os empregados da
empresa.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
77. 7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
Solución:
Neste caso pídese un intervalo de confianza para o
tempo medio de adaptación de todos os empregados(μ)
sendo a desviación típica σ descoñecida, que
estimaremos puntualmente por ŝ.
A mostra coa que contamos é de tamaño n=15<30; polo
tanto, o intervalo de confianza será:
s
ˆ s
ˆ s
ˆ s
ˆ
x − c⋅
,x + c⋅ = x − c⋅
,x + c⋅
n n 15 15
sendo c o valor crítico para unha distribución t de
student con n-1=14 graos de liberdade correspondente
a unha probabilidade p=1-α=0.95
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
78. 7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
xi (xi − x)2
Calculamos x : 3.3 0.2209
3.3 + 2.9 + ... + 4.7 2.9 0.7569
x= = 4.3 0.2809
15 2.6 1.3689
56.6 3.2 0.3249
= = 3.77 horas 4.1 0.1089
15 4.9 1.2769
Calculamos s :
ˆ 2.8 0.9409
5.5 2.9929
∑ (x − x )
2
⋅f 5.3 2.3409
n i i
3.6 0.0289
s2 =
ˆ ⋅ s2 = i 3 0.5929
n −1 n −1
3.5 0.0729
ˆ 12.9295 = 0.92
s2 = 2.9 0.7569
14 4.7 0.8649
12.9295
s = 0.92 = 0.96 horas
ˆ
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
79. 7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
Calculamos c, o valor crítico
para unha distribución t de
student con n-1=14 graos de
liberdade correspondente a
unha probabilidade p=1-α = 0.95
Buscamos os graos de liberdade
en vertical (14) e a
probabilidade p en horizontal
0.95.
C=1.761
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
80. 7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
O intervalo de confianza será:
sˆ s
ˆ s
ˆ s
ˆ
x − c⋅
,x + c⋅ = x − c⋅
,x + c⋅ =
n n 15 15
0.96 0.96
= 3.77 − 1.761 ⋅ , 3.77 + 1.761 ⋅ =
15 15
= ( 3.33, 4.21)
O tempo medio de adaptación
está entre 3.33 horas e 4.21 horas
cun nivel de confianza dun 95%
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
81. 7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
Exemplo 2:
Para analizar o peso duns botes de conserva,
tómase unha mostra de tamaño 32. Os pesos en
quilogramos obtidos son:
0.97 0.99 1.01 0.98 0.99 1.00 0.98 0.98
1.00 1.02 0.97 0.97 0.99 0.99 0.99 0.96
0.98 1.00 0.99 1.01 1.00 1.00 0.98 0.99
0.99 0.98 0.97 0.97 1.01 0.96 1.03 0.92
Calcula o intervalo de confianza ao 95% para o
peso medio dos botes.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
82. 7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
83. 7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
Solución:
Neste caso pídese un intervalo de confianza para o
peso medio en quilogramos duns botes de conserva(μ)
sendo a desviación típica σ descoñecida, que
estimaremos puntualmente por ŝ.
A mostra coa que contamos é de tamaño n=32>30; polo
tanto, o intervalo de confianza será:
s
ˆ s
ˆ
x − zα ⋅
, x + zα ⋅
2 n 2 n
sendo zα/2 o valor crítico nunha N(0,1) correspondente a
unha probabilidade p=1-α=0.95
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
84. 7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
Calculamos x : xi fi xi ·fi (xi − x)2 (xi − x)2 ·f i
∑x ⋅f
i i
31.57 0.92 1 0.92 0.004489 0.004489
x= i
= = 0.96 2 1.92 0.000729 0.001458
N 32
= 0.987 Kg 0.97 5 4.85 0.000289 0.001445
Calculamos s :
ˆ 0.98 6 5.88 0.000049 0.000294
∑ (x − x)
2 0.99 8 7.92 0.000009 0.000072
⋅f
n i i
1 5 5 0.000169 0.000845
s =
ˆ2
⋅s = i
2
n −1 n −1 1.01 3 3.03 0.000529 0.001587
0.013128
s2 =
ˆ = 0.00042 1.02 1 1.02 0.001089 0.001089
31
1.03 1 1.03 0.001849 0.001849
s = 0.00042 = 0.206 Kg
ˆ
32 31.57 0.013128
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
85. 7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
Calculamos zα/2 , o valor crítico
para unha distribución N(0,1)
correspondente a unha
probabilidade p=1-α = 0.95
Fóra do intervalo
característico queda α=0.05 e
en cada cola α/2=0.025.
Polo tanto p(Z≤ zα/2)=0.975
E zα/2=1.96
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
86. 7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
O intervalo de confianza será:
s
ˆ s
ˆ
x − zα ⋅
, x + zα ⋅ =
2 n 2 n
0.206 0.206
0.987 − 1.96 ⋅ ,0.987 + 1.96 ⋅ =
32 32
( 0.916,1.058)
O peso medio dos botes
de conserva está entre
0.916 Kg e 1.058 Kg cun
nivel de confianza do 95%
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
87. 8. Intervalo de confianza para a proporción
Intervalo de confianza para a
proporción.
Desexamos atopar un intervalo de confianza
cun nivel de confianza do p’·100%=(1-α)·100%
para a proporción p poboacional de certa
característica C.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
88. 8. Intervalo de confianza para a proporción
O método pivotal
1 Elección do estatístico pivotal:
Para iso recórrese a unha mostra de tamaño n, na que se obtén
unha proporción mostral pr.
Se x é o número de éxitos nas n probas, entón o estimador é:
Pr=X/n
X=nº de éxitos, en principio, corresponde a unha distribución
binomial B(n,p)
p=probabilidade de éxito , μ=np e σ=√npq.
Pero se np>5 e nq>5 dita binomial aproxímase por unha normal
N(np,√npq) .
E neste caso Pr=x/n segue unha distribución normal
N(np/n, √npq/n)=N(p,√(pq/n))=N(p,√(p(1-p)/n)
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
89. 8. Intervalo de confianza para a proporción
2 Formulación do enunciado probabilístico:
Trataremos de atopar un intervalo característico do estimador que conteña unha
probabilidade p’=1-α e p(c1<Pr<c2)=p’=1-α, Tipificamos a normal, para traballar cunha
N(0,1)
c −p Pr − p c −p
p 1 < < 2 = p'= 1 − α
p(1 - p) p(1 - p ) p( 1 - p )
n n n
Buscamos na táboa da N(0,1) o valor crítico para p'= 1 − α
α
p(Z ≤ zα/2 ) = 1 − α +
2
Entón :
c1 − p c2 − p
= −zα/2 e = zα/2
p(1 - p ) p( 1 - p)
n n
p(1 - p ) p(1 - p )
c1 = p − zα/2 ⋅ e c2 = p + zα/2 ⋅
n n
Polo tanto :
p(1 - p ) p(1 - p )
p(c1 < Pr < c2 ) = p p − zα/2 ⋅
< Pr < p + zα/2 ⋅ = p'= 1 − α
n n
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
90. 8. Intervalo de confianza para a proporción
3 Transformación do enunciado probabilístico:
Facendo as operacións seguintes na desigualdade conseguimos que p quede no
medio:
Restar p :
p(1 - p) p( 1 - p)
p − zα/2 ⋅
< Pr - p < zα/2 ⋅ = p'= 1 − α
n n
Restar Pr :
p(1 - p) p(1 - p)
p − zα/2 ⋅
− Pr < -p < zα/2 ⋅ − Pr = p'= 1 − α
n n
Multiplicar por − 1 :
p( 1 - p) p( 1 - p)
p zα/2 ⋅
+ Pr > p > −zα/2 ⋅ + Pr = p'= 1 − α
n n
p(1 - p) p( 1 - p)
p Pr - zα/2 ⋅
< p < Pr + zα/2 ⋅ = p'= 1 − α
n n
Sustituindo Pr polo valor concreto obtido da mostra, o mesmo que p, que non é coñecido
obtemos como intervalo de confianza ao nivel de confianza dun p'⋅100% = ( 1 − α ) ⋅ 100% :
pr(1 - pr) pr( 1 - pr )
pr - zα/2 ⋅ , pr + zα/2 ⋅
n n
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
91. 8. Intervalo de confianza para a proporción
Conclusión:
Deséxase estimar a proporción p , de individuos cunha
certa característica que hai nunha poboación. Para iso
recórrese a unha mostra de tamaño n, na que se obtén
unha proporción mostral pr.
O intervalo de confianza de p cun nivel de confianza
p’·100%=(1-α)·100% é:
pr( 1 - pr ) pr(1 - pr )
pr - zα/2 ⋅ , pr + zα/2 ⋅
n n
sendo zα/2 o valor crítico nunha N(0,1) correspondente a
unha probabilidade p’=1-α
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
92. 8. Intervalo de confianza para a proporción
Exemplo:
Para estudar a proporción
de estudantes que
practicaban football,
tómase unha mostra de
tamaño 300. O resultado
obtido é que o practican
210. Calcula o intervalo de
confianza para a
proporción p cun nivel de
confianza do 98%.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
93. 8. Intervalo de confianza para a proporción
Queremos estimar a proporción de estudantes que practican
football, polo que tomamos unha mostra de tamaño n=300,
obtendo unha proporción mostral pr=210/300=0.7 (70%).
Sabemos que o intervalo de confianza para unha proporción p cun
nivel de confianza do 98% é:
pr( 1 - pr ) pr( 1 - pr )
pr - zα/2 ⋅ , pr + zα/2 ⋅
n n
sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha
probabilidade 0.98
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
94. 8. Intervalo de confianza para a proporción
Calculamos zα/2 , o valor crítico
para unha distribución N(0,1)
correspondente a unha
probabilidade p’=1-α = 0.98
Fóra do intervalo
característico queda α=0.02 e
en cada cola α/2=0.01
Polo tanto p(Z≤ zα/2)=0.99
zα/2 está entre 2.32 e 2.33,
tomaremos 2.325
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
95. 8. Intervalo de confianza para a proporción
O intervalo de confianza
para a proporción de estudantes
que xogan ao fútbol cun nivel de
confianza dun 98% será:
pr( 1 - pr) pr(1 - pr )
pr - zα/2 ⋅ , pr + zα/2 ⋅ =
n n
0.7 ⋅ ( 1 − 0.7 ) 0.7 ⋅ ( 1 − 0.7 )
0.7 − 2.325 ⋅ , 0.7 + 2.325 ⋅ =
300 300
( 0.64, 0.76)
O intervalo está entre
un 64% e un 76%
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
96. 9. Intervalo de confianza para a diferenza de
medias
Intervalo de confianza para a diferenza de medias.
Desexamos atopar un intervalo de confianza cun nivel de confianza do
p·100% = (1-α)·100% para a diferenza de medias
μ1-μ2 de dúas poboacións sendo as desviacións típicas de ditas poboacións
coñecidas σ1 e σ2.
O método pivotal
1 Elección do estatístico pivotal:
Para iso recórrese a dúas mostras de tamaños n1 e n2, nas que se
x
obteñen dúas medias mostrais x1 e 2 .Empregaremos como
estimador :
X1 − X2
A distribución desta variable viuse que correspondía a unha normal
N(μ1-μ2, √(σ12/ n1 + σ22/ n2 )) se as poboacións iniciais eran
normais ou se o tamaño das mostras é maior de 30
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
97. 9. Intervalo de confianza para a diferenza de
medias
2 Formulación do enunciado probabilístico:
Trataremos de atopar un intervalo característico do estimador que conteña unha
probabilidade p=1-α
( )
p c1 < X1 − X2 < c2 = p = 1 − α
Tipificamos para traballar coa N(0,1)
c1 − ( μ1 − μ2 ) (X1 − X2 ) − ( μ1 − μ2 ) c2 − ( μ1 − μ2 )
p < < = p'= 1 − α
σ1 + σ 2 σ12 σ2 σ12 σ2
2 2 2 2
n + +
1 n2 n1 n2 n1 n2
α
Buscamos na táboa da N(0,1) o valor crítico para p = 1 − α; p(Z ≤ zα/2 ) = 1 − α +
2
Entón :
c1 − ( μ1 − μ2 ) c2 − ( μ1 − μ2 )
= −zα/2 e = zα/2
σ
2
σ 2
σ12 σ2
2
1
+ 2
+
n1 n2 n1 n2
σ12 σ2
2
σ12 σ2
2
c1 = ( μ1 − μ2 ) − zα/2 ⋅ + e c2 = ( μ1 − μ2 ) + zα/2 ⋅ +
n1 n2 n1 n2
Polo tanto :
σ2 σ2 σ2 σ2
p(c1 < X1 − X2 < c2 ) = p ( μ1 − μ2 ) − zα/2 ⋅ 1 + 2 < X1 − X2 < ( μ1 − μ2 ) + zα/2 ⋅ 1 + 2 = p = 1 − α
n1 n2 n1 n2
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
98. 9. Intervalo de confianza para a diferenza de
medias
3 Transformación do enunciado probabilístico
Facendo operacións na desigualdade conseguimos que μ1 − μ2quede no medio
Restar μ1 − μ2 :
σ2 σ2 σ2 σ2
p − zα/2 ⋅ 1 + 2 < (X1 − X2 ) − (μ1 − μ2 ) < zα/2 ⋅ 1 + 2 = p = 1 − α
n1 n2 n1 n2
Restar X1 − X2 :
− z ⋅ σ1 + σ2 − (X − X ) < −(μ − μ ) < z ⋅ σ1 + σ2 − (X − X ) = p = 1 − α
2 2 2 2
p
α/2 n1 n2 1 2 1 2 α/2
n1 n2
1 2
Multiplicar por − 1 :
σ2 σ2 σ2 σ2
p zα/2 ⋅ 1 + 2 + (X1 − X2 ) > (μ1 − μ2 > −zα/2 ⋅ 1 + 2 + (X1 − X2 ) = p = 1 − α
n1 n2 n1 n2
σ2 σ2 σ2 σ2
p (X1 − X2 ) − zα/2 ⋅ 1 + 2 < μ1 − μ2 < (X1 − X2 ) + zα/2 ⋅ 1 + 2 = p = 1 − α
n1 n2 n1 n2
Substituíndo X1 − X2 polo valor concreto obtido da mostra,
obtemos como intervalo de confianza ao nivel de confianza dun p ⋅ 100% = ( 1 − α ) ⋅ 100% :
2
( x − x ) − z ⋅ σ1 + σ 2 , ( x − x ) + z ⋅ σ 1 + σ 2
2 2 2
1 2 α/2
n1 n2
1 2 α/2
n1 n2
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
99. 9. Intervalo de confianza para a diferenza de
medias
Conclusión:
Deséxase estimar a diferenza de medias μ1-μ2 de dúas poboacións con desviacións
típicas, σ1 e σ2, , coñecidas .
Para isto recórrese a dúas mostras de tamaños n1 e n2 nas que se obteñen dúas
medias mostrais.
Entón, o intervalo de confianza de μ1-μ2 cun nivel de confianza de p·100%= (1-
α)·100% é:
σ12 σ2
2
σ12 σ2
2
(x − x ) − z ⋅ + , (x1 − x2 ) + zα/2 ⋅ +
1 2 α/2
n1 n2 n1 n2
sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha probabilidade p=1-α
Se as desviacións típicas, σ1 e σ2, , non fosen coñecidas, pero o tamaño das dúas
mostras fose maior de 30 tomariamos no lugar das varianzas poboacionais, as
cuasivarianzas mostrais, ŝ1 e ŝ2 .
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
100. 9. Intervalo de confianza para a diferenza de
medias
Exemplo:
O tempo en minutos que tardan en reparar certo tipo
de avaría nun taller A segue unha distribución normal
con desviación típica de 25 minutos; mentres nun taller
B a desviación típica é de 30 minutos. Nunha mostra de
10 reparacións dese tipo de avaría no taller A o tempo
medio foi de 80 minutos, mentres que nunha mostra de
15 reparacións en B a media foi de 75 minutos.
Calcula o intervalo de confianza para a diferenza de
tempos medios, cun nivel de significación α do 1%.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
101. 9. Intervalo de confianza para a diferenza de
medias
Solución:
Neste caso pídese un intervalo de confianza para a diferenza de
tempos medios de reparación dun tipo de avaría entre dous
talleres A e B (μ1-μ2 ) sabendo que o tempo de reparación deste
tipo de avaría segue nos dous talleres unha distribución normal
con desviacións típicas σ1=25 minutos e σ2=30 minutos
respectivamente.
As mostra coas que contamos son de tamaños n1=10 e n2=15;
obténdose nelas tempos medios mostrais de 80 minutos e 75
minutos respectivamente.
Polo tanto, o intervalo de confianza será:
σ12 σ2
2
σ12 σ2
2
(x − x ) − z ⋅ + , (x1 − x2 ) + zα/2 ⋅ +
1 2 α/2
n1 n2 n1 n2
sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha
probabilidade p=1-α=1-0.1=0.99
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
102. 9. Intervalo de confianza para a diferenza
de medias
Calculamos zα/2 , o valor crítico
para unha distribución N(0,1)
correspondente a unha
probabilidade p=1-α = 0.99
Fóra do intervalo
característico queda α=0.01 e en
cada cola α/2=0.005
Polo tanto p(Z≤ zα/2)=0.995
zα/2 está entre 2.57 e 2.58,
tomaremos 2.575
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
103. 9. Intervalo de confianza para a diferenza de
medias
O intervalo de confianza para a diferenza de medias quedaría :
σ12 σ2
2
σ12 σ2
2
(x − x ) − z ⋅ + , (x1 − x2 ) + zα/2 ⋅ + =
1 2 α/2
n1 n2 n1 n2
252 302 252 302
(80 − 75) − 2.575 ⋅ + , (80 − 75) + 2.575 ⋅ + =
10 15 10 15
( − 23.5, 33.5)
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
104. 10. Intervalo de confianza para a varianza
Intervalo de confianza para a varianza dunha distribución
normal .
Desexamos atopar un intervalo de confianza cun nivel de confianza do p·100%=(1-
α)·100% para a varianza σ2 dunha poboación normal.
O método pivotal
1 Elección do estatístico pivotal:
Para iso recórrese a unha mostra de tamaño n, na que se obtén a
cuasivarianza mostral ŝ .
Empregaremos como estimador
ˆ
n − 1 ⋅ S2 ( )
σ2
Polo Teorema de Fisher sabemos que dita variable aleatoria segue unha
distribución chi-cadrado con n-1 graos de liberdade
No seguinte enlace podes observar a forma que ten a función de
densidade de dita distribución.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
105. 10. Intervalo de confianza para a varianza
2 Formulación do enunciado probabilístico:
Trataremos de atopar un intervalo do estimador que
conteña unha probabilidade p=1-α e que deixe a cada
lado (dúas colas) unha probabilidade (1-p)/2=α/2
p c1 <
(n − 1) ⋅ S2 < c = p = 1 - α
ˆ
σ2
2
Buscamos na táboa da chi - cadrado con n - 1 graos de liberdade os valores
c e c que deixan á súa esquerda probabilidades
1 2
1−p α 1−p α
de = e p+ =1−
2 2 2 2
respectivamente.
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
106. 10. Intervalo de confianza para a varianza
3 Transformación do enunciado probabilístico
Facendo as operacións seguintes na desigualdade conseguimos que σ2 quede no
medio:
c1 < ( n − 1) ⋅ S < c2 = p = 1 - α
ˆ2
p
σ2
c1 ˆ
S2 c
Dividir por n - 1 : p < 2 < 2 = p =1−α
n -1 σ n -1
ˆ c1 1 c2
Dividir por S2 :p < 2<
(n - 1) ⋅ S2 σ
= p =1−α
ˆ ˆ2
(n - 1) ⋅ S
Ao inverter as fraccións as desigualdades dan a volta :
ˆ
(n - 1) ⋅ S2 ˆ
(n - 1) ⋅ S2 ˆ
(n - 1) ⋅ S2 ˆ
(n - 1) ⋅ S2
p >σ >
2 = p =1−α ; p <σ <
2 = p =1−α
c1 c2 c2 c1
ˆ
Substituíndo S2 polo valor concreto obtido da mostra,
obtemos como intervalo de confianza ao nivel de confianza dun p ⋅ 100% = ( 1 − α ) ⋅ 100% :
ˆ ˆ
(n - 1) ⋅ S2 (n - 1) ⋅ S2
,
c2 c1
IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.