O documento apresenta notas de aula para um curso introdutório de probabilidade e estatística de 60 horas. As notas abordam tópicos como introdução à estatística, probabilidade, variáveis aleatórias, esperança e variância, modelos probabilísticos e inferência estatística. O objetivo é selecionar os principais tópicos a serem ensinados no curso de forma concisa.
1. Notas de aula - Matem´atica Integrada (curso
de 60 horas-aula)
Professor Fl´avio Guardiano de Souza
(Com base no livro de Bussab & Morettin [1] e Magalh˜aes &
Lima [2])
Sum´ario
1 Introdu¸c˜ao `a Estat´ıstica 2
1.1 Popula¸c˜ao e amostra . . . . . . . . . . . . . . . . . . . . . . . 5
2 Probabilidade 7
2.1 Introdu¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Probabilidade Condicional e Independˆencia . . . . . . . . . . . 11
2.3 O Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . 13
2.4 Vari´aveis aleat´orias . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4.1 Vari´avel aleat´oria discreta . . . . . . . . . . . . . . . . 18
2.4.2 Vari´avel aleat´oria cont´ınua . . . . . . . . . . . . . . . . 19
2.5 Esperan¸ca e Variˆancia . . . . . . . . . . . . . . . . . . . . . . 22
2.6 Alguns modelos discretos . . . . . . . . . . . . . . . . . . . . . 27
2.7 Alguns modelos cont´ınuos . . . . . . . . . . . . . . . . . . . . 34
3 Inferˆencia Estat´ıstica – Estima¸c˜ao 42
3.1 Parˆametros, estimadores e estimativas . . . . . . . . . . . . . 43
3.2 Distribui¸c˜oes amostrais . . . . . . . . . . . . . . . . . . . . . . 48
3.3 Teorema central do limite . . . . . . . . . . . . . . . . . . . . 51
Esclarecimento
Estas notas de aula n˜ao representam material de autoria do professor.
Tratam-se, em quase sua totalidade, de c´opia de partes dos livros citados
nas referˆencias bibliogr´aficas e de escritos diversos de posse do professor ou
colhidos da internet.
1
2. Notas de aula - Matem´atica Integrada
O que este material tenta fazer ´e selecionar os t´opicos a serem lecionados
num curso introdut´orio de Probabilidade e Estat´ıstica de 60 horas ministrado
para uma turma do curso de Licenciatura em Matem´atica. Evidentemente,
estas notas n˜ao substituem os livros, sendo fortemente recomend´avel que o
aluno adquira pelo menos uma das obras citadas ou outras do gˆenero, ou que
v´a `a biblioteca e tome emprestado pelo menos um livro para o acompanha-
mento da disciplina durante o semestre.
Para a consolida¸c˜ao dos t´opicos estudados, exerc´ıcios s˜ao apresentados ao
longo do texto, selecionados dentre v´arios outros constantes da bibliografia
citada. Ciˆencia exata s´o ´e aprendida fazendo-se muitos exerc´ıcios. Ao aluno
´e “obrigat´orio” que se fa¸cam pelo menos estes sugeridos para um bom apro-
veitamento do curso; obviamente que quanto mais exerc´ıcios extras puderem
ser feitos, melhor, e os livros os contˆem em um n´umero bastante expressivo.
Dado que a bibliografia utilizada se refere a obras e autores consagrados,
poss´ıveis erros encontrados nestas notas ser˜ao muito provavelmente frutos de
erros de digita¸c˜ao ou de compreens˜ao do professor.
Este material ainda est´a sendo escrito e encontra-se em constante revis˜ao.
Apontamentos de erros, cr´ıticas ou sugest˜oes ser˜ao bem-vindas e poder˜ao ser
enviadas para o e-mail
flavioguardiano@gmail.com.
1 Introdu¸c˜ao `a Estat´ıstica
A disciplina Matem´atica Integrada na Unip consiste em uma esp´ecie de
“coringa”, uma disciplina que de tempos em tempos tem o seu enfoque alte-
rado. Neste semestre foi proposta a abordagem da Estat´ıstica, em que ser˜ao
tratados t´opicos referentes a probabilidade e inferˆencia.
A palavra “estat´ıstica” ´e origin´aria do latim status e tem a mesma origem
etimol´ogica de “estado”. Com efeito, a necessidade de governos coletarem
dados censit´arios de suas popula¸c˜oes foi um dos fenˆomenos que impulsionou
o desenvolvimento deste ramo da ciˆencia.
Dados tˆem sido coletados atrav´es de toda a hist´oria. Nas civiliza¸c˜oes
eg´ıpcia, grega e romana, dados prim´arios eram coletados com prop´ositos de
taxa¸c˜oes e finalidades militares. Na Idade M´edia, igrejas registravam dados
e informa¸c˜oes sobre nascimentos, mortes e casamentos. No Brasil, o IBGE
realiza seu censo a cada 10 anos. Atualmente, empresas investem grandes
somas de dinheiro em sistemas de informa¸c˜ao para se manterem competitivas
no mercado. As dificuldades em armazenar e analisar grandes conjuntos de
dados tˆem sido um consider´avel gargalo para as companhias e o conceito de
Big data (“megadados”, em portuguˆes) ganha relevˆancia a cada dia.
2
3. Notas de aula - Matem´atica Integrada
Evidentemente n˜ao ´e preciso ser um profissional da ´area para ter que
lidar com estat´ıstica. Diariamente somos expostos a grande quantidade de
informa¸c˜ao num´erica, como a apresentada no quadro que segue.
Resorts tˆem taxa de ocupa¸c˜ao maior com a Copa
A presen¸ca de turistas e, principalmente, de delega¸c~oes de
sele¸c~oes fez com que a taxa de ocupa¸c~ao dos resorts do pa´ıs
subisse cerca de 9% em junho na compara¸c~ao com o mesmo m^es de
2013.
Dados da Resorts Brasil (associa¸c~ao do setor) apontam que o
´ındice passou de 39,5%, no ano passado, para 43%, neste ano.
(Blog “Mercado aberto”, texto de Maria Cristina Frias, de 22/7/2014, hospedado em
http://www.folha.uol.com.br/)
Sobre a informa¸c˜ao do quadro acima, se o ´ındice de ocupa¸c˜ao dos resorts
passou de 39,5% para 43% (43% − 39, 5% = 3, 5%), por que a reportagem
fala em aumento de 9%?
Veja agora a not´ıcia do quadro a seguir. Vocˆe sabe o que significa dizer
que “a margem de erro ´e de dois pontos percentuais para mais ou para
menos”? O que significa o termo “margem de erro”? Um candidato com
1% de inten¸c˜ao de voto nessa pesquisa poderia teoricamente estar com um
percentual negativo?
3
4. Notas de aula - Matem´atica Integrada
Ibope: Dilma tem 38%, e A´ecio 22% das inten¸c˜oes de voto
Pesquisa Ibope divulgada nesta ter¸ca-feira (22) mostra a
presidente Dilma Rousseff (PT) na frente da disputa, com 38% dos
votos. Ela ´e seguida pelo tucano A´ecio Neves, com 22%, e por
Eduardo Campos (PSB), com 8%. O candidato Pastor Everaldo (PSC)
tem 3% das inten¸c~oes de voto. Eduardo Jorge (PV), Luciana Genro
(PSOL) e Z´e Maria (PSTU) possuem 1% cada. Os demais candidatos
n~ao pontuaram.
Os votos brancos e nulos correspondem a 16% do total; 9%
n~ao souberam responder. A margem de erro ´e de dois pontos
percentuais para mais ou para menos. O n´ıvel de confian¸ca ´e
de 95%, o que significa que o Ibope tem 95% de certeza de que os
n´umeros est~ao dentro da margem de erro.
(http://eleicoes.uol.com.br/2014/noticias/2014/07/22/
ibope-dilma-tem-38-e-aecio-22-das-intencoes-de-voto.htm, acesso em
23/7/2014.)
Outra ´area que contribuiu sobremaneira no desenvolvimento da Estat´ıstica
moderna ´e o c´alculo de probabilidades. ´E at´e poss´ıvel desenvolver racioc´ınio
estat´ıstico dissociado da probabilidade, mas isso limitaria a Estat´ıstica a in-
terpreta¸c˜oes num´ericas e an´alises descritivas. A Probabilidade ´e quem d´a `a
Estat´ıstica seu car´ater cient´ıfico, firmando bases para que observa¸c˜oes base-
adas em amostras possam ser estendidas `a popula¸c˜ao de que fazem parte.
No quadro acima ´e citada uma pesquisa de inten¸c˜ao de votos em que foram
calculadas simples propor¸c˜oes para aferir o desempenho dos candidatos `a
Presidˆencia da Rep´ublica. Mas para se chegar ao n´ıvel de confian¸ca citado
no texto, um c´alculo de probabilidade precisou ser feito. Essa probabilidade
associada `a margem de erro d´a a entender que a pesquisa foi feita observando
rigores cient´ıficos, sugerindo, por exemplo, que a abordagem dos eleitores n˜ao
foi feita “de qualquer maneira”, mas sim sob alguma metodologia preconi-
zada pela teoria. Vocˆe saberia explicar o que significam os 95% de certeza a
que o texto se refere?
Grosso modo, podemos dividir a Estat´ıstica em trˆes grandes ´areas, que
em geral est˜ao conjuntamente presentes em estudos complexos que envolvem
o tratamento estat´ıstico dos dados.
Estat´ıstica descritiva Em geral, utilizada na etapa inicial da an´alise,
quando tomamos contato com os dados pela primeira vez. Objetivando tirar
conclus˜oes de modo informal e direto, a maneira mais simples seria a ob-
serva¸c˜ao dos valores colhidos. Entretanto, ao depararmos com uma grande
massa de dados, percebemos, imediatamente, que a tarefa pode n˜ao ser sim-
ples. Para tentar depreender dos dados informa¸c˜oes a respeito do fenˆomeno
4
5. Notas de aula - Matem´atica Integrada
sob estudo, ´e preciso aplicar alguma t´ecnica que nos permita resumir a in-
forma¸c˜ao daquele particular conjunto de valores. Em outras palavras, a
Estat´ıstica descritiva pode ser definida como um conjunto de t´ecnicas desti-
nadas a descrever e resumir os dados, a fim de que possamos tirar conclus˜oes
a respeito das caracter´ısticas de interesse.
Probabilidade Pode ser pensada como teoria matem´atica utilizada para
se estudar a incerteza oriunda de fenˆomenos de car´ater aleat´orio. Sua hist´oria
´e relativamente recente e teve in´ıcio com os jogos de cartas, dados e de roleta;
esse ´e o motivo da grande existˆencia de exemplos de jogos de azar no estudo
da probabilidade.
Inferˆencia Estat´ıstica Estudo de t´ecnicas que possibilitam a extrapola¸c˜ao,
a um grande conjunto de dados, das informa¸c˜oes e conclus˜oes obtidas a par-
tir de subconjuntos de valores, usualmente de dimens˜ao muito menor. Deve
ser notado que se tivermos acesso a todos os elementos que desejamos estu-
dar, n˜ao e necess´ario o uso das t´ecnicas de Inferˆencia Estat´ıstica; entretanto,
elas s˜ao indispens´aveis quando existe a impossibilidade de acesso a todo o
conjunto de dados, por raz˜oes de natureza econˆomica, ´etica ou f´ısica.
1.1 Popula¸c˜ao e amostra
Defini¸c˜ao 1.1. O conjunto de valores de uma caracter´ıstica (num´erica) as-
sociada a uma cole¸c˜ao de indiv´ıduos ou objetos de interesse ´e dito ser uma
popula¸c˜ao.
Veja que com essa defini¸c˜ao, uma popula¸c˜ao n˜ao ´e o conjunto de pessoas,
indiv´ıduos ou objetos em si, mas as quantidades de interesse associadas a
essa cole¸c˜ao. Por exemplo, se queremos avaliar a renda m´edia dos moradores
de uma regi˜ao, a popula¸c˜ao de interesse n˜ao seriam pessoas, mas o conjunto
formado por todos os n´umeros referentes `a renda de todas aquelas pessoas.
Ou, o vetor contendo o tempo de vida de todas as lˆampadas fabricadas num
per´ıodo de tempo, e n˜ao as lˆampadas, seria definida como a popula¸c˜ao.
Algumas vezes podemos acessar toda a popula¸c˜ao para se estudar carac-
ter´ısticas de interesse, mas em muitas situa¸c˜oes tal procedimento n˜ao pode
ser realizado. Em geral, raz˜oes econˆomicas s˜ao as mais determinantes des-
sas situa¸c˜oes. Por exemplo, uma empresa usualmente n˜ao disp˜oe de verba
suficiente para saber o que pensam todos os consumidores de seus produtos.
H´a ainda raz˜oes ´eticas, quando, por exemplo, experimentos de laborat´orio
envolvem o uso de seres vivos. Al´em disso existem casos em que a impos-
sibilidade de se acessar toda a popula¸c˜ao de interesse ´e incontorn´avel. Na
an´alise do sangue de uma pessoa ou em um experimento para determinar o
5
6. Notas de aula - Matem´atica Integrada
tempo de funcionamento das lˆampadas produzidas por uma ind´ustria, n˜ao
podemos observar toda a popula¸c˜ao de interesse.
Tendo em vista as dificuldades de v´arias naturezas para se observar todos
os elementos da popula¸c˜ao, tomam-se alguns deles para formar um grupo a
ser estudado.
Defini¸c˜ao 1.2. Qualquer subconjunto da popula¸c˜ao, em geral com dimens˜ao
sensivelmente menor, ´e denominado amostra.
A sele¸c˜ao da amostra pode ser feita de v´arias maneiras, dependendo,
entre outros fatores, do grau de conhecimento que temos da popula¸c˜ao, dos
recursos dispon´ıveis etc. Ressalta-se que, em princ´ıpio, a sele¸c˜ao da amostra
tenta fornecer um subconjunto de valores o mais parecido poss´ıvel com a
popula¸c˜ao que lhe d´a origem. A amostragem mais estudada ´e a amostra
casual simples, ou amostra aleat´oria simples, em que seleciona-se ao acaso,
com ou sem reposi¸c˜ao, os itens da popula¸c˜ao que far˜ao parte da amostra.
Eventualmente, se se tiver informa¸c˜oes adicionais a respeito da popula¸c˜ao
de interesse, outros esquemas de amostragem mais sofisticados podem ser
utilizados. Por exemplo, se numa cidade tivermos mais mulheres do que ho-
mens, pode-se selecionar um certo n´umero de indiv´ıduos entre as mulheres e
outro n´umero entre os homens. Este procedimento ´e conhecido como amos-
tragem estratificada. A Teoria da Amostragem estuda com profundidade os
diferentes esquemas amostrais existentes. O importante aqui ´e ter em mente
que quanto mais complexa for a amostragem, maiores cuidados dever˜ao ser
tomados nas an´alises estat´ısticas utilizadas; em contrapartida, o uso de es-
quemas amostrais mais elaborados pode levar a uma diminui¸c˜ao no tamanho
da amostra necess´ario para uma dada precis˜ao.
Quest˜oes para discuss˜ao Para as situa¸c˜oes descritas a seguir, identifique
a popula¸c˜ao e a amostra correspondente. Discuta a validade do processo de
inferˆencia estat´ıstica para cada um dos casos.
a. Para avaliar a efic´acia de uma campanha de vacina¸c˜ao no Estado de S˜ao
Paulo, 200 m˜aes de rec´em-nascidos durante o primeiro semestre de um
dado ano em uma dada maternidade em S˜ao Paulo foram perguntadas a
respeito da ´ultima vez em que vacinaram seus filhos.
b. Para verificar a audiˆencia de um programa de TV, 563 indiv´ıduos foram
entrevistados por telefone com rela¸c˜ao ao canal em que estavam sintoni-
zados.
c. A fim de avaliar a inten¸c˜ao de voto dos brasileiros para presidente, 122
pessoas foram entrevistadas em Bras´ılia.
6
7. Notas de aula - Matem´atica Integrada
d. O diretor de uma empresa com 5.000 funcion´arios quer saber qual a opini˜ao
de seus subordinados sobre altera¸c˜ao no hor´ario de entrada e de sa´ıda do
expediente; para isso, em um determinado dia, foram entrevistados os 300
primeiros que passaram pela portaria para o in´ıcio da jornada.
2 Probabilidade
2.1 Introdu¸c˜ao
A teoria da probabilidade ´e a base sobre a qual a estat´ıstica ´e desenvol-
vida, fornecendo um meio para modelar popula¸c˜oes, experimentos ou prati-
camente qualquer outra coisa que possa ser considerada como um fenˆomeno
aleat´orio, definido como uma situa¸c˜ao ou acontecimento que n˜ao pode ser
previsto com certeza.
Chamamos espa¸co amostral ao conjunto de todos os resultados poss´ıveis
de um certo fenˆomeno aleat´orio. Ele ser´a representado pela letra grega Ω
(ˆomega). Os subconjuntos de Ω s˜ao denominados eventos e representados
pelas letras latinas mai´usculas A, B, ... O conjunto vazio, como j´a tradicional,
ser´a denotado por ∅. Temos ent˜ao que Ω ´e o evento certo e que ∅ ´e o evento
imposs´ıvel.
A uni˜ao de dois eventos A e B, denotada por A∪B, representa a ocorrˆencia
de pelo menos um dos eventos A ou B. A intersec¸c˜ao do evento A com o
eventos B, denotada por A ∩ B, ´e a ocorrˆencia simultˆanea de A e B.
Dois eventos A e B s˜ao disjuntos ou mutuamente exclusivos quando n˜ao
tˆem elementos em comum, isto ´e, A ∩ B = ∅.
Dizemos que A e B s˜ao complementares se sua uni˜ao ´e o espa¸co amostral
e sua intersec¸c˜ao ´e vazia. O complementar de A ser´a representado por Ac
e
temos A ∪ Ac
= Ω e A ∩ Ac
= ∅.
Se A ´e um subconjunto de B, dizemos que A est´a contido em B (ou,
equivalentemente, B cont´em A), e escrevemos A ⊆ B (ou B ⊇ A). Se
A ⊆ B e B ⊆ A ent˜ao temos A = B. Podemos usar A ⊂ B para indicar que
o conjunto A ´e subconjunto de B, mas A = B.
Consideremos probabilidade como sendo uma fun¸c˜ao P(·) que atribui va-
lores num´ericos aos eventos do espa¸co amostral, conforme a defini¸c˜ao a seguir.
Defini¸c˜ao 2.1. Uma fun¸c˜ao P(·) ´e denominada probabilidade se satisfaz `as
condi¸c˜oes:
i) 0 ≤ P(A) ≤ 1, ∀A ⊆ Ω;
ii) P(Ω) = 1;
7
8. Notas de aula - Matem´atica Integrada
iii) Se A1, A2, ..., An s˜ao disjuntos dois a dois ent˜ao P(
n
j=1
Aj) =
n
j=1
P(Aj).
Mas como atribuir probabilidades aos eventos do espa¸co amostral? H´a
duas maneiras principais de responder essa quest˜ao.
A primeira delas consiste na atribui¸c˜ao de probabilidades baseando-se
em caracter´ısticas te´oricas da realiza¸c˜ao do fenˆomeno. Por exemplo, ao
lan¸carmos um dado comum e observarmos a face voltada para cima temos o
espa¸co amostral Ω = {1, 2, 3, 4, 5, 6}. Admitindo que o dado foi constru´ıdo
de forma homogˆenea e com medidas rigorosamente sim´etricas, n˜ao temos
nenhuma raz˜ao para priorizar essa ou aquela face, de maneira que podemos
considerar P(1) = P(2) = P(3) = P(4) = P(5) = P(6) = 1/6.
Uma outra maneira de obter probabilidades ´e por meio das frequˆencias de
ocorrˆencias. Observando as diversas repeti¸c˜oes do fenˆomeno em que ocorre a
vari´avel de interesse, podemos anotar o n´umero de ocorrˆencias de cada valor
dessa vari´avel. Para um n´umero grande de realiza¸c˜oes, a frequˆencia relativa
poderia ser usada como probabilidade. Por exemplo, desejando estabelecer as
probabilidades de cada face de um dado sem fazer nenhuma suposi¸c˜ao inicial
sobre sua constru¸c˜ao, usamos a experiˆencia de sucessivas ocorrˆencias. Vamos
assumir que `a medida que o n´umero de repeti¸c˜oes nas mesmas condi¸c˜oes
vai aumentando, as frequˆencias relativas de estabilizam em um n´umero que
chamaremos de probabilidade. Em ciˆencias biol´ogicas e humanas essa ´e a
forma mais comum de atribuir probabilidades.
De modo geral, diremos que estamos fazendo um sorteio aleat´orio ou ao
acaso em uma popula¸c˜ao se a escolha desse ou daquele elemento s´o depende
da probabilidade a ele atribu´ıda, seja por meio da frequˆencia relativa ou de
alguma suposi¸c˜ao te´orica.
Exemplo 2.2. Nem sempre o espa¸co amostral ´e obtido com precis˜ao. Seja
o experimento “selecionar ao acaso um habitante do Rio de Janeiro e medir
sua altura em metros”. Quais os resultados poss´ıveis deste experimento? Po-
demos fazer Ω = (0, +∞), que evidentemente cont´em resultados imposs´ıveis.
Outros candidatos para Ω seriam os intervalos limitados (0, 3) e (1/10, 3);
ou ent˜ao Ω = R, a pr´opria reta real. O importante ´e perceber que o espa¸co
amostral pode n˜ao ser ´unico, mas deve conter todo resultado poss´ıvel de um
experimento.
Exemplo 2.3. Para a vari´avel n´umero de filhos em uma pesquisa, o espa¸co
amostral poder´a ser Ω = {0, 1, 2, 3, 4, 5+}, onde 5+ quer dizer “cinco filhos
ou mais”.
Exemplo 2.4. Uma f´abrica produz determinado artigo. Da linha de produ¸c˜ao
8
9. Notas de aula - Matem´atica Integrada
s˜ao retirados trˆes artigos, e cada um ´e classificado como bom (B) ou defei-
tuoso (D). Um espa¸co amostral do experimento ´e
Ω = {BBB, BBD, BDB, DBB, DDB, DBD, BDD, DDD}.
Se A designar o evento que consiste em obter dois artigos defeituosos,
ent˜ao A = {DDB, DBD, BDD}.
Exemplo 2.5. Considere o experimento que consiste em retirar uma lˆampada
de um lote e medir seu “tempo de vida” antes de se queimar. Um espa¸co
amostral conveniente ´e Ω = {t ∈ R : t ≥ 0}, isto ´e, o conjunto de todos
os n´umeros reais n˜ao negativos. Se A indicar o evento “o tempo de vida da
lˆampada ´e inferior a 20 horas”, ent˜ao A = {t : 0 ≤ t ≤ 20}. Esse ´e um
exemplo de um espa¸co amostral cont´ınuo, contrastado com os dos exemplos
anteriores, que s˜ao discretos.
A probabilidade da uni˜ao de eventos ´e calculada por meio da regra da
adi¸c˜ao de probabilidades, enunciada abaixo.
Sejam A e B eventos de Ω. Ent˜ao
P(A ∪ B) = P(A) + P(B) − P(A ∩ B).
Observe que se A e B forem disjuntos a express˜ao acima se reduz `a soma
das probabilidades dos eventos A e B, pois a intersec¸c˜ao ´e vazia e a corres-
pondente probabilidade ´e nula. A regra da adi¸c˜ao das probabilidades pode
ser expandida. Para obter P(A ∪ B ∪ C), podemos fazer D = B ∪ C e, com
algum algebrismo, chegar a P(A ∪ B ∪ C) =
= P(A) + P(B) + P(C) − P(A ∩ B) − P(A ∩ C) − P(B ∩ C) + P(A ∩ B ∩ C).
Exemplo 2.6. Seja o experimento do lan¸camento de um dado comum, com
a observa¸c˜ao da face que cai voltada para cima. Sejam os eventos A = “a
face voltada para cima ´e um n´umero par” e B = “a face voltada para cima
´e um n´umero menor que 5”. Temos Ω = {1, 2, 3, 4, 5, 6}, A = {2, 4, 6} e
B = {1, 2, 3, 4}. Se o dado for equilibrado, temos P(A) = 3/6 e P(B) = 4/6.
Para calcular P(A ∪ B), podemos fazer de duas formas.
• A ∪ B = {1, 2, 3, 4, 6} ⇒ P(A ∪ B) = 5/6.
• A∩B = {2, 4} ⇒ P(A∩B) = 2/6 e P(A∪B) = 3/6+4/6−2/6 = 5/6
(aplica¸c˜ao da regra da adi¸c˜ao).
Como consequˆencia da regra da adi¸c˜ao, obtemos que, para qualquer
evento A ⊆ Ω,
P(A) = 1 − P(Ac
).
9
10. Notas de aula - Matem´atica Integrada
Exerc´ıcios
1 – Para cada um dos casos abaixo, escreva o espa¸co amostral correspon-
dente e conte seus elementos.
a. Uma moeda ´e lan¸cada duas vezes e observam-se as faces voltadas para
cima.
b. Um dado ´e lan¸cado duas vezes e a ocorrˆencia da face par ou ´ımpar ´e
observada.
c. Uma urna cont´em 10 bolas azuis e 10 vermelhas com dimens˜oes rigoro-
samente iguais. Trˆes bolas s˜ao selecionadas ao acaso com reposi¸c˜ao e as
cores s˜ao anotadas.
d. Dois dados s˜ao lan¸cados simultaneamente e estamos interessados na soma
das faces observadas.
e. Em uma cidade, fam´ılias com 3 crian¸cas s˜ao selecionadas ao acaso, anotando-
se o sexo de cada uma.
f. Uma m´aquina produz 20 pe¸cas por hora; escolhe-se um instante qualquer
e observa-se o n´umero de pe¸cas defeituosas na pr´oxima hora.
g. Uma moeda ´e lan¸cada consecutivamente at´e o aparecimento da primeira
cara.
2 – Sendo A e B dois eventos em um mesmo espa¸co amostral, “traduza”
para a linguagem da Teoria dos Conjuntos as seguintes situa¸c˜oes.
a. Pelo menos um dos eventos ocorre.
b. O evento A ocorre mas B n˜ao.
c. Nenhum deles ocorre.
d. Exatamente um dos eventos ocorre.
3 – Uma universidade tem 10 mil alunos, dos quais 4 mil s˜ao considerados
esportistas. Temos ainda que 500 alunos s˜ao do curso de biologia diurno, 700
de biologia noturno e 200 s˜ao esportistas e de biologia noturno. Um aluno ´e
escolhido ao acaso e pergunta-se a probabilidade de ...
a. ser esportista.
10
11. Notas de aula - Matem´atica Integrada
b. ser esportista e aluno de biologia noturno.
c. n˜ao ser de biologia.
d. ser esportista ou aluno de biologia.
e. n˜ao ser esportista nem aluno de biologia.
4 – Sejam A e B dois eventos em um dado espa¸co amostral tais que
P(A) = 0, 2, P(B) = p, P(A ∪ B) = 0, 5 e P(A ∩ B) = 0, 1. Determine o
valor de p.
5 – Dois processadores tipo A e B s˜ao colocados em teste por 50 mil horas.
A probabilidade de que um erro de c´alculo aconte¸ca em um processador do
tipo A ´e de 1/30; no tipo B, 1/80; e em ambos, 1/1000. Qual a probabilidade
de que ...
a. pelo menos um dos processadores tenha apresentado erro?
b. nenhum processador tenha apresentado erro?
c. apenas o processador A tenha apresentado erro?
2.2 Probabilidade Condicional e Independˆencia
Considere a tabela 1, com dados referentes a alunos matriculados em
quatro cursos em uma universidade em um dado ano.
Tabela 1: Distribui¸c˜ao de alunos segundo o sexo e a escolha do curso
Curso Sexo Homens (H) Mulheres (F) Total
Matem´atica Pura (M) 70 40 110
Matem´atica Aplicada (A) 15 15 30
Estat´ıstica (E) 10 20 30
Computa¸c˜ao (C) 20 10 30
Total 115 85 200
Indiquemos por M o evento que ocorre quando, escolhendo-se ao acaso um
aluno do conjunto desses quatro cursos, ele for um estudante de Matem´atica
Pura. A, E, C, H e F tˆem significados an´alogos. Desta maneira, perceba
que, por exemplo,
• P(A) = 30/200;
11
12. Notas de aula - Matem´atica Integrada
• P(H) = 115/200;
• P(A∩H) = 15/200, sendo A∩H o evento “ocorrer A e H”, ou seja, um
aluno sorteado ao acaso ´e estudante de matem´atica aplicada e homem;
• P(A∪H) = P(A)+P(H)−P(A∩H) = 30/200+115/200−15/200 =
130/200 (A ∪ H =“o aluno sorteado ou ´e da Matem´atica Aplicada ou
´e homem, ou ambos”);
• P(A ∩ C) = 0 (A e C s˜ao eventos disjuntos, isto ´e, A ∩ C = ∅).
Agora, suponha sabermos que um estudante sorteado est´a matriculado
no curso de Estat´ıstica. Qual a probabilidade de que esse estudante seja
mulher?
Perceba que o fato de sabermos que o aluno ´e do curso de Estat´ıstica
limitou o nosso espa¸co amostral a esse novo universo de apenas 30 estudantes.
Para respondermos a quest˜ao, basta que olhemos agora apenas para linha
referente aos estudantes do curso de Estat´ıstica e vermos que s˜ao 20 mulheres
dentre 30 alunos, ou seja, a probabilidade pedida ´e 20/30. Escrevemos
P(mulher|Estat´ıstica) = P(F|E) =
20
30
=
2
3
.
Defini¸c˜ao 2.7. Para dois eventos quaisquer A e B, sendo P(B) > 0, defini-
mos a probabilidade condicional de A dado B, P(A|B), como sendo
P(A|B) =
P(A ∩ B)
P(B)
.
Usando a defini¸c˜ao 2.7 e os dados da tabela 1, P(F|E) =
P(F ∩ E)
P(E)
=
20/200
30/200
=
2
3
.
Observe que P(F) = P(mulher) = 85/200 = 17/40; com a informa¸c˜ao
de que E ocorreu (o aluno ´e do curso de Estat´ıstica), temos que P(F|E) =
2/3; logo, a informa¸c˜ao de que E ocorreu aumentou a probabilidade de F
ocorrer. Intuitivamente, percebemos que h´a um rela¸c˜ao de dependˆencia entre
os eventos F e E no que diz respeito `as suas probabilidades de ocorrˆencia.
Defini¸c˜ao 2.8. Dois eventos A e B s˜ao independentes se a informa¸c˜ao da
ocorrˆencia ou n˜ao de B n˜ao altera a probabilidade de ocorrˆencia de A, isto
´e:
P(A|B) = P(A), P(B) > 0,
12
13. Notas de aula - Matem´atica Integrada
ou ainda, de forma equivalente,
P(A ∩ B) = P(A)P(B).
Se A e B n˜ao s˜ao independentes, ent˜ao eles ser˜ao dependentes.
Verifique que se A independente de B ent˜ao B ´e independente de A.
Verifique tamb´em que o evento vazio ´e independente de qualquer evento.
Em verdade, eventos de probabilidade 0 ou 1 s˜ao independentes de qualquer
outro.
N˜ao confunda eventos independentes com eventos disjuntos. Se dois
eventos s˜ao disjuntos (e tˆem cada um probabilidades n˜ao nulas), ent˜ao a
ocorrˆencia de um implica a n˜ao ocorrˆencia do outro, ou seja, eles ser˜ao de-
pendentes. Matematizando, supondo P(A) > 0, P(B) > 0 e A ∩ B = ∅,
temos P(A|B) =
P(A ∩ B)
P(B)
=
0
P(B)
= 0, isto ´e, A e B n˜ao s˜ao independen-
tes.
2.3 O Teorema de Bayes
Defini¸c˜ao 2.9. (parti¸c˜ao do espa¸co amostral). Os eventos C1, C2, ..., Ck
formam uma parti¸c˜ao do espa¸co amostral se eles n˜ao tˆem intersec¸c˜ao entre
si e se sua uni˜ao ´e igual ao espa¸co amostral. Isto ´e,
Ci ∩ Cj = ∅ para i = j e
k
i=1
Ci = Ω.
A figura 1 apresenta um exemplo de uma parti¸c˜ao com 6 eventos.
Figura 1: parti¸c˜ao do espa¸co amostral com k = 6
13
14. Notas de aula - Matem´atica Integrada
Exemplo 2.10. Um fabricante de sorvetes recebe de uma fazenda C1 20%
de todo o leite que utiliza; de uma outra fazenda C2 ele recebe 30% do leite;
e de uma terceira fazenda C3 ele recebe 50% do leite utilizado.
Um ´org˜ao de fiscaliza¸c˜ao inspecionou as fazendas de surpresa, e observou
que 20% do leite produzido por C1 estava adulterado por adi¸c˜ao de ´agua,
enquanto que para as fazendas C2 e C3 essa propor¸c˜ao era de 5% e 2%
respectivamente. Na ind´ustria de sorvetes os gal˜oes de leite s˜ao armazenados
em um refrigerador sem identifica¸c˜ao das fazendas. Para um gal˜ao escolhido
ao acaso, vamos analisar o leite para decidir sobre sua adultera¸c˜ao ou n˜ao.
Se denotarmos por A o evento “o leite est´a adulterado”, temos P(A|C1) =
0, 20, P(A|C2) = 0, 05 e P(A|C3) = 0, 02. Veja que C1, C2 e C3 formam uma
parti¸c˜ao do espa¸co amostral. O evento A pode ser escrito em termos de
intersec¸c˜oes de A com os eventos C1, C2 e C3, conforme ilustra a figura 2.
Figura 2: A = (A ∩ C1) ∪ (A ∩ C2) ∪ (A ∩ C3)
Podemos ainda estar interessados em saber qual a probabilidade de que
a amostra adulterada tenha sido obtida do leite fornecido pela fazenda C1,
isto ´e, P(C1|A), o que implica em se inverter a probabilidade condicional
conhecida P(A|C1). Situa¸c˜oes como essa s˜ao t´ıpicas para o uso do resultado
apresentado a seguir.
Teorema 2.11 (Teorema de Bayes). Suponha que os eventos C1, C2, ...,
Ck formem uma parti¸c˜ao de Ω e que suas probabilidades sejam conhecidas.
Suponha ainda que para um evento A se conhe¸cam as probabilidades P(A|Ci)
para todo i = 1, 2, ..., k. Ent˜ao, para qualquer j,
P(Cj|A) =
P(A|Cj)P(Cj)
k
i=1 P(A|Ci)P(Ci)
, j = 1, 2, ..., k.
Exemplo 2.12. Voltando `a situa¸c˜ao do fabricante de sorvetes (exemplo
2.10), podemos agora calcular a probabilidade desejada.
14
15. Notas de aula - Matem´atica Integrada
P(C1|A) =
P(C1 ∩ A)
P(A)
=
P(A|C1)P(C1)
P(A|C1)P(C1) + P(A|C2)P(C2) + P(A|C3)P(C3)
=
0, 2 × 0, 2
0, 2 × 0, 2 + 0, 3 × 0, 5 + 0, 02 × 0, 2
= 0, 615.
Exerc´ıcios em sala
I – Considere dois eventos A e B, mutuamente exclusivos, com P(A) =
0, 3 e P(B) = 0, 5. Calcule.
a. P(A ∩ B).
b. P(A ∪ B).
c. P(A|B).
d. P(Ac
).
e. P(A ∪ B)c
.
II – Se P(A ∪ B) = 0, 8, P(A) = 0, 5 e P(B) = x, determine x no caso
de:
a. A e B serem mutuamente exclusivos;
b. A e B serem independentes.
III – Um time ganha com probabilidade 0, 7 se chove e com 0, 8 se n˜ao
chove. Em setembro a probabilidade de chuva ´e 0, 3. Se o time ganhou uma
partida em setembro, qual a probabilidade de ter chovido nesse dia?
IV – Mostre que se A e B s˜ao independentes, ent˜ao Ac
e Bc
tamb´em s˜ao
independentes.
P(Ac
)P(Bc
) = [1 − P(A)] × [1 − P(B)] = 1 − P(B) − P(A) + P(A)P(B) = 1 − P(B) −
P(A) + P(A ∩ B) (porque A e B s˜ao independentes). Assim, P(Ac
)P(Bc
) = 1 − [P(A) +
P(B) − P(A ∩ B)] = 1 − P(A ∪ B) = P[(A ∪ B)c
] = P[(A)c
∩ (B)c
].
15
16. Notas de aula - Matem´atica Integrada
Exerc´ıcios
6 – Uma moeda ´e viciada de modo que a probabilidade de sair cara ´e 4
vezes maior que a de sair coroa. Para dois lan¸camentos independentes dessa
moeda, determinar
a. o espa¸co amostral;
b. a probabilidade de sair somente uma cara;
c. a probabilidade de sair pelo menos uma cara;
d. a probabilidade de dois resultados iguais.
7 – As preferˆencias de homens e mulheres para cada gˆenero de filme
alugado em uma locadora est˜ao apresentadas na tabela a seguir.
Sexo Filme Com´edia Romance Policial
Homens 136 92 248
Mulheres 102 195 62
Sorteando-se ao acaso uma dessas loca¸c˜oes de v´ıdeo, pergunta-se a pro-
babilidade de:
a. uma mulher ter alugado um filme policial;
b. o filme alugado ser uma com´edia;
c. um homem ter alugado ou o filme ser um romance;
d. o filme ser policial dado que foi alugado por um homem.
8 – Um m´edico desconfia que um paciente tem tumor no abdˆomen, pois
isto ocorreu em 70% dos casos similares que tratou. Se o paciente de fato
tiver o tumor, o exame ultra-som o detectar´a com probabilidade 0, 9. Entre-
tanto, se ele n˜ao tiver o tumor, o exame pode, erroneamente, indicar presen¸ca
do tumor (falso-positivo) com probabilidade 0, 1. Se o exame detectou um
tumor, qual ´e a probabilidade de o paciente tˆe-lo de fato?
9 – Uma turma de Matem´atica teve a seguinte distribui¸c˜ao das notas
finais: 4 do sexo masculino e 6 do sexo feminino foram reprovados; 8 do sexo
masculino e 14 do feminino foram aprovados. Para um aluno sorteado dessa
turma, denote por M se o aluno escolhido for do sexo masculino e por A se
o aluno foi aprovado. Calcule:
16
17. Notas de aula - Matem´atica Integrada
a. P(A ∪ Mc
);
b. P(Ac
∩ Mc
);
c. P(A|M);
d. P(Mc
|A);
e. P(M|A).
2.4 Vari´aveis aleat´orias
Como visto no estudo das probabilidades, o conjunto de todos os poss´ıveis
resultados de um experimento aleat´orio ´e o espa¸co amostral. Os elementos
desse conjunto podem ser num´ericos ou n˜ao. Por exemplo, se o experimento
for escolher um aluno e registrar sua altura, teremos um conjunto num´erico;
por´em, se indagarmos o time de futebol preferido do aluno, teremos um
conjunto n˜ao num´erico. Como em muitas situa¸c˜oes experimentais precisamos
atribuir um n´umero real x a todo elemento do espa¸co amostral, vamos definir
o conceito de vari´avel aleat´oria.
Defini¸c˜ao 2.13. Seja Ω o espa¸co amostral associado a um experimento
aleat´orio. Uma fun¸c˜ao X que associe a cada elemento ω ∈ Ω um n´umero real
X(ω) ´e denominada vari´avel aleat´oria.
Observe que vari´avel aleat´oria ´e uma fun¸c˜ao cujo dom´ınio ´e o conjunto
Ω, e o contradom´ınio ´e o conjunto R dos n´umeros reais. Vari´aveis aleat´orias
s˜ao denotadas com letras latinas mai´usculas e os seus valores pelas letras
min´usculas correspondentes. Assim, a vari´avel aleat´oria X pode assumir os
valores x1, x2, ...
Ao definirmos uma vari´avel aleat´oria, acabamos definindo tamb´em um
novo espa¸co amostral, formado por todos os valores poss´ıveis da vari´avel.
Exemplo 2.14. Seja X a vari´avel que representa o n´umero de caras obtidas
no lan¸camento de duas moedas. Ent˜ao Ω = {hh, ht, th, tt}, h = cara, t =
coroa. A vari´avel X poder´a assumir os valores 0, 1 e 2. Assim:
• X = 0 corresponde ao resultado do evento tt (nenhuma cara);
• X = 1 corresponde ao resultado ht ou th (uma cara);
• X = 2 corresponde ao resultado hh (duas caras).
Exemplo 2.15. Y = n´umero de clientes que entram em um supermercado
entre 10h00 e 12h00. Y ´e um vari´avel aleat´oria com valores 0, 1, 2, 3, ...
17
18. Notas de aula - Matem´atica Integrada
Exemplo 2.16. Z = altura de alunos de uma escola prim´aria, em metros.
Os valores z assumidos por esta vari´avel pertencem a um intervalo real.
Exemplo 2.17. Claro est´a que um mesmo experimento pode gerar diver-
sas vari´aveis aleat´orias. Considere jogar um dado comum e observar a face
voltada para cima.
a) X = 1, 2, 3, 4, 5, 6 se X ´e o valor da face voltada para cima.
b) Y = 0 se a face voltada para cima ´e par e Y = 1 se a face ´e ´ımpar.
2.4.1 Vari´avel aleat´oria discreta
Defini¸c˜ao 2.18. Seja X uma vari´avel aleat´oria. Se o n´umero de valores
poss´ıveis de X for finito ou infinito numer´avel, denominaremos X de vari´avel
aleat´oria discreta.
As vari´aveis dos exemplos 2.14, 2.15 e 2.17 s˜ao discretas.
Defini¸c˜ao 2.19. A fun¸c˜ao que atribui a cada valor da vari´avel aleat´oria
discreta sua probabilidade ´e denominada fun¸c˜ao discreta de probabilidade,
ou simplesmente fun¸c˜ao de probabilidade.
X x1 x2 x3 ...
pi p1 p2 p3 ...
com pi = P(X = xi), i = 1, 2, 3, ...
Uma fun¸c˜ao de probabilidade satisfaz 0 ≤ pi ≤ 1 e
i
pi = 1.
Exemplo 2.20. Considere o experimento de lan¸car uma moeda e observar
se ocorre cara (H) ou coroa (T). Temos Ω = {HH, HT, TH, TT}. Podemos
agora, a partir do espa¸co amostral, descrever a vari´avel N definida como
“n´umero de caras em dois lan¸camentos dessa moeda”. Considerando inde-
pendˆencia entre os lan¸camentos e moeda n˜ao viciada, obtemos a fun¸c˜ao de
probabilidade da vari´avel aleat´oria N, descrita abaixo.
N 0 1 2
pi 1/4 1/2 1/4
18
19. Notas de aula - Matem´atica Integrada
Exemplo 2.21. Uma popula¸c˜ao de 1000 crian¸cas foi analisada para se de-
terminar a efetividade de uma vacina contra um tipo de alergia. As crian¸cas
recebiam uma dose da vacina e ap´os um mˆes passavam por um novo teste.
Caso ainda tivessem alguma rea¸c˜ao al´ergica, recebiam outra dose. Ao fim de
cinco doses todas as crian¸cas foram imunizadas. O quadro abaixo descreve o
resultado do experimento.
N´umero de doses 1 2 3 4 5 Total
Frequˆencia 245 288 256 145 66 1000
Supondo uma crian¸ca sorteada ao acaso, qual a probabilidade dela ter sido
imunizada ap´os receber duas doses da vacina? Com a ideia de atribuir pro-
babilidade por meio da frequˆencia relativa, a probabilidade desejada ´e de
288/1000 = 0, 288. A fun¸c˜ao de probabilidade da vari´avel X, “n´umero de
doses recebidas”, fica sendo o seguinte.
x 1 2 3 4 5
P(X = x) 0,245 0,288 0,256 0,145 0,066
Veja que P(X ≤ 2) = P(X = 1) + P(X = 2) = 0, 533 = 53, 3% ´e a
probabilidade da crian¸ca sorteada ter recebido at´e 2 vacinas.
2.4.2 Vari´avel aleat´oria cont´ınua
Defini¸c˜ao 2.22. Seja X uma vari´avel aleat´oria. Se os valores poss´ıveis de
X ´e um intervalo real ou uma cole¸c˜ao de intervalos, denominaremos X de
vari´avel aleat´oria cont´ınua.
A vari´avel do exemplo 2.16 ´e cont´ınua. Renda, sal´ario, tempo de dura¸c˜ao
de um equipamento, comprimento de uma pe¸ca, ´area atingida por uma praga
agr´ıcola etc. s˜ao outros exemplos de quantidades que podem ser modeladas
por vari´aveis aleat´orias cont´ınuas.
Defini¸c˜ao 2.23. Dizemos que f(x) ´e uma fun¸c˜ao cont´ınua de probabili-
dade, ou uma fun¸c˜ao densidade de probabilidade para uma vari´avel aleat´oria
cont´ınua X se satisfaz duas condi¸c˜oes:
(i) f(x) ≥ 0 para tido x ∈ (−∞; ∞);
(ii) a ´area definida por f(x) ´e igual a 1, isto ´e,
∞
−∞
f(x)dx = 1.
19
20. Notas de aula - Matem´atica Integrada
Para calcular probabilidades, temos que, para a ≤ b, P(a ≤ X ≤ b) =
b
a
f(x)dx, que ´e a ´area sob a fun¸c˜ao f definida no intervalo [a, b].
Pela forma com que s˜ao atribu´ıdas probabilidades para o caso cont´ınuo,
tem-se ´area 0 sob qualquer valor individual, isto ´e, P(X = k) = 0 para
qualquer k. Portanto, em se tratando de vari´avel aleat´oria cont´ınua, a pro-
babilidade de ocorrˆencia de um valor isolado ´e sempre 0 e, consequentemente,
P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b).
Exemplo 2.24. Num teste educacional com crian¸cas, o tempo para a rea-
liza¸c˜ao de uma bateria de quest˜oes de racioc´ınio l´ogico ´e medido e anotado
para ser comparado com um modelo te´orico, que considera T = tempo de
teste, em minutos, como uma vari´avel aleat´oria cont´ınua com fun¸c˜ao densi-
dade de probabilidade dada por
f(t) =
(t − 4)/40 se 8 ≤ t < 10;
3/20 se 10 ≤ t ≤ 15;
0 caso contr´ario.
Figura 3: gr´afico de f(t)
Note que f(t) se anula para t < 8 ou t > 15. Veja tamb´em que a fun¸c˜ao
f(t) ´e um fun¸c˜ao densidade de probabilidade, pois:
(i) f(t) ≥ 0 para todo t ∈ R;
(ii)
∞
−∞
f(t)dt =
10
8
(t − 4)
40
dt +
15
10
3
20
dt =
1
4
+
3
4
= 1.
Segundo o modelo te´orico, a probabilidade de uma crian¸ca fazer o teste entre
9 e 12 minutos ´e a ´area sob f(t) no intervalo [9, 12], o que neste caso pode
20
21. Notas de aula - Matem´atica Integrada
ser feito geometricamente pelo c´alculo das ´areas do trap´ezio e retˆangulos
formados; ou ent˜ao fazemos P(9 ≤ T ≤ 12) =
12
9
f(t)dt =
10
9
t − 4
40
dt +
12
10
3
20
dt =
11
80
+
3
10
=
11
16
.
Exerc´ıcios
10 – Uma moeda viciada tem probabilidade de cara igual a 0,4. Para dois
lan¸camentos independentes dessa moeda obtenha a fun¸c˜ao de probabilidade
da vari´avel n´umero de caras. Fa¸ca um gr´afico dessa fun¸c˜ao.
11– Fa¸ca X a vari´avel soma dos pontos obtidos no lan¸camento de dois
dados. Determine
a) a distribui¸c˜ao de probabilidade de X;
b) P(3 ≤ X < 10);
c) P(3 ≤ X ≤ 10);
d) P(X > 20);
e) probabilidade de se obter pelo menos soma 3.
12 – Uma vari´avel aleat´oria tem a distribui¸c˜ao de probabilidade dada pela
f´ormula P(X = x) = k/x, para x = 1, 3, 5, 7.
a) Determine k.
b) Calcule P(2 ≤ X ≤ 6).
c) Calcule P(X ≤ 5).
13 – Um homem de vendas calcula que cada contato resulta em vendas
com probabilidade de 20%. Certo dia, ele contata 5 poss´ıveis clientes. Cons-
trua a tabela da distribui¸c˜ao de probabilidade para a vari´avel Y = n´umero
de clientes que assinam um contrato de venda.
14 – Verifique se as fun¸c˜oes abaixo s˜ao fun¸c˜oes densidade de probabili-
dade.
a) f(x) =
3x se 0 ≤ x ≤ 2;
0 caso contr´ario.
21
22. Notas de aula - Matem´atica Integrada
b) f(t) =
−1/π se 0 < t < π;
0 caso contr´ario.
c) f(x) =
2e2x
se x ≤ 0;
0 caso contr´ario.
15 – O tempo, em minutos, de digita¸c˜ao de um texto por secret´arias
experientes ´e uma vari´avel aleat´oria cont´ınua com densidade
f(x) =
1/4 se 0 ≤ x < 2;
1/8 se 2 ≤ x < 6;
0 caso contr´ario.
Determine
a) P(X > 3).
b) P(1 < X ≤ 4).
c) P(X < 3|X ≥ 1).
d) P(X ≥ 1|X < 3).
e) Um n´umero b tal que P(X > b) = 0, 6.
2.5 Esperan¸ca e Variˆancia
Defini¸c˜ao 2.25. O valor esperado (ou m´edia ou ainda esperan¸ca) de uma
vari´avel aleat´oria X, denotado por E(X), ´e definido como
E(X) =
∞
−∞
xf(x)dx se X ´e cont´ınua;
x
xP(X = x) se X ´e discreta.
Uma nota¸c˜ao alternativa ´e representar E(X) por µX ou simplesmente µ,
se n˜ao houver possibilidade de confus˜ao. A m´edia de uma vari´avel aleat´oria ´e
uma medida-resumo de tendˆencia central que representa o “ponto de equil´ıbrio”
da distribui¸c˜ao de seus valores, sendo muito usada para resumir as informa¸c˜oes
e tamb´em em virtude de suas propriedades matem´aticas.
Evidentemente que caracterizar uma vari´avel por uma ´unica medida pode
levar a interpreta¸c˜oes equivocadas, de maneira que o uso de outras medidas
de tendˆencia central (mediana, moda, m´edia harmˆonica, m´edia geom´etrica,
m´edia aparada), de posi¸c˜ao (quartis, decis etc.), de varia¸c˜ao (variˆancia,
desvio-padr˜ao, desvio-m´edio, amplitude etc.) s˜ao amplamente usadas, com
suas adequa¸c˜oes dependendo de cada caso. Num curso de estat´ıstica descri-
tiva, essas medidas s˜ao estudadas mais detalhadamente; aqui, trabalharemos
apenas com as de maior interesse te´orico para os objetivos do curso no se-
mestre.
22
23. Notas de aula - Matem´atica Integrada
Defini¸c˜ao 2.26. A variˆancia de uma vari´avel aleat´oria X, denotado por
V ar(X), ou por σ2
X, ´e definida como V ar(X) = E[(X − µX)2
], ou, de outra
forma:
V ar(X) = σ2
X =
∞
−∞
(x − µx)2
f(x)dx se X ´e cont´ınua;
x
(x − µX)2
P(X = x) se X ´e discreta.
Onde µX = E(X) definida anteriormente.
O desvio-padr˜ao da vari´avel X, denotado por σX, ´e a raiz quadrada positiva
da variˆancia, ou seja, σX = σ2
X.
Exemplo 2.27. Um gerente de loja construiu a seguinte distribui¸c˜ao de
probabilidade para a venda de fog˜oes em uma semana.
x (vendas) 0 1 2 3 4
P(X = x) 0,20 0,30 0,30 0,15 0,05
A m´edia de vendas, ou o n´umero esperado de vendas semanal, ser´a E(X) =
4
x=0
P(X = x) = 0 × 0, 20 + 1 × 0, 30 + 2 × 0, 30 + 3 × 0, 15 + 4 × 0, 05 = 1, 55
fog˜oes.
Quanto `a variˆancia: σ2
X =
4
x=0
(x − µX)2
P(X = x) = (0 − 1, 55)2
· 0, 20 +
(1−1, 55)2
·0, 30+(2−1, 55)2
·0, 30+(3−1, 55)2
·0, 15+(4−1, 55)2
·0, 05 =
1, 2475 “fog˜oes ao quadrado” (sendo a variˆancia ´e uma medida quadr´atica,
sua unidade de medida ´e o quadrado da unidade original).
O desvio-padr˜ao ser´a σ = 1, 2475 = 1, 12 fog˜oes.
Exemplo 2.28. Considere a vari´avel tempo para a realiza¸c˜ao de um teste do
Exemplo 2.24 e vamos calcular o tempo esperado e seu desvio-padr˜ao.
Temos E(T) =
∞
−∞
tf(t)dt =
10
8
t×
(t − 4)
40
dt+
15
10
t×
3
20
dt = 2, 267+
9, 375 ≈ 11, 64 segundos.
Tamb´em, σ2
T =
10
8
(t − 11, 64)2
×
(t − 4)
40
dt +
15
10
(t − 11, 64)2
×
3
20
dt =
1, 7377 + 2, 1172 = 3, 8549 ⇔ σT = 3, 8549 = 1, 96 segundos.
Exemplo 2.29 (m´edia e variˆancia para dados brutos). Se em vez de uma dis-
tribui¸c˜ao de probabilidade tivermos simplesmente os valores dispon´ıveis x1,
x2,..., xn, podemos atribuir probabilidade de ocorrˆencia igual a 1/n para cada
23
24. Notas de aula - Matem´atica Integrada
um dos valores e fazer E(X) = µ =
1
n
x1+
1
n
x2+...+
1
n
xn =
x1 + x2 + ... + xn
n
,
que ´e a m´edia aritm´etica simples entre os valores, tamb´em denotada por ¯x.
Do mesmo modo calculamos V ar(X) = σ2
=
(x1 − µ)2
n
+
(x2 − µ)2
n
+...+
(xn − µ)2
n
=
n
i=1(xi − ¯x)2
n
, que ´e a maneira usual de se ensinar variˆancia
em cursos de estat´ıstica descritiva.
Propriedades Qualquer fun¸c˜ao de vari´avel aleat´oria tamb´em ´e uma va-
ri´avel aleat´oria. Vari´aveis aleat´orias distintas tamb´em podem ser somadas,
multiplicadas etc. sendo a resultante tamb´em uma vari´avel aleat´oria. Mais
adiante veremos alguns exemplos de casos assim. Sejam X, Y vari´aveis
aleat´orias e k uma constante real. Ent˜ao:
(i) E(k) = k
(ii) E(kX) = kE(X).
(iii) E(k ± X) = k ± E(X).
(iv) E(X ± Y ) = E(X) ± E(Y ).
(v) E(XY ) = E(X)E(Y ) se X e Y forem independentes.
(vi) V ar(k) = 0.
(vii) V ar(k ± X) = V ar(X).
(viii) V ar(kX) = k2
V ar(X).
(ix) V ar(X ± Y ) = V ar(X) + V ar(Y ) se X e Y forem independentes.
Um uso imediato das propriedades (i), (ii) e (iii) permite obter uma forma
alternativa – e mais frequentemente usada – para o c´alculo da variˆancia de
uma vari´avel. Sabendo que E(X) = µ ´e uma constante, temos V ar(X) =
E[(X − µ)2
] = E[X2
− 2µX + µ2
] = E(X2
) − 2µE(X) + E(µ2
) = E(X2
) −
2µ2
+ µ2
= E(X2
) − µ2
,
onde E(X2
) =
∞
−∞
x2
f(x)dx se X ´e cont´ınua;
x
x2
P(X = x) se X ´e discreta.
Ou seja, para calcularmos a variˆancia de X, podemos primeiramente calcular
E(X2
) e depois subtrair o quadrado da sua m´edia.
24
25. Notas de aula - Matem´atica Integrada
Exemplo 2.30. A variˆancia da vari´avel do Exemplo 2.27 poderia ter sido
calculada assim:
E(X2
) = 02
× 0, 20 + 12
× 0, 30 + 22
× 0, 30 + 32
× 0, 15 + 42
× 0, 05 = 3, 65.
σ2
= E(X2
) − µ2
= 3, 65 − 1, 552
= 1, 2475.
Exemplo 2.31. Uma m´aquina produz parafusos com peso unit´ario m´edio
10g e desvio-padr˜ao 2g. Se 1.000 desses parafusos forem acondicionados em
um recipiente que pese 5kg, qual o peso m´edio e o desvio-padr˜ao do conjunto?
Solu¸c˜ao. X = peso de um parafuso, E(X) = 10g, V ar(X) = 4g2
. c = 5.000g
´e o peso do recipiente.
Ent˜ao Y = 1.000X +c ´e a vari´avel peso do conjunto caixa-parafusos e, ent˜ao,
E(Y ) = E(1000X + c) = 1000E(X) + c = 1000 × 10g + 5.000g = 15.000g e
V ar(Y ) = V ar(1000X +c) = 10002
V ar(X) = 106
×4g2
⇔ σY = 2.000g.
Exerc´ıcios
16 – Uma vari´avel aleat´oria discreta pode assumir cinco valores, conforme
quadro que segue.
x 1 2 3 5 8
P(X = x) 0,20 0,25 P(X = 3) 0,30 0,10
a) Encontre o valor de P(X = 3).
b) Calcule P(X = 3|X ≥ 2).
c) Encontre a m´edia da distribui¸c˜ao.
d) Calcule a variˆancia e o desvio-padr˜ao.
17 – Uma vari´avel cont´ınua X tem densidade de probabilidade dada por
f(x) =
1
6
x + k , se 0 < x < 3;
0 , caso contr´ario.
a) Qual o valor de k?
b) Calcule a m´edia dessa vari´avel.
c) Calcule a variˆancia.
d) Calcule a mediana dessa vari´avel, sabendo que a mediana ´e um n´umero
m tal que P(X ≤ m) = 0, 5.
18 – Atletas de uma equipe de atletismo universit´ario tiveram medidos
peso e altura conforme quadro a seguir.
25
26. Notas de aula - Matem´atica Integrada
Atleta Peso (kg) Altura (m)
1 76 1,95
2 77 1,71
3 72 1,68
4 68 1,52
5 75 1,85
6 71 1,66
7 70 1,80
8 69 1,70
9 70 1,64
10 72 1,78
11 70 1,67
a) Calcule a m´edia das alturas e dos pesos.
b) Calcule o desvio-padr˜ao das alturas e dos pesos.
c) Em termos de desvio-padr˜ao, qual vari´avel tem maior variabilidade: peso
ou altura? Faz sentido essa compara¸c˜ao?
d) O coeficiente de varia¸c˜ao, que pode ser expresso em porcentagem, ´e a raz˜ao
entre o desvio-padr˜ao de uma vari´avel e sua m´edia. Calcule o coeficiente
de varia¸c˜ao das vari´aveis peso e altura e diga qual das vari´aveis tem maior
variabilidade. Essa compara¸c˜ao faz sentido?
19 – Sejam X e Y vari´aveis aleat´orias independentes com µX = 10, σ2
X =
8, µY = −5 e σ2
Y = 3. Calcule.
Calcule.
a) E(2X).
b) E(Y/3)
c) E(X + 8)
d) E
Y − 3
4
e) E(X + Y ).
f) E(X − 5Y ).
g) E
10Y + 8X
2
.
h) E(X − µX).
i) V ar(2X)
j) V ar(Y/3).
k) V ar(X + 8).
l) V ar(3Y + 4).
m) V ar(X − Y ).
n) V ar
3X − 2Y
5
o) E
X − µX
σX
p) V ar
X − µX
σX
q) E
Y − µY
σY
r) V ar
Y − µY
σY
26
27. Notas de aula - Matem´atica Integrada
20 – Uma pequena cirurgia dent´aria pode ser realizada por trˆes m´etodos
diferentes cujos tempos de recupera¸c˜ao (em dias) s˜ao modelados pelas vari´aveis
X1, X2 e X3, com as seguintes fun¸c˜oes de probabilidade.
k 0 4 5 6 10
P(X1 = k) 0,2 0,2 0,2 0,2 0,2
k 1 5 9
P(X2 = k) 1/3 1/3 1/3
k 4 5 6
P(X3 = k) 0,4 0,4 0,3
O que pode ser dito sobre os tempos de recupera¸c˜ao dos trˆes tratamentos?
2.6 Alguns modelos discretos
Modelo Bernoulli
Dizemos que uma vari´avel X segue o modelo Bernoulli se atribui 0 ou 1
`a ocorrˆencia de fracasso ou sucesso, respectivamente. Com p representando
a probabilidade de sucesso, 0 ≤ p ≤ 1, sua fun¸c˜ao discreta de probabilidade
´e dada por
x 0 1
P(X = x) 1 − p p
ou ent˜ao, P(X = x) = px
(1 − p)1−x
, x = 0, 1.
Nota¸c˜ao: X ∼ bernoulli(p) (leia: “X segue o modelo de Bernoulli com
probabilidade p de sucesso”).
Denominamos sucesso a ocorrˆencia do evento de interesse e fracasso a n˜ao
ocorrˆencia, sem que haja conota¸c˜oes negativa ou positiva nessas express˜oes.
Exemplo 2.32. a) Uma moeda ´e lan¸cada.: o resultado ou ´e cara (“sucesso”)
ou n˜ao ´e cara (“fracasso”).
b) Uma pe¸ca ´e escolhida ao acaso em um lote: a pe¸ca ´e defeituosa (“sucesso”)
ou n˜ao (“fracasso”).
c) Um eleitor ´e escolhido numa popula¸c˜ao e deseja-se verificar se ele vota ou
n˜ao no candidato A.
Se X ∼ binomial(p), segue que
E(X) = 1 × p + 0 × (1 − p) = p.
Para a variˆancia, temos E(X2
) = 12
× p + 02
× (1 − p) = p, de forma que
V ar(X) = E(X2
) − E2
(X) = p − p2
= p(1 − p).
A repeti¸c˜ao de ensaios de Bernoulli independentes d´a origem `a mais im-
portante vari´avel aleat´oria discreta, denominada modelo Binomial.
27
28. Notas de aula - Matem´atica Integrada
Modelo Binomial
Considere a repeti¸c˜ao de n ensaios de Bernoulli independentes e todos
com a mesma probabilidade de sucesso p. A vari´avel aleat´oria que conta o
n´umero total de sucessos ´e denominada Binomial com parˆametros n e p e
sua fun¸c˜ao de probabilidade ´e dada por
P(X = k) =
n
k
pk
(1 − p)n−k
, k = 0, 1, 2, ..., n,
em que
n
k
=
n!
k!(n − k!)
´e o coeficiente binomial. Nota¸c˜ao: X ∼ b(n, p).
Figura 4: exemplos de distribui¸c˜ao Binomial
Exemplo 2.33. Se 15% dos brasileiros torcem pelo Flamengo, ao sortearmos
ao acaso 10 brasileiros, qual a probabilidade de n˜ao haver flamenguista no
grupo sorteado?
Solu¸c˜ao. Podemos pensar no experimento que consiste em sortear um bra-
sileiro ao acaso e verificar o time para o qual torce. Definimos a vari´avel
aleat´oria Y como segue: Y =
1 se flamenguista;
0 caso contr´ario.
Note que Y ∼ bernoulli(p = 0, 15). Repetindo o sorteio 10 vezes nas mesmas
condi¸c˜oes teremos 10 ensaios de Bernoulli Y1, Y2, ..., Y10 cada um assumindo o
valor 1 com 15% de probabilidade (e consequentemente o valor 0 com proba-
bilidade 85%). Se fizermos X =
10
i=1
Yi ent˜ao X representar´a o n´umero de fla-
menguistas no grupo de 10 pessoas. Teremos ent˜ao X ∼ b(n = 10; p = 0, 15)
28
29. Notas de aula - Matem´atica Integrada
e a probabilidade desejada ´e
P(X = 0) =
10
0
× 0, 150
× 0, 8510−0
= 0, 8510
= 19, 7%.
Exemplo 2.34. X ∼ b(15; 0, 4). Calcule:
a) P(X ≥ 14).
b) P(X > 0).
c) P(X ≥ 14|X > 0).
Solu¸c˜ao.
a) P(X ≥ 14) = P(X = 14)+P(X = 15) =
15
14
0, 414
0, 61
+
15
15
0, 415
0, 60
=
15 × 0, 414
× 0, 6 + 0, 415
= 2, 523 × 10−5
.
b) P(X > 0) = 1 − P(X = 0) = 1 − 0, 615
= 0, 9995.
c) P(X ≥ 14|X > 0) =
P(X ≥ 14 ∪ X > 0)
P(X > 0)
=
P(X ≥ 14)
P(X > 0)
=
2, 523 × 10−5
1 − 0, 615
=
2, 525 × 10−5
.
Exemplo 2.35. Uma certa doen¸ca pode ser curada por um procedimento
cir´urgico em 80% dos casos. Dentre os que tˆem essa doen¸ca, sorteamos 8
pacientes que ser˜ao submetidos `a cirurgia. Qual a probabilidade de que ao
menos 2 n˜ao sejam curados?
Solu¸c˜ao.
J´a que a quest˜ao fala em probabilidade de n˜ao cura, podemos definir a
vari´avel X como “n´umero de doentes n˜ao curados dentre os 8 que se submete-
ram `a cirurgia”, concluir que X ∼ b(8; 0, 20) e fazer P(X ≥ 2) = 1 − P(X <
2) = 1 − [P(X = 0) + P(X = 1)] = 1 − [0, 88
+ 8 · 0, 2 · 0, 87
] = 0, 497, que ´e
a probabilidade desejada.
Sendo X ∼ b(n, p) ent˜ao, como visto, X = X1 + X2 + ... + Xn, com
Xi ∼ bernoulli(p), i = 1, 2, ..., n independentes, ent˜ao a m´edia e a variˆancia
de uma vari´avel binomial ser˜ao:
• E(X) = E(X1 + X2 + ... + Xn) = E(X1) + E(X2) + ... + E(Xn) =
p + p + ... + p = np.
• V ar(X) = V ar(X1 + X2 + ... + Xn) = V ar(X1) + V ar(X2) + ... +
V ar(Xn) = p(1 − p) + p(1 − p) + ... + p(1 − p) = np(1 − p).
29
30. Notas de aula - Matem´atica Integrada
Modelo Geom´etrico
Uma vari´avel aleat´oria discreta X tem distribui¸c˜ao Geom´etrica de parˆametro
p, 0 < p < 1, se sua fun¸c˜ao de probabilidade ´e da forma
P(X = k) = p(1 − p)k
, k = 0, 1, 2, ...
Nota¸c˜ao: X ∼ G(p).
Sendo p a probabilidade de sucesso, a distribui¸c˜ao Geom´etrica pode ser
pensada como o n´umero de fracassos que precedem o primeiro sucesso em
ensaios de Bernoulli independentes.
A express˜ao P(X = k) ´e uma fun¸c˜ao de probabilidade, pois ´e positiva e
sua soma ´e
∞
k=0
P(X = k) =
∞
k=0
p(1 − p)k
=
p
1 − (1 − p)
= 1.
O nome da distribui¸c˜ao se deve `a forma como seu gr´afico se apresenta.
Fazendo os valores que a vari´avel assume no eixo das abcissas e as respectivas
probabilidades na ordenada, a fun¸c˜ao tem o aspecto da figura que segue.
Figura 5: exemplo de distribui¸c˜ao Geom´etrica
Exemplo 2.36. Uma linha de produ¸c˜ao est´a sendo analisada para controle
de qualidade das pe¸cas produzidas.A produ¸c˜ao ´e interrompida para regula-
gem toda vez que uma pe¸ca defeituosa ´e observada. Se 0,01 ´e a probabilidade
de uma pe¸ca ser fabricada com defeito, estude o comportamento da vari´avel
Q = quantidade de pe¸cas boas produzidas antes da primeira defeituosa.
Para a aplica¸c˜ao do modelo Geom´etrico, admitamos que cada pe¸ca fa-
bricada tem a mesma probabilidade de ser defeituosa independentemente da
qualidade das demais. Sendo sucesso a ocorrˆencia de uma pe¸ca defeituosa,
temos
P(Q = k) = 0, 01 × 0, 99k
, k = 0, 1, 2, ...
30
31. Notas de aula - Matem´atica Integrada
q 0 1 2 50 150 300 450
P(Q = q) 0,0100 0,0099 0,0098 0,0060 0,0022 0,0005 0,0001
Figura 6: distribui¸c˜ao Geom´etrica para a fabrica¸c˜ao de pe¸cas
Utilizando um software para o aux´ılio nos c´alculos, temos que P(Q ≤
300) = 0, 951, isto ´e, em apenas 4,9% das vezes a produ¸c˜ao atingir´a 300
pe¸cas sem precisar ser interrompida para manuten¸c˜ao.
Se X ∼ G(p) ´e poss´ıvel mostrar que µ = E(X) =
∞
k=0
kP(X = k) =
∞
k=0
k ×p(1−p)k
=
1 − p
p
, que ´e o valor esperado de uma vari´avel com fun¸c˜ao
de probabilidade Geom´etrica de parˆametro p.
´E poss´ıvel mostrar tamb´em que V ar(X) =
∞
k=0
(x − µ)2
p(1 − p)x
=
1 − p
p2
.
Exemplo 2.37. Voltando ao Exemplo 2.36, temos E(Q) =
1 − p
p
=
0, 99
0, 01
=
99, ou seja, podemos afirma que em m´edia 99 pe¸cas boas ser˜ao produzidas
antes de se observar a 1a
pe¸ca defeituosa no processo de produ¸c˜ao.
Modelo Poisson
Uma vari´avel aleat´oria X tem distribui¸c˜ao de Poisson com parˆametro
λ > 0 se sua fun¸c˜ao de probabilidade ´e dada por
P(X = k) =
e−λ
· λk
k!
.
31
32. Notas de aula - Matem´atica Integrada
O modelo Poisson tem sido muito usado em experimentos f´ısicos e biol´ogicos
e, λ ´e a frequˆencia m´edia ou esperada de ocorrˆencias num determinado in-
tervalo de tempo (taxa de ocorrˆencia).
Nota¸c˜ao: X ∼ P(λ).
Figura 7: exemplos de distribui¸c˜ao Poisson
N˜ao ´e dif´ıcil observar que para qualquer k, P(X = k) > 0; tamb´em ´e
poss´ıvel mostrar que
∞
k=0
P(X = k) = 1 (ou seja, a Poisson ´e de fato uma
fun¸c˜ao de probabilidade). Tamb´em mostra-se que, para a Poisson, E(X) =
V ar(X) = λ, ou seja, a m´edia tem o mesmo valor que a variˆancia, que ´e
igual ao parˆametro.
Exemplo 2.38. Estudos mostram que um radar localizado numa determi-
nada via flagra 6,5 carros por hora acima da velocidade permitida em dias
´uteis. Se o modelo Poisson com λ = 6, 5 ´e adequado para a quantidade de
carros infratores em 1 hora, calcule a probabilidade de, num per´ıodo de 1
hora de um dia ´util, o radar flagrar no m´aximo 3 carros acima da velocidade
permitida.
Solu¸c˜ao. X = n´umero de carros infratores por hora. X ∼ P(6, 5) ⇔
P(X = x) = 6, 5x
e−6,5
/x!. A probabilidade desejada ´e P(X ≤ 3) = P(X =
0)+P(X = 1)+P(X = 2)+P(X = 3) =
6, 50
e−6,5
0!
+
6, 51
e−6,5
1!
+
6, 52
e−6,5
2!
+
6, 53
e−6,5
3!
= e−6,5
(1 + 6, 5 +
6, 52
2
+
6, 53
6
) = 0, 112.
Exemplo 2.39. Engenheiros de uma companhia telefˆonica estudam se o mo-
delo de Poisson pode ser ajustado ao n´umero N de chamadas interestaduais
32
33. Notas de aula - Matem´atica Integrada
que chegam por hora a uma central telefˆonica durante o per´ıodo noturno. Os
dados coletados, referentes a 650 per´ıodos de uma hora, est˜ao apresentados
a seguir.
Chamadas 0 1 2 3 4 5 6 7 ≥ 8
Freq obs 9 38 71 115 125 106 79 50 57
Da tabela temos que, por exemplo, em 125 per´ıodos de uma hora ocorreram
4 chamadas.
Os engenheiros sugerem utilizar uma taxa m´edia de ocorrˆencia de 4,5
chamadas por hora no per´ıodo estudado. Seguindo o modelo indicado, a
frequˆencia esperada de ocorrˆencias com k chamadas ´e obtida multiplicando
650 (o total das observa¸c˜oes) pela probabilidade de k chamadas. Assim, para
k = 2 temos frequˆencia esperada para duas chamadas = 650 × P(N = 2) =
650 ×
e−4,5
4, 52
2!
= 73, 1. De modo an´alogo obtemos os demais valores.
Chamadas 0 1 2 3 4 5 6 7 ≥ 8
Freq obs 9 38 71 115 125 106 79 50 57
Freq esp 7,2 32,5 73,1 109,7 123,4 111,0 83,3 53,6 56,4
A tabela acima parece indicar que o modelo P(4, 5) fornece um bom ajuste
para a vari´avel aleat´oria de interesse, pela proximidade das frequˆencias ob-
servadas e esperadas. Conclus˜oes mais objetivas, no entanto, podem ser
feitas por meio de testes estat´ısticos, assunto que pertence `a Inferˆencia Es-
tat´ıstica.
Exerc´ıcios
21 – Uma moeda equilibrada ´e lan¸cada sucessivamente, de modo inde-
pendente, at´e que ocorra a primeira cara. Seja X a vari´avel aleat´oria que
conta o n´umero de lan¸camentos anteriores `a ocorrˆencia de cara. Determine:
a) P(X ≤ 2);
b) P(X > 1);
c) M´edia e desvio-padr˜ao de X.
22 – A vari´avel Y tem distribui¸c˜ao de probabilidade Poisson com parˆametro
λ = 2, 35. Obtenha:
a) P(Y < 2);
b) P(X > 0);
33
34. Notas de aula - Matem´atica Integrada
c) P(Y = 1|Y < 3).
23 – A aplica¸c˜ao de fundo anti-corrosivo em chapas de a¸co de 1m2
´e feita
mecanicamente e pode produzir defeitos (pequenas bolhas na pintura) de
acordo com uma vari´avel Poisson de parˆametro λ = 1 defeito por metro qua-
drado. Uma chapa ´e sorteada ao acaso para inspe¸c˜ao. Qual a probabilidade
de:
a) encontrarmos pelo menos um defeito?
b) encontrarmos de 2 a 4 defeitos?
24 – Um time de futebol tem probabilidade 0,60 de vit´oria sempre que
joga. Se o time atuar 4 vezes, determine a probabilidade de que ven¸ca:
a) Todas as quatro partidas.
b) Exatamente duas partidas.
c) Pelo menos uma partida.
d) No m´aximo trˆes partidas.
25 – 25% dos universit´arios praticam esportes. Escolhendo-se ao acaso
15 desses estudantes, determine a probabilidade de, havendo mais de 5 es-
portistas no grupo, obtermos menos que 8 que praticam esporte.
2.7 Alguns modelos cont´ınuos
Modelo Uniforme
Uma vari´avel aleat´oria X tem distribui¸c˜ao Uniforme Cont´ınua no inter-
valo [a, b], a < b, se sua fun¸c˜ao densidade de probabilidade ´e dada por
f(x) =
1/(b − a) se a ≤ x ≤ b;
0 caso contr´ario.
Nota¸c˜ao: X ∼ U(a, b).
Na figura abaixo temos o gr´afico de uma Uniforme (-5,12), cuja densidade
´e igual 1/(12 − (−5)) = 1/17 se −5 ≤ x ≤ 12 e 0 nos demais casos.
34
35. Notas de aula - Matem´atica Integrada
Figura 8: exemplo de distribui¸c˜ao Uniforme
O modelo Uniforme pressup˜oe que os valores poss´ıveis para a vari´avel
aleat´oria tˆem todos a mesma probabilidade de ocorrˆencia. A m´edia e a
variˆancia para o modelo Uniforme Cont´ınuo s˜ao:
µ = E(X) =
b
a
x
1
(b − a)
dx =
a + b
2
.
σ2
= V ar(X) = E(X2
) − µ2
=
b
a
x2 1
(b − a)
dx −
(a + b)2
4
=
(b − a)2
12
.
Exemplo 2.40. Admite-se que uma pane pode ocorrer em qualquer ponto
de uma rede el´etrica de 10km. Definimos X = local, em km, da ocorrˆencia
de uma pane na rede el´etrica em rela¸c˜ao a uma origem pr´e-fixada. Temos
X ∼ U(0, 10).
A probabilidade da pane ocorrer nos primeiros 500 metros ´e P(X ≤
0, 5) =
0,5
0
1
10 − 0
dx =
1
10
x
0,5
0
= 0, 05.
A probabilidade da pane ocorrer nos trˆes quilˆometros centrais da rede ´e
P(3, 5 ≤ X ≤ 6, 5) =
6,5
3,5
1
10
dx = 3/10.
A m´edia de X, ou seja, em que ponto da central ocorrer´a a pane, em
m´edia, ´e µ =
0 + 10
2
= 5km, com desvio-par˜ao σ =
(10 − 0)2
12
= 2, 9km.
35
36. Notas de aula - Matem´atica Integrada
Modelo Exponencial
Uma vari´avel aleat´oria X assumindo valores n˜ao negativos segue o modelo
Exponencial com parˆametro α > 0 se sua densidade ´e
f(x) =
αe−αx
, x ≥ 0;
0 , caso contr´ario.
Nota¸c˜ao: X ∼ Exp(α).
Exerc´ıcio: mostrar que
∞
0
αe−αx
dx = 1 e que, se X ∼ Exp(α), ent˜ao
E(X) = 1/α e V ar(X) = 1/α2
, ou seja, a m´edia ´e igual ao desvio-padr˜ao.
A distribui¸c˜ao Exponencial tem sido muito usada em f´ısica, engenharia,
computa¸c˜ao, biologia etc. Vari´aveis como a vida ´util de equipamentos, tempo
de falha, tempo de sobrevivˆencia de esp´ecies, entre outras, s˜ao algumas quan-
tidades que tˆem sido modeladas com bons resultados pela Exponencial.
Figura 9: exemplos de distribui¸c˜ao Exponencial
Para calcular probabilidades, fazemos P(a < X < b) =
∞
0
αe−αx
dx =
−e−αx
b
a
= e−αa
− e−αb
. A inclus˜ao ou n˜ao dos extremos n˜ao afeta o c´alculo
efetuado.
Exemplo 2.41. O intervalo de tempo, em minutos, entre emiss˜oes conse-
cutivas de uma fonte radioativa ´e uma vari´avel aleat´oria com distribui¸c˜ao
Exponencial de parˆametro α = 0, 2.
Vamos calcular a probabilidade de haver uma emiss˜ao em um intervalo
inferior a 2 minutos. Temos P(X ≤ 2) =
2
0
0, 2e−0,2x
dx = e−0,2·0
− e−0,2·2
=
1 − e−0,4
= 0, 33.
36
37. Notas de aula - Matem´atica Integrada
Calculemos agora a probabilidade de o intervalo ser superior ou igual a
7 minutos sabendo que ele ´e superior a 5 minutos. P(X ≥ 7|X > 5) =
P(X ≥ 7, X > 5)
P(X > 5)
=
P(X ≥ 7)
P(X > 5)
=
e−1,4
e−1
= 0, 67.
O tempo m´edio entre uma emiss˜ao e outra ´e de 1/0, 2 = 5 minutos, ao
passo que o desvio padr˜ao ´e igual a 1/0, 22 = 5 minutos.
Modelo Normal
De todos os modelos te´oricos, cont´ınuos ou discretos, o mais importante
´e o modelo Normal. Suas origens remontam a Gauss em seus trabalhos sobre
erros de observa¸c˜oes astronˆomicas, por volta de 1810. Por isso a distribui¸c˜ao
Normal de probabilidade tamb´em ´e conhecida pelo nome de Gaussiana.
Dizemos que uma vari´avel aleat´oria cont´ınua X tem distribui¸c˜ao Normal
com parˆametros µ e σ2
se sua fun¸c˜ao densidade ´e dada por
f(x) =
1
√
2πσ2
× e−1
2
(x−µ
σ
)2
, x ∈ R.
Nota¸c˜ao: X ∼ N(µ, σ2
)
Os parˆametros µ e σ2
representam respectivamente a m´edia e a variˆancia
da distribui¸c˜ao. Ou seja, X ∼ N(µ, σ2
) ⇔ E(X) = µ e V ar(X) = σ2
.
Algumas caracter´ıstica das fun¸c˜ao densidade Normal:
• f(x) ´e sim´etrica em rela¸c˜ao a µ;
• f(x) → 0 quando x → ±∞;
• o valor m´aximo de f(x) se d´a para x = µ;
• f(x) tem dois pontos de inflex˜ao: em x − σ e em x + σ.
Figura 10: gr´afico de uma distribui¸c˜ao Normal com m´edia µ e variˆancia σ2
37
38. Notas de aula - Matem´atica Integrada
No c´alculo de probabilidades, devemos resolver a integral da fun¸c˜ao den-
sidade no intervalo de interesse , isto ´e, P(a ≤ X ≤ b) =
b
a
e−1
2
( x−µ
σ
)2
√
2πσ2
dx
Entretanto, a integral acima s´o pode ser resolvida de modo aproximado
e por m´etodos num´ericos. Por essa raz˜ao, as probabilidades para o modelo
Normal s˜ao calculadas com o aux´ılio de tabelas ou softwares.
Por exemplo, se X ∼ N(µ, σ2
), o LibreOffice Calc (similar livre ao
MS Excel), calcula P(X < x) pela digita¸c˜ao em sua barra de f´ormula
“=DIST.NORM(x;µ;σ)”, em que x, µ e σ devem ser substitu´ıdos pelos res-
pectivos valores num´ericos. A digita¸c˜ao da f´ormula “=DIST.NORM(5;8;3)”
retorna o valor 0,1586552539, que ´e o valor de P(X < 5) se X ´e normal com
m´edia 8 e desvio-padr˜ao 3 (perceba que o LibreOffice trabalha com o valor
do desvio-padr˜ao em vez da variˆancia; saber como cada software trabalha
com seus parˆametros ´e um cuidado fundamental).
Sobre o c´alculo de probabilidade Normal com o uso de tabelas, esse re-
curso est´a cada vez mais raro em trabalhos pr´aticos, pois j´a existem, al´em
dos computadores, calculadoras e dispositivos port´ateis que realizam essa
opera¸c˜ao. No entanto, em provas convencionais e de concursos em geral, a
familiaridade com as tabelas ainda ´e uma exigˆencia. Para evitar a confec¸c˜ao
desnecess´aria de tabelas para cada para de valores (µ, σ2
), utiliza-se uma
transforma¸c˜ao que sempre conduz ao c´alculo de probabilidades com uma
vari´avel Normal de m´edia 0 e variˆancia 1:
X ∼ N(µ, σ2
) ⇔ Z =
X − µ
σ
∼ N(0, 1).
Uma vari´avel Z com distribui¸c˜ao Normal de m´edia 0 e variˆancia 1 ´e denomi-
nada distribui¸c˜ao Normal Padr˜ao ou Normal Reduzida.
Assim, P(a ≤ X ≤ b) = P(
a − µ
σ
≤
X − µ
σ
≤
b − µ
σ
) = P(
a − µ
σ
≤ Z ≤
b − µ
σ
), sendo X ∼ N(µ, σ2
) e Z ∼ N(0, 1).
Os valores para P(0 ≤ Z ≤ z = ZC), z > 0, est˜ao apresentados na Figura
11, extra´ıda do livro de Bussab & Morettin [1]. Com a simetria da densidade
Normal podemos calcular valores de probabilidades em quaisquer intervalos.
Note que a simetria tamb´em implica que a probabilidade de Z estar acima
(ou abaixo) de 0 ´e igual a 0,5. Como probabilidade ´e sempre um n´umero
entre 0 e 1, o corpo da tabela cont´em apenas a parte decimal.
Exemplo 2.42. Se X ∼ N(2, 9) ent˜ao:
• P(2 < X < 5) = P(
2 − 2
√
9
< X <
5 − 2
√
9
) = P(0 < Z < 1)
tabela
=
0, 34134.
38
39. Notas de aula - Matem´atica Integrada
Figura 11: probabilidades para a distribui¸c˜ao Normal Padr˜ao
39
40. Notas de aula - Matem´atica Integrada
• P(X < 1, 1) = P(
X − 2
√
9
<
1, 1 − 2
√
9
) = P(Z < −0, 3)
simetria
= P(Z >
0, 3) = 0, 5 − P(0 < Z < 0, 3)
tabela
= 0, 5 − 0, 11791 = 0, 38209.
• P(1 ≤ X < 7) = P(
1 − 2
3
≤ Z <
7 − 2
3
) = P(−0, 17 ≤ Z < 1, 67) =
P(0 < Z ≤ 0, 17) + P(0 < Z < 1, 67)
tabela
= 0, 06749 + 0, 37900 =
0, 44649.
• o valor de x tal que P(X > x) = 0, 35 ´e obtido fazendo P(Z >
x − 2
3
) =
0, 35
tabela
⇔
x − 2
3
= 0, 39 ⇔ x = 3, 17. (O valor 0,39 foi obtido ao se
procurar na tabela do Normal Padr˜ao o valor mais pr´oximo que retorne
uma ´area de 0,15, haja vista P(0 < Z < 0, 39) = 0, 15 ⇔ P(Z >
0, 39) = 0, 35.)
Aproxima¸c˜ao Normal para o modelo Binomial A distribui¸c˜ao Normal
modela bem muitos fenˆomenos pr´aticos com valores muito frequentes em
torno da m´edia e cuja frequˆencia de reduz simetricamente `a medida que se
afasta dessa m´edia.
Uma outra raz˜ao da importˆancia da Normal se refere `a sua utiliza¸c˜ao
como aproxima¸c˜ao de outras distribui¸c˜oes. Veremos como utiliz´a-la para
aproximar o modelo Binomial.
Seja X uma vari´avel aleat´oria discreta com parˆametros n e p (X ∼ b(n, p),
sendo n o n´umero de ensaios de Bernoulli independentes e p a probabilidade
de sucesso em cada um desses ensaios). Temos E(X) = np e V ar(X) =
np(1 − p).
O Teorema Central do Limite, a ser visto mais adiante, fornece a justifi-
cativa te´orica para fazer c´alculo de probabilidades de uma vari´avel Binomial
usando a distribui¸c˜ao Normal. Como regra pr´atica, podemos considerar que
se np(1 − p) ≥ 5, ent˜ao o c´alculo da Binomial poder´a ser feito usando a
distribui¸c˜ao Normal de m´edia np e variˆancia np(1 − p).
Exemplo 2.43. Estudo do sindicato dos banc´arios indica que cerca de 30%
dos funcion´arios tˆem problemas de estresse. Numa amostra de 200 banc´arios,
qual a probabilidade de pelo menos 50 com essa doen¸ca?
Solu¸c˜ao. Admitindo que cada funcion´ario sorteado para compor a mostra
tenha a mesma probabilidade de estar estressado e assumindo independˆencia
entre as observa¸c˜oes, o modelo Binomial ´e o adequado para a vari´avel que
conta o n´umero total de banc´arios, dentre os 200, com o problema. Sendo
X essa vari´avel, temos X ∼ b(200; 0, 0) e a probabilidade desejada ser´a
40
41. Notas de aula - Matem´atica Integrada
P(X ≥ 50) =
200
k=50
200
k
0, 3k
× 0, 7200−k
. A obten¸c˜ao desse resultado ser´a
bastante trabalhoso mesmo com o aux´ılio de uma calculadora. Utilizando
um computador, a conta acima retorna P(X ≥ 50) = 0, 949.
Como temos np(1 − p) = 200 × 0, 3 × 0, 7 = 42 >> 5, , podemos calcular
P(X > 50) usando a distribui¸c˜ao Normal de m´edia np = 200 × 0, 3 = 60
e variˆancia np(1 − p) = 42, ou seja, Y ∼ N(60, 42). Assim, P(X ≥ 50) ≈
P(Y ≥ 50) = P(
Y − 60
√
42
≥
50 − 60
√
42
) = P(Z ≥ −1, 54), Z ∼ N(0, 1). Usando
a simetria da Normal e a tabela 11, temos P(Z > −1, 54) = 0, 5 + P(0 <
Z < 1, 54) = 0, 5 + 0, 43822 = 0, 93822, que, lembremos, ´e uma aproxima¸c˜ao
para P(X ≥ 50) = 0, 949, ou seja, a solu¸c˜ao dada pela aproxima¸c˜ao Normal
parece bastante razo´avel.
Exerc´ıcios
26 – O valor esperado de uma vari´avel aleat´oria com distribui¸c˜ao Uni-
forma Cont´ınua ´e 1 e a variˆancia ´e igual a 1/12. Encontre a probabilidade
da vari´avel assumir valores menores que 3/4.
27 – O tempo de vida de um v´ırus exposto ao meio ambiente segue uma
distribui¸c˜ao Exponencial com parˆametro λ =
1
20
segundo.
a) Qual o tempo m´edio de vida do v´ırus?
b) Qual o desvio-padr˜ao do tempo de vida?
c) Qual a probabilidade do v´ırus viver menos de 12 segundos?
d) Sabendo que o v´ırus viveu mais que 10 segundos, qual a probabilidade de
que viva mais que 15 segundos?
28 – Sejam X ∼ N(4, 1), Y ∼ N(90, 100), W ∼ N(−5, 10). Obtenha:
a) P(X ≤ 4).
b) P(5 ≤ X ≤ 7).
c) P(Y > 80).
d) P(|Y − 90| ≤ 10).
e) P(W ≤ 0).
f) P(W > −6).
g) P(X + W > 0), sabendo que
X + W ´e Normal.
h) P(W − X < −4), sabendo que
W − X ´e Normal.
41
42. Notas de aula - Matem´atica Integrada
29 – A durabilidade de um pneu ´e descrita por uma vari´avel Normal
de m´edia 60.000 km e desvio-padr˜ao 8.300 km. Se a garantia valer pelos
primeiros 48.000 km, qual a propor¸c˜ao de pneus que ser˜ao trocados pela
garantia? Qual deveria ser a garantia, em km, de forma a assegurar que o
fabricante trocaria sob garantia no m´aximo 2% de pneus?
30 – Y tem distribui¸c˜ao Binomial com n = 100 e p = 0, 4. Use a apro-
xima¸c˜ao Normal para calcular:
a) P(30 < Y ≤ 80).
b) P(Y < 80).
c) P(Y > 30|Y < 80).
31 – Um time de futebol vai disputar o campeonato brasileiro da 1a
di-
vis˜ao, fazendo 38 jogos. Considere a vari´avel aleat´oria Xi = n´umero de pontos
na i-´esima partida definida como abaixo e considere os Xi independentes.
Xi =
3 com probabilidade 0,3
1 com probabilidade 0,2
0 com probabilidade 0,5
, i = 1, 2, ..., 38.
a) Calcule E(Xi) e V ar(Xi).
b) Defina X =
38
i=1
Xi e calcule E(X) e V ar(X). Qual a interpreta¸c˜ao pr´atica
da vari´avel X?
c) A vari´avel X ´e discreta (trata-se de uma Trinomial), mas suponha que X
pode ser aproximada por uma distribui¸c˜ao Normal com mesma m´edia e
variˆancia. Se ao final do campeonato o time que somar menos de 45 pontos
´e rebaixado, qual a probabilidade do time em quest˜ao ser rebaixado?
d) Com as mesmas suposi¸c˜oes do item anterior, qual a probabilidade do time
em quest˜ao somar mais que 65 pontos ao final do campeonato e conquistar,
com isso, uma vaga na Libertadores?
3 Inferˆencia Estat´ıstica – Estima¸c˜ao
Em linhas gerais, a Inferˆencia Estat´ıstica objetiva estudar uma ou mais
caracter´ısticas (num´ericas) da popula¸c˜ao por meio de evidˆencias fornecidas
pela amostra. Por´em, o uso inadequado de um procedimento amostral pode
levar a um vi´es de interpreta¸c˜ao dos resultados. O uso de amostras que
42
43. Notas de aula - Matem´atica Integrada
produzam resultados confi´aveis se constitui num campo pr´oprio de estudo
dentro da Estat´ıstica – a Teoria da Amostragem. Neste texto, ´e suficiente
entender que para que as informa¸c˜oes da amostra possam ser estendidas
`a popula¸c˜ao ´e essencial que a aleatoriedade esteja presente no processo de
sele¸c˜ao da amostra. A aleatoriza¸c˜ao justifica o uso da Probabilidade na
Inferˆencia.
3.1 Parˆametros, estimadores e estimativas
Defini¸c˜ao 3.1. As quantidades da popula¸c˜ao, em geral desconhecidas e so-
bre as quais temos interesse s˜ao denominadas parˆametros e s˜ao usualmente
representadas por letras gregas tais como θ, µ, σ etc.
Defini¸c˜ao 3.2. `A combina¸c˜ao das caracter´ısticas num´ericas da amostra,
constru´ıda com a finalidade de representar, ou estimar, um parˆametro po-
pulacional de interesse denominamos estimador. Em geral, estimadores s˜ao
denominados por s´ımbolos com um acento circunflexo em cima: ˆθ, ˆµ, ˆσ etc.
Defini¸c˜ao 3.3. Estimativa ´e o valor num´erico assumido por um estimador.
A nota¸c˜ao usual para a m´edia de uma popula¸c˜ao ´e µ acrescido de um subs-
crito se houver possibilidade de confus˜ao sobre a que popula¸c˜ao ou vari´avel
nos referimos. Tamb´em ´e usual considerar σ para indicar o desvio-padr˜ao
da popula¸c˜ao. Outros parˆametros j´a n˜ao tˆem uma uniformidade de nota¸c˜ao
entre os diversos autores.
Um estimador, digamos ˆθ, ´e ma fun¸c˜ao das vari´aveis aleat´orias constituin-
tes da amostra, isto ´e, ˆθ = f(X1, X2, ..., Xn); logo, um estimador tamb´em ´e
uma vari´avel aleat´oria.
A correspondente distribui¸c˜ao de probabilidade forma a base das argu-
menta¸c˜oes probabil´ısticas utilizadas na extrapola¸c˜ao da informa¸c˜ao da amos-
tra para os parˆametros da popula¸c˜ao.
Exemplo 3.4. Estamos interessados na m´edia das alturas de jovens com
idade entre 15 e 18 anos nascidos na regi˜ao Sudeste do Brasil. Vamos coletar
uma amostra e us´a-la para tirar conclus˜oes.
Suponha que a amostra seja composta pelas alturas de 10 jovens escolhi-
dos ao acaso dentre a popula¸c˜ao mencionada. O parˆametro de interesse ´e a
altura m´edia desses jovens, representada por µ. A amostra X1, X2, ..., X10
ser´a obtida e com base nela vamos dizer algo a respeito de µ. Que fun¸c˜oes
de valores amostrais devemos usar para essa tarefa, isto ´e, que estimador
devemos usar? A seguir s˜ao apresentadas algumas op¸c˜oes.
43
44. Notas de aula - Matem´atica Integrada
• f1(X1, ..., X10) = ˆµ1 =
min(X1, ..., X10) + max(X1, ..., X10)
2
(m´edia
aritm´etica entre o menor e o maior valor amostral);
• f2(X1, ..., X10) = ˆµ2 = X1 (o primeiro valor sorteado na amostra);
• f3(X1, ..., X10) = ˆµ3 =
X1 + ... + X10
10
(a m´edia aritm´etica entre todos
os 10 valores da amostra).
Apresentamos a seguir os valores observados na amostra e as respectivas
estimativas obtidas com os estimadores definidos acima.
Amostra (em metros): 1,65 1,57 1,72 1,66 1,71 1,74 1,81 1,68
1,60 1,77.
Estimativas:
• ˆµ1 =
1, 57 + 1, 81
2
= 1, 69m;
• ˆµ2 = 1, 65m;
• ˆµ3 =
1, 65 + 1, 57 + ... + 1, 77
10
= 1, 69m;
Esses n´umeros, calculados para uma amostra particular, n˜ao s˜ao muito
distintos uns dos outros. Mas parece razo´avel que n˜ao devemos escolher um
estimador olhando apenas se a estimativa correspondente parece adequada.
Como decidir qual estimador usar, ou qual deles ´e o “melhor”? ´E sempre bom
lembrar que n˜ao sabemos o verdadeiro valor da altura m´edia da popula¸c˜ao.
Exemplo 3.5. Para detectar o apoio a um projeto governamental de reforma
agr´aria, foram entrevistas 400 pessoas em v´arias capitais. A amostra cont´em
as 400 respostas que consistem de sim (para aqueles que concordam com o
projeto) e n˜ao (para os que discordam).
Formalizando o problema, caracterizamos a popula¸c˜ao de interesse como
as opini˜oes de todos os habitantes adultos do pa´ıs. A informa¸c˜ao desejada ´e a
propor¸c˜ao de pessoas que concordam com o projeto, ou seja, o parˆametro de
interesse ´e p = propor¸c˜ao de brasileiros adultos que concordam com o projeto.
A amostra pode ser pensada como o vetor de vari´aveis aleat´orias X1, X2,
..., X400, cada uma delas seguindo o modelo de Bernoulli com probabilidade
p de sucesso:
Xi =
1 se a i´esima resposta ´e sim;
0 se a i´esima resposta ´e n˜ao.
, i = 1, 2, ..., 400.
44
45. Notas de aula - Matem´atica Integrada
´E intuitivo considerar o estimador “propor¸c˜ao amostral dos que concordam”
para o verdadeiro valor de p na popula¸c˜ao:
ˆp =
n´umero de entrevistados que concordam com o projeto
n´umero total de entrevistados
, ou seja,
ˆp =
X1 + X2 + ... + X400
400
= ¯X, em que ¯X denota a m´edia aritm´etica amos-
tral.
Exemplo 3.6. Uma amostra de pacientes que sofrem certo tipo de cˆancer foi
coletada para que se tenha uma ideia da variabilidade da ´area atingida pela
doen¸ca. Para 12 pacientes sorteados mediram-se os tamanhos dos tumores
observados. Os dados, em cm2
foram os seguintes:
3,52 6,12 4,50 4,45 5,88 4,08 5,91 4,50 4,86 5,48 5,10.
Tendo em vista que o que se deseja estudar ´e a variabilidade, vamos consi-
derar como parˆametro de interesse a variˆancia σ2
. Para o estimador considere
duas op¸c˜oes: ˆσ2
1 =
1
12
12
i=1
(Xi − ¯X)2
e ˆσ2
2 =
m´ınimo − m´aximo
2
2
.
A primeira op¸c˜ao ´e a variˆancia do conjunto de dados observados, enquanto
que o segundo estimador proposto ´e o quadrado da semi-amplitude dos va-
lores amostrais. Calculemos suas estimativas.
• ˆσ2
1 =
1
12
[(3, 52 − 4, 84)2
+ ... + (3, 10 − 4, 84)2
] = 0, 67(cm2
)2
.
• ˆσ2
2 =
6, 12 − 3, 52
2
2
= 1, 69(cm2
)2
.
Esses n´umeros d˜ao ideia da dispers˜ao de valores que podem ser encontrados
no tamanho dos tumores, e s˜ao estimativas de σ2
, a variˆancia populacional
das ´areas dos tumores.
Como visto, mais de uma fun¸c˜ao da amostra pode ser proposta para esti-
mar o parˆametro de interesse. Para facilitar a escolha entre tais estimadores,
´e importante verificar e possuem algumas das propriedades definidas a seguir.
Defini¸c˜ao 3.7 (v´ıcio). O v´ıcio do estimador ˆθ ´e definido como b(ˆθ) = E(ˆθ)−
θ. Dizemos que ˆθ ´e um estimador n˜ao viciado para θ se E(ˆθ) = θ ou,
equivalentemente, se b(ˆθ) = 0.
Defini¸c˜ao 3.8 (consistˆencia). Um estimador ˆθ ´e consistente se, `a medida
que o tamanho da amostra aumenta, seu valor esperado converge para o
parˆametro de interesse e sua variˆancia converge para 0 (zero). Ou seja, ˆθ ´e
consistente se est˜ao satisfeitos:
45
46. Notas de aula - Matem´atica Integrada
(i) lim
n→∞
E(ˆθ) = θ;
(ii) lim
n→∞
V ar(ˆθ) = 0.
Note que na defini¸c˜ao de consistˆencia o estimador pode ser viciado, bas-
tando que esse v´ıcio tenda a zero `a medida que cresce o tamanho da amostra;
na defini¸c˜ao do v´ıcio, o resultado deve valer para qualquer n.
Defini¸c˜ao 3.9. (erro quadr´atico m´edio) O erro quadr´atico m´edio (EQM) de
um estimador ˆθ do parˆametro θ ´e dado por EQM(ˆθ) = V ar(ˆθ) − b2
(ˆθ), em
que b(ˆθ) ´e o v´ıcio do estimador ˆθ conforme defini¸c˜ao 3.7.
Podemos considerar que um bom estimador ´e aquele que seja n˜ao viciado
(ou pelo menos que tenha v´ıcio pequeno), que seja consistente e que tenha
pequeno erro m´edio quadr´atico.
Exemplo 3.10. Suponha que ´e sabido que uma certa caracter´ıstica popula-
cional X tem m´edia µ e variˆancia σ2
. Uma amostra aleat´oria de tamanho n,
representada por X1, X2, ..., Xn ´e obtida para estimar o parˆametro µ.
Vamos assumir que os Xi, i = 1, 2, ..., n, s˜ao vari´aveis aleat´orias indepen-
dentes com a mesma distribui¸c˜ao de X, o que significa que E(Xi) = µ e
V ar(Xi) = σ2
, i = 1, 2, ..., n.
Considere o estimador ˆµ1 = ¯X.
E(ˆµ1) = E( ¯X) = E
X1 + ... + Xn
n
=
1
n
[E(X1)+...+E(Xn)] =
1
n
[µ + ... + µ
n vezes
] =
1
&n
×&n × µ = µ. Ou seja, o estimador ˆµ1 ´e n˜ao viciado para µ.
V ar(ˆµ1) = V ar
n
i=1 Xi
n
indep.
=
1
n2
n
i=1
V ar(Xi) =
1
n2
n
i=1
σ2
=
1
n¡2
×&n ×
σ2
=
σ2
n
. Veja que lim
n→∞
σ2
n
= 0
Com os c´alculos da esperan¸ca e da variˆancia do estimador ˆµ1 = ¯X, veri-
fique pelas defini¸c˜oes 3.7 e 3.8 que este estimador ´e n˜ao viciado e consistente
para µ.
Ainda, EQM(ˆµ1) = V ar(ˆµ1) − b2
(ˆµ1) =
σ2
n
.
Se a vari´avel X em quest˜ao tiver distribui¸c˜ao Normal, os resultados apre-
sentados acima para ¯X permanecem v´alidos. Se um outro estimador para
µ ´e proposto, qual seja, ˆµ2 = mediana(X1, ..., Xn), ´e poss´ıvel mostrar que
E(ˆµ2) = µ e V ar(ˆµ2) =
π
2
×
σ2
n
, ou seja, ˆµ2 tamb´em ´e n˜ao viciado e consiste
para µ. Por´em, EQM(ˆµ2) =
π
2
×
σ2
n
> EQM( ¯X) =
σ2
n
, de maneira que,
46
47. Notas de aula - Matem´atica Integrada
sob a ´otica das 3 propriedades vistas para os estimadores (e considerando
popula¸c˜ao Normal), a m´edia aritm´etica ´e melhor estimador que a mediana
para a m´edia da popula¸c˜ao.
Exemplo 3.11. Supondo uma amostra X1, ..., Xn obtida de uma popula¸c˜ao
de m´edia µ e variˆancia σ2
, um estimador “natural” da variˆancia foi apre-
sentado anteriormente: ˆσ2
=
n
i=1(Xi − ¯X)2
n
. Utilizando as propriedades
do operador Esperan¸ca e algum algebrismo, ´e poss´ıvel mostrar que E(ˆσ2
) =
(n − 1)σ2
n
, ou seja, o estimador ˆσ2
proposto ´e viciado para σ2
.
Sendo assim, podemos propor um outro estimador para σ2
, qual seja,
S2
=
n
n − 1
ˆσ2
; calculado seu valor m´edio, temos E(S2
) =
n
n − 1
E(ˆσ2
) =
n
n − 1
×
n − 1
n
σ2
= σ2
, obtendo, assim, um estimador n˜ao viciado para a
variˆancia populacional.
Mas veja que S2
=
n
n − 1
ˆσ2
=
n
n − 1
×
n
i=1(Xi − ¯X)2
n
=
n
i=1(Xi − ¯X)2
n − 1
.
´E por isso que ao se trabalhar com uma amostra para estimar σ2
´e frequente
usar o estimador S2
no lugar de ˆσ2
. Note por´em que se n, o tamanho da
amostra, for grande, o uso de S2
ou ˆσ2
´e indiferente. O v´ıcio de ˆσ2
tende a
zero quando o tamanho da amostra tende ao infinito, ou seja, no limite, esse
estimador da variˆancia ´e tamb´em n˜ao viciado – mas s´o no limite.
O estimador S2
, n˜ao viciado para σ2
, ´e em regra denominado variˆancia
amostral.
Exerc´ıcios
32 – Foram sorteadas 15 fam´ılias num certo bairro e observado o n´umero
de crian¸cas de cada fam´ılia matriculadas em escolas da rede oficial de ensino.
Os dados foram: 1, 2, 1, 0, 2, 0, 2, 3, 4, 1, 1, 2, 0, 0, 2. Considerando que
as 15 observa¸c˜oes s˜ao independentes e oriundas de uma mesma popula¸c˜ao,
sejam os seguintes estimadores para µ, a m´edia populacional:
• ˆµ1 =
X1 + X2
2
;
• ˆµ2 = ¯X.
a) Obtenha as estimativas correspondentes aos estimadores propostos para
µ.
b) Qual o melhor estimador para µ e por quˆe?
47
48. Notas de aula - Matem´atica Integrada
c) Determine estimativas para a variˆancia do n´umero de crian¸cas por fam´ılia
em escolas. Utilize os dois estimadores vistos para a variˆancia.
33 – Um pesquisador deseja estimar a produ¸c˜ao m´edia de um processo
qu´ımico com base na observa¸c˜ao da produ¸c˜ao de trˆes realiza¸c˜oes X1, X2, X3
de um experimento. Considere dois estimadores da m´edia: ˆθ1 = (X1 + X2 +
X3)/3 (m´edia amostral) e ˆθ2 = (X1 + 2X2 + X3)/4 (uma m´edia ponderada).
Qual deve ser o estimador preferido
a) quanto `a n˜ao tendenciosidade?
b) quanto `a variabilidade?
34 – Seja X uma vari´avel com distribui¸c˜ao de m´edia µ e variˆancia σ2
. Uma
amostra aleat´oria X1, X2, ..., Xn dessa popula¸c˜ao foi coletada. Considere o
estimador ˆµ =
X1 + Xn
n
.
a) Calcule E(ˆµ) e verifique se o estimador proposto ´e ou n˜ao viciado para a
m´edia.
b) Calcule a variˆancia desse estimador.
c) Calcule os limites da esperan¸ca e da variˆancia desse estimador quando o
tamanho da amostra tende ao infinito. ˆµ ´e consistente para a m´edia de
X?
d) Calcule EQM(ˆµ).
3.2 Distribui¸c˜oes amostrais
Vimos que estimadores s˜ao fun¸c˜oes de vari´aveis aleat´orias e, portanto,
s˜ao tamb´em vari´aveis aleat´orias. Ent˜ao podemos associar uma distribui¸c˜ao
de probabilidade a um estimador, como nos exemplos simples a seguir.
Exemplo 3.12. Um jogo consiste em lan¸car uma moeda honesta 3 vezes.
Para cada lan¸camento, se sair cara vocˆe ganha 1 ponto e se sair coroa vocˆe
perde 1 ponto. Podemos modelar a situa¸c˜ao da seguinte forma.
Xi =
+1 com prob. = 0,5;
−1 com prob. = 0,5.
, i = 1, 2, 3.
Temos o vetor aleat´orio (X1, X2, X3) contendo 3 vari´aveis aleat´orias inde-
pendentes e com a mesma distribui¸c˜ao de probabilidade. A m´edia de cada
vari´avel ´e
E(Xi) = 1 × 0, 5 + (−1) × 0, 5 = 0
48
49. Notas de aula - Matem´atica Integrada
e a variˆancia ´e
V ar(Xi) = E(X2
i ) − E2
(Xi) = [12
× 0, 5 + (−1)2
× 0, 5] − 02
= 1.
Imagine agora que vamos observar uma amostra do vetor (X1, X2, X3) ao
acaso. A tabela a seguir apresenta todas as amostras poss´ıveis com as res-
pectivas probabilidades e valores de ¯X e S2
.
(X1, X2, X3) Prob. ¯X S2
(−1, −1, −1) 1/8 -1 0
(−1, −1, +1) 1/8 -1/3 4/3
(−1, −1, −1) 1/8 -1/3 4/3
(−1, +1, −1) 1/8 1/3 4/3
(−1, +1, +1) 1/8 -1/3 4/3
(+1, −1, −1) 1/8 1/3 4/3
(+1, −1, +1) 1/8 1/3 4/3
(+1, +1, +1) 1/8 1 0
Os valores acima foram obtidos por meio de c´alculos usuais. Por exem-
plo, para a amostra (−1, +1, −1) temos ¯X =
−1 + 1 − 1
3
= −
1
3
e S2
=
[−1 − (−1/3)]2
+ [1 − (−1/3)]2
+ [−1 − (−1/3)]2
3 − 1
=
4
3
.
Temos condi¸c˜oes agora de estabelecer a distribui¸c˜ao dos estimadores ¯X e
S2
.
¯X -1 -1/3 1/3 1
p 1/8 3/8 3/8 1/8
S2
0 4/3
p 1/4 3/4
Pensemos em ¯X como estimador para E(Xi) = µ e em S2
como estimador
para V ar(Xi) = σ2
. Como visto, sabemos que µ = 0 e que σ2
= 1. Olhando
agora as distribui¸c˜oes dos estimadores ¯X e S2
temos
E( ¯X) = (−1) ×
1
8
+ (−
1
3
) ×
1
8
+
1
3
×
1
8
+ 1 ×
1
8
= 0 e
E(S2
) = 0 ×
1
4
+
4
3
×
3
4
= 1.
Dessa forma, ambos os estimadores s˜ao n˜ao viciados para os respectivos
parˆametros estimados.
No exemplo 3.12 pudemos enumerar todas as poss´ıveis amostras e assim
obter a fun¸c˜ao de probabilidade dos estimadores de interesse. Mas isso nem
sempre ´e poss´ıvel. Por exemplo, se o vetor (X1, X2, X3) tiver cada Xi com
49
50. Notas de aula - Matem´atica Integrada
distribui¸c˜ao Uniforme Cont´ınua entre -1 e 1, isto ´e, Xi ∼ U(−1, 1), como
obter todas as amostras poss´ıveis? Sem entrar em detalhes, o importante ´e
ressaltar que a obten¸c˜ao da distribui¸c˜ao de probabilidade dos estimadores ´e
um problema essencial na Estat´ıstica.
Neste texto, vamos nos concentrar em discutir a distribui¸c˜ao de ¯X, a
m´edia aritm´etica dos valores da amostra, em algumas situa¸c˜oes.
Consideremos inicialmente o caso de uma popula¸c˜ao Normal, isto ´e, a
vari´avel de interesse ´e X ∼ N(µ, σ2
). Assim, (X1, X2, ..., Xn) representa
uma amostra aleat´oria cujos elementos s˜ao independentes e identicamente
distribu´ıdos com fun¸c˜ao densidade de probabilidade Normal de m´edia µ e
variˆancia σ2
, ou seja,
Xi ∼ N(µ, σ2
), i = 1, 2, ..., n, Xi independente de Xj ∀ i = j.
Teorema 3.13. Se X1, X1, ..., Xn formam uma sequˆencia de vari´aveis aleat´orias
Normais com m´edia µi e variˆancia σ2
i , i = 1, 2, ..., n independentes e a1, a2, .., an
s˜ao constantes quaisquer, ent˜ao W =
n
i=1
aiXi ter´a distribui¸c˜ao Normal com
parˆametros µW =
n
i=1
aiµi e σ2
W =
n
i=1
a2
i σ2
i .
Voltando ao caso Xi ∼ N(µ, σ2
), i = 1, 2, ..., n independentes e identi-
camente distribu´ıdos, a distribui¸c˜ao amostral de ¯X segue diretamente do
teorema 3.13 fazendo µi = µ, σ2
i = σ2
e ai = 1/n para i = 1, 2, ..., n.
Assim, ¯X ∼ N(µ ¯X, σ2
¯X), sendo
µ ¯X =
n
i=1
(
1
n
× µ) = n ×
1
n
× µ = µ e
σ2
¯X =
n
i=1
(
1
n2
× σ2
) = n ×
1
n2
× σ2
=
σ2
n
.
Logo, para uma cole¸c˜ao de vari´aveis aleat´orias independentes com uma mesma
distribui¸c˜ao de probabilidade Normal de m´edia µ e variˆancia σ2
, a m´edia
amostral ¯X tamb´em ter´a distribui¸c˜ao Normal de m´edia µ, mas de variˆancia
σ2
/n.
Exemplo 3.14. Considere uma amostra independente de tamanho n de uma
vari´avel N(10, 16). Isto ´e, X1, ..., Xn s˜ao independentes e todas com distri-
bui¸c˜ao Normal de m´edia 10 e variˆancia 16. Segue que ¯X ∼ N(10, 16/n). Se
n = 1 estamos falando de uma ´unica observa¸c˜ao oriunda de uma popula¸c˜ao
50
51. Notas de aula - Matem´atica Integrada
Normal de de m´edia 10 e variˆancia 16. `A medida que n aumenta, a m´edia
permanece 10, mas a variˆancia de ¯X vai diminuindo, ou seja, a fun¸c˜ao den-
sidade de ¯X vai se concentrando ao redor da m´edia 10; isso indica maior
probabilidade de amostras grandes fornecerem estimativas pr´oximas `a m´edia
populacional.
3.3 Teorema central do limite
51
52. Notas de aula - Matem´atica Integrada
Referˆencias
[1] Bussab, Wilton de Oliveira & Morettin, Pedro Alberto. Estat´ıstica
b´asica. 8a
edi¸c˜ao, S˜ao Paulo: Saraiva, 2013.
[2] Magalh˜aes, Marcos Nascimento & Lima, Antˆonio Carlos Pedroso de.
No¸c˜oes de Probabilidade e Estat´ıstica. 3a
edi¸c˜ao, S˜ao Paulo: IME-
USP, 2001.
[3] Martins, Gilberto de Andrade. Estat´ıstica Geral e Aplicada. 2a
edi¸c˜ao, S˜ao Paulo: Atlas, 2002.
52