SlideShare una empresa de Scribd logo
1 de 129
Descargar para leer sin conexión
Estatística – Notas de Aulas

ESTATÍSTICA
Notas de Aulas

Professor Inácio Andruski Guimarães, DSc.

Professor Inácio Andruski Guimarães, DSc.
2

Estatística – Notas de Aulas

SUMÁRIO
1

CONCEITOS BÁSICOS
1.1 Estatística
1.2 Estatística Descritiva
1.3 Estatística Inferencial
1.4 População
1.5 Amostra
1.6 Variável
1.7 Séries Estatísticas

5

2

APRESENTAÇÃO DE DADOS
2.1 Apresentação Tabular
2.2 Apresentação Gráfica

7

3

DISTRIBUIÇÃO DE FREQÜÊNCIAS
3.1 Dados Brutos
3.2 Rol
3.3 Amplitude Total
3.4 Número de Classes
3.5 Amplitude de Classe
3.6 Intervalo de Classe
3.7 Freqüência Simples
3.8 Freqüência Acumulada
3.9 Freqüência Relativa
3.10 Ponto Médio de Classe
3.11 Representações Gráficas

11

4

MEDIDAS DE TENDÊNCIA CENTRAL OU DE POSIÇÃO
4.1 Média Aritmética
4.2 Mediana
4.3 Moda ...........................................................................................................................
4.4 Relação entre Média, Mediana e Moda
4.5 Percentil
4.6 Decil
4.7 Quartil

17

5

MEDIDAS DE DISPERSÃO
5.1 Amplitude
5.2 Desvio Médio
5.3 Variância
5.4 Desvio Padrão
5.5 Coeficiente de Variação

26

6

ASSIMETRIA E CURTOSE
6.1 Coeficiente de Assimetria
6.2 Coeficiente de Curtose

32

7

TEORIA DA PROBABILIDADE
7.1 Teoria dos Conjuntos
7.2 Técnicas de Contagem
7.3 Introdução à Probabilidade

36

8

VARIÁVEIS ALEATÓRIAS
8.1 Tipos de Variáveis Aleatórias
8.2 Função de Probabilidade
8.3 Função Densidade de Probabilidade
8.4 Expectância
8.5 Variância

47

Professor Inácio Andruski Guimarães, DSc.
3

Estatística – Notas de Aulas

8.6 Distribuição Conjunta
8.7 Independência
8.8 Função Distribuição Acumulada
9

MODELOS DE PROBABILIDADE PARA VARIÁVEIS DISCRETAS
9.1 Distribuição Uniforme
9.2 Distribuição de Bernoulli
9.3 Distribuição Binomial
9.4 Distribuição Geométrica
9.5 Distribuição de Pascal
9.6 Distribuição de Poisson
9.7 Distribuição Hipergeométrica
9.8 Distribuição Multinomial

56

10

MODELOS DE PROBABILIDADE PARA VARIÁVEIS CONTÍNUAS
10.1 Distribuição Uniforme
10.2 Distribuição Normal
10.3 Distribuição Gama
10.4 Distribuição Exponencial
10.5 Distribuição de Weibull
10.6 Distribuição Qui-Quadrado
10.7 Distribuição t, de Student
10.8 Distribuição F, de Fisher
10.9 Aproximação da Distribuição Binomial pela Normal

61

11

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA
11.1 Estimadores e Estatísticas
11.2 Estimadores Eficientes
11.3 Estatísticas Suficientes
11.4 Família Exponencial
11.5 Método da Máxima Verossimilhança
11.6 Distribuição Amostral da Média

67

12

INTERVALOS DE CONFIANÇA
12.1 Intervalo de Confiança para a Média
12.2 Intervalo de Confiança para a Diferença de Médias
12.3 Intervalo de Confiança para a Proporção
12.4 Intervalo de Confiança para a Diferença de Proporções
12.5 Intervalo de Confiança para a Variância
12.6 Determinação do Tamanho de uma Amostra

74

13

CONTROLE ESTATÍSTICO DE PROCESSO (CEP)
13.1 Conceitos
13.2 Diagrama de Pareto
13.3 Diagrama de Ishikawa
13.4 Gráfico de Controle para Média e Amplitude
13.5 Capabilidade
13.6 Gráficos de Controle para Amplitudes Móveis
13.7 Gráficos de Controle por Atributos

81

14

TEORIA DA DECISÃO ESTATÍSTICA
14.1 Teste de Hipótese
14.2 Teste de Hipótese para a Média
14.3 Teste de Hipótese para a Diferença de Médias
14.4 Teste de Hipótese para a Proporção
14.5 Teste de Hipótese para a Diferença de Proporções

98

15

ANÁLISE DA VARIÂNCIA (ANOVA)
15.1 ANOVA para um Fator
15.2 ANOVA para dois Fatores

104

Professor Inácio Andruski Guimarães, DSc.
4

Estatística – Notas de Aulas

16

TESTE QUI-QUADRADO
16.1 Teste de Bondade de Ajustamento
16.2 Teste de Independência de Variáveis

110

17

TESTES NÃO PARAMÉTRICOS
17.1 Teste U, de Wilcoxon, Mann e Whitney
17.2 Teste H, de Kruskal – Wallis

113

18

ANÁLISE DE CORRELAÇÃO E DE REGRESSÃO
18.1 Coeficiente de Correlação
18.2 Análise de Regressão Linear
18.3 Método dos Mínimos Quadrados
18.4 Modelo Exponencial
18.5 Modelo Potência
18.6 Modelo Logarítmico

118

APÊNDICE I – INTEGRAIS EULERIANAS
APÊNDICE II – MÉTODO DE NEWTON – RAPHSON

Professor Inácio Andruski Guimarães, DSc.
Estatística – Notas de Aulas

1.

5

CONCEITOS BÁSICOS

1.1 Estatística
A Estatística compreende os métodos científicos utilizados para coleta, organização, resumo,
apresentação e análise, ou descrição, de dados de observação. Também abrange métodos utilizados para
tomadas de decisões sob condições de incerteza.
1.2 Estatística Descritiva
Inclui as técnicas empregadas para coleta e descrição de dados. Também é empregada na análise
exploratória de dados.
1.3 Estatística Inferencial
É utilizada para tomar decisões a respeito de uma população, geralmente utilizando dados de
amostras. Uma vez que tais decisões são tomadas sob condições de incerteza, faz-se necessário o uso de
conceitos relativos à Teoria da Probabilidade.
1.4 População
Um dos conceitos fundamentais na Estatística, é empregado para designar um conjunto de
indivíduos que possuem pelo menos uma característica, ou atributo, em comum. Alguns autores
empregam o termo universo para referir-se a uma população.
1.5 Amostra
Refere-se a qualquer subconjunto de uma população. A amostragem é uma das etapas mais
importantes na aplicação de métodos estatísticos, envolvendo aspectos como determinação do tamanho da
amostra, metodologia de formação e representatividade da amostra com relação à população.
1.6 Variável
É usada para atribuição dos valores correspondentes aos dados observados. É importante
ressaltar que os dados em questão não são necessariamente numéricos, uma vez que podem dizer respeito
a atributos qualitativos observados na população. Por esta razão costuma-se classificar as variáveis nas
categorias definidas a seguir.
1.6.1 – Variável Numérica. Também chamada variável quantitativa, é utilizada para representação de
dados numéricos, ou quantitativos.
1.6.1.1 – Variável Numérica Discreta. Variável cujo domínio é um conjunto enumerável. Geralmente
corresponde a dados de contagem. Exemplo: Número de defeitos em um componente, total de unidades
defeituosas em uma amostra.
1.6.1.2 – Variável Numérica Contínua. Variável cujo domínio é um conjunto não enumerável. Refere-se a
dados de mensuração. Exemplo: Diâmetro de um eixo, peso de um recém-nascido.
1.6.2 – Variável Qualitativa. É utilizada para representação de atributos. Pode ser dicotômica, ou
binária, quando assume apenas dois possíveis valores, ou politômica, também referida como multinomial,
quando pode assumir mais de dois possíveis valores.
1.6.2.1 – Variável Qualitativa Categórica. É empregada para representar categorias, ou classes, às quais
pertencem as observações registradas. Exemplo: Cor dos olhos, sexo.
1.6.2.2 – Variável Qualitativa Ordinal. Utiliza-se este tipo de variável em situações nas quais presume-se
a necessidade de uma ordem, crescente ou decrescente, para os resultados. Exemplo: Grau de
escolaridade, categoria salarial.

Professor Inácio Andruski Guimarães, DSc.
6

Estatística – Notas de Aulas

1.7 – Séries Estatísticas
Uma série estatística consiste basicamente de um conjunto de valores observados para diferentes
categorias de uma variável. As séries estatísticas são classificadas em três categorias, apresentadas a
seguir.
1.7.1 – Série Temporal. A variável de interesse refere-se a um período de tempo.
Exemplo 1.7.1 – A tabela a seguir mostra o faturamento, em milhões de reais, da empresa fictícia ABC
durante o ano de 20XY.

Mês
Faturamento

Tabela 1.1 – Faturamento mensal (R$ 1000000) da empresa ABC (20XY).
Jan Fev Mar Abr Mai Jun
Jul Ago Set Out Nov
0,95 1,03 1,12 1,24 1,02 0,92 0,84 0,78 0,72 0,65 0,68

Dez
0,82

Total
10,77

Fonte: Dados fictícios.

1.7.2 – Série Geográfica. Aqui a variável estudada é o local.
Exemplo 1.7.2 – A tabela a seguir mostra o faturamento, em milhões de reais, da empresa fictícia ABC
durante o ano de 20XY, nas respectivas regiões de atuação.
Tabela 1.2 – Faturamento (R$ 1000000) da empresa ABC (20XY), por região.
Grande Interior Interior
Porto
Interior Campo
Região
Cuiabá
Curitiba
do PR
de SC
Alegre
do RS
Grande
Faturamento
2,75
2,58
1,82
1,42
0,80
0,75
0,70

Total
10,77

Fonte: Dados fictícios.

1.7.3 – Série Específica.
Exemplo 1.7.3 - A tabela a seguir mostra o faturamento, em milhões de reais, da empresa fictícia ABC
durante o ano de 20XY, especificado por produto.

Produto
Faturamento

Tabela 1.3 – Faturamento (R$ 1000000) da empresa ABC (20XY), por produto.
Rolamento
Mancal
Óleo
Junta
Válvula
Retentor
3,48
1,84
1,75
1,45
1,25
1,00

Total
10,77

Fonte: Dados fictícios.

1.7.4 – Séries Combinadas. Na prática, é comum combinar séries estatísticas com o objetivo de
aumentar, ou detalhar, as informações disponíveis.
Exemplo 1.7.4 – O quadro a seguir mostra o faturamento da empresa ABC por produto e região, isto é,
uma combinação de uma série geográfica e uma série específica.
Quadro 1.1 – Faturamento (R$ 1000000) da empresa ABC, por produto e região.
Produto
Região
Total
Rolamento Mancal Óleo Junta Válvula Retentor
Grande Curitiba
0,89
0,46
0,45 0,37
0,32
0,26
2,75
Interior do PR
0,83
0,44
0,42 0,35
0,30
0,24
2,58
Interior de SC
0,59
0,31
0,30 0,25
0,21
0,16
1,82
Porto Alegre
0,45
0,24
0,23 0,19
0,16
0,15
1,42
Interior do RS
0,26
0,14
0,13 0,11
0,09
0,07
0,80
Campo Grande
0,24
0,13
0,12 0,10
0,09
0,07
0,75
Cuiabá
0,22
0,12
0,10 0,08
0,08
0,10
0,70
3,48
1,84
1,75 1,45
1,25
1,00
10,77
Total
Fonte: Dados fictícios.

Professor Inácio Andruski Guimarães, DSc.
7

Estatística – Notas de Aulas

2.

APRESENTAÇÃO DE DADOS

A apresentação de dados pode ser efetuada através de dois modos, tabular ou gráfico, não
mutuamente exclusivos. Para esta tarefa deve-se ter em mente o objetivo da apresentação, no que diz
respeito ao nível de detalhamento e ao tipo de informação que se deseja extrair dos dados em questão. A
apresentação tabular permite obter informações mais detalhadas, enquanto a apresentação gráfica permite
uma compreensão mais rápida a respeito do comportamento da variável observada.
2.1 – Apresentação Tabular
Em primeiro lugar, é importante frisar que os termos “tabela” e “quadro” são utilizados para
designar objetos distintos. O primeiro designa o arranjo de dados na forma de grade com laterais abertas,
enquanto o segundo termo é empregado para designar arranjos em grades com laterais fechadas,
conforme a Figura 2.1.
Variável

Total

Valores

Variável

Valores

Total
Figura 2.1 – Formatos de tabela e quadro.

Independente do formato escolhido, uma tabela deve conter três elementos:
1 – Cabeçalho. Deve conter o máximo de informações sobre os dados apresentados
2 – Corpo. De dimensões variáveis, é o espaço destinado à apresentação propriamente dita dos dados.
3 – Rodapé. Deve conter a fonte dos dados e outras informações necessárias à compreensão.
2.1.1 – Tabela Simples.
É o tipo mais comum de tabela, utilizado para representar os valores correspondentes a uma série
estatística. A disposição pode ser feita tanto por colunas como por linhas.
Exemplo 2.1 – Exemplo de tabela simples. Dados dispostos em linha.

Mês
Faturamento

Tabela 1.1 – Faturamento mensal (R$ 1000000) da empresa ABC (20XY).
Jan Fev Mar Abr Mai Jun
Jul Ago Set Out Nov
0,95 1,03 1,12 1,24 1,02 0,92 0,84 0,78 0,72 0,65 0,68
Fonte: Dados fictícios.

Exemplo 2.2 - Exemplo de tabela simples. Dados dispostos em coluna.
Tabela 2.1 – Número de
beneficiários de planos privados
de saúde, em milhões, no período
2000 – 2006.
Ano Beneficiários (milhões)
2000
34,5
2001
34,3
2002
35,0
2003
36,2
2004
38,8
2005
41,6
2006
44,7
Fonte: Jornal Folha de São Paulo. 4/6/2007

Professor Inácio Andruski Guimarães, DSc.

Dez
0,82

Total
10,77
8

Estatística – Notas de Aulas

2.1.2 – Tabela de Dupla Entrada. É utilizada para representar dados de duas séries combinadas.
Exemplo 2.3 – Exemplo de tabela de dupla entrada.
Tabela 2.2 – Faturamento (R$ 1000000) da empresa ABC, por produto e região.
Produto
Região
Total
Rolamento Mancal Óleo Junta Válvula Retentor
Grande Curitiba
0,89
0,46
0,45 0,37
0,32
0,26
2,75
Interior do PR
0,83
0,44
0,42 0,35
0,30
0,24
2,58
Interior de SC
0,59
0,31
0,30 0,25
0,21
0,16
1,82
Porto Alegre
0,45
0,24
0,23 0,19
0,16
0,15
1,42
Interior do RS
0,26
0,14
0,13 0,11
0,09
0,07
0,80
Campo Grande
0,24
0,13
0,12 0,10
0,09
0,07
0,75
Cuiabá
0,22
0,12
0,10 0,08
0,08
0,10
0,70
3,48
1,84
1,75 1,45
1,25
1,00
10,77
Total
Fonte: Dados fictícios.

2.1.3 – Tabela de Múltiplas Entradas. É utilizada na representação de dados correspondentes a mais de
duas séries.
Exemplo 2.4 – Exemplo de tabela de múltipla entrada.
Tabela 2.3 – Unidades vendidas por região e por semestre.
Produto
Região
Rolamento
Mancal
1o Semestre 2o semestre 1o Semestre 2o semestre
Sul
38
24
18
14
Sudeste
26
20
14
12
Centro Oeste
16
18
8
17
80
62
40
43
Total

Total
94
72
59
225

Dados Fictícios.

2.2 – Apresentação Gráfica
Para a apresentação gráfica deve-se levar em consideração o tipo de série estatística estudada e o,
também, o tipo de variável observada, quantitativa ou qualitativa. Também é possível combinar as duas
formas de apresentação, tabular e gráfica. Os principais tipos de gráficos são:
2.2.1 – Gráfico Linear. É utilizado principalmente para representar séries temporais.
Exemplo 2.5
Tabela 1.1 – Faturamento mensal (R$ 1000000) da empresa ABC (20XY).
Jan Fev Mar Abr Mai Jun
Jul Ago Set Out Nov
0,95 1,03 1,12 1,24 1,02 0,92 0,84 0,78 0,72 0,65 0,68
Fonte: Dados fictícios.

Faturam ento da Em presa ABC
R$ 1000000,00

Mês
Faturamento

1,5
1
0,5
0
1

2

3

4

5

6

7

8

9

Meses

Professor Inácio Andruski Guimarães, DSc.

10

11

12

Dez
0,82

Total
10,77
9

Estatística – Notas de Aulas

2.2.2 – Gráfico Setorial. É utilizado para representar séries geográficas ou específicas.
Exemplo 2.6
Tabela 1.2 – Faturamento (R$ 1000000) da empresa ABC (20XY), por região.
Grande Interior Interior
Porto
Interior Campo
Região
Cuiabá
Curitiba
do PR
de SC
Alegre
do RS
Grande
Faturamento
2,75
2,58
1,82
1,42
0,80
0,75
0,70

Total
10,77

Fonte: Dados fictícios.

Faturam ento por Região
Cuiabá; 0,7
Campo Grande;
0,75

Grande Curitiba

Grande Curitiba;
2,75

Interior do RS; 0,8

Interior do PR
Interior de SC
Porto Alegre

Porto Alegre; 1,42
Interior de SC; 1,82

Interior do RS

Interior do PR; 2,58

Campo Grande
Cuiabá

2.2.3 – Gráfico de Colunas. Pode ser utilizado no lugar do gráfico setorial.
Exemplo 2.7 – Os dados da Tabela 1.2 poderiam ser representados através do gráfico a seguir.
Faturam ento por Região
3
2,5
2
1,5
1
0,5
0
Grande
Curitiba

Interior do
PR

Interior de
SC

Porto
Alegre

Interior do
RS

Campo
Grande

Cuiabá

2.2.4 – Gráfico de Colunas Superpostas. É utilizado para representar os dados de tabelas de dupla
entrada.
Exemplo 2.8 – Representação dos dados da Tabela 2.2.
Faturamento por Produto e por Região (%)
100%
80%

Retentor

60%

Válvula

40%

Junta
Óleo

20%

Mancal

0%
Grande Interior do Interior de
Curitiba
PR
SC

Porto
Alegre

Interior do Campo
RS
Grande

Professor Inácio Andruski Guimarães, DSc.

Cuiabá

Rolamento
10

Estatística – Notas de Aulas

2.2.5 – Gráfico de Colunas Justapostas. È utilizado para representar dados de tabelas de dupla entrada.
Faturam ento por Produto e por Região
1
0,8

Rolamento

0,6

Mancal

0,4

Óleo

0,2

Junta
Válvula

0
Grande Interior do Interior de
Curitiba
PR
SC

Porto
Alegre

Interior do Campo
RS
Grande

Professor Inácio Andruski Guimarães, DSc.

Cuiabá

Retentor
11

Estatística – Notas de Aulas

3.

DISTRIBUIÇÕES DE FREQÜÊNCIAS

As distribuições de freqüências são usadas principalmente para a apresentação de grandes
conjuntos de dados.
3.1 – Dados Brutos
É a designação para um conjunto de dados não ordenados.
3.2 – Rol
É um conjunto de dados ordenados.
Exemplo 3.1 – Teores de ácido palmítico (%) observados em 120 amostras de óleos vegetais, utilizadas
em um estudo para comparar as características de óleos obtidos a partir de diferentes fontes.
3,8
3,9
4,1
4,5
4,6
4,8
4,8
4,8
4,9
5
5,1
5,1
5,1
5,1
5,1

5,2
5,4
5,4
5,5
5,6
5,7
5,9
5,9
5,9
6
6
6
6
6,1
6,1

6,1
6,1
6,1
6,2
6,2
6,2
6,2
6,2
6,2
6,2
6,2
6,2
6,2
6,3
6,4

6,4
6,4
6,5
6,6
6,7
6,7
6,8
7
7,2
7,5
7,6
7,7
8
8
8,2

8,3
8,3
9,3
9,4
9,6
9,7
9,7
9,7
9,8
9,8
9,8
9,9
10
10
10

10,1
10,2
10,4
10,4
10,5
10,5
10,5
10,5
10,5
10,5
10,7
10,8
10,8
10,9
10,9

10,9
10,9
11
11
11
11
11,1
11,1
11,1
11,1
11,2
11,2
11,3
11,4
11,4

11,5
11,5
11,5
11,5
11,6
11,6
11,9
11,9
12,2
12,2
12,2
13
13
13,1
13,1

Fonte: Brodnjak – Vončina et al. (2005)

3.3 – Amplitude Total (R)
É a diferença entre o valor máximo e o valor mínimo observados no conjunto de dados, isto é:

R = x ( n ) − x (1)

(3.1)

Exemplo 3.2 – Para o conjunto de dados do exemplo anterior a amplitude total é R = 13,1 – 3,8 = 9,3
3.4 – Número de Classes (k)
Pode ser determinado arbitrariamente ou de acordo com a expressão a seguir, denominada fórmula de
Sturges, onde n é o número de observações, ou tamanho da amostra.

k = 1 + 3,3 log n

(3.2)

Exemplo 3.3 – Uma distribuição de freqüências para os dados do Quadro 3.1, de acordo com a fórmula de
Sturges, terá

k = 1 + 3,3 log(120) = 7,86 ≅ 8
3.5 – Amplitude de Classe (h)
Pode ser calculada por

h=

R
k

Professor Inácio Andruski Guimarães, DSc.

(3.3)
12

Estatística – Notas de Aulas

h=

Exemplo 3.4 – Para os dados dos exemplos anteriores, a amplitude de classe é

9,3
≅ 1,2 .
8

3.6 – Intervalo de Classe
Os limites de cada classe podem ser definidos de quatro modos distintos, mostrados a seguir.
1.

Intervalo “exclusive – exclusive”:

2.

Intervalo “inclusive – exclusive”:

3.

Intervalo “inclusive – inclusive”:

4.

Intervalo “exclusive – inclusive”:

Exemplo 3.5 – Para os dados utilizados como exemplo até agora, as classes e intervalos são:
Tabela 3.1 – Distribuição de freqüências para os teores
(%) de ácido palmítico observados em amostras de
óleos vegetais.
Classe Teores de Ácido Palmítico Observações
1
3,8 |-- 5,0
9
2
5,0 |-- 6,2
24
3
6,2 |-- 7,4
21
4
7,4 |-- 8,6
8
5
8,6 |-- 9,8
6
6
9,8 |-- 11,0
24
7
11,0 |-- 12,2
21
8
12,2 |-- 13,4
7
120
Total (N)
3.7 – Freqüência Simples (fi)
A freqüência simples da i–ésima classe é igual ao número do observações pertencentes à mesma.
Exemplo 3.6 – Na distribuição do exemplo anterior: f1 = 9 , f2 = 24 , ... , f8 = 4.
3.8 – Freqüência Acumulada
i

A freqüência acumulada crescente da i–ésima classe é dada por:

faci = ∑ f j

(3.4)

j =1

Exemplo 3.7 – A freqüência acumulada crescente da quarta classe, na distribuição mostrada na Tabela
3.1, é: fac4 = 9 + 24 + 21 + 8 = 62.
k

A freqüência acumulada decrescente da i–ésima classe é dada por:

fad i = ∑ f j

(3.5)

j =i

Exemplo 3.8 – Para a quarta classe da distribuição anterior, a freqüência acumulada decrescente é dada
por: fad4 = 8 + 6 + 24 + 24 + 4 = 66.
3.9 – Freqüência Relativa (fri)
A freqüência relativa da i–ésima classe é dada por:

fri =

fi

∑
j =1

Professor Inácio Andruski Guimarães, DSc.

(3.6)

k

fj
Estatística – Notas de Aulas

13

Exemplo 3.9 – As freqüências relativas para distribuição da Tabela 3.1 são
Tabela 3.2 – Distribuição de freqüências simples e relativas para os teores (%) de
ácido palmítico observados em amostras de óleos vegetais.
Classe Teores de Ácido Palmítico Observações Freqüências Relativas
1
3,8 |-- 5,0
9
0,0750
2
5,0 |-- 6,2
24
0,2000
3
6,2 |-- 7,4
21
0,1750
4
7,4 |-- 8,6
8
0,0667
5
8,6 |-- 9,8
6
0,0500
6
9,8 |-- 11,0
24
0,2000
7
11,0 |-- 12,4
21
0,1750
8
12,4 |-- 13,6
7
0,0583
120
1,0000
Total (N)
3.10 – Ponto Médio de Classe (Xi)
O ponto médio da i–ésima classe é dado por:

Xi =

LI i + LS i
2

(3.7)

onde LIi e LSi são os limites inferior e superior da classe, respectivamente.
Exemplo 3.10 – As classes da distribuição da Tabela 3.1 têm os seguintes pontos médios:

Classe
1
2
3
4
5
6
7
8

Tabela 3.3 – Distribuição de freqüências simples e
pontos médios de classe para os teores (%) de ácido
palmítico observados em amostras de óleos vegetais.
Teores de Ácido Palmítico Observações Pontos Médios (Xi)
3,8 |-- 5,0
9
4,4
5,0 |-- 6,2
24
6,2 |-- 7,4
21
7,4 |-- 8,6
8
8,6 |-- 9,8
6
9,8 |-- 11,0
24
11,0 |-- 12,2
21
12,2 |-- 13,4
7
12,8
120
Total (n)

3.11 – Representações Gráficas
As distribuições de freqüências podem ser representadas através de três tipos de gráficos, não
mutuamente exclusivos.
3.11.1 – Histograma
É um gráfico de colunas justapostas, onde a largura da base de cada coluna representa o intervalo de
classe correspondente e a altura representa a freqüência simples da referida classe.
Exemplo 3.11 – A Figura 3.1 mostra o histograma da distribuição mostrada na Tabela 3.1.

Professor Inácio Andruski Guimarães, DSc.
14

Estatística – Notas de Aulas

30
25
20
15
10
5
0
3,8 - 5,0

5,0 - 6,2

6,2 - 7,4

7,4 - 8,6

8,6 - 9,8

9,8 - 11,0

11,0 - 12,2

12,2 - 13,4

Figura 3.1 – Histograma da distribuição de freqüências de teores de ácido palmítico.
3.11.2 – Polígono de Freqüências
É definido por uma linha poligonal cujos vértices são definidos pelos pontos médios e pelas freqüências
das classes representadas.
Exemplo 3.12 – O polígono de freqüências para a distribuição anterior é mostrado na Figura 3.2.

30
Freqü ên cias

25
20
15
10
5
0
1

2

3

4

5

6

7

8

Classes

Figura 3.2 – Polígono de freqüências da distribuição de teores de ácido palmítico.
3.11.3 – Curva de Freqüências
Exemplo 3.13 – A curva de freqüências para a distribuição dos exemplos anteriores é mostrada na Figura
3.3.
30
25
20
15
10
5
0
1

2

3

4

5

6

7

8

Figura 3.3 – Curva de freqüências para a distribuição de teores de ácido palmítico.

Professor Inácio Andruski Guimarães, DSc.
15

Estatística – Notas de Aulas

3.12 – Exercícios
O Quadro 3.1 mostra 150 valores correspondentes ao comprimento da sépala, observados em flores de
três espécies: íris virginica, íris setosa e íris versicolor, para um estudo cujo é a comparação das
diferenças entre as dimensões observadas para cada um dos três grupos.
Quadro 3.1 – Comprimentos (mm) das sépalas
observadas em 150 exemplares de flores íris.
43

46

44

46

50

54

50

49

56

44

47

44

48

56

55

51

57

61

58
59

46

48

45

49

56

55

55

58

61

60

46
47

50
50

48
49

50
51

56
58

55
56

56
57

60
64

62
63

62
63

48

51

49

52

59

57

57

64

63

63

48

51

50

53

59

58

57

65

64

64

49
49

51
51

50
50

55
57

60
61

60
60

58
58

65
67

64
67

65
67

50

52

51

63

61

60

61

68

69

67

50

52

51

64

61

63

62

72

72

67

51
54

54
54

52
54

65
66

62
63

66
67

63
63

73
76

72
74

68
69

54

57

55

69

64

67

65

77

77

69

58

57

55

70

67

68

71

77

79

77

Fonte: Fisher (1936).

1)
2)
3)
4)
5)
6)
7)
8)

Calcular a amplitude total.
Calcular o número de classes para construir uma distribuição de freqüências.
Calcular a amplitude de cada classe.
Determinar os intervalos e limites de classes.
Distribuir as freqüências.
Calcular as freqüências acumuladas.
Calcular os pontos médios.
Traçar o histograma.

Resposta:
Classe
1
2
3
4
5
6
7
8
9

Comprimento (mm)
43 |-- 47
47 |-- 51
51 |-- 55
55 |-- 59
59 |-- 63
63 |-- 67
67 |-- 71
71 |-- 75
75 |-- 79
Total

Flores
9
23
19
28
20
23
16
6
6
150

faci
9
32
51
79

fadi
150
141
118
99

150

fri
0,0600
0,1533
0,1267
0,1867

6

Professor Inácio Andruski Guimarães, DSc.

Ponto médio
45
49
53
57
Estatística – Notas de Aulas

16

30
25
20
15
10
5
0

Figura 3.4 – Histograma para os dados do Quadro 3.1.
Referências
Brodnjak – Vončina, D., Kodba, Z., Novič, M., Multivariate data analysis in classification of
vegetable oils characterized by the content of fatty acids. Chemometrics and Intelligent Laboratory
Systems 75, pp. 31-43, 2005.
Fisher, R. A., The use of multiple measurements in taxonomic problems. Annals of Eugenics 7, pp.
179-178, 1936.
Johnson, R. A., Wichern, D. W., Applied multivariate statistical analysis. 2nd. Ed. New Jersey: PrenticeHall International, Inc., 1988.

Professor Inácio Andruski Guimarães, DSc.
17

Estatística – Notas de Aulas

4.

MEDIDAS DE TENDENCIA CENTRAL OU DE POSIÇÃO

São medidas utilizadas principalmente para a descrição de dados. Neste caso o que se deseja
encontrar são os valores representativos do conjunto de dados, de modo a resumir ao máximo as
observações sobre os dados em questão. As principais medidas de posição são a média aritmética, a
mediana e a moda. As definições, e algumas propriedades, destas medidas são brevemente descritas a
seguir.
4.1 – Média Aritmética ( x )
dada por

Seja um conjunto de dados {x1 , x2 , ... , xn }. A média aritmética, ou simplesmente “média”, é
n

∑x

i

i =1

x=

(4.1)

n

Exemplo 4.1 – Seja o conjunto {2 , 4 , 3 , 5 , 6 , 2 , 5}. Então a média aritmética é:

x =

2+4+3+5+6+2+5
= 3,8571 .
7

OBS: A notação x é empregada para representar a média de uma amostra de valores. A média da
população costuma ser representada pela letra grega µ (“mi” ou “mu”).
4.1.1 – Propriedades da Média Aritmética:
P1: Se uma constante k é somada a cada valor do conjunto, então a média será acrescida de k.
Exemplo 4.2 – Se todos os valores do conjunto do exemplo 3.1 forem aumentados em 5, a média será
8,8571.
P2: Se cada valor do conjunto é multiplicado por uma constante k, então a média também será
multiplicada pelo mesmo valor.
Exemplo 4.3 – Se todos os valores do conjunto do exemplo 3.1 forem multiplicados por 5, a média será
19,2855.
n

P3: Seja

d i = xi − x o desvio do i – ésimo valor em relação à média aritmética. Então

∑d

i

= 0.

i =1

4.1.2 – Média Aritmética Ponderada
Para dados agrupados em distribuições de freqüências calcula-se a média ponderada, sendo que a
freqüência observada para cada valor é o peso do mesmo. Então, se um conjunto de n valores foi
agrupado em k classes, com pontos médios X1 , X2 , ... , Xk , e freqüências simples f1 , f2 , ... , fk ,
respectivamente, então a média aritmética é dada por:
k

∑X
x=

fi

i

i =1
k

∑f

(4.2)
i

i =1

Professor Inácio Andruski Guimarães, DSc.
18

Estatística – Notas de Aulas

Exemplo 4.4 – O teor médio de ácido palmítico, para os dados da Tabela 3.1, é dado por:
Classe
1
2
3
4
5
6
7
8

Teores de Ácido Palmítico (%)
3,8 |-- 5,0
5,0 |-- 6,2
6,2 |-- 7,4
7,4 |-- 8,6
8,6 |-- 9,8
9,8 |-- 11,0
11,0 |-- 12,2
12,2 |-- 13,4
Total (n)
x =

Observações (fi)
9
24
21
8
6
24
21
7
120

Xi
4,4

Xi fi
39,6

12,8

89,6

1024 , 4
≅ 8 , 54
120

OBS: Se a média para os 120 valores fosse obtida diretamente do conjunto, através da fórmula (4.1), o
valor encontrado seria 8,40.
4.2 – Mediana ( ~ )
x
É o valor que ocupa a posição central em um conjunto de dados, quando organizados em ordem
crescente. Se a quantidade de valores é ímpar, a mediana, ou valor mediano, é simplesmente o valor
central. Se a quantidade de valores é par, a mediana é a média dos dois valores centrais.
Exemplo 4.5 – Seja o conjunto {2 , 2 , 3 , 5 , 5 , 6 , 7 , 7 , 9 , 9 , 10}. Neste caso a mediana é ~ = 6.
x
Exemplo 4.6 – Seja o conjunto {0 , 1 , 1 , 2 , 3 , 4 , 5 , 5 , 6 , 6 , 7 , 8}. Aqui a mediana é dada pela média
dos dois valores centrais, isto é, ~ = (4 + 5)/2 = 4,5.
x
4.2.1 – Mediana para dados agrupados em distribuições de freqüências
Para dados agrupados em distribuições de freqüências pode-se utilizar para o cálculo da mediana
a expressão:

~ = LI ~
x
x

n
 − fca
+2
 fme





h




(4.3)

onde:
LIx = limite inferior da classe que contém o valor mediano, isto é, da classe cuja freqüência
acumulada crescente é igual ou imediatamente superior a n / 2.
fca = freqüência acumulada crescente da classe anterior à classe que contém o valor mediano.
fme = freqüência simples da classe que contém o valor mediano.
h = amplitude da classe que contém o valor mediano.
Exemplo 4.7 – O teor mediano de ácido palmítico, para os dados da Tabela 3.1, é dado por:
Classe
1
2
3
4
5
6
7
8

Teores de Ácido Palmítico (%)
3,8 |-- 5,0
5,0 |-- 6,2
6,2 |-- 7,4
7,4 |-- 8,6
8,6 |-- 9,8
9,8 |-- 11,0
11,0 |-- 12,2
12,2 |-- 13,4
Total (n)

Observações (fi)
9
24
21
8
6
24
21
7
120

Professor Inácio Andruski Guimarães, DSc.

faci
9
33
54
62
19

Estatística – Notas de Aulas

n
= 60 (Então a mediana pertence à 4ª. classe).
2
LIx = 7,4
fca = 54
fme = 8
h = 8,6 – 7,4 = 1,2
Substituindo na expressão (4.3):
OBS: Se a mediana fosse obtida a partir da definição, diretamente do conjunto de dados, o valor
encontrado seria 8,25.
4.3 - Moda
A moda, ou valor modal, de um conjunto de dados é o valor com maior freqüência individual. É
importante ressaltar que o valor modal pode não existir, além disto, caso exista, pode não ser único. Neste
último caso, diz-se que o conjunto é bimodal, trimodal, etc.
Exemplo 4.8 – O valor modal para o conjunto de observação dos teores de ácido palmítico é 6,2, cuja
freqüência é 10.
3,8
3,9
4,1
4,5
4,6
4,8
4,8
4,8
4,9
5
5,1
5,1
5,1
5,1
5,1

5,2
5,4
5,4
5,5
5,6
5,7
5,9
5,9
5,9
6
6
6
6
6,1
6,1

6,1
6,1
6,1
6,2
6,2
6,2
6,2
6,2
6,2
6,2
6,2
6,2
6,2

6,3
6,4

6,4
6,4
6,5
6,6
6,7
6,7
6,8
7
7,2
7,5
7,6
7,7
8
8
8,2

8,3
8,3
9,3
9,4
9,6
9,7
9,7
9,7
9,8
9,8
9,8
9,9
10
10
10

10,1
10,2
10,4
10,4
10,5
10,5
10,5
10,5
10,5
10,5
10,7
10,8
10,8
10,9
10,9

10,9
10,9
11
11
11
11
11,1
11,1
11,1
11,1
11,2
11,2
11,3
11,4
11,4

11,5
11,5
11,5
11,5
11,6
11,6
11,9
11,9
12,2
12,2
12,2
13
13
13,1
13,1

Para dados agrupados em distribuições de freqüências, a moda pode ser calculada através da fórmula dada
por:
Mo

= LI

mod


∆1
+ 
∆1 + ∆

2


h


onde:
LImod = limite inferior da classe modal, isto é, a de maior freqüência simples.
∆1 = (freqüência simples da classe modal menos a freqüência simples da classe anterior).
∆2 = (freqüência simples da classe modal menos a freqüência simples da classe posterior).
h = amplitude da classe modal.
Exemplo 4.9 – Calcular a moda para a distribuição de freqüências dos teores de ácido palmítico.
A distribuição de freqüências é dada na tabela a seguir.

Classe

Teores de Ácido Palmítico (%)

Observações (fi)

Professor Inácio Andruski Guimarães, DSc.

(4.4)
20

Estatística – Notas de Aulas

1
2
3
4
5
6
7
8

3,8 |-- 5,0
5,0 |-- 6,2
6,2 |-- 7,4
7,4 |-- 8,6
8,6 |-- 9,8
9,8 |-- 11,0
11,0 |-- 12,2
12,2 |-- 13,4
Total (n)

9
24
21
8
6
24
21
7
120

Neste caso as classes 2 e 6 têm a mesma freqüência. Então a distribuição obtida é bimodal, conforme se
pode notar na Figura 3.3, com a curva de freqüências para este conjunto de dados. As respectivas modas
são:
Primeiro valor modal:
LImod = 5,0
∆1 = 24 – 9 = 15
∆2 = 24 – 21 = 3
h = 6,2 – 5,0 = 1,2
Substituindo na fórmula (4.4): Mo

1


= 5 ,0 + 
 15 + 3


.
 ( 1 ,2 ) =


Segundo valor modal:
LImod = 9,8
∆1 = 24 – 6 = 18
∆2 = 24 – 21 = 3
h = 11,0 – 9,8 = 1,2
Substituindo na fórmula (4.4):

Mo

2



= 9 ,8 + 
 ( 1 ,2 ) =
 18 + 3 

.

OBS: É importante chamar a atenção para o fato de que nenhum dos valores coincide com o real valor
modal, que é igual a 6,2.
Comentário
Nos exemplos anteriores é possível observar que as medidas calculadas para um conjunto de
dados podem apresentar discrepância quando calculadas através de abordagens distintas. Para a
distribuição de freqüências dos teores (%) de ácido palmítico observados em amostras de óleos vegetais,
por exemplo, a média aritmética foi calculada como 8,54, para os dados agrupados, e 8,40 para os dados
apenas ordenados. O mesmo ocorre com a mediana, que, por definição, é 8,25. Entretanto, para os
mesmos dados, quando agrupados, a mediana é igual a 8,30. Para o cálculo da moda a diferença é ainda
mais gritante, pois foram encontrados dois valores, 6,0 e 10,8, para a moda. Contudo, é fácil perceber que
o valor em questão é igual a 6,2.
Este tipo de ocorrência deve ser levado em consideração quando se opta pela apresentação, e
tratamento, de dados na forma de distribuições de freqüências. O fácil acesso a programas
computacionais e aplicativos pode tornar dispensável a construção de distribuições de freqüências,
especialmente quando o interesse do estudo restringe-se aos resultados obtidos para as diferentes medidas
aqui estudadas. Neste caso, a distribuição de freqüências pode ser usada apenas como meio de
apresentação dos dados.

Professor Inácio Andruski Guimarães, DSc.
21

Estatística – Notas de Aulas

4.4 – Relação entre Média, Mediana e Moda
A relação entre os valores encontrados para a média, para a mediana e para a moda indica o tipo
de assimetria da distribuição de freqüências. Aqui entende-se por assimetria o grau de desvio dos dados
em relação ao centro da distribuição.

Figura 4.1 – Assimetria positiva (Mo < ~ < x ).
x

Figura 4.2 – Assimetria negativa (Mo > ~ >
x

x ).

22

Figura 4.3 – Distribuição simétrica (normal) (Mo = ~ =
x

x ).

Na prática é comum obter distribuições de freqüências cujas medidas não apresentam nenhum dos
comportamentos descritos, e ilustrados, nas Figuras 4.1 a 4.3. Neste caso recomenda-se excluir a moda
nas relações mostradas acima, isto é, comparar apenas a média e a mediana.
4.5 - Percentil
O valor mediano é aquele que divide um conjunto de dados ordenados em duas partes iguais. Da
mesma forma, também pode ser útil discriminar valores correspondentes a uma determinada
percentagem. Este tipo de situação ocorre, por exemplo, quando se deseja determinar a renda familiar que
define os 10% mais ricos em uma sociedade.

Professor Inácio Andruski Guimarães, DSc.
22

Estatística – Notas de Aulas

Para determinar certo percentil em um conjunto de dados é suficiente ordenar estes mesmos
dados e localizar o elemento correspondente à fração desejada, de modo análogo ao usado para
determinar a mediana.
Exemplo 4.10 – Seja o conjunto de dados mostrado no Quadro 4.1. O 90o percentil é o valor que separa
90% dos exemplares com menor largura dos 10% com a maior largura. Então, considerando que o
conjunto tem n = 150 observações, basta separar os 15 últimos elementos, que são justamente os
pertencentes à última coluna. Neste caso o 90o percentil é igual a 37. Isto significa que 90% dos
exemplares apresentam largura inferior a 37 mm.
Quadro 4.1 – Larguras (em mm) das sépalas
observadas em 150 exemplares de flores íris.
20 25 27 28 30 30 31 32 34 37
22 25 27 28 30 30 31 32 34 37
22 25 27 29 30 30 31 33 34 37
22 25 28 29 30 30 31 33 34 38
23 26 28 29 30 30 32 33 34 38
23 26 28 29 30 30 32 33 35 38
23 26 28 29 30 30 32 33 35 38
23 26 28 29 30 30 32 33 35 38
24 26 28 29 30 31 32 34 35 38
24 27 28 29 30 31 32 34 35 39
24 27 28 29 30 31 32 34 35 39
25 27 28 29 30 31 32 34 36 40
25 27 28 30 30 31 32 34 36 41
25 27 28 30 30 31 32 34 36 42
25 27 28 30 30 31 32 34 36 44
Fonte: Fisher (1936).

Para dados agrupados em distribuições de freqüências pode-se utilizar a fórmula dada por:

P p = LI

P

 pn

 100 − fca 
+ 
h
fP







(4.5)

onde:
LIP = limite inferior da classe que contém o p–ésimo percentil, isto é, da classe cuja freqüência
acumulada crescente é igual ou imediatamente superior a pn / 100.
fca = freqüência acumulada crescente da classe anterior à classe que contém o p–ésimo percentil.
fP = freqüência simples da classe que contém o p–ésimo percentil.
h = amplitude da classe que contém o p–ésimo percentil.
Exemplo 4.11 – Calcular o 90o percentil e o 10o percentil para os dados da distribuição de freqüências dos
dados mostrados no Quadro 4.1.
Classes
1
2
3
4
5
6
7
8

Largura (mm)
20 |-- 23
23 |-- 26
26 |-- 29
29 |-- 32
32 |-- 35
35 |-- 38
38 |-- 41
41 |--| 44
Total

Exemplares
4
15
28
47
31
13
9
3
150

faci
4
19
47
94
125
138
147
150

Professor Inácio Andruski Guimarães, DSc.
Estatística – Notas de Aulas

23

Neste caso: p = 90. Então 90 × 150 = 135 . O valor procurado pertence à 6ª. classe, que tem freqüência
100
acumulada crescente igual a 138.
LIP = 35
fca = 125
fP = 13
h = 38 – 35 = 3

Substituindo na fórmula 4.5: P = 35 +  135 − 125
90

13



.
 ( 3 ) ≅ 37 , 3


O cálculo do 10o percentil é deixado como exercício.
4.6 - Decil

Esta medida é aplicada quando de deseja dividir um conjunto de dados ordenados em dez partes
iguais. Não é difícil perceber que:
D1 = P10
D2 = P20
D3 = P30
...
D9 = P90

Exemplo 4.12 – Para os dados do Quadro 4.1, o quarto decil corresponde ao valor que separa quatro
décimos, ou 40% dos valores. Para n = 150 observações, isto representa 60 valores, ou as quatro
primeiras colunas. Então D4 = 30.
4.7 - Quartil

Esta medida divide um conjunto de dados ordenados em quatro partes iguais. Também é fácil
perceber que:
Q1 = P25
Q2 = P50
Q3 = P75

Exemplo 4.13 – Para os dados do Quadro 4.1, o terceiro quartil é valor que separa o conjunto em duas
partes, uma correspondente a 75% dos valores e outra correspondente a 25% dos valores. Como o
conjunto possui 150 observações, e ¾ de 150 correspondem a 112,5, o elemento procurado é a média do
112o e do 113o valores. Então o Q3 = 33 (verifique no próprio quadro !)

4.8 - Exercícios

4.8.1) O Quadro 3.1 foi utilizado para construir uma distribuição de freqüências no Exercício 3.12.
Calcular, para a distribuição de freqüências obtida:
1)
2)
3)
4)
5)
6)
7)

Média.
Mediana.
Moda.
Comparar os resultados obtidos com os reais valores.
Estudar a assimetria da distribuição.
Calcular o 10o e o 90o percentís.
Calcular o 1o e o 4o quartís.

Respostas: O quadro original é dado a seguir.

Professor Inácio Andruski Guimarães, DSc.
24

Estatística – Notas de Aulas

Quadro 3.1 – Comprimentos (mm) das sépalas
observadas em 150 exemplares de flores íris.
43
44

46
47

44
44

46
48

50
56

54
55

50
51

49
57

56
61

58
59

46

48

45

49

56

55

55

58

61

60

46

50

48

50

56

55

56

60

62

62

47
48

50
51

49
49

51
52

58
59

56
57

57
57

64
64

63
63

63
63

48

51

50

53

59

58

57

65

64

64

49

51

50

55

60

60

58

65

64

65

49
50

51
52

50
51

57
63

61
61

60
60

58
61

67
68

67
69

67
67

50

52

51

64

61

63

62

72

72

67

51

54

52

65

62

66

63

73

72

68

54
54

54
57

54
55

66
69

63
64

67
67

63
65

76
77

74
77

69
69

58

57

55

70

67

68

71

77

79

77

Fonte: Fisher (1936).

A distribuição de freqüências obtida é dada na tabela a seguir.
Classe
1
2
3
4
5
6
7
8
9

Comprimento (mm)
43 |-- 47
47 |-- 51
51 |-- 55
55 |-- 59
59 |-- 63
63 |-- 67
67 |-- 71
71 |-- 75
75 |-- 79
Total

Flores
9
23
19
28
20
23
16
6
6
150

faci
9
32
51
79
99
122
138
144
150

fadi
150
141
118
99
71
51
28
12
6

fri
0,0600
0,1533
0,1267
0,1867
0,1333
0,1533
0,1067
0,0400
0,0400

Ponto médio
45
49
53
57
61
65
69
73
77

1) Média: x = 59,03 mm.
2) Mediana: ~ = 58,43 mm.
x
3) Moda: Mo = 57,12 mm.
4) x = 55,42 mm.
4.8.2) O Quadro 4.1 mostra os valores observados para as larguras (mm) das sépalas observadas nos 150
exemplares mencionados nos exemplos anteriores.
1)
2)
3)
4)
5)

Construir uma distribuição de freqüências para os dados observados.
Calcular a largura média.
Calcular a largura mediana.
Calcular a largura modal.
Comparar os valores obtidos a partir da distribuição de freqüências com os valores obtidos
diretamente no conjunto de dados.
6) Estudar a assimetria da distribuição.
7) Calcular o 10o e o 90o percentís.

Professor Inácio Andruski Guimarães, DSc.
25

Estatística – Notas de Aulas

Quadro 4.1 – Larguras (em mm) das sépalas
observadas em 150 exemplares de flores íris.
20 25 27 28 30 30 31 32 34 37
22 25 27 28 30 30 31 32 34 37
22 25 27 29 30 30 31 33 34 37
22 25 28 29 30 30 31 33 34 38
23 26 28 29 30 30 32 33 34 38
23 26 28 29 30 30 32 33 35 38
23 26 28 29 30 30 32 33 35 38
23 26 28 29 30 30 32 33 35 38
24 26 28 29 30 31 32 34 35 38
24 27 28 29 30 31 32 34 35 39
24 27 28 29 30 31 32 34 35 39
25 27 28 29 30 31 32 34 36 40
25 27 28 30 30 31 32 34 36 41
25 27 28 30 30 31 32 34 36 42
25 27 28 30 30 31 32 34 36 44
Fonte: Fisher (1936).

Respostas:
1) A distribuição de freqüências fica:
Classes
1
2
3
4
5
6
7
8

2) A largura média é:

Largura (mm)
20 |-- 23
23 |-- 26
26 |-- 29
29 |-- 32
32 |-- 35
35 |-- 38
38 |-- 41
41 |--| 44
Total

Exemplares
4
15
28
47
31
13
9
3
150

x = 31,02 mm.

3) A largura mediana é: ~ = 30,78 mm.
x
4) A largura modal é: Mo = 30,63 mm.
50
40
30
20
10
0
20 - 23

23 - 26

26 - 29

29 - 32

32 - 35

35 - 38

38 - 41

Figura 4.4 – Histograma para os dados do Quadro 4.1.

Professor Inácio Andruski Guimarães, DSc.

41 - 44
26

Estatística – Notas de Aulas

5.

MEDIDAS DE DISPERSÃO

A principal utilidade das medidas de tendência central, quando calculadas para determinado conjunto
de dados, é a determinação de valores característicos ou típicos deste conjunto. Entretanto, a informação
fornecida por tais medidas é incompleta, se não for acompanhada de alguma informação sobre a
variabilidade dos dados. Esta informação é obtida através do cálculo de medidas de dispersão, ou
variabilidade.
5.1 – Amplitude Total

Seja um conjunto de dados ordenados {x(1) , x(2) , ... , x(n) }, onde x(1) e x(n) representam o valor
mínimo e o valor máximo, respectivamente, do conjunto. A amplitude total é dada por:

R = x( n ) − x(1)

(5.1)

Exemplo 5.1 – A amplitude total para o conjunto de dados do Quadro 4.1 é: R = 44 – 20 = 24 mm.
Quadro 4.1 – Larguras (em mm) das sépalas
observadas em 150 exemplares de flores íris.
20 25 27 28 30 30 31 32 34 37
22 25 27 28 30 30 31 32 34 37
22 25 27 29 30 30 31 33 34 37
22 25 28 29 30 30 31 33 34 38
23 26 28 29 30 30 32 33 34 38
23 26 28 29 30 30 32 33 35 38
23 26 28 29 30 30 32 33 35 38
23 26 28 29 30 30 32 33 35 38
24 26 28 29 30 31 32 34 35 38
24 27 28 29 30 31 32 34 35 39
24 27 28 29 30 31 32 34 35 39
25 27 28 29 30 31 32 34 36 40
25 27 28 30 30 31 32 34 36 41
25 27 28 30 30 31 32 34 36 42
25 27 28 30 30 31 32 34 36 44
Fonte: Fisher (1936).

5.2 – Desvio Médio

Seja um conjunto de dados {x1 , x2 , ... , xn }, não necessariamente ordenados. Então o desvio
médio dos valores do conjunto em relação à sua média é dado por:
n

∑
D =

xi − x

(5.2)

i =1

n

Exemplo 5.2 – O Quadro 5.1 mostra os teores (%) de vanádio encontrados em uma amostra de sete
estratos de óleo cru extraídas de solo do tipo “Wilhelm sandstone”.
Quadro 5.1 – Teores de vanádio.
Estrato
1
2
3
4
5
6
Teor (%) 3,9 2,7 2,8 3,1 3,5 3,9

7
2,7

Fonte: Johnson e Wichern (1988)

A média é x = 3 , 2286 . O desvio médio é: D = 3 , 9 − 3 , 2286 + ... + 2 , 7 − 3 , 2286
7

Professor Inácio Andruski Guimarães, DSc.

= 0 , 4612 .
27

Estatística – Notas de Aulas

Para uma distribuição de freqüências com k classes, com freqüências simples f1 , ... , fk , e pontos
médios X1 , ... , Xk , respectivamente, o desvio médio é dado por:
k

∑

X i − x fi

(5.3)

i =1

D =

k

∑

fi

i =1

Exemplo 5.3 – O desvio médio para a distribuição de freqüências dos dados do Quadro 4.1 é calculado
como:
A média é x = 31,02 mm.
Classes
1
2
3
4
5
6
7
8

Largura (mm)
20 |-- 23
23 |-- 26
26 |-- 29
29 |-- 32
32 |-- 35
35 |-- 38
38 |-- 41
41 |--| 44
Total

Ponto Médio (Xi)
21,5
24,5
27,5
30,5
33,5
36,5
39,5
42,5

Exemplares
4
15
28
47
31
13
9
3
150

| Xi – x |
9,52
6,52
3,52
0,52
2,48
5,48
8,48
11,48

| Xi – x | fi
38,08
97,80
98,56
24,44
76,88
71,24
76,32
34,44
517,76

Então D = 517 , 76 3 , 4517 .
150
5.3 – Variância

Seja um conjunto de dados {x1 , x2 , ... , xn }, não necessariamente ordenados. Assim como o
desvio médio, a variância é gerada a partir das diferenças dos valores do conjunto de dados em relação à
média do mesmo. Entretanto, é necessário ter em mente a natureza dos dados estudados, mais
especificamente, se os mesmos constituem uma população ou uma amostra. Para o primeiro caso, e
representando a média populacional por µ , a variância é dada por:
n

∑ (x
2

σ

i

− µ

)2

.

i =1

=

(5.4)

n

A fórmula acima pode ser facilmente transformada para uma expressão mais simples, dada por:
n

∑
2

σ

x i2

i =1

=

− µ

n

2

.

(5.6)

Quando o conjunto de dados {x1 , x2 , ... , xn } representa uma amostra, calcula-se o estimador
corrigido para a variância amostral, dado por
n

∑ (x
s

2

i

− x)

2

i =1

=

n −1

.

(5.7)

ˆ2
O estimador acima também costuma ser representado por σ , e a fórmula (5.7) pode ser transformada
para
n

∑
s

2

=

x i2

i =1

n −1

−

nx 2
n −1

.

Professor Inácio Andruski Guimarães, DSc.

(5.8)
28

Estatística – Notas de Aulas

Exemplo 5.4 – Calcular a variância para a amostra de teores de vanádio, mostrados no Quadro 5.1.
Quadro 5.1 – Teores de vanádio.
Estrato
1
2
3
4
5
6
Teor (%) 3,9 2,7 2,8 3,1 3,5 3,9

7
2,7

Fonte: Johnson e Wichern (1988)

A média é x = 3 , 2286 . Então, usando a fórmula (5.8):

s2 =

3,9 2 + 2 ,7 2 + ... + 2 ,7 2 ( 7 )( 3, 2286 2 ) 74 ,7 72 ,97
−
=
−
= 0 , 2833 .
7 −1
7 −1
6
6

Para uma distribuição de freqüências com k classes, com freqüências simples f1 , ... , fk , e pontos
médios X1 , ... , Xk , respectivamente, a variância populacional é dada por:
k

∑
σ

2

=

X

2
i

fi

i =1

− µ

k

∑

2

.

(5.9)

fi

i =1

Para dados amostrais, o estimador corrigido é dado por
k

∑
s2 =

X

2
i

fi

i =1

−

n −1

nx 2 .
n −1

(5.10)

Exemplo 5.5 – Calcular a variância amostral para os dados da distribuição de freqüências dos dados do
Quadro 4.1.
Classes
1
2
3
4
5
6
7
8

A média é

Largura (mm)
20 |-- 23
23 |-- 26
26 |-- 29
29 |-- 32
32 |-- 35
35 |-- 38
38 |-- 41
41 |--| 44
Total

Exemplares (fi)
4
15
28
47
31
13
9
3
150

Ponto Médio (Xi)
21,5
24,5
27,5
30,5
33,5
36,5
39,5
42,5

Xi2
462,25
600,25
756,25
930,25
1122,25
1332,25
1560,25
1806,25

Xi2fi
1849
9003,75
21175
43721,75
34789,75
17319,25
14042,25
5418,75
147319,5

x = 31,02 mm. Então, usando a fórmula (5.10):
s2 =

147319 , 5 (150 )( 31 , 02 2 ) 147319 ,5 144336 , 06
−
=
−
= 20 , 0231 .
150 − 1
150 − 1
149
149

Quando não tem à disposição uma planilha de cálculo, ou mesmo uma calculadora adequada,
pode-se reduzir o esforço para calcular a variância. Isto é possível através das fórmulas (5.12) e (5.13),
obtidas a partir das fórmulas (5.9) e (5.10), respectivamente. Para tanto basta efetuar a substituição de
variável dada por:
X i = A + hd i .
(5.11)
Efetuada a substituição nas fórmulas (5.9) e (5.10), após convenientes manipulações algébricas obtém-se
as fórmulas dadas por:

Professor Inácio Andruski Guimarães, DSc.
29

Estatística – Notas de Aulas

σ

 k

2
 ∑ d i fi 
= h 2  i = 1k
−



 ∑ fi

 i =1


2

k

∑d
i =1
k

∑
i =1

2


fi 


fi 


i

2
 k
 k

 ∑ di fi 
 ∑ d i2 f i

= h 2  i =1
−  i =1
 n −1
n ( n − 1)




s2









(5.12)









(5.13)

Nas fórmulas acima:
A = ponto médio de uma classe de referência escolhida arbitrariamente (em geral escolhe-se a classe
modal, isto é, a que possui a maior freqüência simples).
h = amplitude de classe (deve ser igual para todas as classes).
di = desvio da i-ésima classe em relação à classe escolhida como classe de referência.
k

n = ∑ fi .
i =1

Exemplo 5.6 – Calcular a variância amostral para a distribuição de freqüências do exemplo anterior.
Escolhendo, arbitrariamente, a quarta classe como classe de referência:
Classes
1
2
3
4
5
6
7
8

Largura (mm)
20 |-- 23
23 |-- 26
26 |-- 29
29 |-- 32
32 |-- 35
35 |-- 38
38 |-- 41
41 |--| 44
Total

Exemplares (fi)
4
15
28
47
31
13
9
3
150

di
-3
-2
-1
0
1
2
3
4

difi
- 12
- 30
- 28
0
31
26
27
12
26

di2fi
36
60
28
0
31
52
81
48
336

Lembrando que h = 3 e n = 150:

 336

26 2
s 2 = (3 2 ) 
−
= 9[2, 2550 − 0,0302 ] = 20 ,0232
150 − 1 (150 )(150 − 1) 


5.3.1 – Método Breve para o Cálculo da Média Aritmética

A substituição (5.15) aplicada à fórmula da média, permite a seguinte transformação:
k

k

∑
x=

∑d

X i fi

i =1

↔

k

∑
i =1

fi

x = A+h

i

fi

i =1
k

∑f

(5.14)
i

i =1

A fórmula (5.14) também é conhecida como Método Breve para o cálculo da média.
5.4 – Desvio Padrão

È dado pela raiz quadrada da variância. Deste modo, para o cálculo do desvio padrão, deve-se
levar em consideração a natureza dos dados. È a medida de dispersão mais utilizada para a descrição de
dados, juntamente com a média aritmética.

Professor Inácio Andruski Guimarães, DSc.
30

Estatística – Notas de Aulas

Seja o conjunto de dados {x1 , x2 , ... , xn }, não necessariamente ordenados. Se o conjunto
representa uma população, o desvio padrão é dado por:
n

∑x

2
i

−µ2 .

i =1

σ =

n

(5.15)

Se o conjunto representa uma amostra, o estimador corrigido é dado por:
n

∑x

2
i

i =1

s=

nx 2
n −1

−

n −1

.

(5.16)

Exemplo 5.7 – Calcular o desvio padrão para os dados do Quadro 5.1.
Quadro 5.1 – Teores de vanádio.
Estrato
1
2
3
4
5
6
Teor (%) 3,9 2,7 2,8 3,1 3,5 3,9

7
2,7

Fonte: Johnson e Wichern (1988)

A média é x = 3 , 2286 . Então, usando a fórmula (5.16):
s =

3 , 9 2 + ... + 2 , 7 2
( 7 )( 3 , 2286
−
7 −1
7 −1

2

)

=

0 , 2833

= 0 , 5323 .

5.4.1 – Desvio Padrão para Dados Agrupados em Distribuições de Freqüências

Para uma distribuição de freqüências com k classes, com freqüências simples f1 , ... , fk , e pontos
médios X1 , ... , Xk , respectivamente, o desvio padrão populacional é dado por:
k

∑

2
i

X

fi

i =1

σ =

− µ

k

∑

.

(5.17)

.

2

(5.18)

fi

i =1

O estimador corrigido para o desvio padrão amostral é dado por:
k

∑

X

2
i

fi

i =1

s =

nx 2
n −1

−

n −1

Para o cálculo do desvio padrão através das fórmulas (5.17) e (5.18) também é possível efetuar a
mesma substituição de variável aplicada ao cálculo da variância. Neste caso as duas fórmulas são
transformadas para:
k

∑
σ = h

d i2 f i

i =1
k

∑

fi

i =1



− 





∑1 d i f i 
i=

k

∑1 f i 
i=

k

2

,

(5.19)

.

(5.20)

e
k

∑
s = h

d i2 f i

i =1

n −1

 k

 ∑ d i fi 
 i =1

−
n ( n − 1)

2

Professor Inácio Andruski Guimarães, DSc.
31

Estatística – Notas de Aulas

5.5 – Coeficiente de Variação

É definido como a razão entre o desvio padrão e a média, isto é

CV =

s
x

(5.21)

Exemplo 5.8 – Calcular o coeficiente de variação para os dados do Quadro 5.1.
0 ,5323
CV =
= 0 ,1649 .
3, 2286
5.6 – Exercícios

5.6.1) Seja a distribuição de freqüências dos dados do Quadro 3.1, ou seja:
Classe
1
2
3
4
5
6
7
8
9

Comprimento (mm)
43 |-- 47
47 |-- 51
51 |-- 55
55 |-- 59
59 |-- 63
63 |-- 67
67 |-- 71
71 |-- 75
75 |-- 79
Total

Flores
9
23
19
28
20
23
16
6
6
150

faci
9
32
51
79
99
122
138
144
150

fadi
150
141
118
99
71
51
28
12
6

fri
0,0600
0,1533
0,1267
0,1867
0,1333
0,1533
0,1067
0,0400
0,0400

Ponto médio
45
49
53
57
61
65
69
73
77

Calcular:
1) O desvio padrão.
2) O coeficiente de variação.
5.6.2) Repetir o exercício anterior para os dados da distribuição de teores de ácido palmítico.
Classe
1
2
3
4
5
6
7
8

Teores de Ácido Palmítico (%)
3,8 |-- 5,0
5,0 |-- 6,2
6,2 |-- 7,4
7,4 |-- 8,6
8,6 |-- 9,8
9,8 |-- 11,0
11,0 |-- 12,2
12,2 |-- 13,4
Total (n)

Observações (fi)
9
24
21
8
6
24
21
7
120

Respostas: Desvio padrão: s = 2,6515 ; Coeficiente de variação: CV = 0,3123.
6.

ASSIMETRIA E CURTOSE

Assimetria é o afastamento de uma distribuição em relação a um valor central. Curtose é o
achatamento de uma distribuição.
6.1 – Coeficiente de Assimetria

Já foi visto que uma distribuição de freqüências pode ser assimétrica positiva, negativa ou
simétrica, neste caso também chamada distribuição normal. Os três casos são ilustrados nas figuras a
seguir.

Professor Inácio Andruski Guimarães, DSc.
Estatística – Notas de Aulas

32

Figura 4.1 – Assimetria positiva (Mo < ~ < x ).
x

Figura 4.2 – Assimetria negativa (Mo > ~ > x ).
x

22

Figura 4.3 – Distribuição simétrica (normal) (Mo = ~ = x ).
x
O coeficiente de assimetria de Pearson mede o afastamento que caracteriza o tipo de assimetria.
Este coeficiente é dado por:

ass =

3( x − ~ )
x
.
s

Exemplo 5.1 – Calcular o coeficiente de assimetria para os dados do Quadro 5.1.
Depois de ordenados, os valores ficam:
Quadro 5.1 – Teores de vanádio (ordenados)
Estrato
(1) (2) (3) (4) (5) (6) (7)
Teor (%) 2,7 2,7 2,8 3,1 3,5 3,9 3,9
Fonte: Johnson e Wichern (1988)

A média é x = 3,2286 e o desvio padrão é s = 0,5323. A mediana é ~ = 3,1. Então:
x

Professor Inácio Andruski Guimarães, DSc.

(6.1)
33

Estatística – Notas de Aulas

ass =

3 ( 3 , 2286 − 3 ,1)
= 0 , 7248 .
0 , 5323

6.2 – Coeficiente de Curtose

O coeficiente de curtose mede o achatamento de uma distribuição de freqüências, em
comparação com uma distribuição normal. Na prática só é calculado para distribuições simétricas, ou
muito aproximadamente simétricas. O coeficiente percentílico de curtose é dado por:

C =

P75 − P25
2 ( P90 − P10 )

.

(6.2)

Para uma distribuição normal, o coeficiente de curtose é C = 0,263. Se o valor calculado para C é inferior
a 0,263, diz-se que a distribuição é leptocúrtica (alongada). Se o valor é superior a 0,263, diz-se que a
distribuição é platicúrtica (achatada). As três situações são ilustradas nas Figuras 6.1, 6.2 e 6.3.
70
60
50
40
30
20
10
0

Figura 3.1 – Distribuição leptocúrtica.
45
40
35
30
25
20
15
10
5
0

Figura 3.2 – Distribuição mesocúrtica.

Professor Inácio Andruski Guimarães, DSc.
Estatística – Notas de Aulas

34

30
25
20
15
10
5
0

Figura 3.3 – Distribuição platicúrtica.
A caracterização do tipo de curtose auxilia na avaliação da dispersão dos dados do conjunto.
Uma distribuição leptocúrtica possui dispersão baixa, enquanto uma distribuição platicúrtica possui
dispersão elevada, tomando como referência a dispersão verificada em uma distribuição normal.
6.3 – Exercícios

6.3.1) Seja a distribuição de freqüências para os dados do Quadro 4.1. Isto é,
Classes
1
2
3
4
5
6
7
8

Largura (mm)
20 |-- 23
23 |-- 26
26 |-- 29
29 |-- 32
32 |-- 35
35 |-- 38
38 |-- 41
41 |--| 44
Total

Exemplares
4
15
28
47
31
13
9
3
150

Calcular:
1) O coeficiente de assimetria de Pearson.
2) O coeficiente percentílico de curtose.

Professor Inácio Andruski Guimarães, DSc.
35

Estatística – Notas de Aulas

EXERCÍCIOS DE REVISÃO

O Quadro 6.1 contém os teores de ácido oléico observados em 120 observações de óleos vegetais.
22,3
22,7
22,8
22,9
23,1
23,1
23,2
23,2
24
24,1
24,1
24,4
24,4
24,4
24,5
24,5
24,6
24,6
24,7
24,9

25,1
25,1
25,2
25,3
25,3
25,3
25,5
25,6
25,7
25,7
25,8
25,8
25,9
26
26
26,1
26,1
26,4
26,5
26,7

26,8
27
27,1
27,1
27,1
27,2
27,4
27,8
28,3
28,3
28,3
29,1
29,4
29,5
29,6
29,6
29,8
29,9
30,3
30,4

30,4
31
31,1
31,1
31,1
31,1
31,1
31,7
31,7
31,8
31,8
32,1
32,6
32,9
33,6
33,6
33,9
34
34,4
34,5

34,8
34,9
35
35
35
35,2
35,2
35,2
35,4
35,8
37,4
37,7
38,4
39,3
39,7
40,1
41,4
43
43,3
45,7

52,2
53,2
54,6
55,5
55,9
56,6
57,2
58
58,2
59
59,1
59,2
59,2
59,3
61,6
61,8
62,6
64,9
77,8
80,6

Construir uma distribuição de freqüências para os dados.
Traçar o histograma.
Calcular a média aritmética.
Calcular a mediana.
Calcular a moda.
Tanto a mediana como a moda podem ser obtidas diretamente no Quadro 6.1. Comparar os
valores encontrados pela observação direta com os valores obtidos pelas fórmulas, nos exercícios
4 e 5.
7) Calcular o desvio padrão.
8) Estudar a assimetria da distribuição.
9) O cálculo do coeficiente de curtose é justificado para este conjunto de dados ? Por quê ?
1)
2)
3)
4)
5)
6)

Algumas respostas:
1) Amplitude total: R = 58,3; Número de classes: k = 1 + 3,3log(120) = 8 ; Amplitude de classe
(R/n) : h = 7,3.

Professor Inácio Andruski Guimarães, DSc.
36

Estatística – Notas de Aulas

7.

TEORIA DA PROBABILIDADE

As mais freqüentes aplicações da estatística envolvem processos de tomada de decisões sob
condições de incerteza. Este tipo de situação ocorre, por exemplo, em processos de inspeção de qualidade.
Aqui o tomador de decisões deve decidir, após inspecionar uma amostra, se um lote de certo produto está
conforme parâmetros de qualidade previamente definidos. Neste caso a incerteza decorre de fatores como
tamanho da amostra, representatividade da mesma e método de inspeção, entre outros. Esta incerteza é
tratada pela estatística com o auxílio da teoria da probabilidade. Na seqüência apresenta-se uma breve
revisão dos principais conceitos envolvidos no estudo desta teoria.
7.1 – Teoria dos Conjuntos
7.1.1 – Conjunto.

É o termo empregado para designar uma lista, ou coleção, bem definida de elementos. Um
conjunto é representado por letra maiúscula, enquanto seus elementos são representados por letras
minúsculas. Se um elemento x pertence a um conjunto C, escreve-se x ∈ C . Caso contrário, x ∉ C .
Diz–se que um conjunto A está contido em outro conjunto B, se todos os elementos de A
pertencem também ao conjunto B. Neste caso escreve-se A ⊂ B , ou B ⊃ A . A negação para a
primeira representação é A ⊄ B .
Há duas formas de se representar um conjunto. Pode-se listar os seus elementos ou utilizar uma
representação gráfica conhecida como Diagrama de Venn. Seja por exemplo o conjunto C, de todos os
resultados observáveis no lançamento de um dado. Então:
C={1,2,3,4,5,6}
1

2

3

4

5

6

Se um conjunto V não possui quaisquer elementos, diz-se que o mesmo é vazio. Neste caso podese representar como V = { } ou V = Ø.
7.1.2 – Operações com Conjuntos

Sejam A, B e C três conjuntos arbitrários. São definidas as seguintes operações:
7.1.2.1 – União

A união dos conjuntos A e B é o conjunto formado por todos os elementos que pertencem a A ou
a B.

A ∪ B = {x : x ∈ A ∨ x ∈ B} .
Exemplo 7.1 – Seja os conjuntos A = {1,2,3,4,5,6,7,8,9} e B = {7,8,9,10,11,12}. Então a união de A e B
resulta no conjunto A ∪ B = {1,2,3,4,5,6,7,8,9,10,11,12} .
7.1.2.2 – Intersecção

A intersecção dos conjuntos A e B é o conjunto formado por todos os elementos que pertencem a
A e a B.

A ∩ B = {x ∈ A ∧ x ∈ B} .
Exemplo 7.2 – A intersecção dos conjuntos A e B do exemplo anterior resulta no conjunto
A ∩ B = {7,8,9} .

Professor Inácio Andruski Guimarães, DSc.
Estatística – Notas de Aulas

37

7.1.2.3 – Diferença

A diferença dos conjuntos A e B é o conjunto de elementos de que pertencem ao conjunto A, mas
não ao conjunto B.

A  B = {x : x ∈ A ∧ x ∉ B} .
Se A ⊂ B , diz-se que B  A é o complemento de A em relação a B.

B

A

Exemplo 7.3 – A diferença dos conjuntos A e B dos exemplos anteriores resulta no conjunto

A  B = {1,2,3,4,5,6} .
Exemplo 7.4 – Sejam os conjuntos X = {2,3,4,5,6,7} e Y = {4,5,6}. Então o complemento de Y em relação
a X é X  Y = {2,3,7}.
7.1.3 – Conjuntos Finitos e Enumeráveis

Diz-se que um conjunto A é finito quando é formado por n elementos, onde n é um número
inteiro positivo. Diz-se que um conjunto é enumerável quando é possível atribuir uma seqüência aos seus
elementos.
Exemplo 7.5 – Seja X o conjunto de todos os possíveis resultados observáveis no lançamento de um dado.
Neste caso, X = {1,2,3,4,5,6} é finito e enumerável.
Exemplo 7.6 – Seja I o conjunto de todos os números reais compreendidos entre 0 e 1. Então o conjunto
dado por I = {x : 0 < x < 1} não é finito e nem enumerável.
Exemplo 7.7 – Seja P o conjunto de todos os números inteiros positivos ímpares. Então o conjunto dado
por P = {1,3,5,...} é infinito e enumerável.
7.1.4 – Produto Cartesiano

Sejam dois conjuntos, A e B. O produto cartesiano de A e B, representado por A × B é o conjunto
de todos os pares ordenados (x , y) onde x pertence a A e y pertence a B.

A × B = {( x, y ) : x ∈ A ∧ y ∈ B}
Exemplo 7.8 – Sejam os conjuntos A = {2,4,6} e B = {5,7}. Então o produto cartesiano é o conjunto dado
por A × B = {(2,5) , (2,7) , (4,5) , (4,7) , (6,5) , (6,7)}.
7.1.5 – Classes

Há situações nas quais os elementos de um conjunto também são conjuntos. Seja por exemplo o
conjunto dos números naturais, IN. O subconjunto de todos os múltiplos de 7 forma um conjunto. Seja um
conjunto A. Uma classe de A é um conjunto de subconjuntos de A.
Exemplo 7.9 – Seja o conjunto A = {1,2,3,4,5,6,7,8,9,10}. Algumas classes de A são dadas por:
[{1,3,5,7,9} , {2,4,6,8,10} , {1,2,3,4}] , [{1,3,5} , {7,9} , {2,4} , {6,8,10}] , [{1},{3},{5},{7},{9}].

Professor Inácio Andruski Guimarães, DSc.
Estatística – Notas de Aulas

38

7.1.5.1 – Classe Indexada

Em algumas situações utiliza-se a expressão classe indexada de conjuntos, cuja notação
geralmente é { Ai : i ∈ I } . Neste caso deseja-se esclarecer que a cada elemento i de I corresponde um
conjunto A i . O conjunto I é chamado conjunto dos índices, e os conjuntos A i são os conjuntos indexados
por I. Quando I é subconjunto do conjunto IN, dos números naturais, a classe indexada {A1 , A2 , ... } é
chamada seqüência de conjuntos.
O conjunto de elementos, cada um dos quais pertencente a pelo menos um conjunto A i , é
chamado união dos A i , e pode ser representado por U i∈I Ai .
O conjunto de elementos, cada um dos quais pertencente a todos os conjuntos A i , é chamado
intersecção dos A i , e pode ser representado por I i∈I Ai .
7.1.6 – Partição

Seja um conjunto A. Uma partição é uma classe de subconjuntos não vazios e disjuntos deste
conjunto.
Exemplo 7.10 – Seja o conjunto D = {2,3,4,5,7,8,9}. Uma partição de D é [{2,3,4} , {5,7} , {8,9}]. Por
outro lado, a classe [{2,3,4} , {4,5,7} , {8,9}] não é uma partição, pois o elemento “4” pertence a dois
subconjuntos.
7.1.7 – σ – Álgebra

Sejam um conjunto A e uma classe A não vazia de subconjuntos de U i∈I Ai . Diz-se que A é
uma σ – álgebra se:
1.
2.

O complemento de qualquer conjunto de A pertence a A.
A união de um número finito, e enumerável, de conjuntos de A pertence a A.

7.2 – Técnicas de Contagem

De acordo com o princípio fundamental da contagem, se um procedimento pode ser executado
de m modos possíveis, e um segundo procedimento pode ser executado de n modos possíveis, então o
número de modos pelos quais é possível executar os dois procedimentos é m.n .
Exemplo 7.11 – Seja um experimento que consiste em lançar um dado e, na seqüência, uma moeda. Então
o número de possíveis resultados é 6.2 = 12.
Exemplo 7.12 – Quantas placas com três letras seguidas de quatro algarismos podem ser confeccionadas,
sabendo que nenhuma placa possui quatro algarismos iguais a zero ?
Neste caso pode-se considerar que há 26 letras disponíveis (incluindo k, w e y) e 10 algarismos, 0 , ... , 9.
Como nenhuma placa pode ter quatro algarismos iguais a zero, para a última posição há nove algarismos
possíveis. Então o total de placas possíveis é: 26 × 26 × 26 × 10 × 10 × 10 × 9 = 158 184 000
7.2.1 – Fatorial

Seja n um número inteiro positivo. O fatorial de n é dado por:

n! = n( n − 1)( n − 2)...1 .
É possível demonstrar que 0 ! = 1.
Exemplo 7.13 – 5 ! = 5.4.3.2.1 = 120 ; 8 ! / 6 ! = (8.7.6 !) / 6 ! = 8.7 = 56.

Professor Inácio Andruski Guimarães, DSc.

(7.1)
39

Estatística – Notas de Aulas

7.2.2 – Coeficiente Binomial

Sejam dois números inteiros positivos n e p, tais que p ≤ n. Então o coeficiente binomial de n
sobre p é dado por:

n 
n!
 =
 p  p ! (n − p) !
 

.

(7.2)

7!
7!
7 . 6 . 5! 7 . 6
42
Exemplo 7.14 –  7  =
 
 5  5! ( 7 − 5 )! = 5! 2! = 5! 2 . 1 = 2 . 1 = 2 = 21
 
Propriedades:

n

P1 :   = 1 .
0

 
n

P2 :   = n .
1 

 

n

P3 :   = 1 .
n

 

n  n
 =  .
  
 p q

P4: Se p + q = n , então 

7.2.3 – Permutação

A disposição dos elementos de um conjunto seguindo certa ordem é chamada permutação. O
total de permutações que pode efetuar com n elementos é dado por

Pn = n !

.

(7.3)

Exemplo 7.15 – Seja o conjunto X = {2,4,6}. As possíveis permutações com os três elementos são:
246 , 426 , 462 , 264 , 624 , 642. Total: 3 ! = 3.2.1 = 6.
7.2.4 – Arranjo

Sejam n elementos. Uma permutação de p, p ≤ n, destes elementos, de acordo com determinada
ordem, é denominada arranjo. O número de arranjos de n elementos, tomados p a p, é dado por:

An , p =

n!
.
(n − p) !

(7.4)

Exemplo 7.16 – Sejam os algarismos 1 , 2 , ... , 8 , 9. Quantos números com três dígitos podem ser
formados a partir dos algarismos dados ?

A9 , 3 =

9! 9 .8 .7 .6!
=
= 9 .8 .7 = 504 .
6!
6!

OBS: Alguns autores não fazem distinção entre permutação e arranjo, preferindo utilizar apenas a
primeira expressão.

Professor Inácio Andruski Guimarães, DSc.
Estatística – Notas de Aulas

40

7.2.5 – Permutação com Repetição

Há situações nas quais alguns dos n elementos com os quais deseja-se efetuar um arranjo são
iguais. Então, se n1 , n2 , ... , nr são iguais, o número de permutações é dado por:

n!
n1! n2 !... n r !

.

(7.5)

Exemplo 7.17 – De quantos modos é possível arranjar as letras da palavra PARANÁ ?
6!
6 .5 .4 .3 !
=
= 120
3!
3!

7.2.6 – Combinação

Sejam n elementos. Uma disposição de p, p ≤ n, destes elementos, sem levar em consideração a
ordem, é denominada combinação. O número de combinações de n elementos, tomados p a p, é dado por:

n 
Cn , p =   .
 p
 

(7.6)

Exemplo 7.18: Sejam os algarismos 1 , 2 , ... , 8 , 9. Quantas combinações com três dígitos podem ser
formadas a partir dos algarismos dados ?
Neste caso considera-se que 567 e 675, por exemplo, são uma só combinação, já que a ordem é
irrelevante. Então o total de combinações é dado por:

C 9 ,3 =

9!
9 . 8 .7 .6!
=
= 84 .
3 ! 6 ! 3 . 2 .1 .6!

7.2.7 – Exercícios

7.2.7.1) Arme e efetue:
a) 6 !
b) 8 !

8 
 
 6
 
8 
d)  
 2
 
c)

e)

7
 
5
 
7
 
 2
 

7.2.7.2) Uma loteria consiste em 60 números, numerados de 1 a 60, entre os quais o apostador deve
escolher seis. De quantos modos é possível escolher os seis números ?
7.2.7.3) Quantos anagramas é possível formar com as letras da palavra ESTATÍSTICA ?
7.2.7.4) Um baralho completo possui 52 cartas, divididas em quatro grupos iguais (naipes). Deste baralho
são retiradas cinco cartas. Quantos resultados são possíveis ?

Professor Inácio Andruski Guimarães, DSc.
41

Estatística – Notas de Aulas

7.3 – Introdução à Probabilidade

As origens da teoria da probabilidade remontam a meados do século 17. Os conceitos
fundamentais, como probabilidade e esperança matemática, surgiram nas correspondências trocadas
entre Pascal e Fermat, e que geralmente tratavam de jogos de azar. De acordo com Gnedenko (1962), as
questões então levantadas não faziam parte do escopo da matemática da época. O desenvolvimento da
teoria da probabilidade, observado nos séculos subseqüentes, foi impulsionado em grande parte pelas
necessidades das ciências naturais. A abordagem matemática, caracterizada pelo rigor formal, teve início
em meados do século 19, prolongando-se até meados do século 20. As aplicações da teoria da
probabilidade podem ser observadas em praticamente qualquer área de pesquisa, seja através da
modelagem de experimentos aleatórios, ou através da aplicação de testes estatísticos fundamentados em
conceitos da mencionada teoria.
Embora não haja uma definição formal para o termo probabilidade, pode-se entender que o
mesmo designa o estudo de experimentos aleatórios, isto é, experimentos cujos resultados estão sujeitos
ao acaso. Alguns conceitos necessários ao referido estudo são apresentados a seguir.
7.3.1 – Espaço Amostral e Evento

Seja um experimento aleatório realizado sob condições fixas. Chama-se espaço amostral do
experimento o conjunto
de todos os resultados observáveis para o experimento. Chama-se evento a
qualquer subconjunto E, de . Vale lembrar que um espaço amostral pode conter mais de um evento.
Neste caso é possível combinar eventos através de operações com conjuntos, isto é:
1.
2.

Evento união: A ∪ B .
Evento intersecção: A ∩ B .

3.

Evento complementar: A

C

(só ocorre quando A não ocorre).

Exemplo 7.19 – Um exemplo de experimento aleatório é o lançamento de um dado. Neste caso o espaço
amostral correspondente é o conjunto = {1 , 2 , 3 , 4 , 5 , 6}. Um exemplo de evento é o subconjunto de
dado por E = {2 , 4 , 6}, que corresponde ao resultado “número par”.
Exemplo 7.20 – Imagine-se que um experimento aleatório consiste em registrar o tempo t, em horas, entre
falhas apresentadas por determinado equipamento. Então = {t ∈ IR ; 0 < t}. Não é difícil perceber que
este espaço amostral contém resultados claramente impossíveis. Entretanto, na definição de um espaço
amostral, deve-se ter a preocupação de definir um conjunto que contenha todos os possíveis resultados
para o experimento aleatório em questão. Neste sentido, a escolha do conjunto acima é bastante adequada.
7.3.1.1 – Eventos Mutuamente Exclusivos

Sejam A e B eventos de um espaço amostral
exclusivos se, e somente se, A e B são disjuntos.

. Diz-se que A e B são eventos mutuamente

Exemplo 7.21 – O espaço amostral associado ao lançamento de um dado é = {1 , 2 , 3 , 4 , 5 , 6}. Não é
difícil perceber que os eventos A = {número par} = {2 , 4 , 6} e B = {número ímpar} = {1 , 3 , 5} são
mutuamente exclusivos.
7.3.2 – Enfoques

Para a formalização do conceito de probabilidade pode-se adotar um de três enfoques:
7.3.2.1 – Enfoque Clássico

Também conhecido como definição clássica de probabilidade, estabelece que, se
amostral finito, então a probabilidade de qualquer evento E, contido em , é dada por

P( E ) =

# (E)
# (Ω )

.

Professor Inácio Andruski Guimarães, DSc.

é um espaço

(7.8)
Estatística – Notas de Aulas

42

7.3.2.2 – Enfoque Relativo

De acordo com este enfoque, a probabilidade de um evento E é dada pela razão entre o total de
ocorrências do evento e o total de observações. De outra forma, a probabilidade de ocorrência é igual à
proporção de “sucessos”. Neste caso o cálculo da probabilidade está baseado na coleta de observações,
razão pela qual este enfoque também é denominado enfoque empírico.
Exemplo 7.22 – Se, numa entrevista com 200 eleitores, observou-se que 120 pretendem votar em
determinado candidato, então a probabilidade encontrar um eleitor daquele candidato é p = 0,6.
7.3.2.3 – Enfoque Subjetivo

Também chamado personalístico, é baseado no “grau de crença” na ocorrência do evento em
questão. Atualmente, é muito aplicado à tomada de decisões em finanças e mercado de capitais, por
exemplo.
7.3.3 – Axiomas de Probabilidade

A1: Para qualquer evento E de um espaço amostral

: 0 ≤ P(E) ≤ 1.

A2: P( ) = 1.
A3: Se A e B são eventos mutuamente exclusivos, então P ( A ∪ B ) = P ( A) + P ( B ) .
7.3.4 – Teoremas de Probabilidade
C

T1: P ( A ) = 1 − P ( A) .

T2: A ⊂ B ⇒ P ( A) ≤ P ( B ) .

T3: P ( A  B ) = P ( A) − P ( A ∩ B ) .

T4: P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B ) .

7.3.5 – Espaço de Probabilidade

Seja um espaço amostral finito, isto é, = {e1 , e2 , ... , en }. Um espaço de probabilidade é o
conjunto P = {p1 , p2 , ... , pn } , obtido ao associar-se a cada ei ∈ um valor pi ∈ IR, denominado
probabilidade de ei , e tal que:
1.

0 ≤ pi , i = 1 , ... , n.
n

2.

∑p

i

= 1.

i =1

Exemplo 7.23 – Uma moeda é lançada três vezes, com o objetivo de observar o número de “caras”,
representado por k.
Espaço amostral:

= {0 , 1 , 2 , 3}

Probabilidades: P(k = 0) = ⅛ ; P(k = 1) = ⅜ ; P(k = 2) = ⅜ ; P(k = 3) = ⅛ .
Então o espaço de probabilidade é: P = { ⅛ , ⅜ , ⅜ , ⅛ }.
Exemplo 7.24 – Um dado é lançado até obter o número 6. O número de lançamentos é representado por x.
Espaço amostral:

= {1 , 2 , 3 , ... , ∞}

Probabilidades: P(x = 1) = 1/6 ; P(x = 2) = (5/6)(1/6) ; P(x = 3) = (5/6)2(1/6) ; ... ; P(x = n) = 5/6n
Espaço de probabilidade: P = {1/6 , 5/36 , 5/216 , ... , 0}.

Professor Inácio Andruski Guimarães, DSc.
43

Estatística – Notas de Aulas

7.3.6 – Eventos Independentes

Sejam A e B dois eventos de um espaço amostral , observados em seqüência. Diz-se que ambos
são independentes quando a ocorrência, ou não, do primeiro não afeta a probabilidade de ocorrência do
outro. Neste caso:

P( A ∩ B) = P ( A).P( B) .

(7.9)

Exemplo 7.25 – Um dado é lançado duas vezes. Qual a probabilidade de obter os resultados 4 e 5 ?

P (4 ∩ 5) =

1 1
1 .
=
6 6
36

7.3.7 – Eventos Dependentes e Probabilidade Condicional

Sejam A e B dois eventos de um espaço amostral . Diz-se que ambos são dependentes quando a
ocorrência, ou não, do primeiro afeta a probabilidade de ocorrência do outro. Neste caso:

P( A ∩ B) = P( A).P( B | A) .

(7.10)

OBS: P(B | A) significa “probabilidade de ocorrência de B após a ocorrência de A”.
Exemplo 7.26 – Uma urna contém seis bolas brancas e quatro bolas vermelhas. São retiradas duas bolas,
sem reposição. Sejam os eventos B1 , bola branca na primeira retirada, e V2 , bola vermelha na segunda
retirada. Neste caso, para calcular a probabilidade de V2 deve-se levar em consideração o resultado da
primeira retirada, isto é:

P (V 2 | B1 ) =

6 4
4
=
10 9 15

ou

P (V 2 | V1 ) =

4 3
2
=
10 9 15

A probabilidade condicional de um evento B ocorrer após a ocorrência de um evento A é dada
por:

P( B | A) =

P( A ∩ B)
.
P ( A)

(7.11)

Exemplo 7.27 – Um dado é lançado duas vezes. Se a soma dos resultados é sete, qual a probabilidade de
que um dos resultados tenha sido quatro ?
= {(1,1) , (1,2) , ... , (1,6) , (2,1) , ... , (2,6) , (3,1) , ... , (3,6) , ... , (1,6) , ... , (6,6)} → #( ) = 36.
S = {a soma é sete} = {(1,6) , (2,5) , (3,4) , (4,3) , (5,2) , (6,1)} →

#(S) = 6.

D = {um dos resultados é quatro} = {(1,4) , (4,1) , (2,4) , ... , (3,4) , (4,3) , ... , (4,6)} → #(D) = 12.
S ∩ D = {(3,4) , (4,3)} → #(S ∩ D) = 2.
2
P (D | S ) =

7.3.7.1 – Comentário

6

36 = 1
3
36

É importante ressaltar que eventos mutuamente exclusivos e eventos independentes não são
necessariamente o mesmo tipo de evento. A primeira expressão é utilizada para situações nas quais
apenas um dos eventos pode ocorrer, excluindo qualquer possibilidade de ocorrência do outro. A segunda
expressão é utilizada quando a ocorrência de um dos eventos não tem qualquer efeito sobre a ocorrência
do outro.

Professor Inácio Andruski Guimarães, DSc.
44

Estatística – Notas de Aulas

7.3.8 – Teorema da Probabilidade Total

Seja um espaço amostral e sejam A1 , A2 , ... , An partições de
de todos os Ai é o próprio espaço . Seja B um evento qualquer de .
A1

A2

A3

A4

, isto é, Ai ∩ Aj = Ø e a união
...

A5

An

B

Então a probabilidade de B é dada por:

P(B) =

n

∑ P( A )P(B | A ) .
i

(7.12)

i

i =1

Exemplo 7.28 – Uma indústria adquire certo componente de três fornecedores, A, B e C. O primeiro é
responsável por 40% da produção e o segundo é responsável por 25% da produção. A proporção de
defeituosos é de 2% para o fornecedor A, 5% para o fornecedor B e 4% para o fornecedor C. Qual a
probabilidade de uma unidade selecionada ao acaso ser defeituosa ?
P(A) = 0,40 , P(B) = 0,25 , P(C) = 0,35. P(D|A) = 0,02 , P(D|B) = 0,05 e P(D|C) = 0,04.
P(D) = P(A)P(D|A) + P(B)P(D|B) + P(C)P(D|C) = (0,40)(0,02) + (0,25)(0,05) + (0,35)(0,04) = 0,0345
7.3.9 – Teorema de Bayes

Seja um espaço amostral e sejam A1 , A2 , ... , An partições de , isto é, Ai ∩ Aj = Ø e a união
de todos os Ai é o próprio espaço . Seja B um evento qualquer de . Então, para qualquer i = 1 , ... , n:

P ( Ai | B ) =

P ( Ai ) P ( B | A i )
n

∑ P( A

j

.

(7.13)

)P(B | A j )

j =1

Exemplo 7.29 – Sejam os dados do exemplo anterior. Se uma peça é defeituosa, qual a probabilidade de
ter sido entregue pelo fornecedor C ?
P (C | D ) =

P (C | D ) =

P (C ) P ( D | C )
P ( A ) P ( D | A ) + P ( B ) P ( D | B ) + P (C ) P ( D | C )

(0,35)(0,04)
0,014
=
= 0,4058
(0,40)(0,02) + (0,25)(0,05) + (0,35)(0,04) 0,0345

7.4 – Exercícios

7.4.1) Um caixa contém 12 unidades de certo componente, sendo três defeituosas. São retiradas três
unidades ao acaso, e sem reposição. Seja X o número de unidades defeituosas obtidas neste experimento
aleatório. Determinar os espaços amostral e de probabilidades.
7.4.2) Dois dados são lançados. Calcular a probabilidade de:
a) Obter dois números diferentes.
b) O segundo resultado ser menor que o primeiro.
c) Pelo menos um dos resultados ser 2.

Professor Inácio Andruski Guimarães, DSc.
45

Estatística – Notas de Aulas

7.4.3) São escolhidos ao acaso, em seqüência e sem reposição, dois números entre 0 e 9. Se a soma é par,
qual a probabilidade de que os dois números sejam ímpares ?
7.4.4) Uma caixa contém quatro bolas brancas e seis bolas pretas. Quatro bolas são retiradas, sem
reposição. Qual a probabilidade de que três sejam pretas ?
7.4.5) Um jogador tem na mão quatro cartas de paus. Se ele deve receber mais duas cartas, qual a
probabilidade de:
a) Ambas serem de paus ?
b) Pelo menos uma ser de paus ?
7.4.6) Em uma indústria de móveis, 7% das unidades apresentam risco na pintura, 5% apresentam
dobradiças soltas e 4% apresentam os dois defeitos. Uma unidade é escolhida aleatoriamente.
a) Se apresenta risco na pintura, qual a probabilidade de também apresentar dobradiças soltas ?
b) Se apresenta dobradiças soltas, qual a probabilidade de também apresentar risco na pintura ?
c) Qual a probabilidade de apresentar risco na pintura ou dobradiças soltas ?
7.4.7) Um lote de 20 unidades de um componente contém quatro unidades defeituosas. Escolhe-se
aleatoriamente uma amostra de cinco unidades do lote. Qual a probabilidade de que a amostra contenha
duas unidades defeituosas ?
7.4.8) Uma loja tem no estoque 12 furadeiras da marca X, das quais duas operam em 220 v, 15 furadeiras
da marca Y, das quais três operam em 220 v e oito furadeiras da marca Z, das quais apenas uma opera em
220 v. Uma furadeira é escolhida ao acaso.
a) Qual a probabilidade de ser da marca X e operar em 220 v ?
b) Se opera em 220 v, qual a probabilidade de ser da marca X ?
7.4.9) Em uma escola, 70% dos alunos são do sexo masculino. Sabe-se também que 20% dos rapazes
usam óculos, o mesmo ocorrendo com 30% das moças. Se um nome é escolhido ao acaso e verifica-se
que usa óculos. Qual a probabilidade de ser uma moça ?
7.4.10) Uma urna contém duas bolas vermelhas e três bolas amarelas. Retira-se uma bola da urna e, na
seqüência coloca-se uma bola da outra cor. Em seguida retira-se outra bola da urna. Qual a probabilidade
desta segunda bola ser branca ?
Respostas

1)

= {0 , 1 , 2 , 3} P(X = 0) = (9/12)(8/11)(7/10) = 504/1320 = 0,3818

P(X = 1) = 0,4909 P(X = 2) = 0,1228 P(X = 3) = 0,0045

P = {0,3818 ; 0,4909 ; 0,1228 ; 0,0045}

3) Se a soma é par, os dois números ou são pares ou são ímpares.
= {(0,1) , ... , (0,9) , (1,0) , (1,2) , ... , (1,9) , (2,0) , (2,1) , (2,3) , ... , (2,9) , ... , (9,0) , ... , (9,8)}
Soma Par = {(0,2) , ... , (0,8) , (1,3) , ... , (1,9) , (2,4) , ... , (2,8) , (3,1) , ... , (3,9) , ... , (9,1) , .... , (9,7)}
Ímpares = {(1,3) , (1,5) , (1,7) , (1,9) , (3,1) , (3,5) , (3,7) , (3,9) , (5,1) , ... , (5,9) , ... , (9,1) , .... , (9,7)}
#(

) = 90

#( Soma Par ) = 40

#( Ímpares ) = 20

P( Ímpares | Soma Par ) = 20/40 = ½

5) a) Se o jogador tem quatro cartas de paus, há 48 cartas na mesa, sendo nove de paus. Então o total de
possíveis resultados é dado por  48  = 1128 . Se há nove cartas de paus, então o total de resultados


 2 



com duas cartas de paus é dado por  9  = 36 . Então p = 36 / 1128 = 0,0319.
 
2
 

Professor Inácio Andruski Guimarães, DSc.
46

Estatística – Notas de Aulas

7) Se a amostra contém cinco unidades, e duas devem ser defeituosas, então três devem ser perfeitas. O
número de possibilidades de encontrar duas defeituosas entre as quatro existentes é dado por  4  = 6 .
 
2
 

As três unidades perfeitas podem ser escolhidas entre as 16 nestas condições. Então o total de
possibilidades é  16  = 560 . Finalmente, o total de possíveis combinações é dado por




 3 

 20

 5



 = 15504 . Então p = (6)(560) / 15504 = 0,2167.



9) O diagrama de árvore fica
Usa óculos
0,20
Rapaz
0,70
0,80

Não usa óculos
Usa óculos

0,30

0,30
Moça
0,70

Não usa óculos

P( Moça | Usa óculos) = 0,09 / 0,23 = 0,3913.

Professor Inácio Andruski Guimarães, DSc.
47

Estatística – Notas de Aulas

8.

VARIÁVEIS ALEATÓRIAS

Sejam um espaço amostral
e um espaço de probabilidade P, associados a um experimento
aleatório. Uma variável aleatória X no espaço de probabilidade é uma função real X(ω): → IR definida
em e tal que [X ≤ x] é um evento aleatório para qualquer x real.
Exemplo 8.1 – Um lote contém 20 unidades de um componente, sendo quatro defeituosas. São retiradas
quatro peças e X representa o número de unidades defeituosas entre as quatro retiradas. Neste caso a
variável X assume seus valores no conjunto = {0 , 1 , 2 , 3 , 4}. O espaço de probabilidade P é dado por
P = {0,3756 ; 0,4623 ; 0,1486 ; 0,0132 ; 0,0002}.
x
P( X = x)

0
0,3756

1
0,4623

As probabilidades acima são dadas por:

2
0,1486

3
0,0132

P ( X = 0) =

4
0,0002

Total
1

16 15 14 13
43680
=
= 0 ,3756
20 19 18 17 116280

P ( X = 1) = 4

16 15 14 4
= 0 , 4623
20 19 18 17

P ( X = 2) = 6

P ( X = 3) = 4

16 4 3 2
= 0, 0132
20 19 18 17

P ( X = 4) =

16 15 4 3
= 0,1486
20 19 18 17

4 3 2 1
= 0, 0002
20 19 18 17

Propriedades

Sejam X e Y variáveis aleatórias em um espaço

. Então:

P1: (X + Y )(ω) = X(ω) + Y(ω)

P2: (kX )(ω) = kX (ω)

P3: (X + k )(ω) = X(ω) + k

P4: (XY )(ω) = X (ω) Y (ω)

8.1 – Tipos de Variáveis Aleatórias

São considerados dois tipos de variáveis aleatórias, discreta e contínua, ambos definidos a
seguir.
8.1.1 – Variável Aleatória Discreta

Seja X uma variável aleatória definida no espaço amostral . Diz-se que X é uma variável
aleatória discreta (v.a.d.) se assume um número finito, ou enumerável, de valores. De outro modo, X é
discreta se existe um conjunto enumerável {x1 , x2 , ... , xn }, contido em IR, tal que X(ω) ∈ {x1 , ... , xn },
para qualquer ω ∈ .
Exemplo 8.2 – A variável aleatória X do exemplo anterior é discreta.
8.1.2 – Variável Aleatória Contínua

Seja X uma variável aleatória definida no espaço amostral . Diz-se que X é uma variável
aleatória contínua (v.a.c.) se assume seus valores em um intervalo de números reais.
Exemplo 8.3 – Seja t a variável aleatória que representa o tempo entre duas falhas consecutivas
apresentadas por um equipamento. Neste caso t é uma variável aleatória contínua, e = {t ∈ IR ; 0 ≤ t }.
8.2 – Função de Probabilidade

Seja X uma variável aleatória discreta no espaço amostral , tal que X(ω) ∈ {x1 , x2 ,... , xn },
para qualquer ω ∈ . Diz-se que p (x) é uma função de probabilidade (f.p.) de X se:

Professor Inácio Andruski Guimarães, DSc.
48

Estatística – Notas de Aulas

1.

p (xi ) = P( X = xi ).

2.

p(xi ) ≥ 0 .

3.

∑ p( x ) = 1

n

i

i =1

Exemplo 8.4 – Seja X a v.a.d. que indica o total de resultados iguais a 6, obtidos em cinco lançamentos de
um dado. Então X ∈ {0 , 1 , 2 , 3 , 4 , 5}. As probabilidades são dadas por:
P(X = 0) = C5 , 0 (1/6)0 (5/6)5 = 0,4019

P(X = 1) = C5 , 1 (1/6)1 (5/6)4 = 0,4019
x

Não é difícil verificar que: 1) P ( X = x ) = p ( x ) = C 5 , x  1   5 
   

5− x

6 6

3)

6

∑
i =1

 5

x
 i

x

 1  i  5 
   
 6
   6 

5 − xi

= (1)

...

. 2) p ( xi ) ≥ 0 .

55
54
53
52
5
1
7776
+ ( 5 ) 5 + (10 ) 5 + (10 ) 5 + ( 5 ) 5 + (1 ) 5 =
= 1.
5
7776
6
6
6
6
6
6

8.3 – Função Densidade de Probabilidade

Seja X uma variável aleatória contínua em um espaço amostral
densidade de probabilidade (f.d.p.) se:

. Diz-se que f (x) é uma função

1. f ( xi ) ≥ 0 .
x2

∫ f ( X )dX

2. P ( x1 ≤ X ≤ x 2 ) =

x1
+∞

3.

∫ f ( X )dX = 1

−∞

Exemplo 8.5 – Sejam uma v.a.c. X , 0 ≤ X e a função f ( X ) = e – X . A função dada é uma f.d.p., pois:
1. f ( xi ) ≥ 0
x2

∫e

2. P ( x1 ≤ X ≤ x 2 ) =

−X

dX = −e − x2 + e − x1 .

x1
+∞

2.

∫e

−X

dX = − e − X

0

+∞

0

=1

8.4 – Expectância

A expectância, também chamada esperança, valor esperado ou valor médio, de uma variável
aleatória X é dada por:
n

1. E ( X ) =

µ X = ∑ xi p ( x i ) , se X é uma variável aleatória discreta.

(8.1)

i =1
+∞

2. E ( X ) =

µX =

∫ Xf ( X )dX

, se X é uma variável aleatória contínua.

−∞

Professor Inácio Andruski Guimarães, DSc.

(8.2)
49

Estatística – Notas de Aulas

Propriedades

Sejam X e Y variáveis aleatórias definidas em um mesmo espaço amostral
P1: E(kX ) = kE(X )

P2: E(X + k) = E( X ) + k

, k um número real. Então:

P3: E(X + Y ) = E(X ) + E(Y ) P4: E(XY) = E(X)E(Y)

Exemplo 8.6 – Seja X a variável aleatória do exemplo 8.1. Então a sua expectância é calculada como:
x
P( X = x)
xP(X = x)

0
0,3756
0

1
0,4623
0,4623

2
0,1486
0,2972

3
0,0132
0,0396

4
0,0002
0,0008

Total
1
0,7999

E (X ) = 0,7999
Exemplo 8.7 – Sejam a variável aleatória e a função densidade de probabilidade dadas no exemplo 8.5.
Então:
∞

E(X ) =

∫ xe

−x

dx = Γ ( 2 ) = 1 .

0

8.5 – Variância

A variância de uma variável aleatória X é dada por:
1. Var [ X ] = σ

2

n

=

∑ [x

i

− E ( X )] 2 p ( x i ) , se X é uma variável aleatória discreta.

(8.3)

i =1

+∞

2. Var [ X ] = σ

2

=

∫ [ X − E ( X )]

2

f ( X ) dX , se X é uma variável aleatória contínua.

(8.4)

−∞

Propriedades

Sejam X e Y variáveis aleatórias definidas em um mesmo espaço amostral

, k um número real. Então:

P2: Var(kX) = k2 Var(X)

P1: Var(X + k) = Var(X) .
A variância também pode ser calculada através da fórmula:

Var [ X ] = E ( X 2 ) − [ E ( X )] 2 .
Na fórmula (8.5): E ( X 2 ) =

n

∑x

2
i

p ( xi ) , para v.a.d. e E ( X 2 ) =

i =1

(8.5)
+∞

∫X

2
i

f ( X ) dX , para v.a.c..

−∞

Exemplo 8.8 – Seja X a variável aleatória do exemplo 8.1. Então a sua variância é calculada como:
x
P( X = x)
x2 P(X = x)

0
0,3756
0

1
0,4623
0,4623

2
0,1486
0,5944

3
0,0132
0,1188

4
0,0002
0,0032

Total
1
1,1787

Então: Var[X] = 1,1787 – (0,7999)2 = 0,5389.
Exemplo 8.9 – Sejam a variável aleatória e a função densidade de probabilidade dadas no exemplo 8.5.
Então:
∞

E(X 2) =

Logo, Var[X] = 2 – 12 = 1.

∫x

2

e − x dx = Γ ( 3 ) = 2 ! = 2 .

0

Professor Inácio Andruski Guimarães, DSc.
50

Estatística – Notas de Aulas

8.6 – Distribuição Conjunta

Sejam duas variáveis aleatórias, X e Y, definidas em um espaço amostral , e com os
contradomínios X(ω) = {x1 , ... , xn } e Y(ω) = {y1 , ... , ym }. Seja também o produto cartesiano dado por:

X (ω ) × Y (ω ) = {( x1 , y1 ),..., ( x n , y m )} .
Chama-se distribuição conjunta, ou função de probabilidade conjunta de X e Y a função definida por:

H ( x i , y j ) = P ( X = xi ; Y = y j )

.

(8.6)

Se X e Y são variáveis aleatórias discretas:
1. H ( xi , y j ) ≥ 0 .
n

2.

m

∑∑ H ( x , y
i

j

) = 1.

i =1 j =1

3. P ( X = xi ; Y = y j ) = H ( xi , y j ) .
Se X e Y são variáveis aleatórias contínuas:
1. H ( X , Y ) ≥ 0 .
+∞ +∞

2.

∫ ∫ H ( X , Y )dXdY = 1 .

− ∞− ∞
x2 y 2

3. P ( x1 ≤ X ≤ x 2 ; y1 ≤ Y ≤ y 2 ) =

∫ ∫ H ( X , Y )dYdX

x1 y1

Para a função (8.6) há um espaço de probabilidades. Tais probabilidades podem ser apresentadas
em tabelas, ou quadros, de dupla entrada.
Tabela 8.1 – Distribuição de Probabilidade Conjunta.
Y
y1
y2
...
ym
H(x1 , y1)
H(x1 , y2)
...
H(x1 , ym)
H(x2 , y1)
H(x2 , y2)
...
H(x2 , ym)
...
...
...
...
H(xn , y1)
H(xn , y2)
...
H(xn , ym)
g(y1)
g(y2)
...
g(ym)

X

x1
x2
...
xn
Total

Total

f(x1)
f(x2)
...
f(xn )
1

Na Tabela 8.1 as funções f e g são chamadas distribuições marginais, e são definidas por:
1. f ( x i ) =

m

∑ H (x , y
i

n

j

)

g ( y j ) = ∑ H ( x i , y j ) , para X e Y discretas.

j =1

i =1

+∞

2. f ( x ) =

∫ H ( x, y )dy

+∞

g ( y) =

−∞

∫ H ( x, y )dx

, para X e Y contínuas.

−∞

8.7 – Independência de Variáveis

Sejam X e Y duas variáveis aleatórias definidas em um espaço amostral , com os
contradomínios X(ω) = {x1 , ... , xn } e Y(ω) = {y1 , ... , ym }, e com distribuição conjunta H(xi , yj). Diz-se
que X e Y são variáveis aleatórias independentes se, e somente se:

Professor Inácio Andruski Guimarães, DSc.
51

Estatística – Notas de Aulas

H ( xi , y j ) = f ( xi ) g ( y j ) .
Exemplo 8.10 – Um experimento aleatório consiste em lançar uma moeda e retirar uma carta de um
baralho. Sejam as variáveis aleatórias X , resultado observado na moeda(0 = cara e 1 = coroa), e Y , naipe
da carta retirada (1 = paus, 2 = ouro, 3 = copas, 4 = espada). Então o espaço de probabilidades é:
X

0
1
Total

Y

1
⅛
⅛
¼

2
⅛
⅛
¼

3
⅛
⅛
¼

4
⅛
⅛
¼

Total

½
½
1

Neste caso as variáveis são independentes, pois H(xi , yj) = f(xi )g(yj ).
8.7.1 – Expectância

Sejam X e Y duas variáveis aleatórias definidas em um espaço amostral , com os
contradomínios X(ω) = {x1 , ... , xn } e Y(ω) = {y1 , ... , ym }, e com distribuição conjunta H(xi , yj). A
expectância do produto de X e Y é dada por:
n

1. E ( XY ) =

µ XY = ∑ xi y j H ( xi , y j )

, se X e Y são variáveis aleatórias discretas.

(8.7)

i =1

+∞ +∞

2. E ( XY ) =

∫ ∫ XYH ( X , Y )dXdY

µ XY =

, se X e Y são variáveis aleatórias contínuas.

(8.8)

− ∞− ∞

8.7.2 – Covariância

Sejam X e Y duas variáveis aleatórias definidas em um espaço amostral , e com os
contradomínios X(ω) = {x1 , ... , xn } e Y(ω) = {y1 , ... , ym }, e com expectâncias µX e µY , respectivamente.
Além disto, considere-se que a distribuição conjunta das duas variáveis é H(xi , yj). Então a covariância
de X e Y é dada por:
n

m

Cov( X , Y ) = ∑∑ [ xi − µ X ][ y j − µY ]H ( xi , y j ) , para X e Y discretas.

(8.9)

i =1 j =1
+∞ +∞

Cov ( X , Y ) =

∫ ∫ (X − µ

X

)(Y − µ Y ) H ( X , Y )dXdY , para X e Y contínuas.

(8.10)

− ∞− ∞

A covariância também pode ser calculada por:

Cov ( X , Y ) = E ( XY ) − E ( X ) E (Y ) .

(8.11)

8.7.3 – Correlação

Sejam X e Y duas variáveis aleatórias definidas em um espaço amostral , e com os
contradomínios X(ω) = {x1 , ... , xn } e Y(ω) = {y1 , ... , ym }, e com variâncias σ2X e σ2Y, respectivamente.
O coeficiente de correlação de X e Y é a medida da relação linear entre as duas variáveis, e é dado por:

ρ ( X ,Y ) =

Cov ( X , Y )

σ

2
X

.

(8.12)

σ Y2

O coeficiente de correlação ρ pertence ao intervalo real [– 1 ; 1] . Se ρ = 1 ou ρ = – 1, a relação é perfeita,
e neste caso Y = aX + b , onde a e b são números reais. Quanto maior a independência entre as variáveis
X e Y, mais próximo de zero é o valor de ρ.

Professor Inácio Andruski Guimarães, DSc.
52

Estatística – Notas de Aulas

Exemplo 8.11 – Um experimento aleatório consiste em lançar uma moeda três vezes e anotar os
resultados. Sejam as variáveis aleatórias X = número de caras e Y é definida como: Y = 1, se o primeiro
resultado é cara, ou Y = 0, se o primeiro resultado é coroa.
Espaço amostral
{1,1,1}
{1,1,0}
{1,0,1}
{0,1,1}
{0,0,1}
{0,1,0}
{1,0,0}
{0,0,0}

Probabilidade
0,125
0,125
0,125
0,125
0,125
0,125
0,125
0,125

X
3
2
2
2
1
1
1
0

Y
1
1
1
0
0
0
1
0

A distribuição conjunta é dada por:
X

Y

0
1
Total

0
0,125
0
0,125

1
0,25
0,125
0,375

2
0,125
0,25
0,375

3
0
0,125
0,125

Total

0,5
0,5
1

É possível notar que as variáveis não são independentes. Por exemplo: P(X = 0;Y = 0) ≠ P(X = 0)P(Y = 0).
As expectâncias são: µ X = 0 1 + 1 3 + 2 3 + 3 1 = 12 = 1,5
8
8
8
8
8

e

µY = 0

4
4
4
+ 1 = = 0 ,5 .
8
8
8

A expectância do produto é: E ( XY ) = ( 0 )( 0 )( 0 ,125 ) + (1)( 0 )( 0, 25 ) + ... + ( 3)(1)( 0,125 ) = 1
Nota-se que E(XY) ≠ E(X)E(Y) .
As variâncias são: σ

2
X

=

12 9
− = 0 , 75
4
4

e

σ Y2 =

1 1
− = 0 , 25 .
2 4

A covariância é: Cov ( X , Y ) = 1 − (1,5 )( 0 ,5 ) = 0 , 25 .
O coeficiente de correlação é:

ρ =

0 , 25
1, 5 0 ,5

= 0 , 2887 .

8.8 – Função Distribuição Acumulada

Seja uma variável aleatória X, discreta ou contínua, definida no espaço amostral , e tal que
X(ω) ∈ {x1 ,... , xn }, para qualquer ω ∈ . Chama-se função de distribuição acumulada a função dada
por:
i

1. F ( xi ) =

∑ f ( x ) . Se X é uma variável aleatória discreta.
i

j =1
x

2. F ( x) =

∫ f (t )dt . Se X é uma variável aleatória contínua.
−∞

Em qualquer dos casos:
P1: se a ≤ b, então F(a) ≤ F(b).

Professor Inácio Andruski Guimarães, DSc.
53

Estatística – Notas de Aulas

P2: lim F ( x) = 0
x → −∞

e

lim F ( x) = 1 .

x → +∞

Exemplo 8.12 – Seja X a variável aleatória do exemplo 8.1.
x
P( X = x)
x2 P(X = x)

0
0,3756
0

1
0,4623
0,4623

2
0,1486
0,5944

3
0,0132
0,1188

4
0,0002
0,0032

Total
1
1,1787

F(3) = P(X ≤ 3) = 0,3756+ 0,4623 + 0,0132 = 0,9997.
Exemplo 8.13 – Sejam a variável aleatória e a função densidade de probabilidade dadas no exemplo 8.5.
Então:
3

F (3) =

∫e

−x

dx = − e − x | 3 = − e − 3 + e 0 = 0 , 9502 .
0

0

8.9 – Exercícios,

8.9.1) Seja x uma variável aleatória contínua, e seja a função dada por:
1
 x , 0 ≤ x ≤ 3
f (x) =  k
 0 , outro caso .


a)
b)
c)
d)
e)

Se f é uma função densidade de probabilidade, qual o valor de k ?
Qual a expectância ?
Qual a variância ?
Calcular P(1 ≤ x ≤ 2).
Calcular a função de distribuição acumulada.

8.9.2) Seja X uma variável aleatória discreta, com a distribuição de probabilidade mostrada no quadro a
seguir.
X
P(X)

0
0,12

1
0,24

2
0,28

3
0,18

4
0,10

5
0,08

a) Qual a expectância ?
b) Qual a variância ?
c) Calcular P(0 ≤ x ≤ 3).
8.9.3) Um experimento aleatório consiste em lançar um dado e observar o resultado. Há duas variáveis
aleatórias associadas a este experimento: X, que é igual ao dobro do resultado, e Y, que vale 1 (um)
quando o resultado é um número primo e 0 (zero) quando não é primo.
a)
b)
c)
d)
e)
f)
g)

Definir o espaço amostral.
Definir os espaços X(ω) e Y(ω).
Definir o espaço de probabilidade conjunta.
Verificar se as duas variáveis são independentes.
Calcular a expectância e a variância para X.
Idem para Y.
Calcular o coeficiente de correlação para X e Y.

8.9.4) Seja o experimento aleatório do exercício anterior e seja Z a variável aleatória que é igual ao
número de divisores de X, incluindo 1 e excluindo X.
a) Definir o espaço Z(ω).
b) Definir o espaço de probabilidade conjunta.
c) Verificar se X e Z são independentes.

Professor Inácio Andruski Guimarães, DSc.
54

Estatística – Notas de Aulas

d) Calcular a expectância e a variância para Z.
e) Calcular o coeficiente de correlação para X e Z.
8.9.5) Um jogo consiste em lançar uma moeda duas vezes. Se der uma “cara”, o jogador ganha R$ 1,00.
Se der duas “caras”, o jogador recebe R$ 2,00. Se não der “cara”, o jogador perde R$ 4,00. Este jogo
pode ser considerado como favorável ao jogador ?
8.9.6) Um automóvel custa R$ 45000,00. Sabe-se que em anos anteriores a taxa de roubo deste mesmo
automóvel foi de 2%. Neste caso, qual o valor “justo” do prêmio de um seguro contra roubo ?
8.9.7) Seja X uma variável aleatória que pode assumir os valores {– 1 , 0 , 1} com as probabilidades dadas
no quadro a seguir. Seja Y = X 2.
X
P(X)
a)
b)
c)
d)

–1
¼

0
¼

1
½

Obter a distribuição de probabilidades para a variável Y.
Obter a distribuição conjunta de probabilidades.
Calcular a expectância e a variância para X.
Idem para Y.

8.9.8) Seja X uma variável aleatória contínua com função densidade de probabilidade dada por:
 k , a ≤ x ≤ b.
f ( x) = 
 0 , outro caso .

a) Qual o valor de k ?
b) Quanto vale a expectância ?
c) Quanto vale a variância ?
8.9.9) Seja X uma variável aleatória discreta. Verificar que Var[X] = E[X 2] – {E[X]}2.
8.9.10) Uma caixa contém 10 unidades de um componente, das quais três são defeituosas. Deve-se testar
as unidades até encontrar duas defeituosas. Seja X o número de testes necessários.
a) Obter a distribuição de probabilidades para X.
b) Calcular a expectância e a variância para X.
Respostas

8.9.3)

a)

= {1 , 2 , 3 , 4 , 5 , 6}

b) X(ω) = {2 , 4 , 6 , 8 , 10 , 12}

Y(ω) = {0 , 1}

c)
Y

0
1
Total
d) X e Y não são independentes.

X

2
0
1/6
1/6

4
0
1/6
1/6

6
0
1/6
1/6

8
1/6
0
1/6

10
0
1/6
1/6

12
1/6
0
1/6

e) E[X] = 7 Var[X] = 11,6667

Total

2/6
4/6
1
f) E[Y] = 0,6667 Var[Y] = 0,2222

8.9.4) a) Z(ω) = {1 , 2 , 3 , 3 , 3 , 5}
c) As variáveis não são independentes.
d) E[Z] = 2,8333 Var[Z] = 1,4722
b) A distribuição conjunta é dada no quadro a seguir.

Professor Inácio Andruski Guimarães, DSc.
55

Estatística – Notas de Aulas

X

Z

2
1/6
0
0
0
1/6

1
2
3
5
Total

4
0
1/6
0
0
1/6

6
0
0
1/6
0
1/6

8
0
0
1/6
0
1/6

10
0
0
1/6
0
1/6

12
0
0
0
1/6
1/6

Total

1/6
1/6
3/6
1/6
1

8.9.6) Neste caso, o “jogo” é honesto se P(ser roubado).Valor = P(não ser roubado).Prêmio
Então: (0,02)(45000) = (0,98)(Prêmio) → Prêmio = 918,37
b

8.9.8) a)

∫ kdx = kx

b
a

= k (b − a ) = 1 ⇒ k =

a

1
b−a

b

b

x
1  x2 
1 b2 − a2
a+b
b) E [ x ] =
dx =
=
=
 
∫b−a
b − a  2 a b − a
2
2
a
b

c) E [ x 2 ] =

x2
1
∫ b − a dx = b − a
a

b

 x3 
1 b 3 − a 3 b 2 + ab + a 2
=
=
 
3
3
 3 a b − a

(b − a ) 2
b 2 + ab + a 2
b 2 + 2 ab + b 2
−
=
3
4
12
8.9.10) a) = {2 , 3 , 4 , 5 , 6 , 7 , 8 , 9}
Var [ x ] =

X
P(X)

2
0,0667

3
0,1167

4
0,0150

5
0,1667

6
0,1667

7
0,1500

Referência:

Gnedenko, B.V., Theory of Probability. Chelsea Publishing Company. 1962.

Professor Inácio Andruski Guimarães, DSc.

8
0,1167

9
0,2015
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística
Estatística - Notas de Aulas sobre Estatística

Más contenido relacionado

La actualidad más candente

Unidade 04 - Estatística - Medidas de dispersão.ppt
Unidade 04 - Estatística - Medidas de dispersão.pptUnidade 04 - Estatística - Medidas de dispersão.ppt
Unidade 04 - Estatística - Medidas de dispersão.pptCrobelEtiquetas
 
Conceitos economicos
Conceitos economicosConceitos economicos
Conceitos economicosgustavosmotta
 
Tabelas do teste f, 10, 5, 1%
Tabelas do teste f, 10, 5, 1%Tabelas do teste f, 10, 5, 1%
Tabelas do teste f, 10, 5, 1%thiago carnevali
 
Aula 1 - Bioestatística
Aula 1 - BioestatísticaAula 1 - Bioestatística
Aula 1 - BioestatísticaCaroline Godoy
 
Aula 1 Zootecnia Geral.ppt
Aula 1 Zootecnia Geral.pptAula 1 Zootecnia Geral.ppt
Aula 1 Zootecnia Geral.pptRodrigoMenck2
 
Dietas de-confinamento
Dietas de-confinamentoDietas de-confinamento
Dietas de-confinamentoExagro
 
Análise combinatória e probabilidade morgado
Análise combinatória e probabilidade   morgadoAnálise combinatória e probabilidade   morgado
Análise combinatória e probabilidade morgadoAntonio Batista Mota
 
iLP Sistema São Mateus - Forragicultura - ESALQ/USP
iLP Sistema São Mateus - Forragicultura - ESALQ/USPiLP Sistema São Mateus - Forragicultura - ESALQ/USP
iLP Sistema São Mateus - Forragicultura - ESALQ/USPMateus Arantes
 
Exemplo de cálculo média,moda e mediana com distribuição frequencia
Exemplo de cálculo média,moda e mediana com distribuição frequenciaExemplo de cálculo média,moda e mediana com distribuição frequencia
Exemplo de cálculo média,moda e mediana com distribuição frequenciaRenato Ribeiro Soares
 
Estatística media, mediana e moda
Estatística media, mediana e modaEstatística media, mediana e moda
Estatística media, mediana e modaMila E Wlamir
 

La actualidad más candente (20)

Unidade 04 - Estatística - Medidas de dispersão.ppt
Unidade 04 - Estatística - Medidas de dispersão.pptUnidade 04 - Estatística - Medidas de dispersão.ppt
Unidade 04 - Estatística - Medidas de dispersão.ppt
 
Conceitos economicos
Conceitos economicosConceitos economicos
Conceitos economicos
 
estatística
estatísticaestatística
estatística
 
Aula 05 Gráficos Estatísticos
Aula 05   Gráficos EstatísticosAula 05   Gráficos Estatísticos
Aula 05 Gráficos Estatísticos
 
Apostila estatistica ii processos de ruína
Apostila estatistica ii   processos de ruínaApostila estatistica ii   processos de ruína
Apostila estatistica ii processos de ruína
 
Creep feeding bovinos
Creep feeding bovinosCreep feeding bovinos
Creep feeding bovinos
 
Conceitos e simulação de cadeias de markov
Conceitos e simulação de cadeias de markovConceitos e simulação de cadeias de markov
Conceitos e simulação de cadeias de markov
 
Aula 1 Probabilidade Introdução
Aula 1 Probabilidade IntroduçãoAula 1 Probabilidade Introdução
Aula 1 Probabilidade Introdução
 
Tabelas do teste f, 10, 5, 1%
Tabelas do teste f, 10, 5, 1%Tabelas do teste f, 10, 5, 1%
Tabelas do teste f, 10, 5, 1%
 
Aula 1 - Bioestatística
Aula 1 - BioestatísticaAula 1 - Bioestatística
Aula 1 - Bioestatística
 
DOMAIN NAME SYSTEM (DNS)
DOMAIN NAME SYSTEM (DNS)DOMAIN NAME SYSTEM (DNS)
DOMAIN NAME SYSTEM (DNS)
 
Estatistica aplicada1
Estatistica aplicada1Estatistica aplicada1
Estatistica aplicada1
 
Aula 1 Zootecnia Geral.ppt
Aula 1 Zootecnia Geral.pptAula 1 Zootecnia Geral.ppt
Aula 1 Zootecnia Geral.ppt
 
Dietas de-confinamento
Dietas de-confinamentoDietas de-confinamento
Dietas de-confinamento
 
Análise combinatória e probabilidade morgado
Análise combinatória e probabilidade   morgadoAnálise combinatória e probabilidade   morgado
Análise combinatória e probabilidade morgado
 
iLP Sistema São Mateus - Forragicultura - ESALQ/USP
iLP Sistema São Mateus - Forragicultura - ESALQ/USPiLP Sistema São Mateus - Forragicultura - ESALQ/USP
iLP Sistema São Mateus - Forragicultura - ESALQ/USP
 
Probabilidade
ProbabilidadeProbabilidade
Probabilidade
 
Exemplo de cálculo média,moda e mediana com distribuição frequencia
Exemplo de cálculo média,moda e mediana com distribuição frequenciaExemplo de cálculo média,moda e mediana com distribuição frequencia
Exemplo de cálculo média,moda e mediana com distribuição frequencia
 
Introdução ao Estudo das Ciências Econômicas
Introdução ao Estudo das Ciências EconômicasIntrodução ao Estudo das Ciências Econômicas
Introdução ao Estudo das Ciências Econômicas
 
Estatística media, mediana e moda
Estatística media, mediana e modaEstatística media, mediana e moda
Estatística media, mediana e moda
 

Similar a Estatística - Notas de Aulas sobre Estatística

Apostila de estatistica
Apostila de estatisticaApostila de estatistica
Apostila de estatisticaAna
 
Apostila de estatistica
Apostila de estatisticaApostila de estatistica
Apostila de estatisticaPedro Kangombe
 
Estatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoEstatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoAntonio Mankumbani Chora
 
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...RaquelSilva604657
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptssuser2b53fe
 
Ficha de-trabalho-sobre-estatistica
Ficha de-trabalho-sobre-estatisticaFicha de-trabalho-sobre-estatistica
Ficha de-trabalho-sobre-estatisticaAna Colaco
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptssuser2b53fe
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptssuser2b53fe
 
Estatística completa
Estatística completaEstatística completa
Estatística completaRonne Seles
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptssuser2b53fe
 
EstatíStica Aula 000
EstatíStica Aula 000EstatíStica Aula 000
EstatíStica Aula 000educacao f
 

Similar a Estatística - Notas de Aulas sobre Estatística (20)

Apostila de estatistica
Apostila de estatisticaApostila de estatistica
Apostila de estatistica
 
Apostila de estatistica
Apostila de estatisticaApostila de estatistica
Apostila de estatistica
 
Estatistica exercicios resolvidos
Estatistica exercicios resolvidosEstatistica exercicios resolvidos
Estatistica exercicios resolvidos
 
Estatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoEstatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formando
 
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...
 
Estdescr
EstdescrEstdescr
Estdescr
 
23126 estatisticaaplicada manualtecnicoformando
23126 estatisticaaplicada manualtecnicoformando23126 estatisticaaplicada manualtecnicoformando
23126 estatisticaaplicada manualtecnicoformando
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
 
EstatisticaGIMO_aquiUEM
EstatisticaGIMO_aquiUEMEstatisticaGIMO_aquiUEM
EstatisticaGIMO_aquiUEM
 
Ficha de-trabalho-sobre-estatistica
Ficha de-trabalho-sobre-estatisticaFicha de-trabalho-sobre-estatistica
Ficha de-trabalho-sobre-estatistica
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
 
Estatística completa
Estatística completaEstatística completa
Estatística completa
 
Estatisticas petrobras
Estatisticas petrobrasEstatisticas petrobras
Estatisticas petrobras
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
 
Introdução a Estatistica 2.pdf
Introdução a Estatistica 2.pdfIntrodução a Estatistica 2.pdf
Introdução a Estatistica 2.pdf
 
Estatistica completo revisado
Estatistica completo revisadoEstatistica completo revisado
Estatistica completo revisado
 
Aula1 impressao
Aula1 impressaoAula1 impressao
Aula1 impressao
 
EstatíStica Aula 000
EstatíStica Aula 000EstatíStica Aula 000
EstatíStica Aula 000
 
Atps estatistica 2
Atps estatistica 2Atps estatistica 2
Atps estatistica 2
 

Último

Rota das Ribeiras Camp, Projeto Nós Propomos!
Rota das Ribeiras Camp, Projeto Nós Propomos!Rota das Ribeiras Camp, Projeto Nós Propomos!
Rota das Ribeiras Camp, Projeto Nós Propomos!Ilda Bicacro
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...azulassessoria9
 
planejamento_estrategico_-_gestao_2021-2024_16015654.pdf
planejamento_estrategico_-_gestao_2021-2024_16015654.pdfplanejamento_estrategico_-_gestao_2021-2024_16015654.pdf
planejamento_estrategico_-_gestao_2021-2024_16015654.pdfmaurocesarpaesalmeid
 
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEMPRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEMHELENO FAVACHO
 
INTERVENÇÃO PARÁ - Formação de Professor
INTERVENÇÃO PARÁ - Formação de ProfessorINTERVENÇÃO PARÁ - Formação de Professor
INTERVENÇÃO PARÁ - Formação de ProfessorEdvanirCosta
 
Currículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdfCurrículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdfTutor de matemática Ícaro
 
Revolução russa e mexicana. Slides explicativos e atividades
Revolução russa e mexicana. Slides explicativos e atividadesRevolução russa e mexicana. Slides explicativos e atividades
Revolução russa e mexicana. Slides explicativos e atividadesFabianeMartins35
 
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...IsabelPereira2010
 
SLIDE DE Revolução Mexicana 1910 da disciplina cultura espanhola
SLIDE DE Revolução Mexicana 1910 da disciplina cultura espanholaSLIDE DE Revolução Mexicana 1910 da disciplina cultura espanhola
SLIDE DE Revolução Mexicana 1910 da disciplina cultura espanholacleanelima11
 
Slides Lição 05, Central Gospel, A Grande Tribulação, 1Tr24.pptx
Slides Lição 05, Central Gospel, A Grande Tribulação, 1Tr24.pptxSlides Lição 05, Central Gospel, A Grande Tribulação, 1Tr24.pptx
Slides Lição 05, Central Gospel, A Grande Tribulação, 1Tr24.pptxLuizHenriquedeAlmeid6
 
Nós Propomos! " Pinhais limpos, mundo saudável"
Nós Propomos! " Pinhais limpos, mundo saudável"Nós Propomos! " Pinhais limpos, mundo saudável"
Nós Propomos! " Pinhais limpos, mundo saudável"Ilda Bicacro
 
Construção (C)erta - Nós Propomos! Sertã
Construção (C)erta - Nós Propomos! SertãConstrução (C)erta - Nós Propomos! Sertã
Construção (C)erta - Nós Propomos! SertãIlda Bicacro
 
Dicionário de Genealogia, autor Gilber Rubim Rangel
Dicionário de Genealogia, autor Gilber Rubim RangelDicionário de Genealogia, autor Gilber Rubim Rangel
Dicionário de Genealogia, autor Gilber Rubim RangelGilber Rubim Rangel
 
A QUATRO MÃOS - MARILDA CASTANHA . pdf
A QUATRO MÃOS  -  MARILDA CASTANHA . pdfA QUATRO MÃOS  -  MARILDA CASTANHA . pdf
A QUATRO MÃOS - MARILDA CASTANHA . pdfAna Lemos
 
Estudar, para quê? Ciência, para quê? Parte 1 e Parte 2
Estudar, para quê?  Ciência, para quê? Parte 1 e Parte 2Estudar, para quê?  Ciência, para quê? Parte 1 e Parte 2
Estudar, para quê? Ciência, para quê? Parte 1 e Parte 2Maria Teresa Thomaz
 
PROJETO DE EXTENSÃO - EDUCAÇÃO FÍSICA BACHARELADO.pdf
PROJETO DE EXTENSÃO - EDUCAÇÃO FÍSICA BACHARELADO.pdfPROJETO DE EXTENSÃO - EDUCAÇÃO FÍSICA BACHARELADO.pdf
PROJETO DE EXTENSÃO - EDUCAÇÃO FÍSICA BACHARELADO.pdfHELENO FAVACHO
 
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdfProjeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdfHELENO FAVACHO
 
CRUZADINHA - Leitura e escrita dos números
CRUZADINHA   -   Leitura e escrita dos números CRUZADINHA   -   Leitura e escrita dos números
CRUZADINHA - Leitura e escrita dos números Mary Alvarenga
 
Introdução a Caminhada do Interior......
Introdução a Caminhada do Interior......Introdução a Caminhada do Interior......
Introdução a Caminhada do Interior......suporte24hcamin
 
apostila projeto de vida 2 ano ensino médio
apostila projeto de vida 2 ano ensino médioapostila projeto de vida 2 ano ensino médio
apostila projeto de vida 2 ano ensino médiorosenilrucks
 

Último (20)

Rota das Ribeiras Camp, Projeto Nós Propomos!
Rota das Ribeiras Camp, Projeto Nós Propomos!Rota das Ribeiras Camp, Projeto Nós Propomos!
Rota das Ribeiras Camp, Projeto Nós Propomos!
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
 
planejamento_estrategico_-_gestao_2021-2024_16015654.pdf
planejamento_estrategico_-_gestao_2021-2024_16015654.pdfplanejamento_estrategico_-_gestao_2021-2024_16015654.pdf
planejamento_estrategico_-_gestao_2021-2024_16015654.pdf
 
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEMPRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
 
INTERVENÇÃO PARÁ - Formação de Professor
INTERVENÇÃO PARÁ - Formação de ProfessorINTERVENÇÃO PARÁ - Formação de Professor
INTERVENÇÃO PARÁ - Formação de Professor
 
Currículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdfCurrículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdf
 
Revolução russa e mexicana. Slides explicativos e atividades
Revolução russa e mexicana. Slides explicativos e atividadesRevolução russa e mexicana. Slides explicativos e atividades
Revolução russa e mexicana. Slides explicativos e atividades
 
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...
 
SLIDE DE Revolução Mexicana 1910 da disciplina cultura espanhola
SLIDE DE Revolução Mexicana 1910 da disciplina cultura espanholaSLIDE DE Revolução Mexicana 1910 da disciplina cultura espanhola
SLIDE DE Revolução Mexicana 1910 da disciplina cultura espanhola
 
Slides Lição 05, Central Gospel, A Grande Tribulação, 1Tr24.pptx
Slides Lição 05, Central Gospel, A Grande Tribulação, 1Tr24.pptxSlides Lição 05, Central Gospel, A Grande Tribulação, 1Tr24.pptx
Slides Lição 05, Central Gospel, A Grande Tribulação, 1Tr24.pptx
 
Nós Propomos! " Pinhais limpos, mundo saudável"
Nós Propomos! " Pinhais limpos, mundo saudável"Nós Propomos! " Pinhais limpos, mundo saudável"
Nós Propomos! " Pinhais limpos, mundo saudável"
 
Construção (C)erta - Nós Propomos! Sertã
Construção (C)erta - Nós Propomos! SertãConstrução (C)erta - Nós Propomos! Sertã
Construção (C)erta - Nós Propomos! Sertã
 
Dicionário de Genealogia, autor Gilber Rubim Rangel
Dicionário de Genealogia, autor Gilber Rubim RangelDicionário de Genealogia, autor Gilber Rubim Rangel
Dicionário de Genealogia, autor Gilber Rubim Rangel
 
A QUATRO MÃOS - MARILDA CASTANHA . pdf
A QUATRO MÃOS  -  MARILDA CASTANHA . pdfA QUATRO MÃOS  -  MARILDA CASTANHA . pdf
A QUATRO MÃOS - MARILDA CASTANHA . pdf
 
Estudar, para quê? Ciência, para quê? Parte 1 e Parte 2
Estudar, para quê?  Ciência, para quê? Parte 1 e Parte 2Estudar, para quê?  Ciência, para quê? Parte 1 e Parte 2
Estudar, para quê? Ciência, para quê? Parte 1 e Parte 2
 
PROJETO DE EXTENSÃO - EDUCAÇÃO FÍSICA BACHARELADO.pdf
PROJETO DE EXTENSÃO - EDUCAÇÃO FÍSICA BACHARELADO.pdfPROJETO DE EXTENSÃO - EDUCAÇÃO FÍSICA BACHARELADO.pdf
PROJETO DE EXTENSÃO - EDUCAÇÃO FÍSICA BACHARELADO.pdf
 
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdfProjeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
 
CRUZADINHA - Leitura e escrita dos números
CRUZADINHA   -   Leitura e escrita dos números CRUZADINHA   -   Leitura e escrita dos números
CRUZADINHA - Leitura e escrita dos números
 
Introdução a Caminhada do Interior......
Introdução a Caminhada do Interior......Introdução a Caminhada do Interior......
Introdução a Caminhada do Interior......
 
apostila projeto de vida 2 ano ensino médio
apostila projeto de vida 2 ano ensino médioapostila projeto de vida 2 ano ensino médio
apostila projeto de vida 2 ano ensino médio
 

Estatística - Notas de Aulas sobre Estatística

  • 1. Estatística – Notas de Aulas ESTATÍSTICA Notas de Aulas Professor Inácio Andruski Guimarães, DSc. Professor Inácio Andruski Guimarães, DSc.
  • 2. 2 Estatística – Notas de Aulas SUMÁRIO 1 CONCEITOS BÁSICOS 1.1 Estatística 1.2 Estatística Descritiva 1.3 Estatística Inferencial 1.4 População 1.5 Amostra 1.6 Variável 1.7 Séries Estatísticas 5 2 APRESENTAÇÃO DE DADOS 2.1 Apresentação Tabular 2.2 Apresentação Gráfica 7 3 DISTRIBUIÇÃO DE FREQÜÊNCIAS 3.1 Dados Brutos 3.2 Rol 3.3 Amplitude Total 3.4 Número de Classes 3.5 Amplitude de Classe 3.6 Intervalo de Classe 3.7 Freqüência Simples 3.8 Freqüência Acumulada 3.9 Freqüência Relativa 3.10 Ponto Médio de Classe 3.11 Representações Gráficas 11 4 MEDIDAS DE TENDÊNCIA CENTRAL OU DE POSIÇÃO 4.1 Média Aritmética 4.2 Mediana 4.3 Moda ........................................................................................................................... 4.4 Relação entre Média, Mediana e Moda 4.5 Percentil 4.6 Decil 4.7 Quartil 17 5 MEDIDAS DE DISPERSÃO 5.1 Amplitude 5.2 Desvio Médio 5.3 Variância 5.4 Desvio Padrão 5.5 Coeficiente de Variação 26 6 ASSIMETRIA E CURTOSE 6.1 Coeficiente de Assimetria 6.2 Coeficiente de Curtose 32 7 TEORIA DA PROBABILIDADE 7.1 Teoria dos Conjuntos 7.2 Técnicas de Contagem 7.3 Introdução à Probabilidade 36 8 VARIÁVEIS ALEATÓRIAS 8.1 Tipos de Variáveis Aleatórias 8.2 Função de Probabilidade 8.3 Função Densidade de Probabilidade 8.4 Expectância 8.5 Variância 47 Professor Inácio Andruski Guimarães, DSc.
  • 3. 3 Estatística – Notas de Aulas 8.6 Distribuição Conjunta 8.7 Independência 8.8 Função Distribuição Acumulada 9 MODELOS DE PROBABILIDADE PARA VARIÁVEIS DISCRETAS 9.1 Distribuição Uniforme 9.2 Distribuição de Bernoulli 9.3 Distribuição Binomial 9.4 Distribuição Geométrica 9.5 Distribuição de Pascal 9.6 Distribuição de Poisson 9.7 Distribuição Hipergeométrica 9.8 Distribuição Multinomial 56 10 MODELOS DE PROBABILIDADE PARA VARIÁVEIS CONTÍNUAS 10.1 Distribuição Uniforme 10.2 Distribuição Normal 10.3 Distribuição Gama 10.4 Distribuição Exponencial 10.5 Distribuição de Weibull 10.6 Distribuição Qui-Quadrado 10.7 Distribuição t, de Student 10.8 Distribuição F, de Fisher 10.9 Aproximação da Distribuição Binomial pela Normal 61 11 INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA 11.1 Estimadores e Estatísticas 11.2 Estimadores Eficientes 11.3 Estatísticas Suficientes 11.4 Família Exponencial 11.5 Método da Máxima Verossimilhança 11.6 Distribuição Amostral da Média 67 12 INTERVALOS DE CONFIANÇA 12.1 Intervalo de Confiança para a Média 12.2 Intervalo de Confiança para a Diferença de Médias 12.3 Intervalo de Confiança para a Proporção 12.4 Intervalo de Confiança para a Diferença de Proporções 12.5 Intervalo de Confiança para a Variância 12.6 Determinação do Tamanho de uma Amostra 74 13 CONTROLE ESTATÍSTICO DE PROCESSO (CEP) 13.1 Conceitos 13.2 Diagrama de Pareto 13.3 Diagrama de Ishikawa 13.4 Gráfico de Controle para Média e Amplitude 13.5 Capabilidade 13.6 Gráficos de Controle para Amplitudes Móveis 13.7 Gráficos de Controle por Atributos 81 14 TEORIA DA DECISÃO ESTATÍSTICA 14.1 Teste de Hipótese 14.2 Teste de Hipótese para a Média 14.3 Teste de Hipótese para a Diferença de Médias 14.4 Teste de Hipótese para a Proporção 14.5 Teste de Hipótese para a Diferença de Proporções 98 15 ANÁLISE DA VARIÂNCIA (ANOVA) 15.1 ANOVA para um Fator 15.2 ANOVA para dois Fatores 104 Professor Inácio Andruski Guimarães, DSc.
  • 4. 4 Estatística – Notas de Aulas 16 TESTE QUI-QUADRADO 16.1 Teste de Bondade de Ajustamento 16.2 Teste de Independência de Variáveis 110 17 TESTES NÃO PARAMÉTRICOS 17.1 Teste U, de Wilcoxon, Mann e Whitney 17.2 Teste H, de Kruskal – Wallis 113 18 ANÁLISE DE CORRELAÇÃO E DE REGRESSÃO 18.1 Coeficiente de Correlação 18.2 Análise de Regressão Linear 18.3 Método dos Mínimos Quadrados 18.4 Modelo Exponencial 18.5 Modelo Potência 18.6 Modelo Logarítmico 118 APÊNDICE I – INTEGRAIS EULERIANAS APÊNDICE II – MÉTODO DE NEWTON – RAPHSON Professor Inácio Andruski Guimarães, DSc.
  • 5. Estatística – Notas de Aulas 1. 5 CONCEITOS BÁSICOS 1.1 Estatística A Estatística compreende os métodos científicos utilizados para coleta, organização, resumo, apresentação e análise, ou descrição, de dados de observação. Também abrange métodos utilizados para tomadas de decisões sob condições de incerteza. 1.2 Estatística Descritiva Inclui as técnicas empregadas para coleta e descrição de dados. Também é empregada na análise exploratória de dados. 1.3 Estatística Inferencial É utilizada para tomar decisões a respeito de uma população, geralmente utilizando dados de amostras. Uma vez que tais decisões são tomadas sob condições de incerteza, faz-se necessário o uso de conceitos relativos à Teoria da Probabilidade. 1.4 População Um dos conceitos fundamentais na Estatística, é empregado para designar um conjunto de indivíduos que possuem pelo menos uma característica, ou atributo, em comum. Alguns autores empregam o termo universo para referir-se a uma população. 1.5 Amostra Refere-se a qualquer subconjunto de uma população. A amostragem é uma das etapas mais importantes na aplicação de métodos estatísticos, envolvendo aspectos como determinação do tamanho da amostra, metodologia de formação e representatividade da amostra com relação à população. 1.6 Variável É usada para atribuição dos valores correspondentes aos dados observados. É importante ressaltar que os dados em questão não são necessariamente numéricos, uma vez que podem dizer respeito a atributos qualitativos observados na população. Por esta razão costuma-se classificar as variáveis nas categorias definidas a seguir. 1.6.1 – Variável Numérica. Também chamada variável quantitativa, é utilizada para representação de dados numéricos, ou quantitativos. 1.6.1.1 – Variável Numérica Discreta. Variável cujo domínio é um conjunto enumerável. Geralmente corresponde a dados de contagem. Exemplo: Número de defeitos em um componente, total de unidades defeituosas em uma amostra. 1.6.1.2 – Variável Numérica Contínua. Variável cujo domínio é um conjunto não enumerável. Refere-se a dados de mensuração. Exemplo: Diâmetro de um eixo, peso de um recém-nascido. 1.6.2 – Variável Qualitativa. É utilizada para representação de atributos. Pode ser dicotômica, ou binária, quando assume apenas dois possíveis valores, ou politômica, também referida como multinomial, quando pode assumir mais de dois possíveis valores. 1.6.2.1 – Variável Qualitativa Categórica. É empregada para representar categorias, ou classes, às quais pertencem as observações registradas. Exemplo: Cor dos olhos, sexo. 1.6.2.2 – Variável Qualitativa Ordinal. Utiliza-se este tipo de variável em situações nas quais presume-se a necessidade de uma ordem, crescente ou decrescente, para os resultados. Exemplo: Grau de escolaridade, categoria salarial. Professor Inácio Andruski Guimarães, DSc.
  • 6. 6 Estatística – Notas de Aulas 1.7 – Séries Estatísticas Uma série estatística consiste basicamente de um conjunto de valores observados para diferentes categorias de uma variável. As séries estatísticas são classificadas em três categorias, apresentadas a seguir. 1.7.1 – Série Temporal. A variável de interesse refere-se a um período de tempo. Exemplo 1.7.1 – A tabela a seguir mostra o faturamento, em milhões de reais, da empresa fictícia ABC durante o ano de 20XY. Mês Faturamento Tabela 1.1 – Faturamento mensal (R$ 1000000) da empresa ABC (20XY). Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov 0,95 1,03 1,12 1,24 1,02 0,92 0,84 0,78 0,72 0,65 0,68 Dez 0,82 Total 10,77 Fonte: Dados fictícios. 1.7.2 – Série Geográfica. Aqui a variável estudada é o local. Exemplo 1.7.2 – A tabela a seguir mostra o faturamento, em milhões de reais, da empresa fictícia ABC durante o ano de 20XY, nas respectivas regiões de atuação. Tabela 1.2 – Faturamento (R$ 1000000) da empresa ABC (20XY), por região. Grande Interior Interior Porto Interior Campo Região Cuiabá Curitiba do PR de SC Alegre do RS Grande Faturamento 2,75 2,58 1,82 1,42 0,80 0,75 0,70 Total 10,77 Fonte: Dados fictícios. 1.7.3 – Série Específica. Exemplo 1.7.3 - A tabela a seguir mostra o faturamento, em milhões de reais, da empresa fictícia ABC durante o ano de 20XY, especificado por produto. Produto Faturamento Tabela 1.3 – Faturamento (R$ 1000000) da empresa ABC (20XY), por produto. Rolamento Mancal Óleo Junta Válvula Retentor 3,48 1,84 1,75 1,45 1,25 1,00 Total 10,77 Fonte: Dados fictícios. 1.7.4 – Séries Combinadas. Na prática, é comum combinar séries estatísticas com o objetivo de aumentar, ou detalhar, as informações disponíveis. Exemplo 1.7.4 – O quadro a seguir mostra o faturamento da empresa ABC por produto e região, isto é, uma combinação de uma série geográfica e uma série específica. Quadro 1.1 – Faturamento (R$ 1000000) da empresa ABC, por produto e região. Produto Região Total Rolamento Mancal Óleo Junta Válvula Retentor Grande Curitiba 0,89 0,46 0,45 0,37 0,32 0,26 2,75 Interior do PR 0,83 0,44 0,42 0,35 0,30 0,24 2,58 Interior de SC 0,59 0,31 0,30 0,25 0,21 0,16 1,82 Porto Alegre 0,45 0,24 0,23 0,19 0,16 0,15 1,42 Interior do RS 0,26 0,14 0,13 0,11 0,09 0,07 0,80 Campo Grande 0,24 0,13 0,12 0,10 0,09 0,07 0,75 Cuiabá 0,22 0,12 0,10 0,08 0,08 0,10 0,70 3,48 1,84 1,75 1,45 1,25 1,00 10,77 Total Fonte: Dados fictícios. Professor Inácio Andruski Guimarães, DSc.
  • 7. 7 Estatística – Notas de Aulas 2. APRESENTAÇÃO DE DADOS A apresentação de dados pode ser efetuada através de dois modos, tabular ou gráfico, não mutuamente exclusivos. Para esta tarefa deve-se ter em mente o objetivo da apresentação, no que diz respeito ao nível de detalhamento e ao tipo de informação que se deseja extrair dos dados em questão. A apresentação tabular permite obter informações mais detalhadas, enquanto a apresentação gráfica permite uma compreensão mais rápida a respeito do comportamento da variável observada. 2.1 – Apresentação Tabular Em primeiro lugar, é importante frisar que os termos “tabela” e “quadro” são utilizados para designar objetos distintos. O primeiro designa o arranjo de dados na forma de grade com laterais abertas, enquanto o segundo termo é empregado para designar arranjos em grades com laterais fechadas, conforme a Figura 2.1. Variável Total Valores Variável Valores Total Figura 2.1 – Formatos de tabela e quadro. Independente do formato escolhido, uma tabela deve conter três elementos: 1 – Cabeçalho. Deve conter o máximo de informações sobre os dados apresentados 2 – Corpo. De dimensões variáveis, é o espaço destinado à apresentação propriamente dita dos dados. 3 – Rodapé. Deve conter a fonte dos dados e outras informações necessárias à compreensão. 2.1.1 – Tabela Simples. É o tipo mais comum de tabela, utilizado para representar os valores correspondentes a uma série estatística. A disposição pode ser feita tanto por colunas como por linhas. Exemplo 2.1 – Exemplo de tabela simples. Dados dispostos em linha. Mês Faturamento Tabela 1.1 – Faturamento mensal (R$ 1000000) da empresa ABC (20XY). Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov 0,95 1,03 1,12 1,24 1,02 0,92 0,84 0,78 0,72 0,65 0,68 Fonte: Dados fictícios. Exemplo 2.2 - Exemplo de tabela simples. Dados dispostos em coluna. Tabela 2.1 – Número de beneficiários de planos privados de saúde, em milhões, no período 2000 – 2006. Ano Beneficiários (milhões) 2000 34,5 2001 34,3 2002 35,0 2003 36,2 2004 38,8 2005 41,6 2006 44,7 Fonte: Jornal Folha de São Paulo. 4/6/2007 Professor Inácio Andruski Guimarães, DSc. Dez 0,82 Total 10,77
  • 8. 8 Estatística – Notas de Aulas 2.1.2 – Tabela de Dupla Entrada. É utilizada para representar dados de duas séries combinadas. Exemplo 2.3 – Exemplo de tabela de dupla entrada. Tabela 2.2 – Faturamento (R$ 1000000) da empresa ABC, por produto e região. Produto Região Total Rolamento Mancal Óleo Junta Válvula Retentor Grande Curitiba 0,89 0,46 0,45 0,37 0,32 0,26 2,75 Interior do PR 0,83 0,44 0,42 0,35 0,30 0,24 2,58 Interior de SC 0,59 0,31 0,30 0,25 0,21 0,16 1,82 Porto Alegre 0,45 0,24 0,23 0,19 0,16 0,15 1,42 Interior do RS 0,26 0,14 0,13 0,11 0,09 0,07 0,80 Campo Grande 0,24 0,13 0,12 0,10 0,09 0,07 0,75 Cuiabá 0,22 0,12 0,10 0,08 0,08 0,10 0,70 3,48 1,84 1,75 1,45 1,25 1,00 10,77 Total Fonte: Dados fictícios. 2.1.3 – Tabela de Múltiplas Entradas. É utilizada na representação de dados correspondentes a mais de duas séries. Exemplo 2.4 – Exemplo de tabela de múltipla entrada. Tabela 2.3 – Unidades vendidas por região e por semestre. Produto Região Rolamento Mancal 1o Semestre 2o semestre 1o Semestre 2o semestre Sul 38 24 18 14 Sudeste 26 20 14 12 Centro Oeste 16 18 8 17 80 62 40 43 Total Total 94 72 59 225 Dados Fictícios. 2.2 – Apresentação Gráfica Para a apresentação gráfica deve-se levar em consideração o tipo de série estatística estudada e o, também, o tipo de variável observada, quantitativa ou qualitativa. Também é possível combinar as duas formas de apresentação, tabular e gráfica. Os principais tipos de gráficos são: 2.2.1 – Gráfico Linear. É utilizado principalmente para representar séries temporais. Exemplo 2.5 Tabela 1.1 – Faturamento mensal (R$ 1000000) da empresa ABC (20XY). Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov 0,95 1,03 1,12 1,24 1,02 0,92 0,84 0,78 0,72 0,65 0,68 Fonte: Dados fictícios. Faturam ento da Em presa ABC R$ 1000000,00 Mês Faturamento 1,5 1 0,5 0 1 2 3 4 5 6 7 8 9 Meses Professor Inácio Andruski Guimarães, DSc. 10 11 12 Dez 0,82 Total 10,77
  • 9. 9 Estatística – Notas de Aulas 2.2.2 – Gráfico Setorial. É utilizado para representar séries geográficas ou específicas. Exemplo 2.6 Tabela 1.2 – Faturamento (R$ 1000000) da empresa ABC (20XY), por região. Grande Interior Interior Porto Interior Campo Região Cuiabá Curitiba do PR de SC Alegre do RS Grande Faturamento 2,75 2,58 1,82 1,42 0,80 0,75 0,70 Total 10,77 Fonte: Dados fictícios. Faturam ento por Região Cuiabá; 0,7 Campo Grande; 0,75 Grande Curitiba Grande Curitiba; 2,75 Interior do RS; 0,8 Interior do PR Interior de SC Porto Alegre Porto Alegre; 1,42 Interior de SC; 1,82 Interior do RS Interior do PR; 2,58 Campo Grande Cuiabá 2.2.3 – Gráfico de Colunas. Pode ser utilizado no lugar do gráfico setorial. Exemplo 2.7 – Os dados da Tabela 1.2 poderiam ser representados através do gráfico a seguir. Faturam ento por Região 3 2,5 2 1,5 1 0,5 0 Grande Curitiba Interior do PR Interior de SC Porto Alegre Interior do RS Campo Grande Cuiabá 2.2.4 – Gráfico de Colunas Superpostas. É utilizado para representar os dados de tabelas de dupla entrada. Exemplo 2.8 – Representação dos dados da Tabela 2.2. Faturamento por Produto e por Região (%) 100% 80% Retentor 60% Válvula 40% Junta Óleo 20% Mancal 0% Grande Interior do Interior de Curitiba PR SC Porto Alegre Interior do Campo RS Grande Professor Inácio Andruski Guimarães, DSc. Cuiabá Rolamento
  • 10. 10 Estatística – Notas de Aulas 2.2.5 – Gráfico de Colunas Justapostas. È utilizado para representar dados de tabelas de dupla entrada. Faturam ento por Produto e por Região 1 0,8 Rolamento 0,6 Mancal 0,4 Óleo 0,2 Junta Válvula 0 Grande Interior do Interior de Curitiba PR SC Porto Alegre Interior do Campo RS Grande Professor Inácio Andruski Guimarães, DSc. Cuiabá Retentor
  • 11. 11 Estatística – Notas de Aulas 3. DISTRIBUIÇÕES DE FREQÜÊNCIAS As distribuições de freqüências são usadas principalmente para a apresentação de grandes conjuntos de dados. 3.1 – Dados Brutos É a designação para um conjunto de dados não ordenados. 3.2 – Rol É um conjunto de dados ordenados. Exemplo 3.1 – Teores de ácido palmítico (%) observados em 120 amostras de óleos vegetais, utilizadas em um estudo para comparar as características de óleos obtidos a partir de diferentes fontes. 3,8 3,9 4,1 4,5 4,6 4,8 4,8 4,8 4,9 5 5,1 5,1 5,1 5,1 5,1 5,2 5,4 5,4 5,5 5,6 5,7 5,9 5,9 5,9 6 6 6 6 6,1 6,1 6,1 6,1 6,1 6,2 6,2 6,2 6,2 6,2 6,2 6,2 6,2 6,2 6,2 6,3 6,4 6,4 6,4 6,5 6,6 6,7 6,7 6,8 7 7,2 7,5 7,6 7,7 8 8 8,2 8,3 8,3 9,3 9,4 9,6 9,7 9,7 9,7 9,8 9,8 9,8 9,9 10 10 10 10,1 10,2 10,4 10,4 10,5 10,5 10,5 10,5 10,5 10,5 10,7 10,8 10,8 10,9 10,9 10,9 10,9 11 11 11 11 11,1 11,1 11,1 11,1 11,2 11,2 11,3 11,4 11,4 11,5 11,5 11,5 11,5 11,6 11,6 11,9 11,9 12,2 12,2 12,2 13 13 13,1 13,1 Fonte: Brodnjak – Vončina et al. (2005) 3.3 – Amplitude Total (R) É a diferença entre o valor máximo e o valor mínimo observados no conjunto de dados, isto é: R = x ( n ) − x (1) (3.1) Exemplo 3.2 – Para o conjunto de dados do exemplo anterior a amplitude total é R = 13,1 – 3,8 = 9,3 3.4 – Número de Classes (k) Pode ser determinado arbitrariamente ou de acordo com a expressão a seguir, denominada fórmula de Sturges, onde n é o número de observações, ou tamanho da amostra. k = 1 + 3,3 log n (3.2) Exemplo 3.3 – Uma distribuição de freqüências para os dados do Quadro 3.1, de acordo com a fórmula de Sturges, terá k = 1 + 3,3 log(120) = 7,86 ≅ 8 3.5 – Amplitude de Classe (h) Pode ser calculada por h= R k Professor Inácio Andruski Guimarães, DSc. (3.3)
  • 12. 12 Estatística – Notas de Aulas h= Exemplo 3.4 – Para os dados dos exemplos anteriores, a amplitude de classe é 9,3 ≅ 1,2 . 8 3.6 – Intervalo de Classe Os limites de cada classe podem ser definidos de quatro modos distintos, mostrados a seguir. 1. Intervalo “exclusive – exclusive”: 2. Intervalo “inclusive – exclusive”: 3. Intervalo “inclusive – inclusive”: 4. Intervalo “exclusive – inclusive”: Exemplo 3.5 – Para os dados utilizados como exemplo até agora, as classes e intervalos são: Tabela 3.1 – Distribuição de freqüências para os teores (%) de ácido palmítico observados em amostras de óleos vegetais. Classe Teores de Ácido Palmítico Observações 1 3,8 |-- 5,0 9 2 5,0 |-- 6,2 24 3 6,2 |-- 7,4 21 4 7,4 |-- 8,6 8 5 8,6 |-- 9,8 6 6 9,8 |-- 11,0 24 7 11,0 |-- 12,2 21 8 12,2 |-- 13,4 7 120 Total (N) 3.7 – Freqüência Simples (fi) A freqüência simples da i–ésima classe é igual ao número do observações pertencentes à mesma. Exemplo 3.6 – Na distribuição do exemplo anterior: f1 = 9 , f2 = 24 , ... , f8 = 4. 3.8 – Freqüência Acumulada i A freqüência acumulada crescente da i–ésima classe é dada por: faci = ∑ f j (3.4) j =1 Exemplo 3.7 – A freqüência acumulada crescente da quarta classe, na distribuição mostrada na Tabela 3.1, é: fac4 = 9 + 24 + 21 + 8 = 62. k A freqüência acumulada decrescente da i–ésima classe é dada por: fad i = ∑ f j (3.5) j =i Exemplo 3.8 – Para a quarta classe da distribuição anterior, a freqüência acumulada decrescente é dada por: fad4 = 8 + 6 + 24 + 24 + 4 = 66. 3.9 – Freqüência Relativa (fri) A freqüência relativa da i–ésima classe é dada por: fri = fi ∑ j =1 Professor Inácio Andruski Guimarães, DSc. (3.6) k fj
  • 13. Estatística – Notas de Aulas 13 Exemplo 3.9 – As freqüências relativas para distribuição da Tabela 3.1 são Tabela 3.2 – Distribuição de freqüências simples e relativas para os teores (%) de ácido palmítico observados em amostras de óleos vegetais. Classe Teores de Ácido Palmítico Observações Freqüências Relativas 1 3,8 |-- 5,0 9 0,0750 2 5,0 |-- 6,2 24 0,2000 3 6,2 |-- 7,4 21 0,1750 4 7,4 |-- 8,6 8 0,0667 5 8,6 |-- 9,8 6 0,0500 6 9,8 |-- 11,0 24 0,2000 7 11,0 |-- 12,4 21 0,1750 8 12,4 |-- 13,6 7 0,0583 120 1,0000 Total (N) 3.10 – Ponto Médio de Classe (Xi) O ponto médio da i–ésima classe é dado por: Xi = LI i + LS i 2 (3.7) onde LIi e LSi são os limites inferior e superior da classe, respectivamente. Exemplo 3.10 – As classes da distribuição da Tabela 3.1 têm os seguintes pontos médios: Classe 1 2 3 4 5 6 7 8 Tabela 3.3 – Distribuição de freqüências simples e pontos médios de classe para os teores (%) de ácido palmítico observados em amostras de óleos vegetais. Teores de Ácido Palmítico Observações Pontos Médios (Xi) 3,8 |-- 5,0 9 4,4 5,0 |-- 6,2 24 6,2 |-- 7,4 21 7,4 |-- 8,6 8 8,6 |-- 9,8 6 9,8 |-- 11,0 24 11,0 |-- 12,2 21 12,2 |-- 13,4 7 12,8 120 Total (n) 3.11 – Representações Gráficas As distribuições de freqüências podem ser representadas através de três tipos de gráficos, não mutuamente exclusivos. 3.11.1 – Histograma É um gráfico de colunas justapostas, onde a largura da base de cada coluna representa o intervalo de classe correspondente e a altura representa a freqüência simples da referida classe. Exemplo 3.11 – A Figura 3.1 mostra o histograma da distribuição mostrada na Tabela 3.1. Professor Inácio Andruski Guimarães, DSc.
  • 14. 14 Estatística – Notas de Aulas 30 25 20 15 10 5 0 3,8 - 5,0 5,0 - 6,2 6,2 - 7,4 7,4 - 8,6 8,6 - 9,8 9,8 - 11,0 11,0 - 12,2 12,2 - 13,4 Figura 3.1 – Histograma da distribuição de freqüências de teores de ácido palmítico. 3.11.2 – Polígono de Freqüências É definido por uma linha poligonal cujos vértices são definidos pelos pontos médios e pelas freqüências das classes representadas. Exemplo 3.12 – O polígono de freqüências para a distribuição anterior é mostrado na Figura 3.2. 30 Freqü ên cias 25 20 15 10 5 0 1 2 3 4 5 6 7 8 Classes Figura 3.2 – Polígono de freqüências da distribuição de teores de ácido palmítico. 3.11.3 – Curva de Freqüências Exemplo 3.13 – A curva de freqüências para a distribuição dos exemplos anteriores é mostrada na Figura 3.3. 30 25 20 15 10 5 0 1 2 3 4 5 6 7 8 Figura 3.3 – Curva de freqüências para a distribuição de teores de ácido palmítico. Professor Inácio Andruski Guimarães, DSc.
  • 15. 15 Estatística – Notas de Aulas 3.12 – Exercícios O Quadro 3.1 mostra 150 valores correspondentes ao comprimento da sépala, observados em flores de três espécies: íris virginica, íris setosa e íris versicolor, para um estudo cujo é a comparação das diferenças entre as dimensões observadas para cada um dos três grupos. Quadro 3.1 – Comprimentos (mm) das sépalas observadas em 150 exemplares de flores íris. 43 46 44 46 50 54 50 49 56 44 47 44 48 56 55 51 57 61 58 59 46 48 45 49 56 55 55 58 61 60 46 47 50 50 48 49 50 51 56 58 55 56 56 57 60 64 62 63 62 63 48 51 49 52 59 57 57 64 63 63 48 51 50 53 59 58 57 65 64 64 49 49 51 51 50 50 55 57 60 61 60 60 58 58 65 67 64 67 65 67 50 52 51 63 61 60 61 68 69 67 50 52 51 64 61 63 62 72 72 67 51 54 54 54 52 54 65 66 62 63 66 67 63 63 73 76 72 74 68 69 54 57 55 69 64 67 65 77 77 69 58 57 55 70 67 68 71 77 79 77 Fonte: Fisher (1936). 1) 2) 3) 4) 5) 6) 7) 8) Calcular a amplitude total. Calcular o número de classes para construir uma distribuição de freqüências. Calcular a amplitude de cada classe. Determinar os intervalos e limites de classes. Distribuir as freqüências. Calcular as freqüências acumuladas. Calcular os pontos médios. Traçar o histograma. Resposta: Classe 1 2 3 4 5 6 7 8 9 Comprimento (mm) 43 |-- 47 47 |-- 51 51 |-- 55 55 |-- 59 59 |-- 63 63 |-- 67 67 |-- 71 71 |-- 75 75 |-- 79 Total Flores 9 23 19 28 20 23 16 6 6 150 faci 9 32 51 79 fadi 150 141 118 99 150 fri 0,0600 0,1533 0,1267 0,1867 6 Professor Inácio Andruski Guimarães, DSc. Ponto médio 45 49 53 57
  • 16. Estatística – Notas de Aulas 16 30 25 20 15 10 5 0 Figura 3.4 – Histograma para os dados do Quadro 3.1. Referências Brodnjak – Vončina, D., Kodba, Z., Novič, M., Multivariate data analysis in classification of vegetable oils characterized by the content of fatty acids. Chemometrics and Intelligent Laboratory Systems 75, pp. 31-43, 2005. Fisher, R. A., The use of multiple measurements in taxonomic problems. Annals of Eugenics 7, pp. 179-178, 1936. Johnson, R. A., Wichern, D. W., Applied multivariate statistical analysis. 2nd. Ed. New Jersey: PrenticeHall International, Inc., 1988. Professor Inácio Andruski Guimarães, DSc.
  • 17. 17 Estatística – Notas de Aulas 4. MEDIDAS DE TENDENCIA CENTRAL OU DE POSIÇÃO São medidas utilizadas principalmente para a descrição de dados. Neste caso o que se deseja encontrar são os valores representativos do conjunto de dados, de modo a resumir ao máximo as observações sobre os dados em questão. As principais medidas de posição são a média aritmética, a mediana e a moda. As definições, e algumas propriedades, destas medidas são brevemente descritas a seguir. 4.1 – Média Aritmética ( x ) dada por Seja um conjunto de dados {x1 , x2 , ... , xn }. A média aritmética, ou simplesmente “média”, é n ∑x i i =1 x= (4.1) n Exemplo 4.1 – Seja o conjunto {2 , 4 , 3 , 5 , 6 , 2 , 5}. Então a média aritmética é: x = 2+4+3+5+6+2+5 = 3,8571 . 7 OBS: A notação x é empregada para representar a média de uma amostra de valores. A média da população costuma ser representada pela letra grega µ (“mi” ou “mu”). 4.1.1 – Propriedades da Média Aritmética: P1: Se uma constante k é somada a cada valor do conjunto, então a média será acrescida de k. Exemplo 4.2 – Se todos os valores do conjunto do exemplo 3.1 forem aumentados em 5, a média será 8,8571. P2: Se cada valor do conjunto é multiplicado por uma constante k, então a média também será multiplicada pelo mesmo valor. Exemplo 4.3 – Se todos os valores do conjunto do exemplo 3.1 forem multiplicados por 5, a média será 19,2855. n P3: Seja d i = xi − x o desvio do i – ésimo valor em relação à média aritmética. Então ∑d i = 0. i =1 4.1.2 – Média Aritmética Ponderada Para dados agrupados em distribuições de freqüências calcula-se a média ponderada, sendo que a freqüência observada para cada valor é o peso do mesmo. Então, se um conjunto de n valores foi agrupado em k classes, com pontos médios X1 , X2 , ... , Xk , e freqüências simples f1 , f2 , ... , fk , respectivamente, então a média aritmética é dada por: k ∑X x= fi i i =1 k ∑f (4.2) i i =1 Professor Inácio Andruski Guimarães, DSc.
  • 18. 18 Estatística – Notas de Aulas Exemplo 4.4 – O teor médio de ácido palmítico, para os dados da Tabela 3.1, é dado por: Classe 1 2 3 4 5 6 7 8 Teores de Ácido Palmítico (%) 3,8 |-- 5,0 5,0 |-- 6,2 6,2 |-- 7,4 7,4 |-- 8,6 8,6 |-- 9,8 9,8 |-- 11,0 11,0 |-- 12,2 12,2 |-- 13,4 Total (n) x = Observações (fi) 9 24 21 8 6 24 21 7 120 Xi 4,4 Xi fi 39,6 12,8 89,6 1024 , 4 ≅ 8 , 54 120 OBS: Se a média para os 120 valores fosse obtida diretamente do conjunto, através da fórmula (4.1), o valor encontrado seria 8,40. 4.2 – Mediana ( ~ ) x É o valor que ocupa a posição central em um conjunto de dados, quando organizados em ordem crescente. Se a quantidade de valores é ímpar, a mediana, ou valor mediano, é simplesmente o valor central. Se a quantidade de valores é par, a mediana é a média dos dois valores centrais. Exemplo 4.5 – Seja o conjunto {2 , 2 , 3 , 5 , 5 , 6 , 7 , 7 , 9 , 9 , 10}. Neste caso a mediana é ~ = 6. x Exemplo 4.6 – Seja o conjunto {0 , 1 , 1 , 2 , 3 , 4 , 5 , 5 , 6 , 6 , 7 , 8}. Aqui a mediana é dada pela média dos dois valores centrais, isto é, ~ = (4 + 5)/2 = 4,5. x 4.2.1 – Mediana para dados agrupados em distribuições de freqüências Para dados agrupados em distribuições de freqüências pode-se utilizar para o cálculo da mediana a expressão: ~ = LI ~ x x n  − fca +2  fme     h    (4.3) onde: LIx = limite inferior da classe que contém o valor mediano, isto é, da classe cuja freqüência acumulada crescente é igual ou imediatamente superior a n / 2. fca = freqüência acumulada crescente da classe anterior à classe que contém o valor mediano. fme = freqüência simples da classe que contém o valor mediano. h = amplitude da classe que contém o valor mediano. Exemplo 4.7 – O teor mediano de ácido palmítico, para os dados da Tabela 3.1, é dado por: Classe 1 2 3 4 5 6 7 8 Teores de Ácido Palmítico (%) 3,8 |-- 5,0 5,0 |-- 6,2 6,2 |-- 7,4 7,4 |-- 8,6 8,6 |-- 9,8 9,8 |-- 11,0 11,0 |-- 12,2 12,2 |-- 13,4 Total (n) Observações (fi) 9 24 21 8 6 24 21 7 120 Professor Inácio Andruski Guimarães, DSc. faci 9 33 54 62
  • 19. 19 Estatística – Notas de Aulas n = 60 (Então a mediana pertence à 4ª. classe). 2 LIx = 7,4 fca = 54 fme = 8 h = 8,6 – 7,4 = 1,2 Substituindo na expressão (4.3): OBS: Se a mediana fosse obtida a partir da definição, diretamente do conjunto de dados, o valor encontrado seria 8,25. 4.3 - Moda A moda, ou valor modal, de um conjunto de dados é o valor com maior freqüência individual. É importante ressaltar que o valor modal pode não existir, além disto, caso exista, pode não ser único. Neste último caso, diz-se que o conjunto é bimodal, trimodal, etc. Exemplo 4.8 – O valor modal para o conjunto de observação dos teores de ácido palmítico é 6,2, cuja freqüência é 10. 3,8 3,9 4,1 4,5 4,6 4,8 4,8 4,8 4,9 5 5,1 5,1 5,1 5,1 5,1 5,2 5,4 5,4 5,5 5,6 5,7 5,9 5,9 5,9 6 6 6 6 6,1 6,1 6,1 6,1 6,1 6,2 6,2 6,2 6,2 6,2 6,2 6,2 6,2 6,2 6,2 6,3 6,4 6,4 6,4 6,5 6,6 6,7 6,7 6,8 7 7,2 7,5 7,6 7,7 8 8 8,2 8,3 8,3 9,3 9,4 9,6 9,7 9,7 9,7 9,8 9,8 9,8 9,9 10 10 10 10,1 10,2 10,4 10,4 10,5 10,5 10,5 10,5 10,5 10,5 10,7 10,8 10,8 10,9 10,9 10,9 10,9 11 11 11 11 11,1 11,1 11,1 11,1 11,2 11,2 11,3 11,4 11,4 11,5 11,5 11,5 11,5 11,6 11,6 11,9 11,9 12,2 12,2 12,2 13 13 13,1 13,1 Para dados agrupados em distribuições de freqüências, a moda pode ser calculada através da fórmula dada por: Mo = LI mod  ∆1 +  ∆1 + ∆ 2  h  onde: LImod = limite inferior da classe modal, isto é, a de maior freqüência simples. ∆1 = (freqüência simples da classe modal menos a freqüência simples da classe anterior). ∆2 = (freqüência simples da classe modal menos a freqüência simples da classe posterior). h = amplitude da classe modal. Exemplo 4.9 – Calcular a moda para a distribuição de freqüências dos teores de ácido palmítico. A distribuição de freqüências é dada na tabela a seguir. Classe Teores de Ácido Palmítico (%) Observações (fi) Professor Inácio Andruski Guimarães, DSc. (4.4)
  • 20. 20 Estatística – Notas de Aulas 1 2 3 4 5 6 7 8 3,8 |-- 5,0 5,0 |-- 6,2 6,2 |-- 7,4 7,4 |-- 8,6 8,6 |-- 9,8 9,8 |-- 11,0 11,0 |-- 12,2 12,2 |-- 13,4 Total (n) 9 24 21 8 6 24 21 7 120 Neste caso as classes 2 e 6 têm a mesma freqüência. Então a distribuição obtida é bimodal, conforme se pode notar na Figura 3.3, com a curva de freqüências para este conjunto de dados. As respectivas modas são: Primeiro valor modal: LImod = 5,0 ∆1 = 24 – 9 = 15 ∆2 = 24 – 21 = 3 h = 6,2 – 5,0 = 1,2 Substituindo na fórmula (4.4): Mo 1  = 5 ,0 +   15 + 3  .  ( 1 ,2 ) =  Segundo valor modal: LImod = 9,8 ∆1 = 24 – 6 = 18 ∆2 = 24 – 21 = 3 h = 11,0 – 9,8 = 1,2 Substituindo na fórmula (4.4): Mo 2   = 9 ,8 +   ( 1 ,2 ) =  18 + 3  . OBS: É importante chamar a atenção para o fato de que nenhum dos valores coincide com o real valor modal, que é igual a 6,2. Comentário Nos exemplos anteriores é possível observar que as medidas calculadas para um conjunto de dados podem apresentar discrepância quando calculadas através de abordagens distintas. Para a distribuição de freqüências dos teores (%) de ácido palmítico observados em amostras de óleos vegetais, por exemplo, a média aritmética foi calculada como 8,54, para os dados agrupados, e 8,40 para os dados apenas ordenados. O mesmo ocorre com a mediana, que, por definição, é 8,25. Entretanto, para os mesmos dados, quando agrupados, a mediana é igual a 8,30. Para o cálculo da moda a diferença é ainda mais gritante, pois foram encontrados dois valores, 6,0 e 10,8, para a moda. Contudo, é fácil perceber que o valor em questão é igual a 6,2. Este tipo de ocorrência deve ser levado em consideração quando se opta pela apresentação, e tratamento, de dados na forma de distribuições de freqüências. O fácil acesso a programas computacionais e aplicativos pode tornar dispensável a construção de distribuições de freqüências, especialmente quando o interesse do estudo restringe-se aos resultados obtidos para as diferentes medidas aqui estudadas. Neste caso, a distribuição de freqüências pode ser usada apenas como meio de apresentação dos dados. Professor Inácio Andruski Guimarães, DSc.
  • 21. 21 Estatística – Notas de Aulas 4.4 – Relação entre Média, Mediana e Moda A relação entre os valores encontrados para a média, para a mediana e para a moda indica o tipo de assimetria da distribuição de freqüências. Aqui entende-se por assimetria o grau de desvio dos dados em relação ao centro da distribuição. Figura 4.1 – Assimetria positiva (Mo < ~ < x ). x Figura 4.2 – Assimetria negativa (Mo > ~ > x x ). 22 Figura 4.3 – Distribuição simétrica (normal) (Mo = ~ = x x ). Na prática é comum obter distribuições de freqüências cujas medidas não apresentam nenhum dos comportamentos descritos, e ilustrados, nas Figuras 4.1 a 4.3. Neste caso recomenda-se excluir a moda nas relações mostradas acima, isto é, comparar apenas a média e a mediana. 4.5 - Percentil O valor mediano é aquele que divide um conjunto de dados ordenados em duas partes iguais. Da mesma forma, também pode ser útil discriminar valores correspondentes a uma determinada percentagem. Este tipo de situação ocorre, por exemplo, quando se deseja determinar a renda familiar que define os 10% mais ricos em uma sociedade. Professor Inácio Andruski Guimarães, DSc.
  • 22. 22 Estatística – Notas de Aulas Para determinar certo percentil em um conjunto de dados é suficiente ordenar estes mesmos dados e localizar o elemento correspondente à fração desejada, de modo análogo ao usado para determinar a mediana. Exemplo 4.10 – Seja o conjunto de dados mostrado no Quadro 4.1. O 90o percentil é o valor que separa 90% dos exemplares com menor largura dos 10% com a maior largura. Então, considerando que o conjunto tem n = 150 observações, basta separar os 15 últimos elementos, que são justamente os pertencentes à última coluna. Neste caso o 90o percentil é igual a 37. Isto significa que 90% dos exemplares apresentam largura inferior a 37 mm. Quadro 4.1 – Larguras (em mm) das sépalas observadas em 150 exemplares de flores íris. 20 25 27 28 30 30 31 32 34 37 22 25 27 28 30 30 31 32 34 37 22 25 27 29 30 30 31 33 34 37 22 25 28 29 30 30 31 33 34 38 23 26 28 29 30 30 32 33 34 38 23 26 28 29 30 30 32 33 35 38 23 26 28 29 30 30 32 33 35 38 23 26 28 29 30 30 32 33 35 38 24 26 28 29 30 31 32 34 35 38 24 27 28 29 30 31 32 34 35 39 24 27 28 29 30 31 32 34 35 39 25 27 28 29 30 31 32 34 36 40 25 27 28 30 30 31 32 34 36 41 25 27 28 30 30 31 32 34 36 42 25 27 28 30 30 31 32 34 36 44 Fonte: Fisher (1936). Para dados agrupados em distribuições de freqüências pode-se utilizar a fórmula dada por: P p = LI P  pn   100 − fca  +  h fP       (4.5) onde: LIP = limite inferior da classe que contém o p–ésimo percentil, isto é, da classe cuja freqüência acumulada crescente é igual ou imediatamente superior a pn / 100. fca = freqüência acumulada crescente da classe anterior à classe que contém o p–ésimo percentil. fP = freqüência simples da classe que contém o p–ésimo percentil. h = amplitude da classe que contém o p–ésimo percentil. Exemplo 4.11 – Calcular o 90o percentil e o 10o percentil para os dados da distribuição de freqüências dos dados mostrados no Quadro 4.1. Classes 1 2 3 4 5 6 7 8 Largura (mm) 20 |-- 23 23 |-- 26 26 |-- 29 29 |-- 32 32 |-- 35 35 |-- 38 38 |-- 41 41 |--| 44 Total Exemplares 4 15 28 47 31 13 9 3 150 faci 4 19 47 94 125 138 147 150 Professor Inácio Andruski Guimarães, DSc.
  • 23. Estatística – Notas de Aulas 23 Neste caso: p = 90. Então 90 × 150 = 135 . O valor procurado pertence à 6ª. classe, que tem freqüência 100 acumulada crescente igual a 138. LIP = 35 fca = 125 fP = 13 h = 38 – 35 = 3 Substituindo na fórmula 4.5: P = 35 +  135 − 125 90  13   .  ( 3 ) ≅ 37 , 3  O cálculo do 10o percentil é deixado como exercício. 4.6 - Decil Esta medida é aplicada quando de deseja dividir um conjunto de dados ordenados em dez partes iguais. Não é difícil perceber que: D1 = P10 D2 = P20 D3 = P30 ... D9 = P90 Exemplo 4.12 – Para os dados do Quadro 4.1, o quarto decil corresponde ao valor que separa quatro décimos, ou 40% dos valores. Para n = 150 observações, isto representa 60 valores, ou as quatro primeiras colunas. Então D4 = 30. 4.7 - Quartil Esta medida divide um conjunto de dados ordenados em quatro partes iguais. Também é fácil perceber que: Q1 = P25 Q2 = P50 Q3 = P75 Exemplo 4.13 – Para os dados do Quadro 4.1, o terceiro quartil é valor que separa o conjunto em duas partes, uma correspondente a 75% dos valores e outra correspondente a 25% dos valores. Como o conjunto possui 150 observações, e ¾ de 150 correspondem a 112,5, o elemento procurado é a média do 112o e do 113o valores. Então o Q3 = 33 (verifique no próprio quadro !) 4.8 - Exercícios 4.8.1) O Quadro 3.1 foi utilizado para construir uma distribuição de freqüências no Exercício 3.12. Calcular, para a distribuição de freqüências obtida: 1) 2) 3) 4) 5) 6) 7) Média. Mediana. Moda. Comparar os resultados obtidos com os reais valores. Estudar a assimetria da distribuição. Calcular o 10o e o 90o percentís. Calcular o 1o e o 4o quartís. Respostas: O quadro original é dado a seguir. Professor Inácio Andruski Guimarães, DSc.
  • 24. 24 Estatística – Notas de Aulas Quadro 3.1 – Comprimentos (mm) das sépalas observadas em 150 exemplares de flores íris. 43 44 46 47 44 44 46 48 50 56 54 55 50 51 49 57 56 61 58 59 46 48 45 49 56 55 55 58 61 60 46 50 48 50 56 55 56 60 62 62 47 48 50 51 49 49 51 52 58 59 56 57 57 57 64 64 63 63 63 63 48 51 50 53 59 58 57 65 64 64 49 51 50 55 60 60 58 65 64 65 49 50 51 52 50 51 57 63 61 61 60 60 58 61 67 68 67 69 67 67 50 52 51 64 61 63 62 72 72 67 51 54 52 65 62 66 63 73 72 68 54 54 54 57 54 55 66 69 63 64 67 67 63 65 76 77 74 77 69 69 58 57 55 70 67 68 71 77 79 77 Fonte: Fisher (1936). A distribuição de freqüências obtida é dada na tabela a seguir. Classe 1 2 3 4 5 6 7 8 9 Comprimento (mm) 43 |-- 47 47 |-- 51 51 |-- 55 55 |-- 59 59 |-- 63 63 |-- 67 67 |-- 71 71 |-- 75 75 |-- 79 Total Flores 9 23 19 28 20 23 16 6 6 150 faci 9 32 51 79 99 122 138 144 150 fadi 150 141 118 99 71 51 28 12 6 fri 0,0600 0,1533 0,1267 0,1867 0,1333 0,1533 0,1067 0,0400 0,0400 Ponto médio 45 49 53 57 61 65 69 73 77 1) Média: x = 59,03 mm. 2) Mediana: ~ = 58,43 mm. x 3) Moda: Mo = 57,12 mm. 4) x = 55,42 mm. 4.8.2) O Quadro 4.1 mostra os valores observados para as larguras (mm) das sépalas observadas nos 150 exemplares mencionados nos exemplos anteriores. 1) 2) 3) 4) 5) Construir uma distribuição de freqüências para os dados observados. Calcular a largura média. Calcular a largura mediana. Calcular a largura modal. Comparar os valores obtidos a partir da distribuição de freqüências com os valores obtidos diretamente no conjunto de dados. 6) Estudar a assimetria da distribuição. 7) Calcular o 10o e o 90o percentís. Professor Inácio Andruski Guimarães, DSc.
  • 25. 25 Estatística – Notas de Aulas Quadro 4.1 – Larguras (em mm) das sépalas observadas em 150 exemplares de flores íris. 20 25 27 28 30 30 31 32 34 37 22 25 27 28 30 30 31 32 34 37 22 25 27 29 30 30 31 33 34 37 22 25 28 29 30 30 31 33 34 38 23 26 28 29 30 30 32 33 34 38 23 26 28 29 30 30 32 33 35 38 23 26 28 29 30 30 32 33 35 38 23 26 28 29 30 30 32 33 35 38 24 26 28 29 30 31 32 34 35 38 24 27 28 29 30 31 32 34 35 39 24 27 28 29 30 31 32 34 35 39 25 27 28 29 30 31 32 34 36 40 25 27 28 30 30 31 32 34 36 41 25 27 28 30 30 31 32 34 36 42 25 27 28 30 30 31 32 34 36 44 Fonte: Fisher (1936). Respostas: 1) A distribuição de freqüências fica: Classes 1 2 3 4 5 6 7 8 2) A largura média é: Largura (mm) 20 |-- 23 23 |-- 26 26 |-- 29 29 |-- 32 32 |-- 35 35 |-- 38 38 |-- 41 41 |--| 44 Total Exemplares 4 15 28 47 31 13 9 3 150 x = 31,02 mm. 3) A largura mediana é: ~ = 30,78 mm. x 4) A largura modal é: Mo = 30,63 mm. 50 40 30 20 10 0 20 - 23 23 - 26 26 - 29 29 - 32 32 - 35 35 - 38 38 - 41 Figura 4.4 – Histograma para os dados do Quadro 4.1. Professor Inácio Andruski Guimarães, DSc. 41 - 44
  • 26. 26 Estatística – Notas de Aulas 5. MEDIDAS DE DISPERSÃO A principal utilidade das medidas de tendência central, quando calculadas para determinado conjunto de dados, é a determinação de valores característicos ou típicos deste conjunto. Entretanto, a informação fornecida por tais medidas é incompleta, se não for acompanhada de alguma informação sobre a variabilidade dos dados. Esta informação é obtida através do cálculo de medidas de dispersão, ou variabilidade. 5.1 – Amplitude Total Seja um conjunto de dados ordenados {x(1) , x(2) , ... , x(n) }, onde x(1) e x(n) representam o valor mínimo e o valor máximo, respectivamente, do conjunto. A amplitude total é dada por: R = x( n ) − x(1) (5.1) Exemplo 5.1 – A amplitude total para o conjunto de dados do Quadro 4.1 é: R = 44 – 20 = 24 mm. Quadro 4.1 – Larguras (em mm) das sépalas observadas em 150 exemplares de flores íris. 20 25 27 28 30 30 31 32 34 37 22 25 27 28 30 30 31 32 34 37 22 25 27 29 30 30 31 33 34 37 22 25 28 29 30 30 31 33 34 38 23 26 28 29 30 30 32 33 34 38 23 26 28 29 30 30 32 33 35 38 23 26 28 29 30 30 32 33 35 38 23 26 28 29 30 30 32 33 35 38 24 26 28 29 30 31 32 34 35 38 24 27 28 29 30 31 32 34 35 39 24 27 28 29 30 31 32 34 35 39 25 27 28 29 30 31 32 34 36 40 25 27 28 30 30 31 32 34 36 41 25 27 28 30 30 31 32 34 36 42 25 27 28 30 30 31 32 34 36 44 Fonte: Fisher (1936). 5.2 – Desvio Médio Seja um conjunto de dados {x1 , x2 , ... , xn }, não necessariamente ordenados. Então o desvio médio dos valores do conjunto em relação à sua média é dado por: n ∑ D = xi − x (5.2) i =1 n Exemplo 5.2 – O Quadro 5.1 mostra os teores (%) de vanádio encontrados em uma amostra de sete estratos de óleo cru extraídas de solo do tipo “Wilhelm sandstone”. Quadro 5.1 – Teores de vanádio. Estrato 1 2 3 4 5 6 Teor (%) 3,9 2,7 2,8 3,1 3,5 3,9 7 2,7 Fonte: Johnson e Wichern (1988) A média é x = 3 , 2286 . O desvio médio é: D = 3 , 9 − 3 , 2286 + ... + 2 , 7 − 3 , 2286 7 Professor Inácio Andruski Guimarães, DSc. = 0 , 4612 .
  • 27. 27 Estatística – Notas de Aulas Para uma distribuição de freqüências com k classes, com freqüências simples f1 , ... , fk , e pontos médios X1 , ... , Xk , respectivamente, o desvio médio é dado por: k ∑ X i − x fi (5.3) i =1 D = k ∑ fi i =1 Exemplo 5.3 – O desvio médio para a distribuição de freqüências dos dados do Quadro 4.1 é calculado como: A média é x = 31,02 mm. Classes 1 2 3 4 5 6 7 8 Largura (mm) 20 |-- 23 23 |-- 26 26 |-- 29 29 |-- 32 32 |-- 35 35 |-- 38 38 |-- 41 41 |--| 44 Total Ponto Médio (Xi) 21,5 24,5 27,5 30,5 33,5 36,5 39,5 42,5 Exemplares 4 15 28 47 31 13 9 3 150 | Xi – x | 9,52 6,52 3,52 0,52 2,48 5,48 8,48 11,48 | Xi – x | fi 38,08 97,80 98,56 24,44 76,88 71,24 76,32 34,44 517,76 Então D = 517 , 76 3 , 4517 . 150 5.3 – Variância Seja um conjunto de dados {x1 , x2 , ... , xn }, não necessariamente ordenados. Assim como o desvio médio, a variância é gerada a partir das diferenças dos valores do conjunto de dados em relação à média do mesmo. Entretanto, é necessário ter em mente a natureza dos dados estudados, mais especificamente, se os mesmos constituem uma população ou uma amostra. Para o primeiro caso, e representando a média populacional por µ , a variância é dada por: n ∑ (x 2 σ i − µ )2 . i =1 = (5.4) n A fórmula acima pode ser facilmente transformada para uma expressão mais simples, dada por: n ∑ 2 σ x i2 i =1 = − µ n 2 . (5.6) Quando o conjunto de dados {x1 , x2 , ... , xn } representa uma amostra, calcula-se o estimador corrigido para a variância amostral, dado por n ∑ (x s 2 i − x) 2 i =1 = n −1 . (5.7) ˆ2 O estimador acima também costuma ser representado por σ , e a fórmula (5.7) pode ser transformada para n ∑ s 2 = x i2 i =1 n −1 − nx 2 n −1 . Professor Inácio Andruski Guimarães, DSc. (5.8)
  • 28. 28 Estatística – Notas de Aulas Exemplo 5.4 – Calcular a variância para a amostra de teores de vanádio, mostrados no Quadro 5.1. Quadro 5.1 – Teores de vanádio. Estrato 1 2 3 4 5 6 Teor (%) 3,9 2,7 2,8 3,1 3,5 3,9 7 2,7 Fonte: Johnson e Wichern (1988) A média é x = 3 , 2286 . Então, usando a fórmula (5.8): s2 = 3,9 2 + 2 ,7 2 + ... + 2 ,7 2 ( 7 )( 3, 2286 2 ) 74 ,7 72 ,97 − = − = 0 , 2833 . 7 −1 7 −1 6 6 Para uma distribuição de freqüências com k classes, com freqüências simples f1 , ... , fk , e pontos médios X1 , ... , Xk , respectivamente, a variância populacional é dada por: k ∑ σ 2 = X 2 i fi i =1 − µ k ∑ 2 . (5.9) fi i =1 Para dados amostrais, o estimador corrigido é dado por k ∑ s2 = X 2 i fi i =1 − n −1 nx 2 . n −1 (5.10) Exemplo 5.5 – Calcular a variância amostral para os dados da distribuição de freqüências dos dados do Quadro 4.1. Classes 1 2 3 4 5 6 7 8 A média é Largura (mm) 20 |-- 23 23 |-- 26 26 |-- 29 29 |-- 32 32 |-- 35 35 |-- 38 38 |-- 41 41 |--| 44 Total Exemplares (fi) 4 15 28 47 31 13 9 3 150 Ponto Médio (Xi) 21,5 24,5 27,5 30,5 33,5 36,5 39,5 42,5 Xi2 462,25 600,25 756,25 930,25 1122,25 1332,25 1560,25 1806,25 Xi2fi 1849 9003,75 21175 43721,75 34789,75 17319,25 14042,25 5418,75 147319,5 x = 31,02 mm. Então, usando a fórmula (5.10): s2 = 147319 , 5 (150 )( 31 , 02 2 ) 147319 ,5 144336 , 06 − = − = 20 , 0231 . 150 − 1 150 − 1 149 149 Quando não tem à disposição uma planilha de cálculo, ou mesmo uma calculadora adequada, pode-se reduzir o esforço para calcular a variância. Isto é possível através das fórmulas (5.12) e (5.13), obtidas a partir das fórmulas (5.9) e (5.10), respectivamente. Para tanto basta efetuar a substituição de variável dada por: X i = A + hd i . (5.11) Efetuada a substituição nas fórmulas (5.9) e (5.10), após convenientes manipulações algébricas obtém-se as fórmulas dadas por: Professor Inácio Andruski Guimarães, DSc.
  • 29. 29 Estatística – Notas de Aulas σ  k  2  ∑ d i fi  = h 2  i = 1k −     ∑ fi   i =1  2 k ∑d i =1 k ∑ i =1 2  fi    fi   i 2  k  k   ∑ di fi   ∑ d i2 f i  = h 2  i =1 −  i =1  n −1 n ( n − 1)    s2        (5.12)        (5.13) Nas fórmulas acima: A = ponto médio de uma classe de referência escolhida arbitrariamente (em geral escolhe-se a classe modal, isto é, a que possui a maior freqüência simples). h = amplitude de classe (deve ser igual para todas as classes). di = desvio da i-ésima classe em relação à classe escolhida como classe de referência. k n = ∑ fi . i =1 Exemplo 5.6 – Calcular a variância amostral para a distribuição de freqüências do exemplo anterior. Escolhendo, arbitrariamente, a quarta classe como classe de referência: Classes 1 2 3 4 5 6 7 8 Largura (mm) 20 |-- 23 23 |-- 26 26 |-- 29 29 |-- 32 32 |-- 35 35 |-- 38 38 |-- 41 41 |--| 44 Total Exemplares (fi) 4 15 28 47 31 13 9 3 150 di -3 -2 -1 0 1 2 3 4 difi - 12 - 30 - 28 0 31 26 27 12 26 di2fi 36 60 28 0 31 52 81 48 336 Lembrando que h = 3 e n = 150:  336  26 2 s 2 = (3 2 )  − = 9[2, 2550 − 0,0302 ] = 20 ,0232 150 − 1 (150 )(150 − 1)    5.3.1 – Método Breve para o Cálculo da Média Aritmética A substituição (5.15) aplicada à fórmula da média, permite a seguinte transformação: k k ∑ x= ∑d X i fi i =1 ↔ k ∑ i =1 fi x = A+h i fi i =1 k ∑f (5.14) i i =1 A fórmula (5.14) também é conhecida como Método Breve para o cálculo da média. 5.4 – Desvio Padrão È dado pela raiz quadrada da variância. Deste modo, para o cálculo do desvio padrão, deve-se levar em consideração a natureza dos dados. È a medida de dispersão mais utilizada para a descrição de dados, juntamente com a média aritmética. Professor Inácio Andruski Guimarães, DSc.
  • 30. 30 Estatística – Notas de Aulas Seja o conjunto de dados {x1 , x2 , ... , xn }, não necessariamente ordenados. Se o conjunto representa uma população, o desvio padrão é dado por: n ∑x 2 i −µ2 . i =1 σ = n (5.15) Se o conjunto representa uma amostra, o estimador corrigido é dado por: n ∑x 2 i i =1 s= nx 2 n −1 − n −1 . (5.16) Exemplo 5.7 – Calcular o desvio padrão para os dados do Quadro 5.1. Quadro 5.1 – Teores de vanádio. Estrato 1 2 3 4 5 6 Teor (%) 3,9 2,7 2,8 3,1 3,5 3,9 7 2,7 Fonte: Johnson e Wichern (1988) A média é x = 3 , 2286 . Então, usando a fórmula (5.16): s = 3 , 9 2 + ... + 2 , 7 2 ( 7 )( 3 , 2286 − 7 −1 7 −1 2 ) = 0 , 2833 = 0 , 5323 . 5.4.1 – Desvio Padrão para Dados Agrupados em Distribuições de Freqüências Para uma distribuição de freqüências com k classes, com freqüências simples f1 , ... , fk , e pontos médios X1 , ... , Xk , respectivamente, o desvio padrão populacional é dado por: k ∑ 2 i X fi i =1 σ = − µ k ∑ . (5.17) . 2 (5.18) fi i =1 O estimador corrigido para o desvio padrão amostral é dado por: k ∑ X 2 i fi i =1 s = nx 2 n −1 − n −1 Para o cálculo do desvio padrão através das fórmulas (5.17) e (5.18) também é possível efetuar a mesma substituição de variável aplicada ao cálculo da variância. Neste caso as duas fórmulas são transformadas para: k ∑ σ = h d i2 f i i =1 k ∑ fi i =1   −      ∑1 d i f i  i=  k  ∑1 f i  i=  k 2 , (5.19) . (5.20) e k ∑ s = h d i2 f i i =1 n −1  k   ∑ d i fi   i =1  − n ( n − 1) 2 Professor Inácio Andruski Guimarães, DSc.
  • 31. 31 Estatística – Notas de Aulas 5.5 – Coeficiente de Variação É definido como a razão entre o desvio padrão e a média, isto é CV = s x (5.21) Exemplo 5.8 – Calcular o coeficiente de variação para os dados do Quadro 5.1. 0 ,5323 CV = = 0 ,1649 . 3, 2286 5.6 – Exercícios 5.6.1) Seja a distribuição de freqüências dos dados do Quadro 3.1, ou seja: Classe 1 2 3 4 5 6 7 8 9 Comprimento (mm) 43 |-- 47 47 |-- 51 51 |-- 55 55 |-- 59 59 |-- 63 63 |-- 67 67 |-- 71 71 |-- 75 75 |-- 79 Total Flores 9 23 19 28 20 23 16 6 6 150 faci 9 32 51 79 99 122 138 144 150 fadi 150 141 118 99 71 51 28 12 6 fri 0,0600 0,1533 0,1267 0,1867 0,1333 0,1533 0,1067 0,0400 0,0400 Ponto médio 45 49 53 57 61 65 69 73 77 Calcular: 1) O desvio padrão. 2) O coeficiente de variação. 5.6.2) Repetir o exercício anterior para os dados da distribuição de teores de ácido palmítico. Classe 1 2 3 4 5 6 7 8 Teores de Ácido Palmítico (%) 3,8 |-- 5,0 5,0 |-- 6,2 6,2 |-- 7,4 7,4 |-- 8,6 8,6 |-- 9,8 9,8 |-- 11,0 11,0 |-- 12,2 12,2 |-- 13,4 Total (n) Observações (fi) 9 24 21 8 6 24 21 7 120 Respostas: Desvio padrão: s = 2,6515 ; Coeficiente de variação: CV = 0,3123. 6. ASSIMETRIA E CURTOSE Assimetria é o afastamento de uma distribuição em relação a um valor central. Curtose é o achatamento de uma distribuição. 6.1 – Coeficiente de Assimetria Já foi visto que uma distribuição de freqüências pode ser assimétrica positiva, negativa ou simétrica, neste caso também chamada distribuição normal. Os três casos são ilustrados nas figuras a seguir. Professor Inácio Andruski Guimarães, DSc.
  • 32. Estatística – Notas de Aulas 32 Figura 4.1 – Assimetria positiva (Mo < ~ < x ). x Figura 4.2 – Assimetria negativa (Mo > ~ > x ). x 22 Figura 4.3 – Distribuição simétrica (normal) (Mo = ~ = x ). x O coeficiente de assimetria de Pearson mede o afastamento que caracteriza o tipo de assimetria. Este coeficiente é dado por: ass = 3( x − ~ ) x . s Exemplo 5.1 – Calcular o coeficiente de assimetria para os dados do Quadro 5.1. Depois de ordenados, os valores ficam: Quadro 5.1 – Teores de vanádio (ordenados) Estrato (1) (2) (3) (4) (5) (6) (7) Teor (%) 2,7 2,7 2,8 3,1 3,5 3,9 3,9 Fonte: Johnson e Wichern (1988) A média é x = 3,2286 e o desvio padrão é s = 0,5323. A mediana é ~ = 3,1. Então: x Professor Inácio Andruski Guimarães, DSc. (6.1)
  • 33. 33 Estatística – Notas de Aulas ass = 3 ( 3 , 2286 − 3 ,1) = 0 , 7248 . 0 , 5323 6.2 – Coeficiente de Curtose O coeficiente de curtose mede o achatamento de uma distribuição de freqüências, em comparação com uma distribuição normal. Na prática só é calculado para distribuições simétricas, ou muito aproximadamente simétricas. O coeficiente percentílico de curtose é dado por: C = P75 − P25 2 ( P90 − P10 ) . (6.2) Para uma distribuição normal, o coeficiente de curtose é C = 0,263. Se o valor calculado para C é inferior a 0,263, diz-se que a distribuição é leptocúrtica (alongada). Se o valor é superior a 0,263, diz-se que a distribuição é platicúrtica (achatada). As três situações são ilustradas nas Figuras 6.1, 6.2 e 6.3. 70 60 50 40 30 20 10 0 Figura 3.1 – Distribuição leptocúrtica. 45 40 35 30 25 20 15 10 5 0 Figura 3.2 – Distribuição mesocúrtica. Professor Inácio Andruski Guimarães, DSc.
  • 34. Estatística – Notas de Aulas 34 30 25 20 15 10 5 0 Figura 3.3 – Distribuição platicúrtica. A caracterização do tipo de curtose auxilia na avaliação da dispersão dos dados do conjunto. Uma distribuição leptocúrtica possui dispersão baixa, enquanto uma distribuição platicúrtica possui dispersão elevada, tomando como referência a dispersão verificada em uma distribuição normal. 6.3 – Exercícios 6.3.1) Seja a distribuição de freqüências para os dados do Quadro 4.1. Isto é, Classes 1 2 3 4 5 6 7 8 Largura (mm) 20 |-- 23 23 |-- 26 26 |-- 29 29 |-- 32 32 |-- 35 35 |-- 38 38 |-- 41 41 |--| 44 Total Exemplares 4 15 28 47 31 13 9 3 150 Calcular: 1) O coeficiente de assimetria de Pearson. 2) O coeficiente percentílico de curtose. Professor Inácio Andruski Guimarães, DSc.
  • 35. 35 Estatística – Notas de Aulas EXERCÍCIOS DE REVISÃO O Quadro 6.1 contém os teores de ácido oléico observados em 120 observações de óleos vegetais. 22,3 22,7 22,8 22,9 23,1 23,1 23,2 23,2 24 24,1 24,1 24,4 24,4 24,4 24,5 24,5 24,6 24,6 24,7 24,9 25,1 25,1 25,2 25,3 25,3 25,3 25,5 25,6 25,7 25,7 25,8 25,8 25,9 26 26 26,1 26,1 26,4 26,5 26,7 26,8 27 27,1 27,1 27,1 27,2 27,4 27,8 28,3 28,3 28,3 29,1 29,4 29,5 29,6 29,6 29,8 29,9 30,3 30,4 30,4 31 31,1 31,1 31,1 31,1 31,1 31,7 31,7 31,8 31,8 32,1 32,6 32,9 33,6 33,6 33,9 34 34,4 34,5 34,8 34,9 35 35 35 35,2 35,2 35,2 35,4 35,8 37,4 37,7 38,4 39,3 39,7 40,1 41,4 43 43,3 45,7 52,2 53,2 54,6 55,5 55,9 56,6 57,2 58 58,2 59 59,1 59,2 59,2 59,3 61,6 61,8 62,6 64,9 77,8 80,6 Construir uma distribuição de freqüências para os dados. Traçar o histograma. Calcular a média aritmética. Calcular a mediana. Calcular a moda. Tanto a mediana como a moda podem ser obtidas diretamente no Quadro 6.1. Comparar os valores encontrados pela observação direta com os valores obtidos pelas fórmulas, nos exercícios 4 e 5. 7) Calcular o desvio padrão. 8) Estudar a assimetria da distribuição. 9) O cálculo do coeficiente de curtose é justificado para este conjunto de dados ? Por quê ? 1) 2) 3) 4) 5) 6) Algumas respostas: 1) Amplitude total: R = 58,3; Número de classes: k = 1 + 3,3log(120) = 8 ; Amplitude de classe (R/n) : h = 7,3. Professor Inácio Andruski Guimarães, DSc.
  • 36. 36 Estatística – Notas de Aulas 7. TEORIA DA PROBABILIDADE As mais freqüentes aplicações da estatística envolvem processos de tomada de decisões sob condições de incerteza. Este tipo de situação ocorre, por exemplo, em processos de inspeção de qualidade. Aqui o tomador de decisões deve decidir, após inspecionar uma amostra, se um lote de certo produto está conforme parâmetros de qualidade previamente definidos. Neste caso a incerteza decorre de fatores como tamanho da amostra, representatividade da mesma e método de inspeção, entre outros. Esta incerteza é tratada pela estatística com o auxílio da teoria da probabilidade. Na seqüência apresenta-se uma breve revisão dos principais conceitos envolvidos no estudo desta teoria. 7.1 – Teoria dos Conjuntos 7.1.1 – Conjunto. É o termo empregado para designar uma lista, ou coleção, bem definida de elementos. Um conjunto é representado por letra maiúscula, enquanto seus elementos são representados por letras minúsculas. Se um elemento x pertence a um conjunto C, escreve-se x ∈ C . Caso contrário, x ∉ C . Diz–se que um conjunto A está contido em outro conjunto B, se todos os elementos de A pertencem também ao conjunto B. Neste caso escreve-se A ⊂ B , ou B ⊃ A . A negação para a primeira representação é A ⊄ B . Há duas formas de se representar um conjunto. Pode-se listar os seus elementos ou utilizar uma representação gráfica conhecida como Diagrama de Venn. Seja por exemplo o conjunto C, de todos os resultados observáveis no lançamento de um dado. Então: C={1,2,3,4,5,6} 1 2 3 4 5 6 Se um conjunto V não possui quaisquer elementos, diz-se que o mesmo é vazio. Neste caso podese representar como V = { } ou V = Ø. 7.1.2 – Operações com Conjuntos Sejam A, B e C três conjuntos arbitrários. São definidas as seguintes operações: 7.1.2.1 – União A união dos conjuntos A e B é o conjunto formado por todos os elementos que pertencem a A ou a B. A ∪ B = {x : x ∈ A ∨ x ∈ B} . Exemplo 7.1 – Seja os conjuntos A = {1,2,3,4,5,6,7,8,9} e B = {7,8,9,10,11,12}. Então a união de A e B resulta no conjunto A ∪ B = {1,2,3,4,5,6,7,8,9,10,11,12} . 7.1.2.2 – Intersecção A intersecção dos conjuntos A e B é o conjunto formado por todos os elementos que pertencem a A e a B. A ∩ B = {x ∈ A ∧ x ∈ B} . Exemplo 7.2 – A intersecção dos conjuntos A e B do exemplo anterior resulta no conjunto A ∩ B = {7,8,9} . Professor Inácio Andruski Guimarães, DSc.
  • 37. Estatística – Notas de Aulas 37 7.1.2.3 – Diferença A diferença dos conjuntos A e B é o conjunto de elementos de que pertencem ao conjunto A, mas não ao conjunto B. A B = {x : x ∈ A ∧ x ∉ B} . Se A ⊂ B , diz-se que B A é o complemento de A em relação a B. B A Exemplo 7.3 – A diferença dos conjuntos A e B dos exemplos anteriores resulta no conjunto A B = {1,2,3,4,5,6} . Exemplo 7.4 – Sejam os conjuntos X = {2,3,4,5,6,7} e Y = {4,5,6}. Então o complemento de Y em relação a X é X Y = {2,3,7}. 7.1.3 – Conjuntos Finitos e Enumeráveis Diz-se que um conjunto A é finito quando é formado por n elementos, onde n é um número inteiro positivo. Diz-se que um conjunto é enumerável quando é possível atribuir uma seqüência aos seus elementos. Exemplo 7.5 – Seja X o conjunto de todos os possíveis resultados observáveis no lançamento de um dado. Neste caso, X = {1,2,3,4,5,6} é finito e enumerável. Exemplo 7.6 – Seja I o conjunto de todos os números reais compreendidos entre 0 e 1. Então o conjunto dado por I = {x : 0 < x < 1} não é finito e nem enumerável. Exemplo 7.7 – Seja P o conjunto de todos os números inteiros positivos ímpares. Então o conjunto dado por P = {1,3,5,...} é infinito e enumerável. 7.1.4 – Produto Cartesiano Sejam dois conjuntos, A e B. O produto cartesiano de A e B, representado por A × B é o conjunto de todos os pares ordenados (x , y) onde x pertence a A e y pertence a B. A × B = {( x, y ) : x ∈ A ∧ y ∈ B} Exemplo 7.8 – Sejam os conjuntos A = {2,4,6} e B = {5,7}. Então o produto cartesiano é o conjunto dado por A × B = {(2,5) , (2,7) , (4,5) , (4,7) , (6,5) , (6,7)}. 7.1.5 – Classes Há situações nas quais os elementos de um conjunto também são conjuntos. Seja por exemplo o conjunto dos números naturais, IN. O subconjunto de todos os múltiplos de 7 forma um conjunto. Seja um conjunto A. Uma classe de A é um conjunto de subconjuntos de A. Exemplo 7.9 – Seja o conjunto A = {1,2,3,4,5,6,7,8,9,10}. Algumas classes de A são dadas por: [{1,3,5,7,9} , {2,4,6,8,10} , {1,2,3,4}] , [{1,3,5} , {7,9} , {2,4} , {6,8,10}] , [{1},{3},{5},{7},{9}]. Professor Inácio Andruski Guimarães, DSc.
  • 38. Estatística – Notas de Aulas 38 7.1.5.1 – Classe Indexada Em algumas situações utiliza-se a expressão classe indexada de conjuntos, cuja notação geralmente é { Ai : i ∈ I } . Neste caso deseja-se esclarecer que a cada elemento i de I corresponde um conjunto A i . O conjunto I é chamado conjunto dos índices, e os conjuntos A i são os conjuntos indexados por I. Quando I é subconjunto do conjunto IN, dos números naturais, a classe indexada {A1 , A2 , ... } é chamada seqüência de conjuntos. O conjunto de elementos, cada um dos quais pertencente a pelo menos um conjunto A i , é chamado união dos A i , e pode ser representado por U i∈I Ai . O conjunto de elementos, cada um dos quais pertencente a todos os conjuntos A i , é chamado intersecção dos A i , e pode ser representado por I i∈I Ai . 7.1.6 – Partição Seja um conjunto A. Uma partição é uma classe de subconjuntos não vazios e disjuntos deste conjunto. Exemplo 7.10 – Seja o conjunto D = {2,3,4,5,7,8,9}. Uma partição de D é [{2,3,4} , {5,7} , {8,9}]. Por outro lado, a classe [{2,3,4} , {4,5,7} , {8,9}] não é uma partição, pois o elemento “4” pertence a dois subconjuntos. 7.1.7 – σ – Álgebra Sejam um conjunto A e uma classe A não vazia de subconjuntos de U i∈I Ai . Diz-se que A é uma σ – álgebra se: 1. 2. O complemento de qualquer conjunto de A pertence a A. A união de um número finito, e enumerável, de conjuntos de A pertence a A. 7.2 – Técnicas de Contagem De acordo com o princípio fundamental da contagem, se um procedimento pode ser executado de m modos possíveis, e um segundo procedimento pode ser executado de n modos possíveis, então o número de modos pelos quais é possível executar os dois procedimentos é m.n . Exemplo 7.11 – Seja um experimento que consiste em lançar um dado e, na seqüência, uma moeda. Então o número de possíveis resultados é 6.2 = 12. Exemplo 7.12 – Quantas placas com três letras seguidas de quatro algarismos podem ser confeccionadas, sabendo que nenhuma placa possui quatro algarismos iguais a zero ? Neste caso pode-se considerar que há 26 letras disponíveis (incluindo k, w e y) e 10 algarismos, 0 , ... , 9. Como nenhuma placa pode ter quatro algarismos iguais a zero, para a última posição há nove algarismos possíveis. Então o total de placas possíveis é: 26 × 26 × 26 × 10 × 10 × 10 × 9 = 158 184 000 7.2.1 – Fatorial Seja n um número inteiro positivo. O fatorial de n é dado por: n! = n( n − 1)( n − 2)...1 . É possível demonstrar que 0 ! = 1. Exemplo 7.13 – 5 ! = 5.4.3.2.1 = 120 ; 8 ! / 6 ! = (8.7.6 !) / 6 ! = 8.7 = 56. Professor Inácio Andruski Guimarães, DSc. (7.1)
  • 39. 39 Estatística – Notas de Aulas 7.2.2 – Coeficiente Binomial Sejam dois números inteiros positivos n e p, tais que p ≤ n. Então o coeficiente binomial de n sobre p é dado por: n  n!  =  p  p ! (n − p) !   . (7.2) 7! 7! 7 . 6 . 5! 7 . 6 42 Exemplo 7.14 –  7  =    5  5! ( 7 − 5 )! = 5! 2! = 5! 2 . 1 = 2 . 1 = 2 = 21   Propriedades: n P1 :   = 1 . 0   n P2 :   = n . 1    n P3 :   = 1 . n   n  n  =  .     p q P4: Se p + q = n , então   7.2.3 – Permutação A disposição dos elementos de um conjunto seguindo certa ordem é chamada permutação. O total de permutações que pode efetuar com n elementos é dado por Pn = n ! . (7.3) Exemplo 7.15 – Seja o conjunto X = {2,4,6}. As possíveis permutações com os três elementos são: 246 , 426 , 462 , 264 , 624 , 642. Total: 3 ! = 3.2.1 = 6. 7.2.4 – Arranjo Sejam n elementos. Uma permutação de p, p ≤ n, destes elementos, de acordo com determinada ordem, é denominada arranjo. O número de arranjos de n elementos, tomados p a p, é dado por: An , p = n! . (n − p) ! (7.4) Exemplo 7.16 – Sejam os algarismos 1 , 2 , ... , 8 , 9. Quantos números com três dígitos podem ser formados a partir dos algarismos dados ? A9 , 3 = 9! 9 .8 .7 .6! = = 9 .8 .7 = 504 . 6! 6! OBS: Alguns autores não fazem distinção entre permutação e arranjo, preferindo utilizar apenas a primeira expressão. Professor Inácio Andruski Guimarães, DSc.
  • 40. Estatística – Notas de Aulas 40 7.2.5 – Permutação com Repetição Há situações nas quais alguns dos n elementos com os quais deseja-se efetuar um arranjo são iguais. Então, se n1 , n2 , ... , nr são iguais, o número de permutações é dado por: n! n1! n2 !... n r ! . (7.5) Exemplo 7.17 – De quantos modos é possível arranjar as letras da palavra PARANÁ ? 6! 6 .5 .4 .3 ! = = 120 3! 3! 7.2.6 – Combinação Sejam n elementos. Uma disposição de p, p ≤ n, destes elementos, sem levar em consideração a ordem, é denominada combinação. O número de combinações de n elementos, tomados p a p, é dado por: n  Cn , p =   .  p   (7.6) Exemplo 7.18: Sejam os algarismos 1 , 2 , ... , 8 , 9. Quantas combinações com três dígitos podem ser formadas a partir dos algarismos dados ? Neste caso considera-se que 567 e 675, por exemplo, são uma só combinação, já que a ordem é irrelevante. Então o total de combinações é dado por: C 9 ,3 = 9! 9 . 8 .7 .6! = = 84 . 3 ! 6 ! 3 . 2 .1 .6! 7.2.7 – Exercícios 7.2.7.1) Arme e efetue: a) 6 ! b) 8 ! 8     6   8  d)    2   c) e) 7   5   7    2   7.2.7.2) Uma loteria consiste em 60 números, numerados de 1 a 60, entre os quais o apostador deve escolher seis. De quantos modos é possível escolher os seis números ? 7.2.7.3) Quantos anagramas é possível formar com as letras da palavra ESTATÍSTICA ? 7.2.7.4) Um baralho completo possui 52 cartas, divididas em quatro grupos iguais (naipes). Deste baralho são retiradas cinco cartas. Quantos resultados são possíveis ? Professor Inácio Andruski Guimarães, DSc.
  • 41. 41 Estatística – Notas de Aulas 7.3 – Introdução à Probabilidade As origens da teoria da probabilidade remontam a meados do século 17. Os conceitos fundamentais, como probabilidade e esperança matemática, surgiram nas correspondências trocadas entre Pascal e Fermat, e que geralmente tratavam de jogos de azar. De acordo com Gnedenko (1962), as questões então levantadas não faziam parte do escopo da matemática da época. O desenvolvimento da teoria da probabilidade, observado nos séculos subseqüentes, foi impulsionado em grande parte pelas necessidades das ciências naturais. A abordagem matemática, caracterizada pelo rigor formal, teve início em meados do século 19, prolongando-se até meados do século 20. As aplicações da teoria da probabilidade podem ser observadas em praticamente qualquer área de pesquisa, seja através da modelagem de experimentos aleatórios, ou através da aplicação de testes estatísticos fundamentados em conceitos da mencionada teoria. Embora não haja uma definição formal para o termo probabilidade, pode-se entender que o mesmo designa o estudo de experimentos aleatórios, isto é, experimentos cujos resultados estão sujeitos ao acaso. Alguns conceitos necessários ao referido estudo são apresentados a seguir. 7.3.1 – Espaço Amostral e Evento Seja um experimento aleatório realizado sob condições fixas. Chama-se espaço amostral do experimento o conjunto de todos os resultados observáveis para o experimento. Chama-se evento a qualquer subconjunto E, de . Vale lembrar que um espaço amostral pode conter mais de um evento. Neste caso é possível combinar eventos através de operações com conjuntos, isto é: 1. 2. Evento união: A ∪ B . Evento intersecção: A ∩ B . 3. Evento complementar: A C (só ocorre quando A não ocorre). Exemplo 7.19 – Um exemplo de experimento aleatório é o lançamento de um dado. Neste caso o espaço amostral correspondente é o conjunto = {1 , 2 , 3 , 4 , 5 , 6}. Um exemplo de evento é o subconjunto de dado por E = {2 , 4 , 6}, que corresponde ao resultado “número par”. Exemplo 7.20 – Imagine-se que um experimento aleatório consiste em registrar o tempo t, em horas, entre falhas apresentadas por determinado equipamento. Então = {t ∈ IR ; 0 < t}. Não é difícil perceber que este espaço amostral contém resultados claramente impossíveis. Entretanto, na definição de um espaço amostral, deve-se ter a preocupação de definir um conjunto que contenha todos os possíveis resultados para o experimento aleatório em questão. Neste sentido, a escolha do conjunto acima é bastante adequada. 7.3.1.1 – Eventos Mutuamente Exclusivos Sejam A e B eventos de um espaço amostral exclusivos se, e somente se, A e B são disjuntos. . Diz-se que A e B são eventos mutuamente Exemplo 7.21 – O espaço amostral associado ao lançamento de um dado é = {1 , 2 , 3 , 4 , 5 , 6}. Não é difícil perceber que os eventos A = {número par} = {2 , 4 , 6} e B = {número ímpar} = {1 , 3 , 5} são mutuamente exclusivos. 7.3.2 – Enfoques Para a formalização do conceito de probabilidade pode-se adotar um de três enfoques: 7.3.2.1 – Enfoque Clássico Também conhecido como definição clássica de probabilidade, estabelece que, se amostral finito, então a probabilidade de qualquer evento E, contido em , é dada por P( E ) = # (E) # (Ω ) . Professor Inácio Andruski Guimarães, DSc. é um espaço (7.8)
  • 42. Estatística – Notas de Aulas 42 7.3.2.2 – Enfoque Relativo De acordo com este enfoque, a probabilidade de um evento E é dada pela razão entre o total de ocorrências do evento e o total de observações. De outra forma, a probabilidade de ocorrência é igual à proporção de “sucessos”. Neste caso o cálculo da probabilidade está baseado na coleta de observações, razão pela qual este enfoque também é denominado enfoque empírico. Exemplo 7.22 – Se, numa entrevista com 200 eleitores, observou-se que 120 pretendem votar em determinado candidato, então a probabilidade encontrar um eleitor daquele candidato é p = 0,6. 7.3.2.3 – Enfoque Subjetivo Também chamado personalístico, é baseado no “grau de crença” na ocorrência do evento em questão. Atualmente, é muito aplicado à tomada de decisões em finanças e mercado de capitais, por exemplo. 7.3.3 – Axiomas de Probabilidade A1: Para qualquer evento E de um espaço amostral : 0 ≤ P(E) ≤ 1. A2: P( ) = 1. A3: Se A e B são eventos mutuamente exclusivos, então P ( A ∪ B ) = P ( A) + P ( B ) . 7.3.4 – Teoremas de Probabilidade C T1: P ( A ) = 1 − P ( A) . T2: A ⊂ B ⇒ P ( A) ≤ P ( B ) . T3: P ( A B ) = P ( A) − P ( A ∩ B ) . T4: P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B ) . 7.3.5 – Espaço de Probabilidade Seja um espaço amostral finito, isto é, = {e1 , e2 , ... , en }. Um espaço de probabilidade é o conjunto P = {p1 , p2 , ... , pn } , obtido ao associar-se a cada ei ∈ um valor pi ∈ IR, denominado probabilidade de ei , e tal que: 1. 0 ≤ pi , i = 1 , ... , n. n 2. ∑p i = 1. i =1 Exemplo 7.23 – Uma moeda é lançada três vezes, com o objetivo de observar o número de “caras”, representado por k. Espaço amostral: = {0 , 1 , 2 , 3} Probabilidades: P(k = 0) = ⅛ ; P(k = 1) = ⅜ ; P(k = 2) = ⅜ ; P(k = 3) = ⅛ . Então o espaço de probabilidade é: P = { ⅛ , ⅜ , ⅜ , ⅛ }. Exemplo 7.24 – Um dado é lançado até obter o número 6. O número de lançamentos é representado por x. Espaço amostral: = {1 , 2 , 3 , ... , ∞} Probabilidades: P(x = 1) = 1/6 ; P(x = 2) = (5/6)(1/6) ; P(x = 3) = (5/6)2(1/6) ; ... ; P(x = n) = 5/6n Espaço de probabilidade: P = {1/6 , 5/36 , 5/216 , ... , 0}. Professor Inácio Andruski Guimarães, DSc.
  • 43. 43 Estatística – Notas de Aulas 7.3.6 – Eventos Independentes Sejam A e B dois eventos de um espaço amostral , observados em seqüência. Diz-se que ambos são independentes quando a ocorrência, ou não, do primeiro não afeta a probabilidade de ocorrência do outro. Neste caso: P( A ∩ B) = P ( A).P( B) . (7.9) Exemplo 7.25 – Um dado é lançado duas vezes. Qual a probabilidade de obter os resultados 4 e 5 ? P (4 ∩ 5) = 1 1 1 . = 6 6 36 7.3.7 – Eventos Dependentes e Probabilidade Condicional Sejam A e B dois eventos de um espaço amostral . Diz-se que ambos são dependentes quando a ocorrência, ou não, do primeiro afeta a probabilidade de ocorrência do outro. Neste caso: P( A ∩ B) = P( A).P( B | A) . (7.10) OBS: P(B | A) significa “probabilidade de ocorrência de B após a ocorrência de A”. Exemplo 7.26 – Uma urna contém seis bolas brancas e quatro bolas vermelhas. São retiradas duas bolas, sem reposição. Sejam os eventos B1 , bola branca na primeira retirada, e V2 , bola vermelha na segunda retirada. Neste caso, para calcular a probabilidade de V2 deve-se levar em consideração o resultado da primeira retirada, isto é: P (V 2 | B1 ) = 6 4 4 = 10 9 15 ou P (V 2 | V1 ) = 4 3 2 = 10 9 15 A probabilidade condicional de um evento B ocorrer após a ocorrência de um evento A é dada por: P( B | A) = P( A ∩ B) . P ( A) (7.11) Exemplo 7.27 – Um dado é lançado duas vezes. Se a soma dos resultados é sete, qual a probabilidade de que um dos resultados tenha sido quatro ? = {(1,1) , (1,2) , ... , (1,6) , (2,1) , ... , (2,6) , (3,1) , ... , (3,6) , ... , (1,6) , ... , (6,6)} → #( ) = 36. S = {a soma é sete} = {(1,6) , (2,5) , (3,4) , (4,3) , (5,2) , (6,1)} → #(S) = 6. D = {um dos resultados é quatro} = {(1,4) , (4,1) , (2,4) , ... , (3,4) , (4,3) , ... , (4,6)} → #(D) = 12. S ∩ D = {(3,4) , (4,3)} → #(S ∩ D) = 2. 2 P (D | S ) = 7.3.7.1 – Comentário 6 36 = 1 3 36 É importante ressaltar que eventos mutuamente exclusivos e eventos independentes não são necessariamente o mesmo tipo de evento. A primeira expressão é utilizada para situações nas quais apenas um dos eventos pode ocorrer, excluindo qualquer possibilidade de ocorrência do outro. A segunda expressão é utilizada quando a ocorrência de um dos eventos não tem qualquer efeito sobre a ocorrência do outro. Professor Inácio Andruski Guimarães, DSc.
  • 44. 44 Estatística – Notas de Aulas 7.3.8 – Teorema da Probabilidade Total Seja um espaço amostral e sejam A1 , A2 , ... , An partições de de todos os Ai é o próprio espaço . Seja B um evento qualquer de . A1 A2 A3 A4 , isto é, Ai ∩ Aj = Ø e a união ... A5 An B Então a probabilidade de B é dada por: P(B) = n ∑ P( A )P(B | A ) . i (7.12) i i =1 Exemplo 7.28 – Uma indústria adquire certo componente de três fornecedores, A, B e C. O primeiro é responsável por 40% da produção e o segundo é responsável por 25% da produção. A proporção de defeituosos é de 2% para o fornecedor A, 5% para o fornecedor B e 4% para o fornecedor C. Qual a probabilidade de uma unidade selecionada ao acaso ser defeituosa ? P(A) = 0,40 , P(B) = 0,25 , P(C) = 0,35. P(D|A) = 0,02 , P(D|B) = 0,05 e P(D|C) = 0,04. P(D) = P(A)P(D|A) + P(B)P(D|B) + P(C)P(D|C) = (0,40)(0,02) + (0,25)(0,05) + (0,35)(0,04) = 0,0345 7.3.9 – Teorema de Bayes Seja um espaço amostral e sejam A1 , A2 , ... , An partições de , isto é, Ai ∩ Aj = Ø e a união de todos os Ai é o próprio espaço . Seja B um evento qualquer de . Então, para qualquer i = 1 , ... , n: P ( Ai | B ) = P ( Ai ) P ( B | A i ) n ∑ P( A j . (7.13) )P(B | A j ) j =1 Exemplo 7.29 – Sejam os dados do exemplo anterior. Se uma peça é defeituosa, qual a probabilidade de ter sido entregue pelo fornecedor C ? P (C | D ) = P (C | D ) = P (C ) P ( D | C ) P ( A ) P ( D | A ) + P ( B ) P ( D | B ) + P (C ) P ( D | C ) (0,35)(0,04) 0,014 = = 0,4058 (0,40)(0,02) + (0,25)(0,05) + (0,35)(0,04) 0,0345 7.4 – Exercícios 7.4.1) Um caixa contém 12 unidades de certo componente, sendo três defeituosas. São retiradas três unidades ao acaso, e sem reposição. Seja X o número de unidades defeituosas obtidas neste experimento aleatório. Determinar os espaços amostral e de probabilidades. 7.4.2) Dois dados são lançados. Calcular a probabilidade de: a) Obter dois números diferentes. b) O segundo resultado ser menor que o primeiro. c) Pelo menos um dos resultados ser 2. Professor Inácio Andruski Guimarães, DSc.
  • 45. 45 Estatística – Notas de Aulas 7.4.3) São escolhidos ao acaso, em seqüência e sem reposição, dois números entre 0 e 9. Se a soma é par, qual a probabilidade de que os dois números sejam ímpares ? 7.4.4) Uma caixa contém quatro bolas brancas e seis bolas pretas. Quatro bolas são retiradas, sem reposição. Qual a probabilidade de que três sejam pretas ? 7.4.5) Um jogador tem na mão quatro cartas de paus. Se ele deve receber mais duas cartas, qual a probabilidade de: a) Ambas serem de paus ? b) Pelo menos uma ser de paus ? 7.4.6) Em uma indústria de móveis, 7% das unidades apresentam risco na pintura, 5% apresentam dobradiças soltas e 4% apresentam os dois defeitos. Uma unidade é escolhida aleatoriamente. a) Se apresenta risco na pintura, qual a probabilidade de também apresentar dobradiças soltas ? b) Se apresenta dobradiças soltas, qual a probabilidade de também apresentar risco na pintura ? c) Qual a probabilidade de apresentar risco na pintura ou dobradiças soltas ? 7.4.7) Um lote de 20 unidades de um componente contém quatro unidades defeituosas. Escolhe-se aleatoriamente uma amostra de cinco unidades do lote. Qual a probabilidade de que a amostra contenha duas unidades defeituosas ? 7.4.8) Uma loja tem no estoque 12 furadeiras da marca X, das quais duas operam em 220 v, 15 furadeiras da marca Y, das quais três operam em 220 v e oito furadeiras da marca Z, das quais apenas uma opera em 220 v. Uma furadeira é escolhida ao acaso. a) Qual a probabilidade de ser da marca X e operar em 220 v ? b) Se opera em 220 v, qual a probabilidade de ser da marca X ? 7.4.9) Em uma escola, 70% dos alunos são do sexo masculino. Sabe-se também que 20% dos rapazes usam óculos, o mesmo ocorrendo com 30% das moças. Se um nome é escolhido ao acaso e verifica-se que usa óculos. Qual a probabilidade de ser uma moça ? 7.4.10) Uma urna contém duas bolas vermelhas e três bolas amarelas. Retira-se uma bola da urna e, na seqüência coloca-se uma bola da outra cor. Em seguida retira-se outra bola da urna. Qual a probabilidade desta segunda bola ser branca ? Respostas 1) = {0 , 1 , 2 , 3} P(X = 0) = (9/12)(8/11)(7/10) = 504/1320 = 0,3818 P(X = 1) = 0,4909 P(X = 2) = 0,1228 P(X = 3) = 0,0045 P = {0,3818 ; 0,4909 ; 0,1228 ; 0,0045} 3) Se a soma é par, os dois números ou são pares ou são ímpares. = {(0,1) , ... , (0,9) , (1,0) , (1,2) , ... , (1,9) , (2,0) , (2,1) , (2,3) , ... , (2,9) , ... , (9,0) , ... , (9,8)} Soma Par = {(0,2) , ... , (0,8) , (1,3) , ... , (1,9) , (2,4) , ... , (2,8) , (3,1) , ... , (3,9) , ... , (9,1) , .... , (9,7)} Ímpares = {(1,3) , (1,5) , (1,7) , (1,9) , (3,1) , (3,5) , (3,7) , (3,9) , (5,1) , ... , (5,9) , ... , (9,1) , .... , (9,7)} #( ) = 90 #( Soma Par ) = 40 #( Ímpares ) = 20 P( Ímpares | Soma Par ) = 20/40 = ½ 5) a) Se o jogador tem quatro cartas de paus, há 48 cartas na mesa, sendo nove de paus. Então o total de possíveis resultados é dado por  48  = 1128 . Se há nove cartas de paus, então o total de resultados    2    com duas cartas de paus é dado por  9  = 36 . Então p = 36 / 1128 = 0,0319.   2   Professor Inácio Andruski Guimarães, DSc.
  • 46. 46 Estatística – Notas de Aulas 7) Se a amostra contém cinco unidades, e duas devem ser defeituosas, então três devem ser perfeitas. O número de possibilidades de encontrar duas defeituosas entre as quatro existentes é dado por  4  = 6 .   2   As três unidades perfeitas podem ser escolhidas entre as 16 nestas condições. Então o total de possibilidades é  16  = 560 . Finalmente, o total de possíveis combinações é dado por      3   20   5    = 15504 . Então p = (6)(560) / 15504 = 0,2167.   9) O diagrama de árvore fica Usa óculos 0,20 Rapaz 0,70 0,80 Não usa óculos Usa óculos 0,30 0,30 Moça 0,70 Não usa óculos P( Moça | Usa óculos) = 0,09 / 0,23 = 0,3913. Professor Inácio Andruski Guimarães, DSc.
  • 47. 47 Estatística – Notas de Aulas 8. VARIÁVEIS ALEATÓRIAS Sejam um espaço amostral e um espaço de probabilidade P, associados a um experimento aleatório. Uma variável aleatória X no espaço de probabilidade é uma função real X(ω): → IR definida em e tal que [X ≤ x] é um evento aleatório para qualquer x real. Exemplo 8.1 – Um lote contém 20 unidades de um componente, sendo quatro defeituosas. São retiradas quatro peças e X representa o número de unidades defeituosas entre as quatro retiradas. Neste caso a variável X assume seus valores no conjunto = {0 , 1 , 2 , 3 , 4}. O espaço de probabilidade P é dado por P = {0,3756 ; 0,4623 ; 0,1486 ; 0,0132 ; 0,0002}. x P( X = x) 0 0,3756 1 0,4623 As probabilidades acima são dadas por: 2 0,1486 3 0,0132 P ( X = 0) = 4 0,0002 Total 1 16 15 14 13 43680 = = 0 ,3756 20 19 18 17 116280 P ( X = 1) = 4 16 15 14 4 = 0 , 4623 20 19 18 17 P ( X = 2) = 6 P ( X = 3) = 4 16 4 3 2 = 0, 0132 20 19 18 17 P ( X = 4) = 16 15 4 3 = 0,1486 20 19 18 17 4 3 2 1 = 0, 0002 20 19 18 17 Propriedades Sejam X e Y variáveis aleatórias em um espaço . Então: P1: (X + Y )(ω) = X(ω) + Y(ω) P2: (kX )(ω) = kX (ω) P3: (X + k )(ω) = X(ω) + k P4: (XY )(ω) = X (ω) Y (ω) 8.1 – Tipos de Variáveis Aleatórias São considerados dois tipos de variáveis aleatórias, discreta e contínua, ambos definidos a seguir. 8.1.1 – Variável Aleatória Discreta Seja X uma variável aleatória definida no espaço amostral . Diz-se que X é uma variável aleatória discreta (v.a.d.) se assume um número finito, ou enumerável, de valores. De outro modo, X é discreta se existe um conjunto enumerável {x1 , x2 , ... , xn }, contido em IR, tal que X(ω) ∈ {x1 , ... , xn }, para qualquer ω ∈ . Exemplo 8.2 – A variável aleatória X do exemplo anterior é discreta. 8.1.2 – Variável Aleatória Contínua Seja X uma variável aleatória definida no espaço amostral . Diz-se que X é uma variável aleatória contínua (v.a.c.) se assume seus valores em um intervalo de números reais. Exemplo 8.3 – Seja t a variável aleatória que representa o tempo entre duas falhas consecutivas apresentadas por um equipamento. Neste caso t é uma variável aleatória contínua, e = {t ∈ IR ; 0 ≤ t }. 8.2 – Função de Probabilidade Seja X uma variável aleatória discreta no espaço amostral , tal que X(ω) ∈ {x1 , x2 ,... , xn }, para qualquer ω ∈ . Diz-se que p (x) é uma função de probabilidade (f.p.) de X se: Professor Inácio Andruski Guimarães, DSc.
  • 48. 48 Estatística – Notas de Aulas 1. p (xi ) = P( X = xi ). 2. p(xi ) ≥ 0 . 3. ∑ p( x ) = 1 n i i =1 Exemplo 8.4 – Seja X a v.a.d. que indica o total de resultados iguais a 6, obtidos em cinco lançamentos de um dado. Então X ∈ {0 , 1 , 2 , 3 , 4 , 5}. As probabilidades são dadas por: P(X = 0) = C5 , 0 (1/6)0 (5/6)5 = 0,4019 P(X = 1) = C5 , 1 (1/6)1 (5/6)4 = 0,4019 x Não é difícil verificar que: 1) P ( X = x ) = p ( x ) = C 5 , x  1   5      5− x 6 6 3) 6 ∑ i =1  5  x  i x  1  i  5       6    6  5 − xi = (1) ... . 2) p ( xi ) ≥ 0 . 55 54 53 52 5 1 7776 + ( 5 ) 5 + (10 ) 5 + (10 ) 5 + ( 5 ) 5 + (1 ) 5 = = 1. 5 7776 6 6 6 6 6 6 8.3 – Função Densidade de Probabilidade Seja X uma variável aleatória contínua em um espaço amostral densidade de probabilidade (f.d.p.) se: . Diz-se que f (x) é uma função 1. f ( xi ) ≥ 0 . x2 ∫ f ( X )dX 2. P ( x1 ≤ X ≤ x 2 ) = x1 +∞ 3. ∫ f ( X )dX = 1 −∞ Exemplo 8.5 – Sejam uma v.a.c. X , 0 ≤ X e a função f ( X ) = e – X . A função dada é uma f.d.p., pois: 1. f ( xi ) ≥ 0 x2 ∫e 2. P ( x1 ≤ X ≤ x 2 ) = −X dX = −e − x2 + e − x1 . x1 +∞ 2. ∫e −X dX = − e − X 0 +∞ 0 =1 8.4 – Expectância A expectância, também chamada esperança, valor esperado ou valor médio, de uma variável aleatória X é dada por: n 1. E ( X ) = µ X = ∑ xi p ( x i ) , se X é uma variável aleatória discreta. (8.1) i =1 +∞ 2. E ( X ) = µX = ∫ Xf ( X )dX , se X é uma variável aleatória contínua. −∞ Professor Inácio Andruski Guimarães, DSc. (8.2)
  • 49. 49 Estatística – Notas de Aulas Propriedades Sejam X e Y variáveis aleatórias definidas em um mesmo espaço amostral P1: E(kX ) = kE(X ) P2: E(X + k) = E( X ) + k , k um número real. Então: P3: E(X + Y ) = E(X ) + E(Y ) P4: E(XY) = E(X)E(Y) Exemplo 8.6 – Seja X a variável aleatória do exemplo 8.1. Então a sua expectância é calculada como: x P( X = x) xP(X = x) 0 0,3756 0 1 0,4623 0,4623 2 0,1486 0,2972 3 0,0132 0,0396 4 0,0002 0,0008 Total 1 0,7999 E (X ) = 0,7999 Exemplo 8.7 – Sejam a variável aleatória e a função densidade de probabilidade dadas no exemplo 8.5. Então: ∞ E(X ) = ∫ xe −x dx = Γ ( 2 ) = 1 . 0 8.5 – Variância A variância de uma variável aleatória X é dada por: 1. Var [ X ] = σ 2 n = ∑ [x i − E ( X )] 2 p ( x i ) , se X é uma variável aleatória discreta. (8.3) i =1 +∞ 2. Var [ X ] = σ 2 = ∫ [ X − E ( X )] 2 f ( X ) dX , se X é uma variável aleatória contínua. (8.4) −∞ Propriedades Sejam X e Y variáveis aleatórias definidas em um mesmo espaço amostral , k um número real. Então: P2: Var(kX) = k2 Var(X) P1: Var(X + k) = Var(X) . A variância também pode ser calculada através da fórmula: Var [ X ] = E ( X 2 ) − [ E ( X )] 2 . Na fórmula (8.5): E ( X 2 ) = n ∑x 2 i p ( xi ) , para v.a.d. e E ( X 2 ) = i =1 (8.5) +∞ ∫X 2 i f ( X ) dX , para v.a.c.. −∞ Exemplo 8.8 – Seja X a variável aleatória do exemplo 8.1. Então a sua variância é calculada como: x P( X = x) x2 P(X = x) 0 0,3756 0 1 0,4623 0,4623 2 0,1486 0,5944 3 0,0132 0,1188 4 0,0002 0,0032 Total 1 1,1787 Então: Var[X] = 1,1787 – (0,7999)2 = 0,5389. Exemplo 8.9 – Sejam a variável aleatória e a função densidade de probabilidade dadas no exemplo 8.5. Então: ∞ E(X 2) = Logo, Var[X] = 2 – 12 = 1. ∫x 2 e − x dx = Γ ( 3 ) = 2 ! = 2 . 0 Professor Inácio Andruski Guimarães, DSc.
  • 50. 50 Estatística – Notas de Aulas 8.6 – Distribuição Conjunta Sejam duas variáveis aleatórias, X e Y, definidas em um espaço amostral , e com os contradomínios X(ω) = {x1 , ... , xn } e Y(ω) = {y1 , ... , ym }. Seja também o produto cartesiano dado por: X (ω ) × Y (ω ) = {( x1 , y1 ),..., ( x n , y m )} . Chama-se distribuição conjunta, ou função de probabilidade conjunta de X e Y a função definida por: H ( x i , y j ) = P ( X = xi ; Y = y j ) . (8.6) Se X e Y são variáveis aleatórias discretas: 1. H ( xi , y j ) ≥ 0 . n 2. m ∑∑ H ( x , y i j ) = 1. i =1 j =1 3. P ( X = xi ; Y = y j ) = H ( xi , y j ) . Se X e Y são variáveis aleatórias contínuas: 1. H ( X , Y ) ≥ 0 . +∞ +∞ 2. ∫ ∫ H ( X , Y )dXdY = 1 . − ∞− ∞ x2 y 2 3. P ( x1 ≤ X ≤ x 2 ; y1 ≤ Y ≤ y 2 ) = ∫ ∫ H ( X , Y )dYdX x1 y1 Para a função (8.6) há um espaço de probabilidades. Tais probabilidades podem ser apresentadas em tabelas, ou quadros, de dupla entrada. Tabela 8.1 – Distribuição de Probabilidade Conjunta. Y y1 y2 ... ym H(x1 , y1) H(x1 , y2) ... H(x1 , ym) H(x2 , y1) H(x2 , y2) ... H(x2 , ym) ... ... ... ... H(xn , y1) H(xn , y2) ... H(xn , ym) g(y1) g(y2) ... g(ym) X x1 x2 ... xn Total Total f(x1) f(x2) ... f(xn ) 1 Na Tabela 8.1 as funções f e g são chamadas distribuições marginais, e são definidas por: 1. f ( x i ) = m ∑ H (x , y i n j ) g ( y j ) = ∑ H ( x i , y j ) , para X e Y discretas. j =1 i =1 +∞ 2. f ( x ) = ∫ H ( x, y )dy +∞ g ( y) = −∞ ∫ H ( x, y )dx , para X e Y contínuas. −∞ 8.7 – Independência de Variáveis Sejam X e Y duas variáveis aleatórias definidas em um espaço amostral , com os contradomínios X(ω) = {x1 , ... , xn } e Y(ω) = {y1 , ... , ym }, e com distribuição conjunta H(xi , yj). Diz-se que X e Y são variáveis aleatórias independentes se, e somente se: Professor Inácio Andruski Guimarães, DSc.
  • 51. 51 Estatística – Notas de Aulas H ( xi , y j ) = f ( xi ) g ( y j ) . Exemplo 8.10 – Um experimento aleatório consiste em lançar uma moeda e retirar uma carta de um baralho. Sejam as variáveis aleatórias X , resultado observado na moeda(0 = cara e 1 = coroa), e Y , naipe da carta retirada (1 = paus, 2 = ouro, 3 = copas, 4 = espada). Então o espaço de probabilidades é: X 0 1 Total Y 1 ⅛ ⅛ ¼ 2 ⅛ ⅛ ¼ 3 ⅛ ⅛ ¼ 4 ⅛ ⅛ ¼ Total ½ ½ 1 Neste caso as variáveis são independentes, pois H(xi , yj) = f(xi )g(yj ). 8.7.1 – Expectância Sejam X e Y duas variáveis aleatórias definidas em um espaço amostral , com os contradomínios X(ω) = {x1 , ... , xn } e Y(ω) = {y1 , ... , ym }, e com distribuição conjunta H(xi , yj). A expectância do produto de X e Y é dada por: n 1. E ( XY ) = µ XY = ∑ xi y j H ( xi , y j ) , se X e Y são variáveis aleatórias discretas. (8.7) i =1 +∞ +∞ 2. E ( XY ) = ∫ ∫ XYH ( X , Y )dXdY µ XY = , se X e Y são variáveis aleatórias contínuas. (8.8) − ∞− ∞ 8.7.2 – Covariância Sejam X e Y duas variáveis aleatórias definidas em um espaço amostral , e com os contradomínios X(ω) = {x1 , ... , xn } e Y(ω) = {y1 , ... , ym }, e com expectâncias µX e µY , respectivamente. Além disto, considere-se que a distribuição conjunta das duas variáveis é H(xi , yj). Então a covariância de X e Y é dada por: n m Cov( X , Y ) = ∑∑ [ xi − µ X ][ y j − µY ]H ( xi , y j ) , para X e Y discretas. (8.9) i =1 j =1 +∞ +∞ Cov ( X , Y ) = ∫ ∫ (X − µ X )(Y − µ Y ) H ( X , Y )dXdY , para X e Y contínuas. (8.10) − ∞− ∞ A covariância também pode ser calculada por: Cov ( X , Y ) = E ( XY ) − E ( X ) E (Y ) . (8.11) 8.7.3 – Correlação Sejam X e Y duas variáveis aleatórias definidas em um espaço amostral , e com os contradomínios X(ω) = {x1 , ... , xn } e Y(ω) = {y1 , ... , ym }, e com variâncias σ2X e σ2Y, respectivamente. O coeficiente de correlação de X e Y é a medida da relação linear entre as duas variáveis, e é dado por: ρ ( X ,Y ) = Cov ( X , Y ) σ 2 X . (8.12) σ Y2 O coeficiente de correlação ρ pertence ao intervalo real [– 1 ; 1] . Se ρ = 1 ou ρ = – 1, a relação é perfeita, e neste caso Y = aX + b , onde a e b são números reais. Quanto maior a independência entre as variáveis X e Y, mais próximo de zero é o valor de ρ. Professor Inácio Andruski Guimarães, DSc.
  • 52. 52 Estatística – Notas de Aulas Exemplo 8.11 – Um experimento aleatório consiste em lançar uma moeda três vezes e anotar os resultados. Sejam as variáveis aleatórias X = número de caras e Y é definida como: Y = 1, se o primeiro resultado é cara, ou Y = 0, se o primeiro resultado é coroa. Espaço amostral {1,1,1} {1,1,0} {1,0,1} {0,1,1} {0,0,1} {0,1,0} {1,0,0} {0,0,0} Probabilidade 0,125 0,125 0,125 0,125 0,125 0,125 0,125 0,125 X 3 2 2 2 1 1 1 0 Y 1 1 1 0 0 0 1 0 A distribuição conjunta é dada por: X Y 0 1 Total 0 0,125 0 0,125 1 0,25 0,125 0,375 2 0,125 0,25 0,375 3 0 0,125 0,125 Total 0,5 0,5 1 É possível notar que as variáveis não são independentes. Por exemplo: P(X = 0;Y = 0) ≠ P(X = 0)P(Y = 0). As expectâncias são: µ X = 0 1 + 1 3 + 2 3 + 3 1 = 12 = 1,5 8 8 8 8 8 e µY = 0 4 4 4 + 1 = = 0 ,5 . 8 8 8 A expectância do produto é: E ( XY ) = ( 0 )( 0 )( 0 ,125 ) + (1)( 0 )( 0, 25 ) + ... + ( 3)(1)( 0,125 ) = 1 Nota-se que E(XY) ≠ E(X)E(Y) . As variâncias são: σ 2 X = 12 9 − = 0 , 75 4 4 e σ Y2 = 1 1 − = 0 , 25 . 2 4 A covariância é: Cov ( X , Y ) = 1 − (1,5 )( 0 ,5 ) = 0 , 25 . O coeficiente de correlação é: ρ = 0 , 25 1, 5 0 ,5 = 0 , 2887 . 8.8 – Função Distribuição Acumulada Seja uma variável aleatória X, discreta ou contínua, definida no espaço amostral , e tal que X(ω) ∈ {x1 ,... , xn }, para qualquer ω ∈ . Chama-se função de distribuição acumulada a função dada por: i 1. F ( xi ) = ∑ f ( x ) . Se X é uma variável aleatória discreta. i j =1 x 2. F ( x) = ∫ f (t )dt . Se X é uma variável aleatória contínua. −∞ Em qualquer dos casos: P1: se a ≤ b, então F(a) ≤ F(b). Professor Inácio Andruski Guimarães, DSc.
  • 53. 53 Estatística – Notas de Aulas P2: lim F ( x) = 0 x → −∞ e lim F ( x) = 1 . x → +∞ Exemplo 8.12 – Seja X a variável aleatória do exemplo 8.1. x P( X = x) x2 P(X = x) 0 0,3756 0 1 0,4623 0,4623 2 0,1486 0,5944 3 0,0132 0,1188 4 0,0002 0,0032 Total 1 1,1787 F(3) = P(X ≤ 3) = 0,3756+ 0,4623 + 0,0132 = 0,9997. Exemplo 8.13 – Sejam a variável aleatória e a função densidade de probabilidade dadas no exemplo 8.5. Então: 3 F (3) = ∫e −x dx = − e − x | 3 = − e − 3 + e 0 = 0 , 9502 . 0 0 8.9 – Exercícios, 8.9.1) Seja x uma variável aleatória contínua, e seja a função dada por: 1  x , 0 ≤ x ≤ 3 f (x) =  k  0 , outro caso .  a) b) c) d) e) Se f é uma função densidade de probabilidade, qual o valor de k ? Qual a expectância ? Qual a variância ? Calcular P(1 ≤ x ≤ 2). Calcular a função de distribuição acumulada. 8.9.2) Seja X uma variável aleatória discreta, com a distribuição de probabilidade mostrada no quadro a seguir. X P(X) 0 0,12 1 0,24 2 0,28 3 0,18 4 0,10 5 0,08 a) Qual a expectância ? b) Qual a variância ? c) Calcular P(0 ≤ x ≤ 3). 8.9.3) Um experimento aleatório consiste em lançar um dado e observar o resultado. Há duas variáveis aleatórias associadas a este experimento: X, que é igual ao dobro do resultado, e Y, que vale 1 (um) quando o resultado é um número primo e 0 (zero) quando não é primo. a) b) c) d) e) f) g) Definir o espaço amostral. Definir os espaços X(ω) e Y(ω). Definir o espaço de probabilidade conjunta. Verificar se as duas variáveis são independentes. Calcular a expectância e a variância para X. Idem para Y. Calcular o coeficiente de correlação para X e Y. 8.9.4) Seja o experimento aleatório do exercício anterior e seja Z a variável aleatória que é igual ao número de divisores de X, incluindo 1 e excluindo X. a) Definir o espaço Z(ω). b) Definir o espaço de probabilidade conjunta. c) Verificar se X e Z são independentes. Professor Inácio Andruski Guimarães, DSc.
  • 54. 54 Estatística – Notas de Aulas d) Calcular a expectância e a variância para Z. e) Calcular o coeficiente de correlação para X e Z. 8.9.5) Um jogo consiste em lançar uma moeda duas vezes. Se der uma “cara”, o jogador ganha R$ 1,00. Se der duas “caras”, o jogador recebe R$ 2,00. Se não der “cara”, o jogador perde R$ 4,00. Este jogo pode ser considerado como favorável ao jogador ? 8.9.6) Um automóvel custa R$ 45000,00. Sabe-se que em anos anteriores a taxa de roubo deste mesmo automóvel foi de 2%. Neste caso, qual o valor “justo” do prêmio de um seguro contra roubo ? 8.9.7) Seja X uma variável aleatória que pode assumir os valores {– 1 , 0 , 1} com as probabilidades dadas no quadro a seguir. Seja Y = X 2. X P(X) a) b) c) d) –1 ¼ 0 ¼ 1 ½ Obter a distribuição de probabilidades para a variável Y. Obter a distribuição conjunta de probabilidades. Calcular a expectância e a variância para X. Idem para Y. 8.9.8) Seja X uma variável aleatória contínua com função densidade de probabilidade dada por:  k , a ≤ x ≤ b. f ( x) =   0 , outro caso . a) Qual o valor de k ? b) Quanto vale a expectância ? c) Quanto vale a variância ? 8.9.9) Seja X uma variável aleatória discreta. Verificar que Var[X] = E[X 2] – {E[X]}2. 8.9.10) Uma caixa contém 10 unidades de um componente, das quais três são defeituosas. Deve-se testar as unidades até encontrar duas defeituosas. Seja X o número de testes necessários. a) Obter a distribuição de probabilidades para X. b) Calcular a expectância e a variância para X. Respostas 8.9.3) a) = {1 , 2 , 3 , 4 , 5 , 6} b) X(ω) = {2 , 4 , 6 , 8 , 10 , 12} Y(ω) = {0 , 1} c) Y 0 1 Total d) X e Y não são independentes. X 2 0 1/6 1/6 4 0 1/6 1/6 6 0 1/6 1/6 8 1/6 0 1/6 10 0 1/6 1/6 12 1/6 0 1/6 e) E[X] = 7 Var[X] = 11,6667 Total 2/6 4/6 1 f) E[Y] = 0,6667 Var[Y] = 0,2222 8.9.4) a) Z(ω) = {1 , 2 , 3 , 3 , 3 , 5} c) As variáveis não são independentes. d) E[Z] = 2,8333 Var[Z] = 1,4722 b) A distribuição conjunta é dada no quadro a seguir. Professor Inácio Andruski Guimarães, DSc.
  • 55. 55 Estatística – Notas de Aulas X Z 2 1/6 0 0 0 1/6 1 2 3 5 Total 4 0 1/6 0 0 1/6 6 0 0 1/6 0 1/6 8 0 0 1/6 0 1/6 10 0 0 1/6 0 1/6 12 0 0 0 1/6 1/6 Total 1/6 1/6 3/6 1/6 1 8.9.6) Neste caso, o “jogo” é honesto se P(ser roubado).Valor = P(não ser roubado).Prêmio Então: (0,02)(45000) = (0,98)(Prêmio) → Prêmio = 918,37 b 8.9.8) a) ∫ kdx = kx b a = k (b − a ) = 1 ⇒ k = a 1 b−a b b x 1  x2  1 b2 − a2 a+b b) E [ x ] = dx = = =   ∫b−a b − a  2 a b − a 2 2 a b c) E [ x 2 ] = x2 1 ∫ b − a dx = b − a a b  x3  1 b 3 − a 3 b 2 + ab + a 2 = =   3 3  3 a b − a (b − a ) 2 b 2 + ab + a 2 b 2 + 2 ab + b 2 − = 3 4 12 8.9.10) a) = {2 , 3 , 4 , 5 , 6 , 7 , 8 , 9} Var [ x ] = X P(X) 2 0,0667 3 0,1167 4 0,0150 5 0,1667 6 0,1667 7 0,1500 Referência: Gnedenko, B.V., Theory of Probability. Chelsea Publishing Company. 1962. Professor Inácio Andruski Guimarães, DSc. 8 0,1167 9 0,2015