Estatística é a ciência dos dados, envolvendo o desenvolvimento de métodos e técnicas de coleta, organização, análise e interpretação de dados para tirar conclusões ou fazer predições. A estatística descritiva descreve os dados de forma concisa através de médias, variâncias e gráficos. A estatística indutiva faz inferências sobre a população a partir da amostra.
1. Estatística básica
Estatística é a ciência dos dados, envolvendo o
desenvolvimento de processos, métodos e técnicas de
coleta, classificação, organização, resumo, análise e
interpretação de dados sobre uma população, e os
métodos de tirar conclusões ou fazer predições com
base nesses dados.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
2. Estatística básica
Organização e
descrição
dos dados
Descritiva
Cálculo de médias,
variâncias, estudo de
gráficos, tabelas, etc.
Estatística
Indutiva
(Inferencial)
Estimação de
parâmetros, teste de
hipóteses, etc.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
3. Estatística básica
• A estatística tem a capacidade de sintetizar os dados;
• A amostragem é o ponto de partida (na prática) para
todo um Estudo Estatístico. É através da amostragem
que obtemos os dados da medição de determinada
característica ou propriedade de um objeto, pessoa ou
coisa;
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
4. Estatística básica
• População: é a coleção de todas as observações
potenciais sobre determinado fenômeno;
•Amostra: é o conjunto de dados efetivamente
observados, ou extraídos;
População
Amostras
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
5. Estatística básica
Cada observação individual ou item é denominada
como unidade elementar, que pode estar composta
por um ou mais itens medidos, propriedades,
atributos, etc, denominados como variáveis.
Variável é uma característica, propriedade ou
atributo de uma unidade da população, cujo
valor pode variar entre as unidades da
população.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
8. Estatística básica
• Exemplo:
Para uma população de peças produzidos em um
processo, poderíamos ter:
Variável
Tipo
Estado: Perfeita ou defeituosa
Qualitativa Nominal
Qualidade: 1ª, 2ª ou 3ª categoria
Qualitativa Ordinal
Número de peças defeituosas
Quantitativa Discreta
Diâmetro das peças
Quantitativa Contínua
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
9. Estatística básica
Agrupamento de dados e distribuição de frequências
• Quando vamos fazer um levantamento de uma população, um dos
passos é retirar uma amostra dessa população e obter dados relativos
à variável desejada nessa amostra;
• Cabe à Estatística sintetizar tais dados na forma de tabela e gráficos
que contenham, além dos valores das variáveis, o número de
elementos correspondentes a cada variável;
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
10. Estatística básica
Agrupamento de dados e distribuição de frequências
• A esse procedimento está associado o conceito de:
• Dados brutos: é o conjunto de dados numéricos obtidos que ainda
não foram organizados;
• Rol: é o arranjo dos dados brutos em ordem crescente (ou
decrescente);
• Amplitude (H): é a diferença entre o maior e o menor dos valores
observados;
•Frequência absoluta (ni): é o número de vezes que um elemento
aparece na amostra;
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
11. Estatística básica
Agrupamento de dados e distribuição de frequências
• n : número total de dados da amostra
k
n
i 1
i
n
• k : número de valores diferentes na amostra
• Frequência relativa (fi):
ni
fi
n
k
i 1
fi 1
• Frequência absoluta acumulada (Ni): é a soma da frequência absoluta
do valor da variável i com todas as frequências absolutas anteriores;
• Frequência relativa acumulada (Fi):
Ni
Fi
n
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
12. Estatística básica
Agrupamento de dados e distribuição de frequências
• Exemplo: Os seguintes dados foram amostrados do números de negócios
efetuados diariamente por um operador financeiro:
População: Número de negócios efetuados diariamente
Dados brutos: {14, 12, 13, 11, 12, 13, 16, 14, 14, 15, 17,
14, 11, 13, 14, 15, 13, 12, 14, 13, 14, 13, 15, 16, 12, 12}
Rol: {11, 11, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14,
14,14, 15,15,15, 16,16, 17}
Amplitude: 17 – 11 = 6
n = 26 observações
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
15. Estatística básica
Classes
• As classes são um artifício para condensar o número de elementos
diferentes de uma amostra. Imagine construir uma tabela para 200
valores diferentes, nos moldes do problema anterior.
• Os principais pré-requisitos para uma boa definição de classes em um
conjunto de dados são:
•a) as classes devem abranger todas as observações;
•b) o extremo superior de uma classe é o extremo inferior da classe
subsequente (simbologia: |, intervalo fechado à esquerda e aberto à
direita);
•c) cada valor absoluto deve enquadrar-se em apenas uma classe;
•d) k 25, de modo geral, sendo k o número de classes;
•e) As unidades das classes devem ser as mesmas dos dados.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
16. Estatística básica
Classes
• Cálculo de k (Formas de calcular) :
k 1 log 2 N (Fórmula de Sturges)
k
N
ln n
2 n2 nk
ln 2
k
k
Obs.: N é o número de elementos diferentes da amostra e, muitas
vezes, pode ser considerado N = n (no. de observações).
• Intervalo da classe (h): h H/k
• Ponto médio da classe (xi) : Ponto médio entre o limite inferior e o
limite superior de cada classe.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
17. Estatística básica
• Exemplo: Utilizando os dados do exemplo anterior, temos:
H 6
k
7 3
6
k 1 log 2 7 4
h 2
k ln N
3
3
ln 2
Xi
Freq.
Absoluta
Freq.
Relativa
Freq. Absoluta
Acumulada
Freq.
Acumulad
a
11|13
12
7
26,92%
7
26,92%
13|15
14
13
50,00%
20
76,92%
15|17
16
6
23,08%
26
100,00%
26
100,00%
Faixa de
negócios
Total
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
18. Estatística básica
Medidas de Posição
• Mostram o valor representativo em torno do qual os dados tendem a
agrupar-se com maior ou menor frequência.
n
x
• Média aritmética:
x1 x2 x3 x4 ... xn
x
n
• Média aritmética ponderada:
x1 . p1 x2 . p2 x3 . p3 ... xn . pn
x
p1 p2 p3 ... pn
i
i 1
n
n
x .p
i 1
n
i
i
p
i 1
pi : peso da amostra xi
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
i
19. Estatística básica
Medidas de Posição
• Exemplo: Os dados {11, 13, 15, 17, 19} apresenta a seguinte
média (n=5, pois temos cinco números) :
11 13 15 17 19
x
15
5
• Se um aluno obteve as notas {7, 10, 6, 8} com pesos {1, 2, 2,
3}, qual será a nota final do aluno:
7.1 10.2 6.2 8.3
63
x
7,875
1 2 2 3
8
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
20. Estatística básica
Medidas de Posição
P
R
O
P
R
I
E
D
A
D
E
• A soma dos desvios é sempre
igual a zero
•A soma dos quadrados dos
desvios das observações de uma
série é sempre um valor mínimo
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
21. Estatística básica
Medidas de Posição
•
Média aritmética ponderada para dados agrupados em classes:
n
x1 .n1 x2 .n2 x3 .n3 ... xn .nn
x
n1 n2 n3 ... nn
x .n
i 1
n
• Sabendo que:
n ni
i 1
i
n
i 1
n
i
i
ni
fi
n
x x1 . f1 x2 . f 2 x3 . f 3 ... xn . f n
n
x .f
i 1
i
• fi : Frequência de ocorrência da amostra xi
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
i
22. Estatística básica
Medidas de Posição
• Exemplo: Qual a média do número de operações fechadas
por dia:
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
23. Estatística básica
Medidas de Posição
• A média pela frequência absoluta é:
11.2 12.5 13.6 14.7 15.3 16.2 17.1
x
2 5 6 7 3 2 1
352
x
13,54
26
• A média pela frequência relativa é:
x 11 .7,69 % 12 .19 ,23 % 13 .23,08 %
14 .26 ,92 % 15 .11,54 % 16 .7,69 % 17 .3,85 %
x 13,54
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
24. Estatística básica
Medidas de Posição
• Exemplo: Calcule a média da tabela abaixo:
Valor
médio da
classe
12.7 14.13 16.6 362
x
13,92
7 13 6
26
•Observe que o resultado apresentou uma pequena diferença do anterior (2,8% maior que 13,54 ). A precisão dos
dados na tabela em classes diminuiu pouco em relação aos dados originais.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
25. Estatística básica
Medidas de Posição
• Mediana: É o valor do meio de um conjunto de dados, quando os
dados estão dispostos em ordem crescente ou decrescente, ou seja, o Rol
de Dados.
n 1
x
termo
2
o
~
o
Se n é impar
o
n
n
termo 1 termo
~
2
2
x
2
Se n é par
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
26. Estatística básica
Medidas de Posição
Exemplo: Qual a mediana dos dados abaixo:
Dados brutos: {14, 12, 13, 11, 12, 13, 16, 14, 14, 15, 17, 14, 11, 13, 14, 15, 13, 12, 14, 13,
14, 13, 15, 16, 12, 12}
Rol: {11, 11, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14,14, 15,15,15,
16,16, 17}
n = 26 observações (par)
o
o
26
26
termo 1 termo
~
13o termo 14o termo 13 14
2
2
x
13,5
2
2
2
A mediana dos dados é 13,5.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
27. Estatística básica
Medidas de Posição
• Exemplo: Calcule a mediana dos dados abaixo:
• A mediana estará na faixa de 13 a 15, pois temos no total 26 observações e mediana
encontra-se no meio (13º termo) (aqui não iremos calcular a média entre o 13º e o 14º Verique !).
~
x
13
13
15 13
13 7
20 7
~
x
13
13,92
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
28. Estatística básica
Medidas de Posição
• Moda ou classe modal (mo): É o valor que representa a maior
frequência em um conjunto de observações individuais. Em alguns casos,
pode haver mais de uma moda.
X
Xi
ni
0| 3
1,5
7
3| 6
6| 9
9| 12
4,5
7,5
10,5
13
6
2
Classe modal
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
29. Estatística básica
Medidas de Posição
Média
• Sensível a valores extremos de um conjunto de observações
• Usa todos os dados disponíveis
• “Robusta” : Não sofre muito com a presença de alguns valores
muito altos ou muito baixos
Mediana • Não usa todos os dados disponíveis
Moda
• Não é afetada por valores extremos
• Não usa todos os dados disponíveis
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
30. Estatística básica
Medidas de Posição
• Percentil: De forma geral, o percentil de um conjunto de valores
postos em ordem crescente é um valor que contém p% das observações
abaixo dele.
Os percentis de ordem 25, 50 e 75 são chamados de quartis. Os decis são
os percentis de ordem 10, 20, ..., 90.
p0
x 1
100 0 n 1
p
1
x
n
x 1
p 100.
n 1
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
31. Estatística básica
Medidas de Posição
• Calcular o percentil de ordem 50 (2º Quartil).
Q50 = mediana (são 50 dados o Q50 está no 25º termo)
X
ni
Acum.
1,810| 1,822
7
7
1,822| 1,834
14
21
1,834| 1,846
18
39
1,846| 1,858
7
46
1,858| 1,870
4
50
~
x 1,834
25 21
1,846 1,834 39 21
~
x 1,834
0,012
4
18
~
x 1,837
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
32. Estatística básica
Medidas de Dispersão ou Variabilidade
As medidas de dispersão possuem a finalidade de verificar quanto os
valores da série estão distantes da média da série.
O principal meio de calcular a variabilidade é através da variância, que é
calculada pela fórmula abaixo:
x
n
s
2
i 1
i
x
n
x
n
2
i 1
n
2
i
x
2
Onde n é o número de observações, x é a média e xi são os valores
individuais. Esta fórmula é valida para população. Para amostra deve-se
considerar n-1 ao invés de n.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
33. Estatística básica
Medidas de Dispersão ou Variabilidade
Exemplo: Os dados {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} apresentam qual média,
variância e desvio padrão ?
A sequência apresenta n=10 números. A média é igual a soma dos valores
dividido pelo número de elementos. A variância e desvio padrão são
calculados na sequência:
55
5,5
10
x
n
x
i 1
2
i
12 2 2 ... 9 2 10 2 385
n
xi2
s2
385
5,5 2 8,25
n
10
8,25 s 2,87
i 1
s2
x
2
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
34. Estatística básica
Medidas de Dispersão ou Variabilidade
Para calcular a variância quando os dados estiverem dispostos em classes
deve-se utilizar a seguinte fórmula:
x
k
s
2
i 1
i
2
x .ni
n
x
k
i 1
i
2
x . fi
k é o número de classes, ni é a frequência absoluta, n o número de observações e fi a frequência
relativa;
•Quando extraímos a raiz quadrada da variância, obtemos o desvio
padrão (s).
• Uma observação importante é que a variância possui as unidades dos
dados individuais elevado ao quadrado, enquanto que o desvio padrão e
média possuem mesma unidade.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
35. Estatística básica
Medidas de Dispersão ou Variabilidade
Exemplo: Calcular a variância e desvio padrão dos dados abaixo:
X
Freq.
Absoluta
1,810|1,822
7
1,822|1,834
14
1,834|1,846
18
1,846|1,858
7
1,858|1,870
4
Iremos
realizar
os
cálculos na forma de
tabela, porque os dados
ficam mais organizados e
os cálculos mais fáceis de
serem entendidos.
Verifique que as colunas serão organizadas de acordo com a fórmula para
calcular a variância.
x x .n
k
s
2
i 1
2
i
i
n
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
36. Estatística básica
Medidas de Dispersão ou Variabilidade
x
xi
ni
xi-xm
(xi-xm)2
(xi-xm)2.ni
1,810|1,822
1,816
7
-0,0024
0,00058
0,0040
1,822|1,834
1,828
14
-0,012
0,00014
0,0020
1,834|1,846
1,840
18
0,000
0,00000
0,0000
1,846|1,858
1,852
7
0,012
0,00014
0,0010
1,858|1,870
1,864
4
0,024
0,00058
0,0023
Soma
9,200
Soma
0,00936
Média (xm)
1,840
s2
0,00187
s 2 0,00187
s 0,043
CV s
x
.100 % 0,043
1,840
.100 % 2,4%
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
37. Estatística básica
Medidas de Dispersão ou Variabilidade
Outra forma de expressar a dispersão dos dados é através do Coeficiente
de Variação (CV), que é dado pela fórmula:
s
CV .100%
x
onde s é o desvio padrão, e x é a média.
• O Coeficiente de Variação dá uma indicação de quanto os dados estão
dispersos em torno da média. Quanto maior o valor de CV, maior a
dispersão.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
38. Estatística básica
Medidas de Dispersão ou Variabilidade
Exemplo: No exemplo de cálculo de variância e desvio padrão, obtivemos
os valores 8,25 e 2,87 respectivamente. A média tinha resultado em 5,5
O valor do Coeficiente de Variação será:
s
2,87
CV .100 %
.100 % 52 %
5,5
x
Um valor de 52% indica que os dados estão muito dispersos com relação
a média.
Por exemplo, os dados {5,1; 5,2; 5,3; 5,4; 5,5; 5,6; 5,7; 5,8; 5,9; 6,0}
apresentam média: 5,55; desvio-padrão: 0,29 e CV = 5% (Confira!)
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
39. Estatística básica
Covariância: Mede a correlação (dependência) linear entre duas
variáveis x e y.
É calculada como:
x
n
Cov( x, y )
i 1
i
x . yi y
n
x. y x. y
A covariância entre as mesmas variáveis, isto é, Cov(x, x) por
exemplo, é igual a própria variância Var(x) = s2.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
40. Estatística básica
x
n
Cov( x, x )
i 1
i
x . xi x
n
Var( x ) s 2
• Os seguintes valores de covariância dão uma indicação se os
valores são independentes, ou possuem correlação positiva ou
negativa.
Cov( x, y ) 0
Variáveis independentes
Cov( x, y ) 0 Correlação linear positiva
Cov( x, y ) 0
Correlação linear negativa
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
41. Estatística básica
Cov( x, y ) 0
Cov( x, y ) 0
Correlação
linear positiva
Correlação
linear negativa
Cov( x, y ) 0
Variáveis
independentes
• Na prática quando as variáveis são independentes o valor da covariância
resulta em um valor próximo de 0 (entre -3 a 3), mas não sendo estes valores
fixos e, portanto, é sempre recomendável considerar o gráfico das variáveis x
e y para uma avaliação conjunta.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
42. Estatística básica
Exemplo: Calcular a covariância dos dados abaixo, e verifique se a
correlação é positiva ou negativa.
X
Y
10
21
15
15
18
12
12
18
9
20
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com
43. Estatística básica
Solução: Sempre esboce o gráfico das variáveis X e Y para confirmar!
X
X.Y
10
21
210
15
15
225
18
12
18
216
9
20
180
12,8
17,2
Cov( x, y ) x. y x. y
209,4 12,8.17,2
10,76
216
12
Média
Y
209,4
A covariância resultou em um valor negativo, indicando uma correlação
linear negativa que podemos confirmar pelo gráfico.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com