Este documento apresenta fórmulas e conceitos sobre estatística descritiva, incluindo medidas de tendência central, dispersão, elementos de distribuição de frequência e amostragem. Fornece definições e cálculos para média, mediana, moda, variância, desvio-padrão e outros conceitos comuns na análise de dados.
Fórmulas estatística - medidas - central e dispersão
1. ESTATÍSTICA DESCRITIVA
EQUAÇÕES E FÓRMULAS ALGÉBRICAS DAS MEDIDAS
DE TENDÊNCIA CENTRAL E DE DISPERSÃO
1- ELEMENTOS DA DISTRIBUIÇÃO DE FREQUENCIA
1.1- Frequência absoluta ou simples
f i n
→ Somatório
f i → Frequência absoluta ou simples
n → Quantidade de frequência da amostra ou tamanho da amostra
1.2- Frequência acumulada simples
Fk f1 f 2 f3... f k
Fk → Frequência acumulada simples
f1 → Frequência na primeira ordem
f 2 → Frequência na segunda ordem
f k → Frequência na última ordem
1.3- Frequência relativa
fi
f ri
f i
f ri → Frequência relativa
f i → Frequência absoluta ou simples
→ Somatório
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
2. 1.4- Frequência acumulada relativa
Fi
Fri
f i
Fri → Frequência acumulada relativa
f i → Frequência acumulada
→ Somatório
1.5- Frequência relativa (percentual)
fi
f ri % .100
fi
f ri → Frequência relativa em porcentagem
f i → Frequência absoluta ou simples
→ Somatório
1.6- Frequência acumulada relativa
Fi
Fri % .100
Fi
Fri → Frequência acumulada relativa em porcentagem
f i → Frequência acumulada
→ Somatório
2- AMOSTRA
2.1- Dados brutos (não agrupados) ou dados em rol
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
3. 2.1.1- Número de classes (K)
K = 5 se n ≤ 25
K n se n > 25 ou K = 1 + 3,32 log(n) → Regra de Sturges
K → Número de classes
n → Quantidade de frequência da amostra ou tamanho da amostra
2.1.2- Amplitude de classe
Maior Menor
h
K
h → Amplitude da classe
Maior → Maior número do rol ou da série
Menor → Menor número do rol ou da série
K → Número de classes
2.1.3- Média aritmética simples
x
x i
n
x → Média aritmética
xi → Valor genérico da observação ou da frequência (rol ou série)
n → Quantidade de frequência da amostra ou tamanho da amostra
2.1.4- Média geométrica simples
xg n x1.x2 .x3...xn
x g → Média geométrica
x1 → Valor dado qualquer do rol ou da série (primeiro)
x2 → Valor dado qualquer do rol ou da série (segundo)
xn → Valor dado qualquer (último valor do rol ou da série)
n → Quantidade de frequência da amostra ou tamanho da amostra
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
4. 2.1.5- Média harmônica simples
n
xh
1 1 1
...
x1 x2 xn
xh → Média harmônica
x1 → Valor dado qualquer do rol ou da série (primeiro)
x2 → Valor dado qualquer do rol ou da série (segundo)
xn → Valor dado qualquer (último valor do rol ou da série)
n → Quantidade de frequência da amostra ou tamanho da amostra
2.1.6- Média ponderada simples
xp c .x
i i
c 1
x p → Média ponderada
xi → Valor genérico da observação ou da frequência (rol ou série)
ci → Valor do peso da variável
2.1.7- Desvio em relação à média
di xi x
d i → Desvio
xi → Valor genérico da observação ou frequência
x → Média aritmética
2.1.8- Desvio médio simples
DM
x x
i
n
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
5. DM → Desvio médio
xi → Valor genérico da observação ou frequência
x → Média aritmética
n → Quantidade de frequência da amostra ou tamanho da amostra
→ Somatório
2.1.9- Mediana
n 1
Md Quando for ímpar (A mediana divide o rol ou a série em
2
duas partes iguais - ordem central do rol ou da série).
M d → Mediana
n → Quantidade de dados do rol ou da série ou a frequência da
amostra ou tamanho da amostra
n n
Md e M d 1 Quando for par (A medida divide o rol ou a
2 2
série em duas partes iguais - duas ordens centrais do rol ou da
série). A mediana será a média aritmética entre os termos da ordem.
M d → Mediana
n → Quantidade de frequência da amostra ou tamanho da amostra
2.1.10- Moda
Mo Valor com maior número de repetições (classe modal). A moda é
o valor que estiver na ordem ou na classe modal (valor modal).
M o → Moda
Observações:
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
6. Série amodal → não tem valor modal
Série unimodal → um valor modal
Série bimodal → dois valores modais
Série trimodal → três valores modais
Série polimodal → quatro ou mais valores modais
2.1.11- Quartis
Q1 → Mediana da primeira metade dos elementos da série
Q2 → Mediana de todos os elementos da série
Q3 → Mediana da segunda metade dos elementos da série
Observações: Nos quartis a série é dividida em quatro partes iguais
com o mesmo número de elementos, de tal forma que cada intervalo
do quartil contenha 25% dos elementos coletados: 1º quartil separa
os primeiros 25% dos elementos da serie; 2º quartil separa os
primeiros 50% dos elementos da serie; 3º quartil separa os primeiros
75% dos elementos da serie.
2.1.12- Variância
s 2
x x
i
2
n 1
s 2 → Variância
xi → Valor genérico da observação ou frequência
x → Média aritmética
n → Quantidade de frequência da amostra ou tamanho da amostra
→ Somatório
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
7. 2.1.13- Desvio-padrão
s s2
s → Desvio-padrão
s 2 → Variância
2.2- Dados agrupados sem intervalos de classes
2.2-1. Média aritmética simples
x .f x .f
x ou x f
i i
n
i i
Observação:
n f i
i
x → Média aritmética
xi → Valor genérico da observação ou frequência
f i → Frequência absoluta ou simples
n → Quantidade de frequência da amostra ou tamanho da amostra
→ Somatório
2.2-2. Mediana
n 1
Md Quando for ímpar (A mediana divide o rol ou a série em
2
duas partes iguais, mas a ordem central do rol ou da série).
M d → Mediana
n → Quantidade de dados do rol ou da série ou a frequência da
amostra ou tamanho da amostra
n n
Md e M d 1 Quando for par (A medida divide o rol ou a
2 2
série em duas partes iguais - duas ordens centrais do rol ou da
série). A mediana será a média aritmética entre os termos da ordem.
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
8. M d → Mediana
n → Quantidade de frequência da amostra ou tamanho da amostra
2.2-3. Moda
Mo Valor com maior número de repetições ou maior frequência
(classe modal). A moda é o valor que estiver na ordem ou na classe.
M o → Moda
Observação: 1º- Localizar a classe modal (classe que contém o maior
valor de frequência); 2º- Verificar o valor da variável contido na
classe modal.
2.2-4. Quartis
Q1 →k=1
Q2 →k=2
Q3 →k=3
Qk → É o valor da variável que corresponde à classe desse quartil
considerado.
1º- Calcular a posição do quartil para estabelecer em que classe se
localiza o quartil considerado
k.n
Qk
4
Qk → É o valor da variável que corresponde à classe desse quartil
considerado.
k → Número do quartil considerado
n → Quantidade de frequência da amostra ou tamanho da amostra
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
9. Observação: 1º- Localizar esse valor na coluna da frequência
acumulada para conhecer qual é a classe que corresponde a essa
posição (classe do quartil k); 2º- Verificar na coluna da variável em
estudo qual o valor da variável localizada na classe do quartil
considerado.
2.2-5. Variância
x 2
x
2
i
n
i
s2
n 1
s 2 → Variância
xi → Valor genérico da observação ou frequência
x → Média aritmética
n → Quantidade de frequência da amostra ou tamanho da amostra
→ Somatório
2.2-6. Desvio-padrão
s s2
s → Desvio-padrão
s 2 → Variância
2.3- Dados agrupados com intervalos de classes
2.3.1- Amplitude de classe
R
h Li li h
ou k
h → Amplitude da classe h → Amplitude da classe
Li → Limite superior da classe R → Amplitude
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
10. li → Limite inferior da classe k → Número de classes
2.3.2- Amplitude total da distribuição
AT Lmáx lmín
AT → Amplitude total da distribuição
Lmáx → Limite superior da distribuição
lmín → Limite inferior da distribuição
2.3.3- Amplitude amostral
AA xmáx xmín
AA → Amplitude amostral
xmáx → Limite máximo da amostra
xmín → Limite mínimo da amostra
2.3.4- Ponto médio de classe
li Li
PM
2
PM → Ponto Médio
li → Limite inferior da classe
Li → Limite superior da classe
2.3.5- Média aritmética ponderada
x
x .f
i i
f i
x → Média aritmética ponderada
xi → Valor do ponto médio do intervalo de classe
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
11. f i → Frequência absoluta ou simples
→ Somatório
2.3.6- Ponto médio de classe
linf Lsup
xi
2
xi → Valor genérico da observação ou frequência
linf → Limite inferior da classe
Lsup → Limite superior da classe
2.3.7- Desvio em relação à média
di xi x
d i → Desvio
xi → Valor genérico da observação ou frequência
x → Média aritmética
2.3.8- Desvio médio simples
DM
x x
i
n
DM → Desvio médio
xi → Valor genérico da observação ou frequência
x → Média aritmética
n → Quantidade de frequência da amostra ou tamanho da amostra
→ Somatório
2.3.9- Desvio médio absoluto
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
12. DM A
x i x
Observação: O desvio médio, em geral, é
n
aproximadamente igual a 0,8 vezes o desvio-padrão.
DM A → Desvio médio
xi → Valor genérico da observação ou frequência
x → Média aritmética
n → Quantidade de frequência da amostra ou tamanho da amostra
→ Somatório
2.3.10- Mediana
Critérios para determinação da mediana:
1º-
f i n
2 ou 2
→ Somatório
f i → Frequência absoluta ou simples
n → Quantidade de frequência da amostra ou tamanho da amostra
2º- A menor frequência acumulada que superar o valor da frequência
acumulada da classe mediana
3º-
fi n
Fant .h Fant .hMd
2
M d lMd
2
M d linf
fi ou f Md
M d → Mediana
linf → Limite inferior do intervalo de classe mediana
f i → Frequência absoluta ou simples da classe mediana
Fant → Frequência acumulada da classe anterior à classe mediana
h → Amplitude do intervalo de classe mediana
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
13. → Somatório
M d → Mediana
l Md → Limite inferior da classe que contém a mediana
n → Quantidade de frequência da amostra ou tamanho da amostra ou
número de elementos do conjunto de dados
f Md → Frequência absoluta ou simples da classe que contém a
mediana
Fant → Frequência acumulada da classe anterior à classe mediana ou
soma das frequências simples anteriores à classe que contém a
medida
hMd → Amplitude do intervalo da classe que contém a mediana
2.3.11- Moda
d
M o linf 1 .h
d d
1 2
Mo → Moda
linf → Limite inferior da classe modal
d1 → Frequência absoluta ou simples menos frequência absoluta ou
simples anterior à classe modal (diferença entre a frequência da
classe modal e a da classe imediatamente anterior)
d 2 → Frequência absoluta ou simples menos frequência absoluta ou
simples posterior à classe modal (diferença entre a frequência da
classe modal e a da classe imediatamente posterior - seguinte)
h → Amplitude de intervalo da classe modal
Observação: 1º- Localizar a classe modal (classe que contém o maior
valor de frequência); 2º- A moda é um valor contido no intervalo de
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
14. classe modal; 3º - Cálculo da moda pela Regra de Czuber com base
nos valores da classe modal.
hMo LMo lMo
hMo → Amplitude de intervalo da classe modal
LMo → Limite Superior da classe modal
l Mo → Limite inferior da classe modal
d1 f Mo f ant
d1 → Diferença entre a frequência da classe modal e a frequência da
classe anterior à classe modal
f Mo → Frequência da classe modal
f ant → Frequência da classe anterior à classe modal
d 2 f Mo f post
d 2 → Diferença entre a frequência da classe modal e a frequência da
classe posterior à classe modal
f Mo → Frequência da classe modal
f post → Frequência da classe posterior à classe modal
Observação: Moda bruta é o valor do ponto médio da classe modal.
2.3.12- Quartis
k .n
Fant
Q k lQk 4 .hQk
f Qk
Qk → Quartil
k → Quartil considerado
lQk → Limite inferior do intervalo de classe do quartil considerado
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
15. n → Quantidade de frequência da amostra ou tamanho da amostra ou
número de elementos do conjunto de dados
f Qk → Frequência absoluta ou simples da classe do quartil considerado
Fant → Frequência acumulada da classe anterior à classe do quartil
considerado
hQk → Amplitude do intervalo de classe do quartil considerado
hQk LQk lQk
hQk → Amplitude do intervalo de classe do quartil considerado
LQk → Limite Superior da classe do quartil considerado
lQk → Limite inferior da classe do quartil considerado
2.3.13- Relação empírica entre média, mediana e moda
x M o 3x M d
x → Média aritmética
Mo → Moda
M d → Mediana
2.3.14- Amplitude total
R xmáx xmín
R → Amplitude total
xmáx → Limite máximo e xmín → Limite mínimo
2.3.15- Variância
x . f 2
x .f
2
i i i
n
i
s
2
n 1
s 2 → Variância
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
16. xi → Valor genérico da observação ou frequência
f i → Frequência absoluta ou simples
n → Quantidade de frequência da amostra ou tamanho da amostra
→ Somatório
2.3.16- Desvio-padrão
s s2
s → Desvio-padrão
s 2 → Variância
2.3.17- Erro padrão
s
sx
n
s x → Erro padrão
s → Desvio-padrão
n → Quantidade de frequência da amostra ou tamanho da amostra
2.3.18- Relação empírica entre o desvio-padrão e a amplitude
R R
<s<
6 3
R → Amplitude
s → Desvio-padrão
2.3.19- Coeficiente de variação
s
CV .100 Observação: CV é dado em percentual
x
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
17. CV → Coeficiente de variação
s → Desvio-padrão
x → Média aritmética
Análise do coeficiente de variação
CV≥ 30% → Dispersão alta (elevada, intensa)
15%<CV<30% → Dispersão média (central, mediana)
CV≤ 15% → Dispersão baixa (mínima, pequena)
2.3.20- Momentos de uma distribuição de frequências
2.3.19.1- Dados em ordem ou rol ou série
Mt
x t
i
Observação: momento de ordem t de um conjunto
n
de dados
M t → Momento de ordem t
xi → Valor genérico da observação ou frequência
n → Quantidade de frequência da amostra ou tamanho da amostra
x a
t
M t
a
i
Observação: momento de ordem t em
n
relação a uma constante a
M ta → Momento de ordem t em relação a constante a
xi → Valor genérico da observação ou frequência
a → Constante
n → Quantidade de frequência da amostra ou tamanho da amostra
x x
t
Mt i
Observação: momento de ordem t centrado
n
em relação à média
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
18. M t → Momento de ordem t
xi → Valor genérico da observação ou frequência
x → Média aritmética
n → Quantidade de frequência da amostra ou tamanho da amostra
2.3.19.2- Dados agrupados em classes de frequências
Mt
x .ft
i i
Observação: momento de ordem t de um
n
conjunto de dados
M t → Momento de ordem t
xi → Valor genérico da observação ou frequência
f i → Frequência absoluta ou simples
n → Quantidade de frequência da amostra ou tamanho da amostra
x a . fi
t
M t
a
i
Observação: momento de ordem t em
n
relação a uma constante a
M ta → Momento de ordem t em relação a constante a
xi → Valor genérico da observação ou frequência
a → Constante
f i → Frequência absoluta ou simples
n → Quantidade de frequência da amostra ou tamanho da amostra
x x . fi
t
Mt i
Observação: momento de ordem t
n
centrado em relação à média
M t → Momento de ordem t
xi → Valor genérico da observação ou frequência
x → Média aritmética
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
19. f i → Frequência absoluta ou simples
n → Quantidade de frequência da amostra ou tamanho da amostra
2.3.19.3- Momentos em ordens
M1 x e m1 0
M 1 → Momento de ordem 1
x → Média aritmética
n 1 2
m2 .s
n
m2 → Momento de ordem 2
s 2 → Variância
n → Quantidade de frequência da amostra ou tamanho da amostra
2.3.19.4- Momentos centrados de 3ª e 4ª ordem em rol ou
série
m3
x 3
i
3x.
x 2
i
2x 3
n n
m3 → Momento de ordem 3
x → Média aritmética
n → Quantidade de frequência da amostra ou tamanho da amostra
m4
x 4
i
4 x.
x 3
i
6x 2
.
x 2
i
3x 4
n n n
m4 → Momento de ordem 4
x → Média aritmética
n → Quantidade de frequência da amostra ou tamanho da amostra
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
20. 2.3.19.5- Momentos centrados de 3ª e 4ª ordem em classes
m3
x 3
i . fi
3x.
x 2
i . fi
2x 3
n n
m3 → Momento de ordem 3
f i → Frequência absoluta ou simples
x → Média aritmética
n → Quantidade de frequência da amostra ou tamanho da amostra
m4
x 4
i . fi
4 x.
x 3
i . fi
6x 2
.
x
2
i . fi
3x 4
n n n
m4 → Momento de ordem 4
f i → Frequência absoluta ou simples
x → Média aritmética
n → Quantidade de frequência da amostra ou tamanho da amostra
h 2 .s 2 2
m4 .h 4
2 240 Observação: Correção de Sheppard
(subtração) para dados agrupados em classes
m4 → Momento de ordem 4
h → Amplitude da classe
s 2 → Variância
2.3.21- Escore padronizado
xi x
zi Observação: xi x afastamento do valor da
s
observação em relação a media com a divisão pelo Desvio-padrão
como unidade de medida
z i → Escore padronizado
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
21. xi → Valor genérico da observação ou frequência
x → Média aritmética
s → Desvio-padrão
z>1 → Anormal
z<1 → Normal
2.3.22- Assimetria
3 x md
AS Observação: assimetria situa-se entre -3 e 3
s
AS → Assimetria
x → Média aritmética
M d → Mediana
s → Desvio-padrão
Análise da assimetria
AS > 1 → Assimetria Moderada
AS > 0 → Assimetria positiva
AS < 0 → Assimetria negativa
2.3.23- Medidas de assimetria (coeficiente de assimetria)
m3
a3 Observação: momento de 3ª ordem dividido pelo cubo do
s3
desvio-padrão (indica o sentido da assimetria)
a3 → Coeficiente de assimetria de ordem 3
m3 → Momento de ordem 3
s → Desvio-padrão
2.3.24- Índice de assimetria de Pearson
x mo
A
sx
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
22. A → Coeficiente de assimetria de ordem 3
x → Média aritmética
Mo → Moda
s → Desvio-padrão
Análise da assimetria
|A| < 0,15 → praticamente a distribuição é simétrica
0,15 < |A| < 1 → Assimetria moderada
|A| > 1 → Assimetria forte
2.3.25- Medidas de achatamento ou curtose
m4
a4 2
s2
a4 → Coeficiente de curtose
m4 → Momento de ordem 4
s 2 → Variância
Observação: Coeficiente de curtose é o quociente do momento de 4ª
ordem pelo quadrado da variância
Análise da assimetria
Adimensional < 3 para as distribuições platicúrticas
Adimensional = 3 para as distribuições mesocúrticas
Adimensional > 3 para as distribuições leptocúrticas
Observação: Distribuição normal é mesocúrtica; Distribuições
achatadas: platicúrtica e leptocúrtica.
Coeficiente de excesso: a4 3 para fixar o zero como referência
mesocúrtica.
Observação especial: Os tamanhos da população e da amostra
permitem estabelecer duas relações importantes:
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG
23. n
Fração de amostragem =
N
n → Tamanho da amostra
N → Tamanho da população
N
Fator de expansão ou Intervalo de Seleção =
n
N → Tamanho da população
n → Tamanho da amostra
Mário Ferreira Neto
Professor Especialista em Matemática e Estatística – UFLA/MG