Medidas de Tendência Central em Aula de Estatística
1. Estatística e Probabilidade
Aula 3 – Cap 02
Estatística Descritiva
er ch er
a ch eima
eim n St
o n St s o
. Aly
ss r. Alys
Dr f. D
Pro
f. Pro
2. Estatística e Probabilidade
Nesta aula...
estudaremos medidas de tendência
central, medidas de variação
e medidas de posição.
er ch er
a ch eima
eim n St
o n St s o
. Aly
ss r. Alys
Dr f. D
Pro
f. Pro
3. Estatística e Probabilidade
Medidas de tendência central
Uma medida de tendência central é um valor que
representa uma entrada típica, ou central, de um conjunto
de dados.
Os três tipos de medidas de tendência central mais usadas
são:
• Média er • Mediana • Moda ch er
a ch eima
eim n St
o n St s o
. Aly
ss r. Alys
Dr f. D
Pro
f. Pro
4. Estatística e Probabilidade
Média
A média de um conjunto de dados é
a soma de toda as entradas de
dados dividida pelo números de Dica de estudo
entradas. Símbolo Descrição
Σ Indica uma soma de
valores
Em uma população:
x Variável que representa
uma entrada de dados
N Número de entradas em
uma população
n Número de entradas em
Em uma amostra: uma amostra r
ch er ch e
ima μ Média de uma ima e
on S
te o n St
ss ly s s
população
. Aly r. A
. DMédia de uma amostra
f. Dr xProf
Pro
5. Estatística e Probabilidade
Mediana
A Mediana de um conjunto de dados é o dado que fica no meio
quando as entradas são colocadas em ordem crescente ou
decrescente.
Moda
A Moda de um conjunto de dados é o dado que ocorre com maior
freqüência.
Se nenhuma entrada é repetida, o conjunto de dados não possui moda.
Se duas entradas ocorrem com freqüência elevada → dados são macher
er
a ch
bimodais on Steim n Stei
ss sso ly
. Aly r. A
Dr f. D
Pro
f. Pro
6. Estatística e Probabilidade
Exemplo...
Um instrutor registra a média de faltas de seus alunos em
determinado semestre. Em uma amostra aleatória, os dados são:
2 4 2 0 40 2 4 3 6
Calcule a média, a mediana e a moda.
Média:
Mediana: Ordene os dados.
0 2 2 2 3 4 4 6 40
her meio é 3, logo a mediana é 3. er
O valor que fica no ac ma ch
Steim on Stei
ly s so n .Aly s s
f. D
Moda: f. Dr
r. AA moda é 2, pois esse é o valor que ocorre mais vezes.
Pro Pro
7. Estatística e Probabilidade
Exemplo...
Em um debate político pediu-se que uma amostra dos membros do
público citasse o partido a qual eles pertenciam.
As respostas estão na Tabela abaixo:
Partido Político frequência Qual é a moda das
respostas?
PT 34
PSDB 56
PMDB 21
Outros 9
her er
ac a ch
A moda é aSúnica medida de tendência central que pode ser Steim
teim utilizada
o n ly s so n
ly s s
para. descrever dados no nível nominal de medida. r. A
r A f. D
ro f. D Pro
P
8. Estatística e Probabilidade
Média Ponderada
Uma média ponderada é a média de um conjunto de dados cujas
entradas tem pesos variáveis. Uma média ponderada é dada por:
x=
∑ ( x.w)
∑w
Onde w é o peso de cada entrada
er ch er
a ch eima
eim n St
o n St s o
. Aly
ss r. Alys
Dr f. D
Pro
f. Pro
9. Estatística e Probabilidade
Exemplo...
Você está fazendo uma disciplina na qual sua nota final é composta
por:
Fonte notas,x Pesos, w xw
Média dos testes 8,6 0,5 4,3
Exame no meio do 9,6 0,15 1,44
semestre
Exame final 8,2 0,2 1,64
Laboratório de 9,8 0,1 0,98
computação
Trabalho extra-classe 10,0 0,05 0,5
er h er
eim
a ch Σw=1 Σ(xw)=8,86 c
eima
o n St so n St
. Aly
ss r. Alys
f. Dr Assim, sua média ponderada para a disciplina D de 88,6
Pro
f. é
Pro
10. Estatística e Probabilidade
Média de uma distribuição de freqüência
A média de uma distribuição de freqüências de uma amostra é
aproximada por:
x=
∑ ( x. f ) n=∑f
n
Onde x e f são os pontos médios e freqüências, respectivamente.
er ch er
a ch eima
eim n St
o n St s o
. Aly
ss r. Alys
Dr f. D
Pro
f. Pro
11. Estatística e Probabilidade
Aspecto das distribuições de freqüência
As distribuições de frequência podem ser:
freqüência
Simétricas: Uniforme:
Quando pudermos traçar uma linha Quando todas as entradas, ou classes
vertical pelo ponto médio do gráfico e na distribuição tiverem freqüências
as duas metades forem iguais. iguais
er ch er
a ch eima
eim n St
o n St s o
. Aly
ss r. Alys
Dr f. D
Pro
f. Pro
12. Estatística e Probabilidade
Assimétricas à direita: Assimétricas à esquerda:
Se a ‘cauda’ do gráfico se prolongar Se a ‘cauda’ do gráfico se prolongar
mais para a direita, a distribuição é mais para a esquerda, a distribuição é
chamada de assimétrica à direita. chamada de assimétrica à esquerda.
er ch er
a ch eima
eim n St
o n St s o
. Aly
ss r. Alys
Dr Média > Mediana f. D
Média < Mediana
Pro
f. Pro
13. Estatística e Probabilidade
Medidas de variação
• Desvio,
• Variância e
• Desvio padrão
er ch er
a ch eima
eim n St
o n St s o
. Aly
ss r. Alys
Dr f. D
Pro
f. Pro
14. Estatística e Probabilidade
Desvio populacional
O desvio de uma entrada x em um conjunto de dados de uma população
ou amostra é a diferença entre a entrada e a média (μ ou x ) do conjunto
de dados
Em uma população, o desvio de cada valor x é:
Em uma amostra, o desvio de cada valor x é:
Como a soma dos desvios de todas as entradas é igual a zero, não faz
sentido determinar a média dos desvios.
Desta maneira, você pode elevar ao quadrado cada desvio e obter a
média... her er
c a ch
ima te teim nS
yss on S Alys
so
r. Al f. D
r .
f. D Pro
Pro
15. Estatística e Probabilidade
Variância populacional
É a média da soma dos quadrados dos desvios de um conjunto de
dados de uma população com N entradas, ou seja
∑ (x − μ )
2
σ 2
=
N
Desvio Padrão populacional
É a raiz quadrada da variância populacional:
er ch er
a ch ∑ (x − μ ) ima
2
eim e
o n St σ= σ = 2
s o n St
. Aly
ss N r. Alys
Dr f. D
Prof. Pro
16. Estatística e Probabilidade
Variância amostral
A média dos quadrados dos desvios padrão é chamada de variância
amostral. Para um conjunto de dados de uma amostra com n
∑ (x − x )
entradas é: 2
s 2
=
n −1
Uma desvantagem da variância consiste no fato de suas unidades
normalmente não terem sentido (como dólares ao quadrado, por
exemplo). Assim, pode-se retornar a unidade original dos dados
tomando sua raiz quadrada.
Desvio Padrão amostral
É a raiz quadrada da variância amostral:
er ch er
a ch eima
o n St
eim
∑ ( x − x )2 s o n St
. Aly
ss s= s = 2
r. Alys
Dr f. D
Prof. n −1 Pro
17. Estatística e Probabilidade
Resumindo...
Para obter a variância e o desvio padrão
1. Obtenha a média do conjunto de x=
∑x
dados n
2. Obtenha o desvio de cada entrada x= x−x
(x − x)
2
3. Eleve ao quadrado cada desvio
∑(x − x )
2
4. Some os resultados para obter a
soma dos quadrados
5. Divida por (n – 1) para obter a ∑ ( x − x )2
s2 =
variância n −1
er er
achquadrada da a ch
6. Determine teim a raiz em
Stx i− x )2
o nS y s on (
∑
ly s s
variância para obter o desvio padrão s = Drs
.
2
Al=s
r. A f. n −1
f. D Pro
Pro
18. Estatística e Probabilidade
Existe ainda...
Desvio Padrão para dados agrupados
Grandes conjuntos de dados são normalmente mais bem representados
por uma distribuição de freqüência.
A fórmula para o desvio padrão da amostra de uma distribuição de
freqüência é
∑ ( x − x )2 f
s=
n −1
na qual n=Σf é o número de entradas no conjunto de dados. er
er ch
a ch eima
eim n St
o n St s o
. Aly
ss r. Alys
Dr f. D
Pro
f. Pro
19. Estatística e Probabilidade
Medidas de Posição
São utilizadas para identificar a posição de uma entrada dentro de um
conjunto de dados. Quartis, por exemplo, são números que dividem
em partes iguais um conjunto de dados ordenados.
Definição:
Os três quartis Q1, Q2 e Q3 dividem aproximadamente um conjunto
ordenado de dados em quatro partes.
• 1/4 dos dados ficam dentro ou abaixo do primeiro quartil
• metade dos dados ficam dentro ou abaixo do segundo quartil (é
igual a mediana doeconjunto de dados)
h r er
ac ma ch
Steim on Stei
• ¾ Alysson
dos dados ficam dentro ou abaixo de terceiro quartilyss
.Al
f. D
r. f. Dr
Pro Pro
20. Estatística e Probabilidade
Exemplo:
A pontuação nos testes de 15 empregados envolvidos em um
curso de treinamento estão dispostos abaixo. Obtenha Q1, Q2 e
Q3.
13 9 18 15 14 21 7 10 11 20 5 18 37 16 17
Metade inferior Metade superior
5 7 9 10 11 13 14 15 16 17 18 18 20 21 37
Q1 Q2 Q3
r h er
Q1 = Mediana dos dadose a ch Q2 = Mediana Q3 = Mediana dos dados imace
teim n St
abaixosde S
o n Q2 acima de lQ2soys
ly s r. A
r. A f. D
f. D Pro
Pro
21. Estatística e Probabilidade
Amplitude interquartil (AIQ)
A amplitude interquartil (AIQ) de um conjunto de dados é a diferença
entre o primeiro e o terceiro quartis.
Amplitude interquartil (AIQ)= Q3 – Q1
A AIQ é uma medida da variação que fornece uma idéia de quanto os
50% médios dos dados variam.
(AIQ)= Q3 – Q1 = 18-10 = 8
(as pontuações no teste na metade do conjunto de dados varia em 8 pontos)
A AIQ também serve para identificar dados estranhos (discrepantes).
Qualquer valor acima de 1,5 AIQ à esquerda de Q1 ou a direita de Q3
her er
é estranho. ac ma ch
Steim on Stei
so n ly s s
No r. Alys .A
exemplo anterior, 37 é um dado estranho as pontuações.
. Dr
f. D f
Pro Pro
22. Estatística e Probabilidade
Outras medidas de posição...
• Decis → Divide o conjunto de dados em dez partes
iguais (D1, D2, D3.......D9)
• Percis → Divide o conjunto de dados em cem partes
iguais (P1, P2, P3.......P99)
er ch er
a ch eima
eim n St
o n St s o
. Aly
ss r. Alys
Dr f. D
Pro
f. Pro