Este documento discute os fatores a serem considerados na escolha do método de análise de dados em pesquisas de marketing e apresenta algumas medidas descritivas comumente utilizadas. Os principais pontos abordados são: 1) a escolha do método deve levar em conta o tipo de escala da variável, nível de conhecimento sobre os parâmetros populacionais, tipo de análise desejada e relação entre as variáveis; 2) existem medidas de posição como média, mediana e moda e medidas de dispersão como distribuição de frequências e ordenamento;
C409 m artigo 3 narrativa transmidia e o magazine luiza
Pesquisa Aplicada a Comunicação cap-6
1. PESQUISA
DE
MARKETING
Edição Compacta
Prof. Dr. Fauze Najib Mattar
2. 2
Capítulo 6 – Análise de Dados
PESQUISA DE MARKETING – Edição Compacta Mattar
3. Análise de Dados 3
Escolha do método
Muitas pesquisas de marketing têm apresentado
conclusões baseadas em resultados obtidos com a
utilização incorreta de técnicas de análises,
comprometendo, dessa forma, sua qualidade,
precisão e confiabilidade.
PESQUISA DE MARKETING – Edição Compacta Mattar
4. Análise de Dados 4
Fatores a considerar na escolha do método de análise
Tipo de escala da variável.
Nível de conhecimento dos parâmetros da população.
Tipo de análise desejada.
Número de variáveis a serem analisadas conjuntamente.
Número de amostras e seu grau de relacionamento.
Relação de dependência entre as variáveis.
PESQUISA DE MARKETING – Edição Compacta Mattar
5. Análise de Dados 5
Tipo de escala
Em função das diferentes características das
escalas, as técnicas possíveis de serem utilizadas na
análise variam conforme a escala seja nominal,
ordinal, intervalar ou razão (Cap. 3).
PESQUISA DE MARKETING – Edição Compacta Mattar
6. Análise de Dados 6
Nível de conhecimento dos parâmetros da população
Uma técnica estatística é paramétrica quando o
modelo do teste especifica certas condições sobre os
parâmetros da população da qual a amostra foi
obtida, para que possa ser utilizada.
Uma técnica estatística não paramétrica é aquela que
compreende um teste cujo modelo não especifica
condições sobre os parâmetros da população da qual
a amostra foi obtida.
PESQUISA DE MARKETING – Edição Compacta Mattar
7. Análise de Dados 7
Nível de conhecimento dos parâmetros da população
(continuação)
Exemplo:
Exigências a serem atendidas na aplicação do teste
paramétrico t:
as observações precisam ser independentes;
as amostras precisam ter sido retiradas de populações
com distribuições normais;
as populações precisam ter as mesmas variâncias (ou a
relação entre as variâncias conhecida);
as variáveis em estudo precisam ter sido medidas ao
menos numa escala de intervalo que possibilite as
quatro operações aritméticas.
PESQUISA DE MARKETING – Edição Compacta Mattar
8. Análise de Dados 8
Tipo de análise
Métodos descritivos – têm o objetivo de proporcionar
informações sumarizadas dos dados contidos no total de
elementos da amostra estudada.
Métodos descritivos compreendem:
Medidas de posição – servem para caracterizar o que é
“típico” no grupo.
Medidas de dispersão – servem para medir como os
indivíduos estão distribuídos no grupo.
Medidas de associação – servem para medir o nível de
relacionamento existente entre duas ou mais variáveis.
PESQUISA DE MARKETING – Edição Compacta Mattar
9. Análise de Dados 9
Tipo de análise
(continuação)
Métodos inferenciais – compreendem um conjunto grande
de testes que servem para julgar a validade das hipóteses
estatísticas sobre uma população ou para estimar seus
parâmetros, a partir da análise dos dados de uma amostra
dessa população.
Os métodos inferenciais são baseados na teoria das
probabilidades, de forma que a incerteza da inferência
pode ser medida, isto é, o risco de efetuar inferências
incorretas pode ser estabelecido.
As técnicas inferenciais compreendem a estimação de
parâmetros e os testes de hipóteses.
PESQUISA DE MARKETING – Edição Compacta Mattar
10. Análise de Dados 10
Número de variáveis a serem analisadas
simultaneamente
Se o número de variáveis for respectivamente uma,
duas ou mais de duas, o pesquisador encontrará
métodos específicos aplicáveis a cada situação,
denominados de:
univariados;
bivariados;
multivariados.
PESQUISA DE MARKETING – Edição Compacta Mattar
11. Análise de Dados 11
Número de amostras a analisar e grau de
relacionamento entre elas
Possibilidades:
amostra simples;
duas amostras relacionadas;
duas amostras não relacionadas;
amostras múltiplas relacionadas;
amostras múltiplas não relacionadas.
PESQUISA DE MARKETING – Edição Compacta Mattar
12. Análise de Dados 12
Número de amostras a analisar e grau de
relacionamento entre elas
(continuação)
Amostras relacionadas e não relacionadas - diz
respeito a se a escolha de um elemento para fazer
parte da amostra interfere na probabilidade de
escolha de outro ou se o resultado da avaliação de
qualquer elemento da amostra possa ter interferido
na avaliação de outro.
PESQUISA DE MARKETING – Edição Compacta Mattar
13. Análise de Dados 13
Relação de dependência entre as variáveis
Nos casos em que houver mais de uma variável a
ser analisada simultaneamente, um fator também
determinante para a escolha da técnica adequada
de análise é a relação de dependência existente
entre as variáveis.
As variáveis podem ter entre si uma relação de
dependência ou de interdependência.
PESQUISA DE MARKETING – Edição Compacta Mattar
14. Análise de Dados 14
Relação de dependência entre as variáveis
(continuação)
Numa relação de dependência, uma (ou mais de uma) das
variáveis é escolhida, segundo as condições estabelecidas
pelo problema de pesquisa, para ser examinada, no
sentido de se verificar sua dependência de outras
variáveis.
Numa relação de interdependência, o interesse está em
verificar o relacionamento existente entre as próprias
variáveis do conjunto, não sendo nenhuma escolhida, em
especial, como sendo a variável dependente.
Dos métodos descritivos de análise dos dados, as medidas
de posição e as medidas de dispersão dependem apenas
do tipo de escala de medição da variável sob análise.
PESQUISA DE MARKETING – Edição Compacta Mattar
15. Análise de Dados 15
Métodos descritivos de análise de dados
Medidas de posição e de dispersão para variáveis em escalas nominais,
ordinais e intervalares mais utilizadas em pesquisas de marketing
Medidas de
Escala da
variável Posição Dispersão
Nominal Moda Distribuição de freqüências
(absoluta e relativa)
Ordinal Mediana Ordenamento
Quartis, decis e percentis
Intervalar Média aritmética Distribuição de freqüência
ou Razão acumulada (absoluta e relativa)
Amplitude
Desvio-médio
Desvio-padrão
Coeficiente de variação
Obs.: As medidas apresentadas são cumulativas, em cada coluna, no sentido de cima para baixo, isto é, todas as
medidas aplicáveis às variáveis com escalas nominais são também aplicáveis àquelas com escalas ordinais,
e todas as aplicáveis às variáveis com escalas ordinais o são também àquelas com escalas intervalares.
PESQUISA DE MARKETING – Edição Compacta Mattar
16. Análise de Dados 16
Divisão das medidas de posição
Medidas de posição
Tendência central Separatrizes
Média Quartil
Moda Decil
Mediana Percentil
Observação: o segundo quartil = mediana
PESQUISA DE MARKETING – Edição Compacta Mattar
17. Análise de Dados 17
Dados nominais
Moda é o valor ou categoria da variável que ocorre
com a maior frequência.
É uma medida típica de tendência central para
variáveis nominais.
Pode ser aplicada a variáveis ordinais ou
intervalares, desde quem tenham sido agrupadas
em classes.
A classe que obtiver maior frequência é
denominada classe modal.
PESQUISA DE MARKETING – Edição Compacta Mattar
18. Análise de Dados 18
Exemplo de determinação da moda
Empresa de transporte Freqüência
aéreo preferida absoluta
A 20
B 40
C 10
D 30
E 50
F 10
G 60 (moda)
Total 220
PESQUISA DE MARKETING – Edição Compacta Mattar
19. Análise de Dados 19
Dados ordinais
Mediana é o valor da variável que divide o grupo em
dois subgrupos de igual tamanho (é o valor da
variável correspondente ao elemento central da
distribuição; corresponde ao 2° quartil)).
É uma medida típica de tendência central para
variáveis ordinais.
Pode ser aplicada a variáveis intervalares.
PESQUISA DE MARKETING – Edição Compacta Mattar
20. Análise de Dados 20
Dados ordinais
(continuação)
Determinação do valor da mediana:
ordenar numericamente os dados;
procurar o valor da variável correspondente ao
elemento que divide o grupo em dois subgrupos
quando a amostra tiver número ímpar de elementos;
procurar a média dos valores dos dois elementos
centrais, quando a amostra possuir um número par
de elementos.
PESQUISA DE MARKETING – Edição Compacta Mattar
21. Análise de Dados 21
Dados ordinais
(continuação)
Quartis são os valores da variável correspondentes aos três elementos
que dividem o conjunto de dados ordenados em quatro subgrupos de
tamanhos iguais.
São chamados, respectivamente, de:
1º quartil – o valor da variável que divide os elementos do grupo em 25% e 75%;
2º quartil – o valor da variável que divide os elementos do grupo em 50% e 50%;
3º quartil – o valor da variável que divide os elementos do grupo em 75% e 25%.
Decis e percentis são os valores da variável correspondentes aos
elementos que dividem o conjunto de dados ordenados em 10 e 100
partes iguais, respectivamente.
PESQUISA DE MARKETING – Edição Compacta Mattar
22. Análise de Dados 22
Dados ordinais
(continuação)
Fórmula para cálculo dos quartis:
Qn = ν + (Q – Frac) / Frel
Onde:
Qn = valor do quartil que se deseja calcular;
Q1 = 1º quartil;
Q2 = 2º quartil = Mediana;
Q3 = 3º quartil;
ν = valor médio do intervalo de classe em que o quartil está situado;
Q = frequência relativa acumulada do quartil a ser calculado. Assim,
Q = 0,25 para o 1º quartil, Q = 0,50 para a mediana e Q = 0,75
para o 3º quartil;
Frac= frequência relativa acumulada até a classe anterior à do quartil
considerado;
Frel= frequência relativa da classe em que o quartil está situado.
PESQUISA DE MARKETING – Edição Compacta Mattar
23. Análise de Dados 23
Dados intervalares
Média aritmética (ou simplesmente média) corresponde
ao valor médio de um conjunto de dados.
É uma medida de tendência central de aplicação exclusiva
a variáveis intervalares.
Existem duas fórmulas para o cálculo da média,
dependendo da forma de apresentação dos dados.
PESQUISA DE MARKETING – Edição Compacta Mattar
24. Análise de Dados 24
Fórmulas para o cálculo da média
Fórmula para o cálculo da média para dados que não
estejam na forma de distribuição de freqüências:
População Amostra
N n
∑ Xi ∑ xi
i=1 i=1
µ= x=
N n
Fórmula para o cálculo da média para dados que estejam
na forma de distribuição de freqüências:
População Amostra
N n
∑ fi Xi ∑fi xi
i=1 i=1
µ= x=
N n
PESQUISA DE MARKETING – Edição Compacta Mattar
25. Análise de Dados 25
Medidas de dispersão
As medidas de tendência central informam a respeito do
ponto de concentração da maioria das respostas, porém
não informam nada a respeito do grau de concentração
dessas respostas, nem da maneira como as observações
estão dispersas por toda a distribuição.
O conhecimento da dispersão dos dados de uma variável
permite avaliar a confiabilidade de uma medida de
tendência central numa amostra como parâmetro da
população.
PESQUISA DE MARKETING – Edição Compacta Mattar
26. Análise de Dados 26
Variáveis nominais
A distribuição de freqüência absoluta é resultante da
contagem das ocorrências de respostas por opção possível
da variável.
A distribuição de freqüência relativa é resultante da
divisão da freqüência absoluta de cada opção pelo total de
elementos da amostra.
Constituem as únicas medidas de dispersão que podem ser
aplicadas a variáveis nominais.
PESQUISA DE MARKETING – Edição Compacta Mattar
27. Análise de Dados 27
Variáveis ordinais
Ordenamento é a disposição de todos os elementos
do grupo de forma crescente ou decrescente,
segundo as avaliações efetuadas para a variável
ordinal pesquisada.
PESQUISA DE MARKETING – Edição Compacta Mattar
28. Análise de Dados 28
Variáveis ordinais
(continuação)
Exemplo:
Uma rede de supermercados deseja avaliar o quanto três
de suas lojas estão agradando a seus clientes, para, em
função dos resultados, decidir em qual(ais) loja(s) devem
ser tomadas providências administrativas e
mercadológicas.
Para tanto, realizou uma pesquisa junto a 9
consumidores de cada uma das lojas, quanto a seu grau
de satisfação, avaliado através da atribuição de pontos
para um grande número de tópicos de um mesmo
instrumento.
PESQUISA DE MARKETING – Edição Compacta Mattar
29. Análise de Dados 29
Variáveis ordinais
(continuação)
Dados brutos resultantes da avaliação do grau de satisfação em
três lojas de uma rede de supermercados
Loja A Loja B Loja C
78 113 72
120 90 93
106 99 80
77 100 69
87 123 97
86 92 76
111 121 62
128 104 67
110 132 116
PESQUISA DE MARKETING – Edição Compacta Mattar
30. Análise de Dados 30
Variáveis ordinais
(continuação)
Uma forma comumente encontrada em pesquisas de marketing
é efetuar a soma das pontuações na vertical e comparar os
resultados, e a partir desses resultados decidir qual (ais) loja (s)
merece (m) mudanças.
Por tratar-se de uma variável ordinal, esta prática está
conceitualmente errada.
A prática correta é proceder a um ordenamento conjunto,
somar na vertical as várias posições ocupadas no ordenamento
conjunto e, somente a seguir, comparar os resultados e tomar
as decisões.
PESQUISA DE MARKETING – Edição Compacta Mattar
31. Análise de Dados 31
Variáveis ordinais
(continuação)
Resultados do ordenamento conjunto da avaliação do grau de
satisfação em três lojas de uma rede de supermercados
Loja A Loja B Loja C
21 7 24
5 17 15
10 13 20
22 12 25
18 3 14
19 16 23
8 4 27
2 11 26
9 1 6
Total 114 84 180
PESQUISA DE MARKETING – Edição Compacta Mattar
32. Análise de Dados 32
Variáveis intervalares
A distribuição de freqüência absoluta acumulada é resultante
da contagem acumulativa da ocorrência de respostas até
determinado valor da variável.
A distribuição de freqüência relativa acumulada é resultante
da divisão da freqüência absoluta acumulada pelo total de
elementos da amostra.
Constituem medidas de dispersão exclusivas de serem
aplicadas a variáveis intervalares.
PESQUISA DE MARKETING – Edição Compacta Mattar
33. Análise de Dados 33
Variáveis intervalares
(continuação)
Amplitude de uma distribuição é uma medida de
dispersão típica de variáveis intervalares.
A amplitude é a diferença entre o maior e o menor valor
da variável observados numa amostra.
A amplitude fornece a dimensão do campo de variação
da variável.
Fórmula para o cálculo da amplitude:
A = xmaior – xmenor
PESQUISA DE MARKETING – Edição Compacta Mattar
34. Análise de Dados 34
Variáveis intervalares
(continuação)
Desvio-médio
O desvio-médio é uma medida de dispersão típica de variáveis
intervalares e indica o grau de dispersão do total dos indivíduos
num grupo, em relação a determinada variável.
O desvio-médio é a média aritmética das diferenças (em
módulo, ou seja, despreza-se o sinal) entre cada observação e a
média das observações.
Serve para comparar duas distribuições com igual média e
saber qual das duas está mais ou menos dispersa.
Fórmula para o cálculo do desvio-médio:
População Amostra
N n
∑ Xi - µ ∑ xi - x
DM = i=1 DM = i=1
N n
PESQUISA DE MARKETING – Edição Compacta Mattar
35. Análise de Dados 35
Variáveis intervalares
(continuação)
Variância é a soma dos quadrados das diferenças
entre cada observação e a média, dividida pelo
número de observações.
Desvio-padrão é a raiz quadrada da variância.
PESQUISA DE MARKETING – Edição Compacta Mattar
36. Análise de Dados 36
Variáveis intervalares
(continuação)
Fórmula para o cálculo do desvio-padrão
População Amostra
Original Computacional Original Computacional
Dados 2 2
∑(X - µ)2 ∑X2 ∑X ∑(x - x)2 ∑x2 ∑x
brutos σ= σ= S= S=
N N N n n n
Dados em
2 2
distribuição de ∑f(X)2 ∑fX ∑f(x)2 ∑fx
σ= S=
freqüência N N n n
PESQUISA DE MARKETING – Edição Compacta Mattar
37. Análise de Dados 37
Variáveis intervalares
(continuação)
Coeficiente de variação
O desvio-padrão é uma medida absoluta da dispersão e é
apresentado nas mesmas unidades de medida originais em que os
dados foram coletados.
Pode existir a necessidade da comparação da dispersão de
diversas distribuições que não possuam as mesmas médias ou
que não estejam nas mesmas escalas ou unidades de medida e
que, por isso, não podem ser feitas com os desvios-padrão.
O coeficiente de variação permite efetuar essas comparações.
O coeficiente de variação é uma medida abstrata da dispersão e é
obtido através da divisão do desvio-padrão pela média:
População Amostra
CVp = σ / µ CVa = S / x
PESQUISA DE MARKETING – Edição Compacta Mattar
38. Análise de Dados 38
Métodos de inferência
A inferência diz respeito a como se podem assumir
conclusões para toda uma população a partir das
medições e da análise de apenas uma parte dela, de
forma que o risco de se realizarem conclusões
incorretas possa ser medido.
A inferência compreende dois tipos de problemas:
estimar os parâmetros de uma população;
realizar testes de hipóteses.
PESQUISA DE MARKETING – Edição Compacta Mattar
39. Análise de Dados 39
Métodos de inferência
(continuação)
Os métodos de inferência estatística possibilitam:
assumir, com determinada probabilidade
conhecida de erro, a média (ou a porcentagem)
calculada numa amostra como estimativa do
parâmetro da população;
realizar os testes de hipóteses a respeito, por
exemplo, da diferença da média entre duas
distribuições.
PESQUISA DE MARKETING – Edição Compacta Mattar
40. Análise de Dados 40
Testes de hipóteses
Procedimentos para realização do teste de hipóteses:
1. estabelecer a hipótese nula (H0) e a hipótese
alternativa (H1), tendo em vista a hipótese da
pesquisa;
2. selecionar o teste estatístico adequado à situação;
3. estabelecer um nível de significância;
4. determinar ou assumir a distribuição amostral da
prova estatística sob a hipótese nula (H0);
PESQUISA DE MARKETING – Edição Compacta Mattar
41. Análise de Dados 41
Testes de hipóteses
(continuação)
Procedimentos para realização do teste de hipóteses:
5. com base em 2, 3 e 4 definir a região de rejeição da
hipótese nula (H0);
6. calcular o valor da prova estatística a partir dos
dados da (s) amostra (s) ;
7. tomar a decisão quanto à não-rejeição ou à rejeição
da hipótese nula (H0) e, conseqüentemente, a
adoção ou não da hipótese alternativa (H1).
PESQUISA DE MARKETING – Edição Compacta Mattar
42. Análise de Dados 42
Métodos da inferência – testes estatísticos apropriados segundo os
métodos estatísticos, as escalas de mensuração e o número de
amostras e seu relacionamento
TESTES DE INFERÊNCIA
Escala de Duas amostras Várias amostras
mensuração
Método Uma amostra Não relacionadas Não relacionadas
da variável
Relacionadas Relacionadas
Binomial McNemar χ2 Duas amostras Cochran Q χ2 Várias amostras
Nominal χ2 Uma independentes
amostra
Não Kolmogorov- Wilcoxon Mediana Análise da Mediana –
paramétricos Smirnov Mann-Whitney U variância por várias amostras
Kolmogorov- postos de independentes
Ordinal Smirnov Friedman Análise da variância
numa direção de
Kruskal – Wallis
z tr Diferença de Análise da variância
t médias
Intervalar z
Paramétricos t
ou Razão
Regressão
t
PESQUISA DE MARKETING – Edição Compacta Mattar
43. Análise de Dados 43
Testes de hipóteses
(continuação)
Regiões de rejeição para testes unicaudais e bicaudais
p = 0,05
Região de
aceitação Região de
de H0 rejeição
de H0
a. Região de rejeição de um teste unicaudal quando α = 0,05
p = 0,025 Região de p = 0,025
Região de Região de
aceitação
rejeição rejeição
de H0
de H0 de H0
b. Região de rejeição de um teste bicaudal quando α = 0,05
PESQUISA DE MARKETING – Edição Compacta Mattar
44. Análise de Dados 44
Testes de hipóteses
(continuação)
A seguir, serão apresentados, como exemplo, três
modelos de testes de hipóteses: teste para uma
amostra; teste para duas amostras e teste para
várias amostras, pois todos os outros testes seguem
o mesmo padrão de raciocínio.
PESQUISA DE MARKETING – Edição Compacta Mattar
45. Análise de Dados 45
Teste para uma amostra – variável nominal
Teste qui-quadrado de uma amostra:
É utilizado em pesquisas de marketing para verificar se a
distribuição de freqüência absoluta observada de uma
variável em uma amostra é significativamente diferente da
distribuição de freqüência absoluta esperada (teórica ou
conhecida).
Exemplo de aplicação:
Sabendo-se qual tem sido a distribuição da preferência dos
consumidores em relação aos quatro tamanhos de
embalagens de determinado produto, verificar se a
distribuição da preferência observada numa amostra, nos
tamanhos de embalagem, para uma nova marca do produto a
ser lançada difere significativamente da distribuição
conhecida.
PESQUISA DE MARKETING – Edição Compacta Mattar
46. Análise de Dados 46
Teste para uma amostra – variável nominal
(continuação)
Condições para utilização:
Exclusivamente para variáveis nominais ou ordinais.
Observações independentes.
Não pode ser utilizado se mais de 20% das freqüências absolutas
forem inferiores a 5 ou se qualquer freqüência for inferior a 1.
Nestes casos, a solução para possibilitar a utilização do teste é
agrupar células até terem as condições atendidas.
Teoria/ Conceito:
É uma prova do tipo aderência, isto é, o quanto a distribuição
observada (Oi) se ajusta à distribuição esperada (Ei).
Através da comparação entre as Ois e as Eis, aceita-se ou
rejeita-se H0, a determinado nível de significância α.
PESQUISA DE MARKETING – Edição Compacta Mattar
47. Análise de Dados 47
Teste para uma amostra – variável nominal
(continuação)
Procedimento sumarizado do teste:
1. Determinar H0 como sendo a negativa da existência de
diferenças entre a distribuição de freqüência observada e a
esperada.
2. Estabelecer um nível de significância α.
3. Distribuir as freqüências observadas Ois pelas k categorias e,
sob a hipótese H0, determinar a distribuição de freqüência
esperada Eis pelas k categorias.
4. Determinar a região de rejeição de H0. Calcular os graus de
liberdade (gl),
Graus de liberdade: gl = k – 1, sendo k = número de categorias
e procurar, a seguir, na Tabela C (SIEGEL, 1981, p. 280) o
valor do qui-quadrado tabelado correspondente para α e gl.
PESQUISA DE MARKETING – Edição Compacta Mattar
48. Análise de Dados 48
Teste para uma amostra – variável nominal
(continuação)
1. Decisão. Calcular o valor de qui-quadrado a partir dos Ois,
segundo a fórmula:
k (Oi – Ei)2
χ2 = ∑
i=1 Ei
Onde:
Oi = número de observações classificadas na categoria i;
Ei = número de casos na categoria i, sob H0 (distribuição teórica);
k
∑ (Oi – Ei)2
= somatório dos cálculos efetuados para todas as
i=1 Ei células, segundo a fórmula acima.
Comparando o qui-quadrado calculado com o qui-quadrado
tabelado, decidir-se pela aceitação ou rejeição de H0.
PESQUISA DE MARKETING – Edição Compacta Mattar
49. Análise de Dados 49
Teste para uma amostra – variável nominal
(continuação)
Exemplo:
Um gerente de produto pretende verificar se a posição que o
produto ocupa na prateleira dos supermercados tem
influência sobre a quantidade vendida, através de um
experimento.
Um supermercado possui, geralmente, prateleiras com sete
divisões verticais, sendo a posição 1 correspondente à mais
próxima do piso.
Para a realização do experimento, o gerente conseguiu que,
durante um dia, todas as posições verticais da prateleira
fossem ocupadas pelo seu produto.
PESQUISA DE MARKETING – Edição Compacta Mattar
50. Análise de Dados 50
Teste para uma amostra – variável nominal
(continuação)
Ao final do dia, as tabulações das vendas por posição foram as
seguintes:
Posição
Total
1 2 3 4 5 6 7
Vendas (unidades) Oi 10 11 15 25 29 19 17 126
Vendas (unidades) Ei 18 18 18 18 18 18 18 126
Com base nesses dados, o gerente quer saber se as diferenças
verificadas nas posições são significativas, a ponto de poder
montar, com sucesso, um plano para induzir os supermercadistas
a colocar seu produto em determinadas posições.
PESQUISA DE MARKETING – Edição Compacta Mattar
51. Análise de Dados 51
Teste para uma amostra – variável nominal
(continuação)
Procedimentos para o teste:
1. Determinação de:
H0 = não há diferenças significativas entre as posições 4 e 5 na
prateleira.
H1 = as diferenças observadas para as posições 4 e 5 são
significativamente diferentes para melhor em relação às demais
posições (Teste unicaudal).
2. Nível de significância α = 0,02.
3. Distribuição de freqüências esperadas sob H0. Se não houver
diferenças entre as posições, a distribuição de freqüências será de 18
unidades por posição, conforme a tabela anterior.
PESQUISA DE MARKETING – Edição Compacta Mattar
52. Análise de Dados 52
Teste para uma amostra – variável nominal
(continuação)
4. Região de rejeição. Para α = 0,02 e gl = 7 – 1 = 6, o valor (Tabela C,
SIEGEL, 1981, p. 280) de qui-quadrado tabelado é 15,03. Portanto,
a região de rejeição é a correspondente a todas as ordenadas
maiores ou iguais a 15,03 para o qui-quadrado calculado.
5. Decisão.
Cálculo de qui-quadrado =
{(10 – 18)2 + (11 – 18)2 + (15 – 18)2 + (25 – 18)2 + (29 – 18)2 +
+ (19 – 18)2 + (17 – 18)2} / 18 = 16,3
Tendo em vista que o qui-quadrado calculado (16,3) é
maior que o tabelado (15,03), rejeitamos H0 em prol de
H1 .
Portanto, há diferença significativa, no nível de 0,02, para
as posições 4 e 5 nas prateleiras dos supermercados e, por
isso, o gerente deve realizar o plano promocional.
PESQUISA DE MARKETING – Edição Compacta Mattar
53. Análise de Dados 53
Teste para duas amostras não relacionadas – variável nominal
(continuação)
Teste qui-quadrado para duas ou mais amostras (o caso de mais
de duas amostras foi juntado, pois a metodologia é a mesma):
É utilizado em pesquisas de marketing para verificar se as
distribuições absolutas de duas ou mais amostras não
relacionadas diferem significativamente em relação a
determinada variável.
Exemplo: verificar se as classes socioeconômicas diferem
significativamente no consumo de determinado produto;
verificar se a escolha do tamanho do automóvel difere
significativamente em função do tamanho da família etc.
PESQUISA DE MARKETING – Edição Compacta Mattar
54. Análise de Dados 54
Teste para duas amostras não relacionadas – variável nominal
(continuação)
Condições para utilização:
Dados nominais.
Distribuição dos dados em freqüências absolutas.
Amostras não relacionadas ou independentes.
Não pode ser utilizado se mais de 20% das freqüências absolutas forem
inferiores a 5 ou se qualquer freqüência for inferior a 1. Nestes casos, a
solução para tornar a utilização do teste possível é agrupar células até ter as
condições atendidas.
Teoria/ Conceito:
A prova qui-quadrado para duas ou mais amostras não relacionadas é,
semelhantemente à prova qui-quadrado de uma amostra, uma prova não
paramétrica do tipo aderência, isto é, o quanto a distribuição observada
(Oi) se ajusta à distribuição esperada (Ei). Através da comparação entre as
Ois e Eis, aceita-se ou rejeita-se H0, em determinado nível de significância α.
PESQUISA DE MARKETING – Edição Compacta Mattar
55. Análise de Dados 55
Teste para duas amostras não relacionadas – variável nominal
(continuação)
Procedimento sumarizado do teste:
1. Determinar H0 como sendo a negativa da existência de diferenças entre a
distribuição de freqüência absoluta observada e a esperada.
2. Estabelecer um nível de significância α.
3. Distribuir as freqüências absolutas das r variáveis pelas j categorias. Sob
a hipótese H0, determinar a distribuição de freqüência absoluta esperada
das r variáveis pelas k categorias. Verificar se as restrições ao uso do
qui-quadrado quanto ao número de freqüências por células não estão
ocorrendo.
4. Determinar a região de rejeição de H0. Determinar os graus de
liberdade (gl), sendo r o número de linhas e k o número de colunas.
Graus de liberdade: = gl = (r – 1) (k – 1)
Procurar a seguir, na Tabela C (SIEGEL, 1981, p. 280) o valor do qui-
quadrado tabelado ( χ2) correspondente para α (teste unicaudal) ou α/2
t
(teste bicaudal) e gl. Todos os valores maiores ou iguais ao valor tabelado
correspondem a ordenadas da região de rejeição de H0.
PESQUISA DE MARKETING – Edição Compacta Mattar
56. Análise de Dados 56
Teste para duas amostras não relacionadas – variável nominal
(continuação)
1. Decisão. Calcular o valor de qui-quadrado utilizando a seguinte fórmula:
r k
(Oij – Eij )2
χ = ∑
2 ∑
c i=1 j=1
Eij
Onde:
Oij = número de observações classificadas, simultaneamente, na linha i e na
coluna j;
Eij = número de casos esperados simultaneamente na linha i e na coluna j ,
sob H0 (distribuição teórica);o cálculo de cada Eij é obtido pela multiplicação
do total de observações da linha pelo total de observações da coluna,
dividido pelo total de observações.
r k
∑ ∑ = somatório dos cálculos efetuados para todas as r linhas e k colunas,
i=1 j=1
segundo a fórmula apresentada.
Comparando o qui-quadrado calculado com o qui-quadrado tabelado decidir-
se pela aceitação ou rejeição de H0. Se χ2 ≥ χ2t , rejeita-se H0.
c
PESQUISA DE MARKETING – Edição Compacta Mattar
57. Análise de Dados 57
Teste para duas amostras não relacionadas – variável nominal
(continuação)
Exemplo:
Um gerente de concessionárias de uma montadora de automóveis,
analisando o desempenho de suas 417 concessionárias, em
relação, simultaneamente, a inúmeros itens, classificou-os em
baixo, médio e alto desempenho.
A empresa mantém um intenso programa de treinamento
dirigido aos proprietários e aos funcionários das concessionárias.
Esse mesmo gerente, analisando os quadros de atendimento aos
programas de treinamento, notou que um grande número de
concessionárias não tem atendido regularmente aos programas.
PESQUISA DE MARKETING – Edição Compacta Mattar
58. Análise de Dados 58
Teste para duas amostras não relacionadas – variável nominal
(continuação)
Exemplo:
Interessado em saber se há relação entre o atendimento aos
programas de treinamento e o desempenho das concessionárias,
solicitou que as duas informações fossem cruzadas, o que
resultou na seguinte tabela:
Atendimento do treinamento
Desempenho da Não Sim Totais
concessionária Oij Eij Oij Eij
Baixo 14 7,3 7 13,7 21
Médio 21 19,1 34 35,9 55
Alto 110 118,6 231 222,4 341
Totais 145 272 417
PESQUISA DE MARKETING – Edição Compacta Mattar
59. Análise de Dados 59
Teste para duas amostras não relacionadas – variável nominal
(continuação)
Procedimentos para o teste:
1. H0 = não existe diferença significativa entre o desempenho das
concessionárias que atenderam aos programas de treinamento e o
das que não.
H1 = há diferenças significativas entre as concessionárias que
atenderam aos programas de treinamento e as outras (Teste
unicaudal).
2. Nível de significância α = 0,01.
3. A distribuição das freqüências absolutas observadas (O ij) das r
variáveis pelas k categorias corresponde à tabela anterior
solicitada ao gerente. Sob a hipótese H0, a determinação da
distribuição de freqüência absoluta esperada (Eij) das r variáveis
pelas k categorias segue o seguinte raciocínio: supondo que o nível
de desempenho seja designado pela variável A e o atendimento ao
treinamento pela variável B, teremos as seguintes possibilidades:
PESQUISA DE MARKETING – Edição Compacta Mattar
60. Análise de Dados 60
Teste para duas amostras não relacionadas – variável nominal
(continuação)
Procedimentos para o teste:
A1 = Baixo desempenho.
A2 = Médio desempenho.
A3 = Alto desempenho.
B1 = Não-atendimento ao treinamento.
B2 = Atendimento ao treinamento.
Como as variáveis A e B são independentes, então a probabilidade de
ocorrer o evento A1B1 (concessionárias com baixo desempenho e que
não atenderam ao treinamento) é dada pelo produto das
probabilidades independentes para A1 e B1:
P(A1 B1) = P(A1) P(B1)
P(A1) = 21/ 417 e P(B×) = 125/ 41
1
e P(A1B1) = 21/ 417 125/ 417 = 7,3, que corresponde à freqüência
absoluta esperada da respectiva célula. E assim, sucessivamente,
calculamos todas as demais.
PESQUISA DE MARKETING – Edição Compacta Mattar
61. Análise de Dados 61
Teste para duas amostras não relacionadas – variável nominal
(continuação)
A seguinte fórmula facilita esses cálculos:
Eij = A multiplicação do total de observações da linha pelo total de
observações da coluna dividido pelo total de observações.
Assim, para a mesma célula já calculada, teríamos:
Eij = 21 x 145/ 417 = 7,3
Efetuando todos os cálculos, teremos os dados constantes da tabela
anterior, com as freqüências absolutas observadas e esperadas.
4. Determinação da região de rejeição de H0.
Procurar na tabela de qui-quadrado o valor correspondente a α = 0.01
e gl = (3 – 1) (2 – 1) = 2. Esse valor é χ2 = 9,21. Desta forma, todas as
t
ordenadas com valores maiores ou iguais estarão na região de rejeição
de H0.
PESQUISA DE MARKETING – Edição Compacta Mattar
62. Análise de Dados 62
Teste para duas amostras não relacionadas – variável nominal
(continuação)
5. Decisão. Calcular o valor do qui-quadrado (χt2) a partir das
Oijs e das Eijs, segundo a fórmula apresentada:
χ2 = (14 – 7,3)2/ 7,3 + (21 – 19,1)2/ 19,1 + (110 – 118,6)2/ 118,6 +
c
χ2 = 10,67 – 13,7) / 13,7 + (34 – 35,9) /35,9 + (231 –
+ (7 2 2
c
222,4)2/222,4
Como o qui-quadrado calculado (10,67) é maior que o tabulado
(7,3) para α = 0,02, H0 é rejeitada em favor de H1. Portanto, no
nível de confiança de α = 1,01, as concessionárias que atenderam
aos programas de treinamento tiveram um desempenho
significativamente melhor do que as outras.
PESQUISA DE MARKETING – Edição Compacta Mattar
63. Análise de Dados 63
Teste para várias amostras não relacionadas – variável ordinal
Análise da variância por classificação numa só direção de
Kruskal-Wallis:
A utilização em pesquisas de marketing da análise da variância
de Kruskal-Wallis é a mesma do teste Mann-Whitney U para
situações em que amostras de mais de duas variáveis
independentes estejam sendo comparadas.
É a contrapartida não paramétrica da análise da variância
num só sentido, cuja utilização exige que as distribuições das
populações sejam normais e com variâncias homogêneas.
PESQUISA DE MARKETING – Edição Compacta Mattar
64. Análise de Dados 64
Teste para várias amostras não relacionadas – variável ordinal
(continuação)
Condições para utilização:
Serve para a comparação de três ou mais variáveis
independentes.
Medições ao menos ordinais.
Escalas de medição idênticas nos diversos grupos.
Os dados precisam ser ordenados.
PESQUISA DE MARKETING – Edição Compacta Mattar
65. Análise de Dados 65
Teste para várias amostras não relacionadas – variável ordinal
(continuação)
Teoria/ Conceito:
O procedimento para o teste compreende a combinação dos
escores das n amostras num único rol ordenado do maior para
o menor escore, numerados, respectivamente, de 1 a n.
A seguir, todas as classificações obtidas para os escores de
cada amostra são somadas.
Quanto mais parecidas forem essas somas, mais parecidas
serão as amostras e, conseqüentemente, as populações de onde
foram extraídas; analogamente, quanto mais diferentes forem,
mais diferentes serão as amostras e a população de onde
foram extraídas.
O teste Kruskal-Wallis determina se as somas dos escores são
tão diferentes que as amostras e as populações de onde foram
extraídas não são idênticas, a determinado nível de
confiabilidade.
PESQUISA DE MARKETING – Edição Compacta Mattar
66. Análise de Dados 66
Teste para várias amostras não relacionadas – variável ordinal
(continuação)
Procedimento sumarizado do teste:
1. Definir H0 como não havendo diferenças entre os escores das
n variáveis consideradas.
2. Definir um nível de confiabilidade α para a realização do
teste.
3. Para amostras com tamanho n > 5, sob H0, a estatística de H,
usada para o cálculo do teste, é dada pela seguinte fórmula, cuja
distribuição é a mesma de qui-quadrado com gl = k – 1:
k
12
∑ R j - 3(n+1)
2
H =
n(n+1) j=1 nj
Onde:
k = número de amostras;
nj = número de casos na j-ésima coluna;
n = número de casos na combinação de todas as amostras;
Rj = soma das classificações na j-ésima amostra;
k
∑ R j = soma de todos os quadrados de Rj divididos por nj
2
j=1 nj
PESQUISA DE MARKETING – Edição Compacta Mattar
67. Análise de Dados 67
Teste para várias amostras não relacionadas – variável ordinal
(continuação)
Procedimento sumarizado do teste:
4. Região de rejeição. Corresponde a todos os valores de H
calculados que forem maiores ou iguais ao qui-quadrado
tabelado (Tabela C, SIEGEL, 1981, p. 280) para a e gl = k – 1.
5. Decisão. Calcular o valor de H utilizando a fórmula
anteriormente apresentada.
Se H for maior ou igual ao qui-quadrado tabelado para α e gl =
k – 1, rejeite H0 em prol de H1.
PESQUISA DE MARKETING – Edição Compacta Mattar
68. Análise de Dados 68
Teste para várias amostras não relacionadas – variável ordinal
(continuação)
Exemplo:
Para verificar a necessidade de reformulações em três de suas
lojas, uma cadeia de supermercados encomendou uma
pesquisa para avaliar o grau de satisfação dos consumidores
de cada uma das lojas.
A escala utilizada pela agência de pesquisa foi a do tipo Likert,
composta por uma série de afirmações às quais os
consumidores apontam o seu grau de concordância.
De cada uma das três lojas foram selecionados aleatoriamente
nove consumidores.
PESQUISA DE MARKETING – Edição Compacta Mattar
69. Análise de Dados 69
Teste para várias amostras não relacionadas – variável ordinal
(continuação)
Resultado tabulado das avaliações efetuadas
Avaliações Ordenação conjunta
A B C A B C
78 113 72 21 7 24
120 90 93 5 17 15
106 99 80 10 13 20
77 100 69 22 12 25
87 123 97 18 3 14
86 92 76 19 16 23
111 121 62 8 4 27
128 104 67 2 11 26
110 132 116 9 1 6
Totais 114 84 180
PESQUISA DE MARKETING – Edição Compacta Mattar
70. Análise de Dados 70
Teste para várias amostras não relacionadas – variável ordinal
(continuação)
Procedimentos para o teste:
1. H0 = não há diferenças na satisfação dos consumidores em
relação às três lojas consideradas.
2. H1 = há diferenças significativas na satisfação dos
consumidores das três lojas (Teste bicaudal).
3. α = 0,10.
1. A distribuição de H, para H0 , é a mesma de qui-quadrado
com gl =3 – 1 = 2.
1. Região de rejeição. Corresponde a todos os valores de H
calculados que forem maiores ou iguais ao qui-quadrado
tabelado para α/ 2 = 0,05 e gl = 2. Portanto, a região de
rejeição é compreendida por todos os valores maiores ou
iguais a 5,99.
PESQUISA DE MARKETING – Edição Compacta Mattar
71. Análise de Dados 71
Teste para várias amostras não relacionadas – variável ordinal
(continuação)
Procedimentos para o teste:
5. Decisão. Calculando o valor de H, utilizando a fórmula:
k
∑ R j - 3(n+1)
2
12
Hc = n
n(n+1) j=1 j
teremos:
12 1142 + 842 + 1802
Hc = - 3(27+1)
27(27+1) 9 9 9
Hc = 12 12.946 +7.056 + 32.400
- 84
756 9
Hc = 8,51
PESQUISA DE MARKETING – Edição Compacta Mattar
72. Análise de Dados 72
Teste para várias amostras não relacionadas – variável ordinal
(continuação)
Procedimentos para o teste:
Conclusão:
Como Hc = 8,51 é maior que o qui-quadrado tabelado = 5,99,
rejeitamos H0 em prol de H1.
Portanto, há diferenças significativas, no nível de 0,10, no grau de
satisfação dos consumidores para as três lojas, sendo a loja C a
que apresenta maiores problemas, seguida pela loja A. A loja C
deveria receber reformulações no seu funcionamento.
PESQUISA DE MARKETING – Edição Compacta Mattar
73. Análise de Dados 73
Inferência estatística
Dois diferentes testes de inferência estatística são apropriados
para variáveis intervalares: o teste z e o teste t.
A escolha entre um e outro dependerá do conhecimento do
desvio‑ padrão da população e do tamanho da amostra.
Esses testes são utilizados em hipóteses a respeito da média da
população, das diferenças entre médias, das proporções na
população, das diferenças entre proporções e do coeficiente de
regressão.
PESQUISA DE MARKETING – Edição Compacta Mattar
74. Análise de Dados 74
Teste da média para uma amostra – variável intervalar
Teste z:
O teste z é utilizado em pesquisas de marketing para
comparar a média de uma amostra com a média
hipotética da população e decidir com base na média
da amostra se a média hipotética da população pode
ser aceita como verdadeira.
PESQUISA DE MARKETING – Edição Compacta Mattar
75. Análise de Dados 75
Teste da média para uma amostra – variável intervalar
(continuação)
Condições para utilização:
Exclusivamente para variáveis intervalares.
Qualquer tamanho da amostra se o desvio ‑ padrão da população
for conhecido.
Somente para amostras de tamanho igual ou maior do que 30
elementos, se o desvio‑ padrão da população não for conhecido.
Para amostras de tamanho menor do que 30, o teste t será o mais
recomendado.
PESQUISA DE MARKETING – Edição Compacta Mattar
76. Análise de Dados 76
Teste da média para uma amostra – variável intervalar
(continuação)
Teoria/ Conceito:
O teste consiste em verificar se a média obtida na
_
amostra (х) pode ser aceita como a média hipotética
da população (µ).
PESQUISA DE MARKETING – Edição Compacta Mattar
77. Análise de Dados 77
Teste da média para uma amostra – variável intervalar
(continuação)
Procedimento sumarizado do teste:
1. Determinar H0 como sendo a média da amostra igual à média hipotética
da população (ou a negativa da existência de diferença entre essas duas
médias). Conseqüentemente, H1, a hipótese alternativa, será a existência
de diferença entre essas duas médias (Teste bicaudal). Ou que a média
da amostra é maior (ou menor) que a média hipotética da população
(Teste unicaudal).
2. Estabelecer um nível de significância.
3. Calcular os valores de z, segundo as fórmulas:
Caso 1: a variância da população é conhecida:
_ _
Zc = х - µ Zc = х - µ
ou
σ-x σ/ n
_
Onde: x = média da amostra;
µ = média hipotética da população;
-
σx = desvio-padrão da média que é igual a σ/ n, onde n é o
tamanho da amostra e σ, o desvio-padrão da população.
PESQUISA DE MARKETING – Edição Compacta Mattar
78. Análise de Dados 78
Teste da média para uma amostra – variável intervalar
(continuação)
Procedimento sumarizado do teste:
Caso 2: a variância da população é desconhecida:
_ _
Zc = х - µ Zc = х - µ
ou
S-x S/ n
_
Onde: x = média da amostra;
µ = média hipotética da população;
-
Sx = estimativa do desvio-padrão da média que é igual a S/ n,
onde n é o tamanho da amostra e S, a estimativa do
desvio-padrão da população.
PESQUISA DE MARKETING – Edição Compacta Mattar
79. Análise de Dados 79
Teste da média para uma amostra – variável intervalar
(continuação)
Procedimento sumarizado do teste:
4. Determinar a região de rejeição de z ao nível de significância
α estabelecido. Procurar na tabela da distribuição
padronizada de z o valor crítico Zt para o nível de
significância estabelecido.
5. Decidir comparando os valores de Zc e Zt. Se o valor de Z
calculado (Zc) for maior que de Z tabelado (Zt), a hipótese
nula (H0) é rejeitada e a hipótese alternativa (H1) é aceita.
PESQUISA DE MARKETING – Edição Compacta Mattar
80. Análise de Dados 80
Teste da média para uma amostra – variável intervalar
(continuação)
Procedimento sumarizado do teste:
Esses mesmos passos devem ser utilizados quando os dados
forem apresentados em proporção, e a fórmula para z a ser
utilizada quando o desvio-padrão da variância for conhecida
e n > 30 é:
Z = p–P = p–P
S pq/ n
Onde:
p = proporção de ocorrência na amostra;
P = proporção hipotética de ocorrência na
população;
S = desvio padrão da proporção;
n = número de elementos da amostra.
PESQUISA DE MARKETING – Edição Compacta Mattar
81. Análise de Dados 81
Teste da média para uma amostra – variável intervalar
(continuação)
Exemplo:
O comprador de uma rede de 500 farmácias está interessado em
verificar a viabilidade de adotar a comercialização de uma nova
marca de sabonete de um fornecedor tradicional.
Sua experiência anterior, em função da categoria do produto e da
margem de comercialização oferecida, indica que para essa
comercialização ser viável e lucrativa é necessário vender no mínimo
uma média de 100 unidades/ loja/ dia.
O fornecedor concordou em fornecer uma partida do produto que
permitiu a realização de um teste de vendas numa amostra
probabilística de 32 lojas da rede.
Com base nos dados da tabela a seguir, o comprador deve decidir se
adota ou não a comercialização dessa nova marca de sabonete.
PESQUISA DE MARKETING – Edição Compacta Mattar
82. Análise de Dados 82
Teste da média para uma amostra – variável intervalar
(continuação)
Os resultados obtidos de vendas por loja
Vendas Vendas
Loja x x2 Loja x x2
1 116 13.456 17 110 12.100
2 105 11.025 18 70 4.900
3 120 14.400 19 95 9.025
4 93 8.649 20 90 8.100
5 132 17.424 21 120 14.400
6 114 12.996 22 115 13.225
7 97 9.409 23 125 15.625
8 108 11.664 24 98 9.604
9 86 7.396 25 103 10.609
10 123 15.129 26 112 12.544
11 105 11.025 27 92 8.464
12 102 10.404 28 101 10.201
13 123 15.129 29 109 11.881
14 88 7.744 30 132 17.424
15 114 12.996 31 119 14.161
16 94 8.836 32 101 10.201
PESQUISA DE MARKETING – Edição Compacta Mattar
83. Análise de Dados 83
Teste da média para uma amostra – variável intervalar
(continuação)
Procedimento para o teste:
1. Determinar H0:
H0 = média é menor ou igual a 100.
H1 = média é maior que 100.
Portanto, um teste do tipo unicaudal.
2. Estabelecer um nível de significância. Seja o nível de significância de
α = 0,05.
3. Calcular os valores de z. Nesse caso, utilizamos a fórmula:
_
Zc = (x - µ) / Sx
- sendo Sx = S / n
-
_ n
x = ∑ xi / n = 3.412 / 32 = 106,625
i=1
-
Sx = ∑ (x)2 / n = 372.441 / 32 – 106,625 = 11.638,78 – 11.368,89 = 269,89
-
Sx = 16,428
Zc = (106,625 – 100) / (6,625 / (16,428 / 32)) = 6,625 / 2,904 = 2,281
Zc = 2,281
PESQUISA DE MARKETING – Edição Compacta Mattar
84. Análise de Dados 84
Teste da média para uma amostra – variável intervalar
(continuação)
Procedimento para o teste:
4. Determinar a região de rejeição de z. Procurar na tabela da
distribuição padronizada de z o valor correspondente ao nível de
significância de 0,05, que é, para o teste unicaudal, 1,65.
5. Decidir comparando os valores de Zc e Zt. Como o valor de Z
calculado (2,281) é maior que o de Z tabelado (1,65), a hipótese
nula (H0) é rejeitada e a hipótese alternativa (H1) é aceita para α =
0,05. Portanto, a nova marca de sabonete deverá ser aceita para
ser comercializada pela rede de farmácias.
Observação:
Teste t da média para uma amostra: a utilização em
pesquisas de marketing do teste t é análoga à do teste z.
PESQUISA DE MARKETING – Edição Compacta Mattar
85. Análise de Dados 85
Teste para duas amostras não relacionadas –
variável intervalar
Teste z da diferença entre duas médias:
O teste z da diferença entre duas médias é utilizado em pesquisas
de marketing para verificar se a diferença observada entre duas
médias obtidas de amostras não relacionadas é suficientemente
grande para ser considerada significativa.
Condições para utilização:
Exclusivamente para variáveis intervalares.
Medições devem ser efetuadas na mesma unidade ou escala.
Qualquer tamanho de amostras, se o desvio ‑ padrão da população
for conhecido.
Para amostras de tamanho maior do que 30, se o desvio ‑ padrão
da população não for conhecido. Se o tamanho da amostra for
menor ou igual a 30, o teste recomendado é o t.
PESQUISA DE MARKETING – Edição Compacta Mattar
86. Análise de Dados 86
Teste para duas amostras não relacionadas – variável intervalar
(continuação)
Teoria/ Conceito:
O princípio que norteia este teste é o de que, se as médias
amostrais de duas populações são normalmente distribuídas, a
distribuição de sua soma ou diferença também será normalmente
distribuída, desde que as populações que lhes deram origem
sejam normalmente distribuídas ou as amostras sejam maiores
do que 30.
Neste caso, o cálculo do teste será efetuado pela fórmula:
_ _
Z = (x1 – x2) – (µ1 - µ2)
σ -x - -
x
1 2
_ _
Onde: x1 e x2 = médias das amostras 1 e 2, respectivamente;
µ1 e µ2 = as médias desconhecidas das populações 1 e 2,
respectivamente, que sob H0 são idênticas;
σx – x- = é o desvio-padrão da diferença das médias e é igual a:
- 2
1
σx - x- 2 =
- σ2x + σ2x
_
1
_
1 2
PESQUISA DE MARKETING – Edição Compacta Mattar
87. Análise de Dados 87
Teste para duas amostras não relacionadas – variável intervalar
(continuação)
Teoria/ Conceito:
σ2 σ2
2
Sendo: σx =
-1
2 1 e σ-
2
x =
n1 2
n2
Teremos: σ-x1 - - 2 =
x σ21 + σ22
n1 n2
PESQUISA DE MARKETING – Edição Compacta Mattar
88. Análise de Dados 88
Teste para duas amostras não relacionadas – variável intervalar
(continuação)
Exemplo:
Um fabricante de cigarros realizou uma pesquisa entre 100
fumantes em duas classes socioeconômicas e constatou que os
fumantes da classe socioeconômica A/B fumam em média 20
cigarros/ dia e os da classe C/D uma média de 25 cigarros/ dia.
Sabe‑ se de estudos anteriores que o desvio ‑ padrão da população
de fumantes na classe A/B é 10 e na classe C/D é 14.
Esse fabricante deseja saber se a diferença verificada no
consumo de cigarros entre as duas amostras deverá ser aceita
como verdadeira na população ou atribuída apenas a variações
eventuais.
PESQUISA DE MARKETING – Edição Compacta Mattar
89. Análise de Dados 89
Teste para duas amostras não relacionadas – variável intervalar
(continuação)
Procedimento para o teste:
1. Determinar H0 = não há diferença significativa entre
fumantes das classes A/B e C/D, ou seja, µ1 = µ2.
H1 = há diferença significativa, ou seja, µ1 ≠ µ2.
É um teste bicaudal.
2. Estabelecer um nível de significância. Seja o nível de
significância de α = 0,05.
3. Calcular os valores de z utilizando as fórmulas apresentadas
no item teoria/ conceito:
_ _
Z = (x1 – x2) – (µ1 - µ2)
σ-x - x-
1 2
PESQUISA DE MARKETING – Edição Compacta Mattar
90. Análise de Dados 90
Teste para duas amostras não relacionadas – variável intervalar
(continuação)
Procedimento para o teste:
4. Determinar a região de rejeição de z. Procurar na tabela
da distribuição padronizada de z o valor correspondente a
0,025 (0,05/ 2 por ser teste bicaudal), que é –1,96.
5. Decidir comparando os valores de Zc e Zt. Como o valor de
Z calculado (–2,90) excede o de Z tabelado (–1,96) para
0,05 de significância, a hipótese nula (H0) é rejeitada e
aceita‑ se a hipótese alternativa H1. Portanto, há uma
diferença estatisticamente significativa no nível de 0,05 no
consumo médio diário de cigarros entre as duas classes
consideradas.
Observação:
Teste t da diferença entre duas médias: a utilização
em pesquisa de marketing do teste t da diferença de duas
médias é análoga à do teste z.
PESQUISA DE MARKETING – Edição Compacta Mattar
91. Análise de Dados 91
Resumo dos testes z e t sobre inferências da média para
uma amostra e duas amostras não relacionadas
σ conhecido σ desconhecido
n qualquer: n < 30
-
x - µ onde S = S
T= -
-
x - µ S-
x
x
~ N(0,1) n
Z =
σ-
x - -
∑ (xi - x) 2
Uma e S=
ou n
amostra
utilizar a tabela t para gl = n - 1
-
x - µ
Z = n ≥ 30
σ/ n - -
x-µ
x-µ
Z = ou Z=
-
Sx S/ n
PESQUISA DE MARKETING – Edição Compacta Mattar
92. Análise de Dados 92
Resumo dos testes z e t sobre inferências da média para
uma amostra e duas amostras não relacionadas
(continuação)
σ conhecido σ desconhecido
n qualquer: n < 30
- -
(x1 - x2) - (µ1 - µ2)
T =
S- - x
x
-
- -
(x1 - x2) - (µ1 - µ2) ~ N(0,1)
1 2
Z = n ≥ 30
σ- - σx-
x
1 2
Duas - -
(x1 - x2) - (µ1 - µ2)
amostras Z =
-
S- - x
x
não 1 2
relacionadas onde
S- - x =
x
- 2
x -
S- + S2
x =
1 2 1 2
S2
+ S2
2
1
n1 n2
utilizar a tabela t para gl = n1 + n2 - 2
PESQUISA DE MARKETING – Edição Compacta Mattar
93. Análise de Dados 93
Teste para duas amostras relacionadas – variável intervalar
Teste tr:
O teste tr é o indicado para o caso de duas amostras
relacionadas.
Exemplo:
Um fabricante de vinhos pretende lançar uma nova marca.
Desenvolveu duas versões para a embalagem e a adoção de uma
ou outra deveria ser decidida através de pesquisa.
Para realizar a pesquisa, solicitou que o novo vinho fosse
engarrafado em cada uma das versões de embalagem.
Essas duas versões foram colocadas à venda numa amostra
aleatória de cinco lojas de uma rede de supermercados.
PESQUISA DE MARKETING – Edição Compacta Mattar
94. Análise de Dados 94
Teste para duas amostras relacionadas – variável intervalar
(continuação)
Resultados das vendas do vinho nas duas embalagens
Vendas em unidades
Loja Embalagem 1 Embalagem 2 Diferença (d)
1 72 67 5
2 60 52 8
3 65 60 5
4 43 41 2
5 54 50 4
Com base nesses dados, qual embalagem deve ser adotada para o
novo vinho?
PESQUISA DE MARKETING – Edição Compacta Mattar
95. Análise de Dados 95
Teste para duas amostras relacionadas – variável intervalar
(continuação)
Procedimentos para o teste:
1. Determinar H0.
H0 = não há diferença entre as médias de venda das duas
embalagens.
H1 = há diferença significativa entre as médias de venda das
duas embalagens.
Portanto, um teste do tipo bicaudal.
2. Estabelecer um nível de significância. Seja o nível de
significância de α = 0,05.
PESQUISA DE MARKETING – Edição Compacta Mattar
96. Análise de Dados 96
Teste para duas amostras relacionadas – variável intervalar
(continuação)
3. Calcular os valores de t. O cálculo de t, neste caso, é obtido
através da seguinte fórmula:
_
Tc = (xd – D) / {(Sd / (n – 1))}
_
Onde: xd = média das diferenças observadas entre as duas amostras
em cada loja;
D = diferença esperada para H0, ou seja, D = 0;
n = número de diferenças, que no caso é 5;
Sd = desvio-padrão das diferenças observadas em relação à
diferença média, que é calculado pela seguinte fórmula:
n _
∑ (d1 – d)2
Sd = i=1
n-1
di = diferenças observadas entre as embalagens 1 e 2;
_
d = média das diferenças observadas entre as embalagens 1 e 2.
PESQUISA DE MARKETING – Edição Compacta Mattar
97. Análise de Dados 97
Teste para duas amostras relacionadas – variável intervalar
(continuação)
Procedimentos para o teste:
Aplicando estas formulações aos dados da tabela, teremos os
n qualquer:
onde
seguintes resultados:
_
xd = (5 + 8 + 5 + 2 + 4) / 5 = 4,8
Sd = {(5 – 4,8)2 + (8 – 4,8)2 + (5 – 4,8)2 + (2 – 4,8)2 + (4 – 4,8)2} / (5 – 1) = 6,5
Tc = (4,8 – 0) / (6,5 / 4) = 1,6
PESQUISA DE MARKETING – Edição Compacta Mattar
98. Análise de Dados 98
Teste para duas amostras relacionadas – variável intervalar
(continuação)
Procedimentos para o teste:
4. Determinar a região de rejeição de t . Procurar na tabela da
distribuição padronizada de t o valor correspondente a α/ 2 =
0,025 (pois o teste é bicaudal) para gl = n – 1 = 5 – 1 = 4, que é
2,776.
4. Decidir comparando os valores de Tc e Tt. Como o valor de T
calculado (1,6) é menor que o de T tabelado (2,776), a hipótese
nula (H0) é aceita no nível de significância de 0,05. Portanto, a
diferença observada na maior compra da embalagem 2 não é
significativa, e a adoção de qualquer uma das embalagens é
indiferente.
PESQUISA DE MARKETING – Edição Compacta Mattar
99. Análise de Dados 99
Métodos para medir a associação
As medidas de associação servem para verificar se dois ou
mais conjuntos de dados estão relacionados e para medir
o nível de relacionamento ou associação existente.
Em marketing e pesquisas de marketing, existem
inúmeras situações em que a medida da associação ou do
relacionamento entre duas ou mais variáveis é
extremamente útil.
PESQUISA DE MARKETING – Edição Compacta Mattar
100. Análise de Dados 100
Métodos para medir a associação
(continuação)
Exemplo:
Relacionar quanto a preferência para um produto, associada
à classe social dos consumidores, ajuda nos processos de
segmentação de mercado e de planejamento de marketing.
Relacionar quanto a intensidade dos gastos promocionais
está relacionada aos resultados de vendas ou de participação
no mercado também ajuda no planejamento futuro desses
gastos, tendo em vista os objetivos de vendas ou de
participação de mercado visados.
PESQUISA DE MARKETING – Edição Compacta Mattar
101. Análise de Dados 101
Métodos para medir a associação
(continuação)
A escolha do método não paramétrico para a medida da
associação irá depender de:
considerar uma ou mais de uma variável independente;
se as escalas de medição são nominais ou ordinais;
da existência ou não de variável dependente;
se a escala de medição é ordinal ou intervalar.
PESQUISA DE MARKETING – Edição Compacta Mattar
102. Análise de Dados 102
Métodos paramétricos e não paramétricos de
medidas de associação
Nominal Ordinal Intervalar ou Razão
Escala de Número de -
Nº de variáveis Nº- de variáveis -
Nº de variáveis
Método mensuração da variáveis dependentes dependentes dependentes
variável independentes
Nenhuma Uma Nenhuma Uma Nenhuma Uma
Coeficiente
Uma de
Contingência
Nominal
Índice de
Mais de uma Associação
Preditiva
Coeficiente
de
Não Correlação
Paramétrico de Postos de
Spearman
Uma
Coeficiente
Ordinal de
Correlação
de Postos de
Kendall
Coeficiente de
Mais de uma Concordância
de Kendall
PESQUISA DE MARKETING – Edição Compacta Mattar
103. Análise de Dados 103
Métodos paramétricos e não paramétricos de
medidas de associação
(continuação)
Nominal Ordinal Intervalar ou Razão
Escala de Número de - -
Nº de variáveis
-
Nº de variáveis dependentes Nº de variáveis dependentes
dependentes
Método mensuração variáveis
da variável independentes
Nenhuma Uma Nenhuma Uma Nenhuma Uma
Análise da
Uma
Regressão
Intervalar ou Análise Fatorial Análise de Análise Fatorial Análise da
Paramétrico com Variável Regressão Regressão
Razão Análise de
Mais de uma Dummy Múltipla com Conglomerados Múltipla
Análise de Variável
Conglomerados Dummy
PESQUISA DE MARKETING – Edição Compacta Mattar
104. Análise de Dados 104
Métodos para medir a associação
(continuação)
Coeficiente de CONTINGÊNCIA C
O coeficiente de correlação de postos de Spearman é o mais
conhecido e utilizado coeficiente para estabelecer a correlação
de dois conjuntos de dados ordenados.
Em pesquisas de marketing, sua utilização ocorre quando, de
um mesmo grupo de pessoas, são obtidas medições ordinais de
duas diferentes variáveis cujo relacionamento se deseja
conhecer, tais como classe social e preferência para o produto.
Pode também ser utilizado para comparar a associação existente
entre dois quaisquer conjuntos de dados ordenados.
PESQUISA DE MARKETING – Edição Compacta Mattar
105. Análise de Dados 105
Métodos para medir a associação
(continuação)
Coeficiente de correlação de postos de Spearman Rs
O coeficiente de correlação de postos de Spearman é o mais
conhecido e utilizado coeficiente para estabelecer a correlação
de dois conjuntos de dados ordenados.
Em pesquisas de marketing, sua utilização ocorre quando, de
um mesmo grupo de pessoas, são obtidas medições ordinais de
duas diferentes variáveis cujo relacionamento se deseja
conhecer, tais como classe social e preferência para o produto.
Pode também ser utilizado para comparar a associação existente
entre dois quaisquer conjuntos de dados ordenados.
PESQUISA DE MARKETING – Edição Compacta Mattar
106. Análise de Dados 106
Métodos para medir a associação
(continuação)
Condições para utilização:
Dois conjuntos de variáveis da mesma amostra ou de
amostras diferentes.
Variáveis medidas ao menos em escalas ordinais.
PESQUISA DE MARKETING – Edição Compacta Mattar
107. Análise de Dados 107
Métodos para medir a associação
(continuação)
Teoria/Conceito:
O coeficiente mede a disparidade de classificação entre dois
conjuntos de dados ordenados.
Os dois conjuntos de dados a comparar são ordenados,
independentemente, do maior para o menor valor das medições,
atribuindo-se, seqüencialmente, aos maiores valores a posição 1, e
aos menores, a posição n.
Comparando-se essas duas ordenações, pode ser deduzido que,
quanto mais homogêneas e coincidentes forem, menores serão as
diferenças algébricas observadas entre uma e outra, e vice-versa.
Se o relacionamento entre os dois conjuntos de classificações
ordenadas for perfeito, todas as diferenças nos pares de classificação
serão iguais a zero; analogamente, caso o relacionamento seja
exatamente o inverso, todas as diferenças serão máximas (por
exemplo, um mesmo respondente que tenha avaliado a primeira
variável num valor que resultou numa classificação 1 e, a segunda,
numa classificação n).
PESQUISA DE MARKETING – Edição Compacta Mattar