














Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Os melhores documentos à venda: Trabalhos de alunos formados
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Comunidade
Peça ajuda à comunidade e tire suas dúvidas relacionadas ao estudo
Descubra as melhores universidades em seu país de acordo com os usuários da Docsity
Guias grátis
Baixe gratuitamente nossos guias de estudo, métodos para diminuir a ansiedade, dicas de TCC preparadas pelos professores da Docsity
Este documento explica o processo de análise de variância (anova) com dois fatores: loja e empregado. O texto aborda a decomposição da variância total em componentes devidas aos fatores individuais e à interacção entre eles, além da verificação da hipótese de igualdade de médias entre os níveis de cada fator. O documento também inclui exemplos de cálculos e testes estatísticos.
Tipologia: Exercícios
1 / 22
Esta página não é visível na pré-visualização
Não perca as partes importantes!
50
Neste exemplo, ao testarmos a hipótese de as três lojas terem volumes médios de vendas iguais, estamos a testar se o factor Loja tem influência no volume de vendas.
Note que o volume de vendas deve também sofrer influência de outros factores.
Assim, a variação nas vendas pode estar relacionada não só com a loja, mas também com o desempenho do empregado. Vamos então introduzir no nosso estudo um segundo factor, o factor Empregado.
ANÁLISE DE VARIÂNCIA
Admitamos então que o Sr Fernando tem cinco empregados que estão igualmente familiarizados com as três lojas. Os dados recolhidos das vendas dos cinco empregados nas três lojas (por conveniência, os mesmos apresentados anteriormente) são os seguintes:
Loja 1
Factor Loja Loja 2 Loja 3
Médias dos Empregados x x j Emp 1 53 61 51 55 Factor Emp 2 47 55 51 51 Empregado Emp 3 46 52 49 49 Emp 4 50 58 54 54 Emp 5 49 54 50 51 Médias das Lojas xi (^) x (^49 56 51) x =
52
O factor Empregado tem cinco níveis ( Emp1 , Emp2 ,..., Emp5 ) e o factor Loja tem três níveis ( Loja 1 , Loja 2 e Loja3 ).
Os dados amostrais estão organizados de acordo com um esquema designado por classificação cruzada , uma vez que cada nível de um factor é cruzado com cada nível do outro factor.
Uma observação mais atenta da tabela anterior, mostra que há empregados que, aparentemente, apresentam melhores resultados do que outros.
Deste modo, é razoável pensar que talvez as lojas não sejam assim tão diferentes umas das outras, no que diz respeito ao volume de vendas, pode é haver também diferenças no desempenho dos empregados.
ANÁLISE DE VARIÂNCIA
Podemos então perguntar:
A variação nas vendas é explicada apenas pelas lojas onde são efectuadas, ou será que também pode ser explicada pela performance dos empregados?
No Exemplo 4 estamos perante um problema ao qual vamos aplicar um outro modelo da ANOVA, a ANOVA com dois factores (para o exemplo, factor Loja e factor Empregado), ainda sob os pressupostos de normalidade , igualdade de variâncias , independência entre as observações e assumindo adicionalmente que não há interacção entre os dois factores.
56
Recordemos que quando aplicamos a ANOVA com apenas um factor, as fontes de variação dos dados são duas:
¾ variação entre os grupos ou níveis do factor ( SSA ) ¾ variação que provem das flutuações aleatórias dentro dos grupos , SSE , e que fica por explicar (residual).
Aplicando o modelo de ANOVA com dois factores, esperamos reduzir a variação não explicada , uma vez que esta pode provir da variação entre os grupos do segundo factor e essa passa a ser “contabilizada”.
ANÁLISE DE VARIÂNCIA
Para o Exemplo 2 tínhamos,
Variação total nos dados, SST = 224, Variação entre os níveis do factor Loja, SSA =130, Variação não explicada ou residual, SSE =94, onde,
SST =SSA +SSE
Introduzindo um segundo factor, o factor Empregado, esperamos, como já dissemos, reduzir a variação não explicada, pois, parte desta passa a ser explicada pela variação no desempenho dos empregados.
58
Passamos a ter então três fontes de variação:
a variação devida ao factor Loja (medida por SSA ou SSLoja ); a variação devida ao factor Empregado (medida por SSB ou SSEmp ); a variação não explicada pelo modelo (medida por SSE ),
verificando-se agora, SST =SSA +SSB +SSE
Os cálculos são muito semelhantes aos efectuados na análise anterior, mas agora com mais um factor. Assim, consideramos:
Soma dos quadrados entre os grupos ou níveis do factor A :
a i 1 xi^ x
Soma dos quadrados entre os grupos ou níveis do factor B :
b j 1 x j^ x
ANÁLISE DE VARIÂNCIA
Os cálculos destas medidas são resumidos nos quadros seguintes:
Factor Loja Factor Empregado ( xi x x ) ( xi x x )^2 ( x (^) x j x ) ( x (^) x j x )^2 -3 9 3 9 4 16 -1 1 -1 1 -3 9 Totais 0 26 2 4 -1 1 SSLoja=5u26=130 Totais^^0 SSEmp =3u24=
62
Comparando com o Exemplo 2 , salienta-se que se reduziu a variação não explicada pelo modelo de 94 para 22. De facto, a variação não explicada no Exemplo 2 , que valia 94 , está agora decomposta em duas parcelas, a variação explicada pelo factor Empregado ( 72 ) e a variação residual ( 22 ) - a variação que continua por explicar.
Finalmente, a soma dos quadrados total, a que mede a variação total dos dados, que já foi calculada no Exemplo 2 :
ANÁLISE DE VARIÂNCIA A Tabela ANOVA com dois factores tem o mesmo formato que a de um factor, e é construída do seguinte modo:
Fonte de Variação
Soma dos Quadrados (SS) Graus de Liberd.
Variância (Soma Média dos Quadrados)
Razões F
Entre Grupos
a i 1 xi^ x ( )^2 a-1^ MSA = a 1
E
A MS
Entre Grupos
b j j^ x x 1 ( )^2 b-1^ MSB = b 1
E
B MS
i
b 1 j 1 xij^ xi x j x ( )^2 (a-1)(b-1)^ MSE = ( a 1 )( b 1 )
i
b 1 j 1 xij^ x ( )^2 ab-
64
Para o Exemplo 4 , temos a seguinte Tabela ANOVA :
Fonte de Variação Soma dos Quadrados (SS)
g.l. Variância (Soma Média dos Quadrados)
Razões F Entre grupos Lojas
SSLoja=130 2 MSLoja= E
Loja MS
Entre grupos Empregados
SSEmp =72 4 MSEmp = E
Emp MS
Residual SSE =22 8 MSE =2. Total SST =224 14
ANÁLISE DE VARIÂNCIA Testamos por um lado,
médios de vendas diferentes)
Sob H 0 , F = E
Loja MS
MS (^) a 1 F ( aa^ 1 )( b 1 ).
Tem-se: Quantil de probabilidade (1-0.05) da distribuição F 8^2 : 4. R.C.: [4.46, +f[ Fobs=23.6 R.C., logo rejeitamos H 0 , tal como na aplicação da ANOVA com apenas o factor Loja
Notemos, no entanto, que o valor observado da estatística de teste F é neste caso maior do que o obtido na análise anterior ( 23.6>8.3 ) - a variação não explicada é menor. A rejeição de H 0 é neste caso ainda mais “forte”.
68
Factor Loja,
Para D=0.05, tem-se 4.04 2.^575 =2.996 e
x 1 (^) x x 2 x=|49-56|=7>2. x 1 (^) x x 3 x=|49-51|=2 <2. x 2 (^) x x 3 x=|56-51|=5 >2.996.
Confirmamos assim o resultado obtido anteriormente, i.e., que a loja 2 (grupo 2) difere significativamente das lojas 1 e 3, no que diz respeito ao volume médio de vendas.
ANÁLISE DE VARIÂNCIA Para o Factor B
x x (^) r x x s t ST(1-D) (^) a
onde, 9 ST(1-D) é o quantil de probabilidade (1-D) da distribuição da “Studentized Range” com (b, (a-1)(b-1)) graus de liberdade; 9 a é a dimensão das amostras de cada um dos grupos do factor B, neste caso coincidente com o número de grupos do factor A.
70
Factor Empregado,
Para D=0.05, tem-se 4.89 2.^375 =4.682 e
x x (^) 1 x x 2 =|55-51|=4 x x (^) 2 x x 4 =|51-54|= x x (^) 1 x x 3 =|55-49|=6>4.682 x x (^) 2 x x 5 =|51-51|= x x (^) 1 x x 4 =|55-54|=1 x x (^) 3 x x 4 =|49-54|=5>4. x x (^) 1 x x 5 =|55-51|=4 x x (^) 3 x x 5 =|49-51|= x x (^) 2 x x 3 =|51-49|=2 x x (^) 4 x x 5 =|54-51|=
Há evidência de que o empregado 3 tem um volume médio de vendas diferente dos empregados 1 e 4. Observando as médias amostrais, podemos verificar que essa diferença é favorável aos empregados 1 e 4.
ANÁLISE DE VARIÂNCIA
O modelo de ANOVA com dois factores que apresentámos não contempla a interacção entre os dois factores.
De facto, alguma da variação existente nos dados pode ter ainda origem na interacção entre os dois factores, e esta deve de ser pesada na análise.
No entanto, para levar a cabo esta análise são necessárias mais observações por célula, dando origem a uma estrutura de dados mais complexa.
74
Retomemos os Exemplo 4, mas agora admitindo a possibilidade de existência de interacção entre o factor Loja e o factor Empregado.
Vamos então aplicar o modelo de análise de variância com interacção, o que nos obriga a ter mais do que uma observação por cada combinação Loja-Empregado.
Assim, suponhamos que os dados recolhidos pelo Sr. Fernando foram os seguintes (consideramos apenas três empregados para facilitar os cálculos):
Loja 1 2 3 x x j x 1 53, 52, 54 53 53, 56, 56 55 52, 56, 54 54 54 Empregado 2 41, 46, 45 44 48, 51, 51 50 48, 48, 45 47 47 3 51, 54, 54 53 54, 56, 52 54 48, 51, 48 49 52 xi (^) x x 50 53 50 51
ANÁLISE DE VARIÂNCIA
Pretende-se testar:
1. H 01 : os volumes médios de vendas são iguais nas três lojas H 11 : existem pelo menos duas lojas com volumes médios de vendas diferentes 2. H 02 : os três empregados têm volumes médios de vendas iguais H 12 : existem pelo menos dois empregados com volumes médios de vendas diferentes 3. H 03 : não existe interacção entre o factor Loja e o factor Empregado H 13 : existe interacção entre o factor Loja e o factor Empregado
76
Num modelo com interacção a variação total dos dados é decomposta em quatro parcelas: a variação devida ao factor A ( SSA ); a variação devida ao factor B ( SSB ); a variação devida à interacção ( SSI ); a variação residual ( SSE ) que é a variação não explicada pelo modelo.
Mais uma vez os cálculos a efectuar são muito semelhantes aos das análises anteriores:
a i 1 xi^ x
j 1 x j^ x
a i
b 1 j 1 xij^ xi xj x
i
b j
n 1 1 k 1 xijk^ xij
a i
b j
n 1 1 k 1 xijk^ x
com, SST =SSA +SSB +SSI+SSE
ANÁLISE DE VARIÂNCIA
A Tabela ANOVA para o modelo com interacção é a seguinte: Fonte de Variação
Soma dos Quadrados (SS) Graus de Liberdade
Variância (Soma Média Quadrados)
Razões F
i 1 xi^ x ( )^2 a-1^ MSA = a 1
E
A MS
j 1 x j^ x ( )^2 b-1^ MSB = b 1
E
B MS
i
b 1 j 1 xij^ xi x j x ( )^2 (a-1)(b-1)^ MSI= ( a 1 )( b 1 )
E
I MS
i
b j
n 1 1 k 1 xijk^ xij ( )^2 ab(n-1)^ MSE = ab ( n 1 )
i
b j
n 1 1 k 1 xijk^ x ( )^2 abn-
80
A Tabela ANOVA é então,
Fonte de Variação Soma dos Quadrados (SS)
Graus de Liberdade Variância (Soma Média dos Quadrados)
Razões F Loja SS (^) Loja= 54 2 MSLoja=27 7. Empregado SSEmp = 234 2 MS (^) Emp =117 34. Interacção SS (^) I= 48 4 MS (^) I=12 3. Residual SSE = 62 18 MS (^) E =3. Total SST = 398 26
ANÁLISE DE VARIÂNCIA Salienta-se que quando existe interacção entre os dois factores o efeito de um deles depende dos níveis do outro.
Assim, na presença de uma interacção significativa o efeito de cada um dos factores isoladamente pode ser “mascarado” pela interacção e, consequentemente, os testes à significância da influência de cada um dos factores podem ficar desprovidos de sentido.
Por esta razão, em primeiro lugar deve-se fazer o teste relativo à interacção, isto é, deve- se testar a hipótese nula de que não existe interacção entre os dois factores.
Representando as médias amostrais xij (^) x graficamente, como se ilustra nas figuras
seguintes, é possível averiguar se existe ou não uma interacção significativa.
82
Factor B - Nível 1 Factor B - Nível 2 Factor B - Nível 3
Factor A - Nível 1 Factor A - Nível 2
Ausência de interacção significativa : Segmentos de recta paralelos – A diferença entre os valores médios para quaisquer dois níveis do Factor A é igual para todos os níveis do factor B e vice-versa. Neste caso, é possível comparar os níveis do Factor A sem ter de especificar o nível do Factor B envolvido e vice-versa.
xij x
ANÁLISE DE VARIÂNCIA
Factor B
Factor A- Nível 1
Factor A- Nível 2
Factor B
Factor A- Nível 1
Factor A- Nível 2
Existência de interacção significativa : A diferença entre os valores médios para dois níveis do Factor A pode depender do nível do factor B envolvido e vice-versa. Neste caso, nem sempre é possível comparar os níveis do Factor A sem ter de especificar o nível do Factor B envolvido e vice-versa.
xij (^) x xij x
86
Sob H 01 , F = E
Loja MS
MS (^) a 1 Fab a^ ( n 1 ), com a-1=2 e ab(n-1)=18.
Mais:
- Quantil de probabilidade (1-0.05) da distribuição F 18^2 : 3.55; - R.C.: [3.55, +f[ - Fobs=7.85 R.C., logo rejeitamos H 01 - há evidência para concluir que as três lojas diferem no que diz respeito ao volume médio de vendas semanais.
ANÁLISE DE VARIÂNCIA
Sob H 02 ,
F = E
Emp MS
MS (^) a 1 Fab b^ ( n 1 ), com b-1=2 e ab(n-1)=18.
Mais:
- Quantil de probabilidade (1-0.05) da distribuição F 18^2 : 3.55; - R.C.: [3.55, +f[ - Fobs=34.01 R.C., logo rejeitamos H 02 - há evidência de que existem diferenças entre os empregados no que diz respeito ao seu volume médio de vendas.
Podemos concluir que tanto o factor Loja como o factor Empregado exercem uma influência significativa sobre o volume de vendas.
88
Como já dissemos, a existência de interacção entre os factores pode levar a que os testes relativos aos factores A e B não tenham significado. Na figura seguinte representa-se uma situação deste tipo (compare-a com a Figura anterior).
B1 B2 B Factor B
Factor A Factor A xij x Factor A
ANÁLISE DE VARIÂNCIA
O teste que vamos considerar é, uma vez mais, o teste de Tuckey.
Para o Factor A
xr (^) x xs x t ST(1-D) (^) nb
onde, ST(1-D) é o quantil de probabilidade (1-D) da distribuição da “Studentized Range” com (a, ab(n-1)) graus de liberdade