Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Análise de Variância: Dois Factores (Loja e Empregado), Exercícios de Probabilidade

Este documento explica o processo de análise de variância (anova) com dois fatores: loja e empregado. O texto aborda a decomposição da variância total em componentes devidas aos fatores individuais e à interacção entre eles, além da verificação da hipótese de igualdade de médias entre os níveis de cada fator. O documento também inclui exemplos de cálculos e testes estatísticos.

Tipologia: Exercícios

2022

Compartilhado em 07/11/2022

Amazonas
Amazonas 🇧🇷

4.4

(80)

224 documentos

1 / 22

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
ANÁLISE DE VARIÂNCIA
50
Análise de Variância com Dois Factores
Modelo sem interacção
Exemplo 2
Neste exemplo, ao testarmos a hipótese de as três lojas terem volumes médios de vendas
iguais, estamos a testar se o factor Loja tem influência no volume de vendas.
Note que o volume de vendas deve também sofrer influência de outros factores.
Assim, a variação nas vendas pode estar relacionada não só com a loja, mas também
com o desempenho do empregado. Vamos então introduzir no nosso estudo um segundo
factor, o factor Empregado.
ANÁLISE DE VARIÂNCIA
51
Exemplo 4
Admitamos então que o Sr Fernando tem cinco empregados que estão igualmente
familiarizados com as três lojas. Os dados recolhidos das vendas dos cinco empregados
nas três lojas (por conveniência, os mesmos apresentados anteriormente) são os
seguintes:
Loja 1
Factor Loja
Loja 2 Loja 3
Médias dos
Empregados
j
xx
Emp 1 53 61 51 55
Factor Emp 2 47 55 51 51
Empregado Emp 3 46 52 49 49
Emp 4 50 58 54 54
Emp 5 49 54 50 51
Médias das
Lojas xi
x49 56 51 x=52
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16

Pré-visualização parcial do texto

Baixe Análise de Variância: Dois Factores (Loja e Empregado) e outras Exercícios em PDF para Probabilidade, somente na Docsity!

50

Análise de Variância com Dois Factores

Modelo sem interacção

Exemplo 2

Neste exemplo, ao testarmos a hipótese de as três lojas terem volumes médios de vendas iguais, estamos a testar se o factor Loja tem influência no volume de vendas.

Note que o volume de vendas deve também sofrer influência de outros factores.

Assim, a variação nas vendas pode estar relacionada não só com a loja, mas também com o desempenho do empregado. Vamos então introduzir no nosso estudo um segundo factor, o factor Empregado.

ANÁLISE DE VARIÂNCIA

Exemplo 4

Admitamos então que o Sr Fernando tem cinco empregados que estão igualmente familiarizados com as três lojas. Os dados recolhidos das vendas dos cinco empregados nas três lojas (por conveniência, os mesmos apresentados anteriormente) são os seguintes:

Loja 1

Factor Loja Loja 2 Loja 3

Médias dos Empregados x x j Emp 1 53 61 51 55 Factor Emp 2 47 55 51 51 Empregado Emp 3 46 52 49 49 Emp 4 50 58 54 54 Emp 5 49 54 50 51 Médias das Lojas xi (^) x (^49 56 51) x =

52

O factor Empregado tem cinco níveis ( Emp1 , Emp2 ,..., Emp5 ) e o factor Loja tem três níveis ( Loja 1 , Loja 2 e Loja3 ).

Os dados amostrais estão organizados de acordo com um esquema designado por classificação cruzada , uma vez que cada nível de um factor é cruzado com cada nível do outro factor.

Uma observação mais atenta da tabela anterior, mostra que há empregados que, aparentemente, apresentam melhores resultados do que outros.

Deste modo, é razoável pensar que talvez as lojas não sejam assim tão diferentes umas das outras, no que diz respeito ao volume de vendas, pode é haver também diferenças no desempenho dos empregados.

ANÁLISE DE VARIÂNCIA

Podemos então perguntar:

A variação nas vendas é explicada apenas pelas lojas onde são efectuadas, ou será que também pode ser explicada pela performance dos empregados?

No Exemplo 4 estamos perante um problema ao qual vamos aplicar um outro modelo da ANOVA, a ANOVA com dois factores (para o exemplo, factor Loja e factor Empregado), ainda sob os pressupostos de normalidade , igualdade de variâncias , independência entre as observações e assumindo adicionalmente que não há interacção entre os dois factores.

56

Recordemos que quando aplicamos a ANOVA com apenas um factor, as fontes de variação dos dados são duas:

¾ variação entre os grupos ou níveis do factor ( SSA ) ¾ variação que provem das flutuações aleatórias dentro dos grupos , SSE , e que fica por explicar (residual).

Aplicando o modelo de ANOVA com dois factores, esperamos reduzir a variação não explicada , uma vez que esta pode provir da variação entre os grupos do segundo factor e essa passa a ser “contabilizada”.

ANÁLISE DE VARIÂNCIA

Para o Exemplo 2 tínhamos,

Variação total nos dados, SST = 224, Variação entre os níveis do factor Loja, SSA =130, Variação não explicada ou residual, SSE =94, onde,

SST =SSA +SSE

Introduzindo um segundo factor, o factor Empregado, esperamos, como já dissemos, reduzir a variação não explicada, pois, parte desta passa a ser explicada pela variação no desempenho dos empregados.

58

Passamos a ter então três fontes de variação:

™ a variação devida ao factor Loja (medida por SSA ou SSLoja ); ™ a variação devida ao factor Empregado (medida por SSB ou SSEmp ); ™ a variação não explicada pelo modelo (medida por SSE ),

verificando-se agora, SST =SSA +SSB +SSE

Os cálculos são muito semelhantes aos efectuados na análise anterior, mas agora com mais um factor. Assim, consideramos:

ƒ Soma dos quadrados entre os grupos ou níveis do factor A :

SSA = b¦ x 

a i 1 xi^ x

( )^2 ;

ƒ Soma dos quadrados entre os grupos ou níveis do factor B :

SSB = a ¦ x 

b j 1 x j^ x

( )^2.

ANÁLISE DE VARIÂNCIA

Exemplo 4

Os cálculos destas medidas são resumidos nos quadros seguintes:

Factor Loja Factor Empregado ( xi x  x ) ( xi x  x )^2 ( x (^) x j  x ) ( x (^) x j  x )^2 -3 9 3 9 4 16 -1 1 -1 1 -3 9 Totais 0 26 2 4 -1 1 SSLoja=5u26=130 Totais^^0 SSEmp =3u24=

62

Comparando com o Exemplo 2 , salienta-se que se reduziu a variação não explicada pelo modelo de 94 para 22. De facto, a variação não explicada no Exemplo 2 , que valia 94 , está agora decomposta em duas parcelas, a variação explicada pelo factor Empregado ( 72 ) e a variação residual ( 22 ) - a variação que continua por explicar.

Finalmente, a soma dos quadrados total, a que mede a variação total dos dados, que já foi calculada no Exemplo 2 :

SST = i ¦ ¦^ a 1 jb 1 ( xij  x )^2 =

ANÁLISE DE VARIÂNCIA A Tabela ANOVA com dois factores tem o mesmo formato que a de um factor, e é construída do seguinte modo:

Fonte de Variação

Soma dos Quadrados (SS) Graus de Liberd.

Variância (Soma Média dos Quadrados)

Razões F

Entre Grupos

Factor A SSA^ =b^ ¦^ x^ 

a i 1 xi^ x ( )^2 a-1^ MSA = a  1

SS A

E

A MS

MS

Entre Grupos

Factor B SSB^ =a^ ¦^ x^ 

b j j^ x x 1 ( )^2 b-1^ MSB = b  1

SS B

E

B MS

MS

Residual SSE =¦ ¦^ a  x  x 

i

b 1 j 1 xij^ xi x j x ( )^2 (a-1)(b-1)^ MSE = ( a  1 )( b  1 )

SS E

Total SST =¦ ¦^ a 

i

b 1 j 1 xij^ x ( )^2 ab-

64

Para o Exemplo 4 , temos a seguinte Tabela ANOVA :

Fonte de Variação Soma dos Quadrados (SS)

g.l. Variância (Soma Média dos Quadrados)

Razões F Entre grupos Lojas

SSLoja=130 2 MSLoja= E

Loja MS

MS =23.

Entre grupos Empregados

SSEmp =72 4 MSEmp = E

Emp MS

MS =6.

Residual SSE =22 8 MSE =2. Total SST =224 14

ANÁLISE DE VARIÂNCIA Testamos por um lado,

H 0 : P 1 = P 2 = P 3 (os volumes médios de vendas são iguais nas três lojas)

H 1 : P i zP j para algum i z j (existem pelo menos duas lojas com volumes

médios de vendas diferentes)

Sob H 0 , F = E

Loja MS

MS (^) a 1 F ( aa^  1 )( b  1 ).

Tem-se: ƒ Quantil de probabilidade (1-0.05) da distribuição F 8^2 : 4. ƒ R.C.: [4.46, +f[ ƒ Fobs=23.6 R.C., logo rejeitamos H 0 , tal como na aplicação da ANOVA com apenas o factor Loja

Notemos, no entanto, que o valor observado da estatística de teste F é neste caso maior do que o obtido na análise anterior ( 23.6>8.3 ) - a variação não explicada é menor. A rejeição de H 0 é neste caso ainda mais “forte”.

68

Exemplo 4

Factor Loja,

Para D=0.05, tem-se 4.04 2.^575 =2.996 e

x 1 (^) x  x 2 x=|49-56|=7>2. x 1 (^) x  x 3 x=|49-51|=2 <2. x 2 (^) x  x 3 x=|56-51|=5 >2.996.

Confirmamos assim o resultado obtido anteriormente, i.e., que a loja 2 (grupo 2) difere significativamente das lojas 1 e 3, no que diz respeito ao volume médio de vendas.

ANÁLISE DE VARIÂNCIA Para o Factor B

A hipótese nula H 0 : P r = P s (os grupos r e s do factor B têm médias iguais) é rejeitada se

x x (^) r  x x s t ST(1-D) (^) a

MS E

onde, 9 ST(1-D) é o quantil de probabilidade (1-D) da distribuição da “Studentized Range” com (b, (a-1)(b-1)) graus de liberdade; 9 a é a dimensão das amostras de cada um dos grupos do factor B, neste caso coincidente com o número de grupos do factor A.

70

Exemplo 4

Factor Empregado,

Para D=0.05, tem-se 4.89 2.^375 =4.682 e

x x (^) 1  x x 2 =|55-51|=4 x x (^) 2  x x 4 =|51-54|= x x (^) 1  x x 3 =|55-49|=6>4.682 x x (^) 2  x x 5 =|51-51|= x x (^) 1  x x 4 =|55-54|=1 x x (^) 3  x x 4 =|49-54|=5>4. x x (^) 1  x x 5 =|55-51|=4 x x (^) 3  x x 5 =|49-51|= x x (^) 2  x x 3 =|51-49|=2 x x (^) 4  x x 5 =|54-51|=

Há evidência de que o empregado 3 tem um volume médio de vendas diferente dos empregados 1 e 4. Observando as médias amostrais, podemos verificar que essa diferença é favorável aos empregados 1 e 4.

ANÁLISE DE VARIÂNCIA

Modelo com interacção

O modelo de ANOVA com dois factores que apresentámos não contempla a interacção entre os dois factores.

De facto, alguma da variação existente nos dados pode ter ainda origem na interacção entre os dois factores, e esta deve de ser pesada na análise.

No entanto, para levar a cabo esta análise são necessárias mais observações por célula, dando origem a uma estrutura de dados mais complexa.

74

Exemplo 5

Retomemos os Exemplo 4, mas agora admitindo a possibilidade de existência de interacção entre o factor Loja e o factor Empregado.

Vamos então aplicar o modelo de análise de variância com interacção, o que nos obriga a ter mais do que uma observação por cada combinação Loja-Empregado.

Assim, suponhamos que os dados recolhidos pelo Sr. Fernando foram os seguintes (consideramos apenas três empregados para facilitar os cálculos):

Loja 1 2 3 x x j x 1 53, 52, 54 53 53, 56, 56 55 52, 56, 54 54 54 Empregado 2 41, 46, 45 44 48, 51, 51 50 48, 48, 45 47 47 3 51, 54, 54 53 54, 56, 52 54 48, 51, 48 49 52 xi (^) x x 50 53 50 51

ANÁLISE DE VARIÂNCIA

Pretende-se testar:

1. H 01 : os volumes médios de vendas são iguais nas três lojas H 11 : existem pelo menos duas lojas com volumes médios de vendas diferentes 2. H 02 : os três empregados têm volumes médios de vendas iguais H 12 : existem pelo menos dois empregados com volumes médios de vendas diferentes 3. H 03 : não existe interacção entre o factor Loja e o factor Empregado H 13 : existe interacção entre o factor Loja e o factor Empregado

76

Num modelo com interacção a variação total dos dados é decomposta em quatro parcelas:  a variação devida ao factor A ( SSA );  a variação devida ao factor B ( SSB );  a variação devida à interacção ( SSI );  a variação residual ( SSE ) que é a variação não explicada pelo modelo.

Mais uma vez os cálculos a efectuar são muito semelhantes aos das análises anteriores:

SSA = nb¦ xx 

a i 1 xi^ x

( )^2 SSB = na ¦^ b x x

j 1 x j^ x

( )^2

SSI=n¦ ¦ x  xx x x

a i

b 1 j 1 xij^ xi xj x

( )^2 SSE =¦ ¦ ¦^ a  x

i

b j

n 1 1 k 1 xijk^ xij

( )^2

SST =¦ ¦ ¦ 

a i

b j

n 1 1 k 1 xijk^ x

( )^2

com, SST =SSA +SSB +SSI+SSE

ANÁLISE DE VARIÂNCIA

A Tabela ANOVA para o modelo com interacção é a seguinte: Fonte de Variação

Soma dos Quadrados (SS) Graus de Liberdade

Variância (Soma Média Quadrados)

Razões F

Factor A SSA = nb¦^ a xx 

i 1 xi^ x ( )^2 a-1^ MSA = a  1

SS A

E

A MS

MS

Factor B SSB = na ¦^ b x x

j 1 x j^ x ( )^2 b-1^ MSB = b  1

SS B

E

B MS

MS

Interacção SSI=n ¦ ¦^ a x  xx xx

i

b 1 j 1 xij^ xi x j x ( )^2 (a-1)(b-1)^ MSI= ( a  1 )( b  1 )

SS I

E

I MS

MS

Residual SSE =¦ ¦ ¦^ a  x

i

b j

n 1 1 k 1 xijk^ xij ( )^2 ab(n-1)^ MSE = ab ( n  1 )

SS E

Total SST =¦ ¦ ¦^ a 

i

b j

n 1 1 k 1 xijk^ x ( )^2 abn-

80

A Tabela ANOVA é então,

Fonte de Variação Soma dos Quadrados (SS)

Graus de Liberdade Variância (Soma Média dos Quadrados)

Razões F Loja SS (^) Loja= 54 2 MSLoja=27 7. Empregado SSEmp = 234 2 MS (^) Emp =117 34. Interacção SS (^) I= 48 4 MS (^) I=12 3. Residual SSE = 62 18 MS (^) E =3. Total SST = 398 26

ANÁLISE DE VARIÂNCIA Salienta-se que quando existe interacção entre os dois factores o efeito de um deles depende dos níveis do outro.

Assim, na presença de uma interacção significativa o efeito de cada um dos factores isoladamente pode ser “mascarado” pela interacção e, consequentemente, os testes à significância da influência de cada um dos factores podem ficar desprovidos de sentido.

Por esta razão, em primeiro lugar deve-se fazer o teste relativo à interacção, isto é, deve- se testar a hipótese nula de que não existe interacção entre os dois factores.

Representando as médias amostrais xij (^) x graficamente, como se ilustra nas figuras

seguintes, é possível averiguar se existe ou não uma interacção significativa.

82

Factor B - Nível 1 Factor B - Nível 2 Factor B - Nível 3

Factor A - Nível 1 Factor A - Nível 2

Ausência de interacção significativa : Segmentos de recta paralelos – A diferença entre os valores médios para quaisquer dois níveis do Factor A é igual para todos os níveis do factor B e vice-versa. Neste caso, é possível comparar os níveis do Factor A sem ter de especificar o nível do Factor B envolvido e vice-versa.

xij x

ANÁLISE DE VARIÂNCIA

Factor B

  • Nível 1 Factor B
    • Nível 2 Factor B
      • Nível 3

Factor A- Nível 1

Factor A- Nível 2

Factor B

  • Nível 1 Factor B - Nível 2 Factor B - Nível 3

Factor A- Nível 1

Factor A- Nível 2

Existência de interacção significativa : A diferença entre os valores médios para dois níveis do Factor A pode depender do nível do factor B envolvido e vice-versa. Neste caso, nem sempre é possível comparar os níveis do Factor A sem ter de especificar o nível do Factor B envolvido e vice-versa.

xij (^) x xij x

86

Sob H 01 , F = E

Loja MS

MS (^) a 1 Fab a^ ( n  1 ), com a-1=2 e ab(n-1)=18.

Mais:

- Quantil de probabilidade (1-0.05) da distribuição F 18^2 : 3.55; - R.C.: [3.55, +f[ - Fobs=7.85 R.C., logo rejeitamos H 01 - há evidência para concluir que as três lojas diferem no que diz respeito ao volume médio de vendas semanais.

ANÁLISE DE VARIÂNCIA

Sob H 02 ,

F = E

Emp MS

MS (^) a 1 Fab b^ ( n  1 ), com b-1=2 e ab(n-1)=18.

Mais:

- Quantil de probabilidade (1-0.05) da distribuição F 18^2 : 3.55; - R.C.: [3.55, +f[ - Fobs=34.01 R.C., logo rejeitamos H 02 - há evidência de que existem diferenças entre os empregados no que diz respeito ao seu volume médio de vendas.

Podemos concluir que tanto o factor Loja como o factor Empregado exercem uma influência significativa sobre o volume de vendas.

88

Como já dissemos, a existência de interacção entre os factores pode levar a que os testes relativos aos factores A e B não tenham significado. Na figura seguinte representa-se uma situação deste tipo (compare-a com a Figura anterior).

B1 B2 B Factor B

Factor A Factor A xij x Factor A

ANÁLISE DE VARIÂNCIA

Comparações Múltiplas

O teste que vamos considerar é, uma vez mais, o teste de Tuckey.

Para o Factor A

A hipótese nula H 0 : P r = P s (os níveis r e s do factor A têm médias iguais) é rejeitada se

xr (^) x  xs x t ST(1-D) (^) nb

MS E

onde, ST(1-D) é o quantil de probabilidade (1-D) da distribuição da “Studentized Range” com (a, ab(n-1)) graus de liberdade