


















Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Os melhores documentos à venda: Trabalhos de alunos formados
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Comunidade
Peça ajuda à comunidade e tire suas dúvidas relacionadas ao estudo
Descubra as melhores universidades em seu país de acordo com os usuários da Docsity
Guias grátis
Baixe gratuitamente nossos guias de estudo, métodos para diminuir a ansiedade, dicas de TCC preparadas pelos professores da Docsity
Este documento explica o conceito de análise de variância fatorial dupla (anova) e sua aplicabilidade quando se deseja estudar a interação entre dois ou mais fatores em relação a uma variável. O texto aborda o conceito de anova hierárquica, modelos de anova com efeitos fixos, aleatórios e mistos, interação entre fatores e como realizar a análise no spss.
Tipologia: Notas de estudo
1 / 26
Esta página não é visível na pré-visualização
Não perca as partes importantes!
Em muitas experiˆ
encias interessa estudar o efeito de mais do que um factor
sobre uma vari´
avel de interesse. Quando uma experiˆ
encia envolve dois ou mais
factores diz-se que temos uma
ANOVA m´
ultipla
. Uma ANOVA em que todas
as combina¸
c˜ oes de todos os n´
ıveis de todos os factores s˜
ao consideradas diz-se
ANOVA factorial
. Na maioria das situa¸
c˜ oes, quando estamos interessados em
estudar a influˆ
encia de dois ou mais factores numa vari´
avel, utilizamos uma
Exemplo:ANOVA factorial.
Pretende-se estudar a concentra¸
c˜ ao de c´
alcio no sangue de uma
popula¸
c˜ ao de aves parte da qual foi sujeita a um tratamento hormonal.
Os
investigadores pretendem averiguar se existem diferen¸
cas na concentra¸
c˜ ao m´
edia
de c´
alcio dependendo do tratamento hormonal e tamb´
em dependendo do sexo
das aves.
Os factores deste estudo s˜
ao o tratamento hormonal (presente ou
Bioestat´ ausente) e o sexo (feminino e masculino).
ıstica, 2007
1
Em geral o n´
umero de n´
ıveis de cada factor bem como o seu valor n˜
ao
depende dos restantes factores.
Quando o n´
umero de n´
ıveis ou o seu valor
varia consoante os n´
ıveis considerados nos restantes factores diz-se que temos
uma
ANOVA hier´
arquica
. Nestes casos deixamos de ter uma ANOVA factorial.
Enquanto numa ANOVA factorial os factores s˜
ao
cruzados
(dando origem a
todas as poss´
ıveis combina¸
c˜ oes dos seus n´
ıveis), numa ANOVA hier´
arquica os
factores s˜
ao
encaixados
uns nos outros (dando origem a uma estrutura tipo
Exemplo: Pretende-se fazer um estudo sobre os n´´arvore).
ıveis de uma dada substˆ
ancia
no sangue (usada como anti-epil´
eptico) e para tal v´
arias amostras de sangue
foram enviadas para 4 laborat´
orios. Cada laborat´
orio utiliza diferentes t´
ecnicas
para fazer a an´
alise e o n´
umero de t´
ecnicas dispon´
ıveis tamb´
em varia de
laborat´
orio para laborat´
orio.
Neste caso temos dois factores:
o laborat´
orio
(com 4 n´
ıveis) e a t´
ecnica de an´
alise (com um n´
umero de n´
ıveis que depende
do laborat´
orio). Este ´
ultimo factor encontra-se encaixado no primeiro.
Bioestat´
ıstica, 2007
2
Quando temos dois ou mais factores h´
a que ter em conta que estes podem
interagir entre si,
i.e.,
a varia¸
c˜ ao na vari´
avel resposta produzida por uma
altera¸
c˜ ao do n´
ıvel de um dos factores pode variar consoante os n´
ıveis dos
restantes factores. Assim h´
a que prestar aten¸
c˜ ao `
as poss´
ıveis interac¸
c˜ oes entre
os v´
arios factores, dois a dois, trˆ
es a trˆ
es, etc.. Quanto mais factores existirem
no estudo mais complexo se torna o modelo, porque o n´
umero de interac¸
c˜ oes
poss´
ıveis aumenta muito rapidamente. Quando n˜
ao existe interac¸
c˜ ao entre os
factores o valor esperado de cada combina¸
c˜ ao de n´
ıveis dos factores ´
e a soma
dos valores esperados de cada n´
ıvel separadamente e o modelo diz-se aditivo.
Seguidamente apresenta-se um conjunto de gr´
aficos que pretende ilustrar difer-
entes comportamentos de ANOVA’s com 2 factores (
e
B
), tendo cada um
deles apenas 2 n´
ıveis (
A 1 e A 2 , B 1 e B 2
Quando as linhas s˜
ao paralelas
temos modelos sem interac¸
c˜ ao entre os factores (modelo aditivo). Este tipo de
gr´
aficos permite ao investigador ter uma ideia se a interac¸
c˜ ao est´
a presente ou
n˜ ao.
Bioestat´
ıstica, 2007
4
Bioestat´
ıstica, 2007
5
Uma ANOVA com dois factores diz-se
ANOVA dupla
Em seguida iremos
Iremos designar os factores porpletamente aleatorizado).considerar o modelo geral de uma ANOVA factorial dupla (planeamento com-
e
B
sendo que
tem
a
n´ ıveis e
tem
b
n´ ıveis.
Existem portanto
ab
combina¸
c˜ oes poss´
ıveis dos n´
ıveis dos factores.
Tal como
ou seja, para cada combina¸foi feito para a ANOVA simples iremos considerar o planeamento equilibrado,
c˜ ao de n´
ıveis dos factores existem
n
observa¸
c˜ oes
(r´
eplicas) independentes. No total s˜
ao necess´
arias
abn
observa¸
c˜ oes.
As observa¸
c˜ oes da vari´
avel de interesse
s˜ ao indexadas por 3 ´
ındices,
ijk
i representa o n´
ıvel do factor
j
representa o n´
ıvel do factor
, e
k
representa
a posi¸
c˜ ao dentro do grupo
ij
.
Bioestat´
ıstica, 2007
7
ijk
μ
(^) τ i + β j + γ
ij
ǫ ijk
i = 1
,... , a,
j
= 1
,... , b,
k
= 1
,... , n,
onde
μ
representa a m´
edia global,
τ i representa o efeito do n´
ıvel
i
do factor
β j
representa o efeito do n´
ıvel
j
do factor
γ ij
representa o efeito da interac¸
c˜ ao dos factores
e
B
,
ǫ ijk
representa um erro aleat´
orio de cada observa¸
c˜ ao sendo estes erros
independentes entre si e todos com distribui¸
c˜ ao Normal de m´
edia 0 e
variˆ
ancia
σ 2 .
Bioestat´
ıstica, 2007
8
Seja
y i ··
=
b
n
y ijk
¯y i ··
=
y i ··
bn
y · j · =
a
n
y ijk
¯y ·j · =
y · j ·
an
y ij
n
y ijk
¯y ij · =
y ij
·
n
y ···
a
b
n
y ijk
¯y ···
y ···
abn
Bioestat´
ıstica, 2007
10
a
b
n
y ijk
¯y ···
) 2
SS
total
bn
a
y i ··
−
¯y ···
) 2
SS
A
(^) an
b
y · j · −
¯y ···
) 2
SS
B
(^) n
a
b
y ij
· −
¯y i ··
−
¯y · j ·
y ···
) 2
SS
AB
a
b
n
y ijk
¯y ij
· ) 2
SS
E
Bioestat´
ıstica, 2007
11
Fonte de Varia¸
c˜ ao
Soma
de
quadrados
g.l.
edia
de
quadrados
obs
p
factor A
A
a
−
A
SS
A
a − 1
M S
A
M S
E
factor B
B
b −
B
SS
B
b − 1
M S
B
M S
E
Interac¸
c˜ ao
AB
a
−
(^) 1)(
b (^) −
AB
SS
AB
( a − 1)(
b −
M S
AB
M S
E
Erros
E
ab
n
−
(^) 1)
E
Total
total
abn
Bioestat´
ıstica, 2007
13
Atrav´
es desta tabela podemos testar as hip´
oteses referidas anteriormente atrav´
es
dos
p-values
da ´
ultima coluna. Neste caso:
a estat´
ıstica de teste para as hip´
oteses 1 (efeito principal do factor
e
M S
A
M S
E ∼ F a − 1
,ab
( n −
, sob
0 ;
a estat´
ıstica de teste para as hip´
oteses 2 (efeito principal do factor
e
M S
B
M S
E ∼ F b − 1
,ab
( n −
, sob
0 ;
a
estat´
ıstica
de
teste
para
as
hip´
oteses
(interac¸
c˜ ao) ´
e
M S
AB
M S
E
( a − 1)(
b −
,ab
( n −
, sob
0 ;
Bioestat´
ıstica, 2007
14
Ora,
μ
(^) τ i + β j + γ
ij
representa o valor m´
edio da combina¸
c˜ ao dos n´
ıveis
i e
j , que podemos representar por
μ ij
. Este valor m´
edio pode ser estimado pela
m´
edia das observa¸
c˜ oes deste grupo,
ij ·
. Assim, os erros podem ser estimados
por
ˆǫ ijk
ijk
ij · .
Estas diferen¸
cas chamam-se
res´
ıduos
e costumam-se representar por
e ijk
Uma an´
alise de res´
ıduos consiste em estudar o conjunto de todos os res´
ıduos
(^) e
ijk
i
= 1
,... , a
j
= 1
,... , b
k
= 1
,... , n
, no sentido de averiguar se podemos
considerar que
essa amostra ´
e
aleat´
oria e
proveniente
de
uma popula¸
c˜ ao
Normal.
Para averiguar a Normalidade, constroem-se QQ-plots e fazem-se
No SPSS, podemos guardar os res´testes de ajustamento.
ıduos, para seguidamente os analisar, atrav´
es
do bot˜
ao
Save
do menu da ANOVA,
Analyze / General Linear Model /
Univariate
Bioestat´
ıstica, 2007
16
Em certas experiˆ
encias podem existir factores (externos) que introduzem vari-
abilidade nos dados e que interessa controlar.
Por exemplo, se estivermos
interessados em comparar 3 variedades de trigo atrav´
es do peso m´
edio dos
gr˜
aos, pode ter influˆ
encia o tipo de solo em que as plantas v˜
ao crescer. Em vez
de seleccionarmos ao acaso um certo n´
umero de campos para semear as v´
arias
caracter´sementes, podemos seleccionar um conjunto de campos (possivelmente com
ısticas de solo diferentes) e dividir cada campo em trˆ
es parte de modo a
semear as trˆ
es variedades de trigo em cada campo. Neste tipo de planeamento
designa-se cada campo por
bloco
. Os blocos constituem o factor externo cuja
variabilidade induzida vai ser poss´
ıvel controlar do ponto de vista estat´
ıstico.
que possuiAssim, num planeamento com blocos aleatorizados temos um factor de interesse
g
n´ ıveis (tratamentos) e temos
b
blocos prefazendo um total de
gb
observa¸
c˜ oes.
Os tratamentos s˜
ao distribu´
ıdos aleatoriamente pelos
g
Bioestat´^ elementos de cada bloco.
ıstica, 2007
17
e v´
alido.
ao aleat´
orios e independentes entre si, com distribui¸
c˜ ao Normal,
ǫ ij
, σ
ao tˆ
em interac¸
c˜ ao (resulta do pressu-
posto 1.).
Bioestat´
ıstica, 2007
19
Hip´
oteses a testar
No caso de o factor em estudo ser de feitos fixos temos
H 0 : μ 1 = μ 2 =
μ g
=
μ
vs
H 1 : μ i 6
μ
pelo menos para um
i
ou equivalentemente
H 0 : τ 1 = τ 2 =
τ g
= 0
vs
H 1 : τ i 6
pelo menos para um
i
No caso de o factor em estudo ser de efeitos aleat´
orios temos
0
:
σ τ 2
= 0
vs
1
: σ τ 2
onde
σ τ 2
representa a variˆ
ancia associada ao factor de interesse.
Bioestat´
ıstica, 2007
20