Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Análise Estatística de Modelos Lineares: Igualdade entre Hipóteses de Tipo I e II, Notas de aula de Estatística

Este documento discute a igualdade entre as hipóteses de tipo i e ii em modelos lineares, mostrando que para um modelo caracterizado por yijk = µ+ai+l3j+eijk, a hipótese do tipo i é igual a hipótese do tipo ii para qualquer fator do modelo, independentemente de interações. O documento também apresenta a partição da matriz x referente a constante µ, ao fator a, ao fator b e ao fator c, e os efeitos principais e interações desses fatores.

O que você vai aprender

  • Qual é a hipótese de Tipo II em modelos lineares?
  • Qual é a hipótese de Tipo I em modelos lineares?
  • Em que condições as hipóteses de Tipo I e II em modelos lineares são iguais?
  • Como a partição da matriz X é utilizada em modelos lineares?
  • Quais são os fatores principais e interações em modelos lineares?

Tipologia: Notas de aula

2022

Compartilhado em 07/11/2022

usuário desconhecido
usuário desconhecido 🇧🇷

4.6

(158)

172 documentos

1 / 145

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
DELINEAMENTOS ORTOGONAIS E PARCIALMENTE
ORTOGONAIS: TEORIA E APLICAÇÃO
DENISE GARCIA DE SANTANA
Engenheiro Agrônomo
Orientador: Prof. Dr. ANTONIO FRANCISCO IEMMA
Tese apresentada à Escola Superior de
Agricultura "Luiz de Queiroz", Universidade
de São Paulo, para obtenção do título de
Doutor em Agronomia. Área de Concentração:
Estatística e Experimentação Agronômica.
PIRACICABA
Estado de São Paulo -Brasil
Dezembro - 2000
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Pré-visualização parcial do texto

Baixe Análise Estatística de Modelos Lineares: Igualdade entre Hipóteses de Tipo I e II e outras Notas de aula em PDF para Estatística, somente na Docsity!

DELINEAMENTOS ORTOGONAIS E PARCIALMENTE

ORTOGONAIS: TEORIA E APLICAÇÃO

DENISE GARCIA DE SANTANA

Engenheiro Agrônomo

Orientador: Prof. Dr. ANTONIO FRANCISCO IEMMA

Tese apresentada à Escola Superior de Agricultura "Luiz de Queiroz", Universidade de São Paulo, para obtenção do título de Doutor em Agronomia. Área de Concentração: Estatística e Experimentação Agronômica.

PIRACICABA

Estado de São Paulo - Brasil

Dezembro - 2000

Dados Internacionais de catalogação na Publicação DIVISÃO DE BIBLIOTECA E DOCUMENTAÇÃO • campus "Luiz de Queiroz"/USP

Santana, Denise Garcia deDelineamentos ortogonais e parcialmente ortogonais: teoria e aplicação/ Denise Garcia de Santana. - - Piracicaba, 2000. 135 p. Tese (doutorado) - Escola Superior de Agricultura Luiz de Queiroz, 2000. Bibliografia.

  1. Análise de variância 2. Delineamento de experimento 3. Estatística experimental 4. Modelo matemático 1. Título CDD 519.

AGRADECIMENTOS

Ao prof. Dr. Antonio Francisco Iemma, por ter ido além da função de orientador. À CAPES/PICDT pela bolsa de estudo concedida para a realização do curso. Ao Instituto de Ciências Agrárias da Universidade Federal de Uberlândia-MG pela oportunidade e pela espera. Aos professores e funcionários do Departamentos de Ciências Exatas da Escola Superior de Agricultura " Luiz de Queiroz". Agradeço a oportunidade de ter encontrado nesse longo caminho Leda Maria Gurgel do Amaral Garrido, referência de dedicação, empenho e amizade. À minha amiga Sílvia Maria de Freitas por ter me estendido a mão nos momentos mais difíceis. Às amigas Lara Hoffmann Xavier e Jeanete Alves Moreira pelo carinho e companheirismo. À minha secretária Sandra Maria Aparecida Matias Orsalino pela dedicação ao meu filho Pedro.

SUMÂRIO

Página RESUMO .................................................................................................... vii

DELINEAMENTOS ORTOGONAIS E PARCIALMENTE

ORTOGONAIS : TEORIA E APLICAÇÃO

RESUMO

Autora: DENISE GARCIA DE SANTANA Orientador: Prof. ANTONIO FRANCISCO IEMMA

Em situações experimentais, não raro, o pesquisador depara-se com a impossibilidade de planejar experimentos balanceados. Um grave problema surge imediatamente, no tocante à interpretação das hipóteses testadas através dos sistemas estatísticos, principalmente quando há vários fatores envolvidos e se faz presente um alto grau de desbalanceamento pois, em geral, as hipóteses sobre os efeitos principais de um dos fatores contêm os efeitos principais de outros fatores, além dos efeitos de interações. Diante disso, o objetivo deste trabalho está centrado no estudo das funções estimáveis e das hipóteses testáveis em delineamentos ortogonais e parcialmente ortogonais com mais de dois fatores, à luz do procedimento GLM do sistema estatístico SAS. Face aos resultados obtidos, concluiu-se que para todos os efeitos principais, nos quais o subespaço gerado é individualmente ortogonal aos subespaços inerentes aos demais fatores, são estimáveis e, portanto, as hipóteses correspondentes são testáveis nos modelos sem interações. Na presença de interações, as funções estimáveis apresentam além de parâmetros do próprio fator, parâmetros das interações nas quais o fator está presente. Para esses casos, independente do modelo conter ou não conter interações, as hipóteses sobre médias ponderadas (tipo I) são equivalentes às hipóteses sobre médias ponderadas ajustadas (tipo II) e, como o termo completo é condição necessária para a^ ortogonalidade parcial ou plena, ocorre também a equivalência entre as hipóteses sobre médias não ponderadas ajustadas (tipos III e IV). A igualdade entre as hipóteses dos tipos I e II ocorre para todas as interações, nos delineamentos ortogonais e, nos delineamentos parcialmente

viii

ortogonais, ocorre para as interações formadas pelos fatores que não foram ortogonais entre si, pelas interações formadas por combinações de fatores que geraram subespaços individualmente ortogonais aos demais e para as todas as combinações formadas pelos fatores cujos subespaços não foram ortogonais entre si, além dos fatores cujos subespaços gerados foram individualmente ortogonais aos demais. Nessas interações as funções estimáveis apresentam parâmetros da própria interação, além de parâmetros das interações de grau maior que o grau da interação em estudo. Como uma aplicação imediata do conteúdo deste texto e, com o intuito de orientar os pesquisadores no tocante ao (^) planejamento de experimentos ortogonais e parcialmente ortogonais, apresenta-se, ao final, um capítulo sobre o tema.

X

interactions formed by the factors that were not orthogonal between themselves, by the interactions formed by a combination of factors that generated subspaces individually orthogonal to the others and (^) in all the combinations formed by the factors of which subspaces were not orthogonal between themselves, including the factors of which generated subspaces were individually orthogonal to the others. ln these interactions the estimable functions present parameters of the interaction itself, including parameters of the interactions of higher degree than the degree of the interaction being studied. As an immediate application of the contents of this text and, with the aim of instructing the researchers concerning the planning of orthogonal and partially orthogonal experiments, a chapter on this subject can be found at the end of this abstract.

1 INTRODUÇÃO

Um dos temas da estatística experimental, especificamente em análise de variância, que tem motivado e preocupado os pesquisadores, consiste no estudo das hipóteses realmente testadas através do modelo adotado. De fato, a forma das hipóteses é diretamente dependente da estrutura do delineamento, freqüências das

que está associada entre outras caracteristícas, às caselas. A distribuição das freqüências de maneira homogênea, que caracteriza os conjuntos completos e balanceados, é a mais discutida nos textos de estatística experimental e os modelos oriundos de tais conjuntos, apresentam as hipóteses mais simples de serem interpretadas. Entretanto, conjuntos balanceados podem ser, em muitos casos, uma exceção, pois a perda de parcelas por causas naturais ou acidentais, bem como a impossibilidade fisica de instalação de conjuntos balanceados constituem situações usuais na experimentação agronômica. Sabe-se que a utilização de conjuntos desbalanceados afeta a interpretação prática dos resultados, no sentido de que as hipóteses de interesse do pesquisador que, em geral, são aquelas que envolvem apenas funções de um mesmo parâmetro, podem não ser testáveis. Ainda assim, muitos delineamentos de conjuntos desbalanceados ou mesmo incompletos foram, e ainda têm sido interpretados como se fossem balanceados. Naturalmente, tal procedimento pode gerar conclusões errôneas e afirmações que não serão reprodutíveis em ensaios futuros. Nesse contexto, quando se pensou que a análise de variância era um tema bastante ex--plorado, novos textos de estatística experimental (Azais, 1994; Iemma, 1995; Claustriaux & Iemma, 1999; Iemma & Claustriaux, 1999) surgiram com o enfoque principal no estudo das hipóteses do modelo. Para o estudo de tais hipóteses, conceitos como os de delineamentos ortogonais e não ortogonais, assim como os de conjuntos

3

- apresentar a forma geral das hipóteses sobre os efeitos principais e interações para os delineamentos ortogonais, assim como, estabelecer **propriedades sob ortogonalidade;

  • apresentar a forma geral das hipóteses sobre os efeitos principais e** interações para os delineamentos parcialmente ortogonais, assrm como, **estabelecer propriedades sob ortogonalidade parcial;
  • obter um critério para determinação das freqüências de caselas de** delineamentos ortogonais e parcialmente ortogonais.

2 REVISÃO DE UTERATURA

2.1 Conceitos e definições

A pnme1ra referência consistente do termo ortogonal foi apresentada por Yates (1933), citado por Preece (1977). O autor define ortogonalidade como uma propriedade dos delineamentos que garante que as diferentes classes de efeitos, aos quais o material experimental está sujeito, podem ser isoladas e estimadas sem qualquer obstáculo. Entretanto, a definição de ortogonalidade de Yates (1933) não menciona especificamente o termo delineamento ortogonal. Pearce (1953) apresenta a seguinte definição para a ortogonalidade: "Duas classificações são mutuamente ortogonais se os vários grupos de parcelas formadas por uma classificação, são compostos de um número de parcelas proporcionais à outra classificação. Quando todos os pares de classificações são mutuamente ortogonais, o delineamento é dito ortogonal." Preece (1977) faz uma revisão sobre os termos ortogonalidade e delineamento e mostra a confusão na literatura gerada pelos diferentes significados dos termos, principalmente entre os estatísticos e os chamados "combinatoristas". O autor comenta, também, que a definição de delineamento ortogonal apresentada por Pearce (1953) deve ser ampliada, principalmente quando aplicada a experimentos fatoriais na presença de interações. Para justificar o comentário, o autor utiliza um exemplo de Yates (1935) de um delineamento com três fatores, onde o fator A apresenta três níveis (O, 1 e 2), o fator B, dois níveis (O e 1) e o fator C dois níveis (O e 1). O esquema está descrito no Quadro 1.

6

as freqüências de caselas, o que não ocorre para o caso b para os fatores B e C em relação aos blocos.

Quadro 3. Ortogonalidade parcial, segundo as idéias de Preece (1977).

a Parte ortogonal

Bloco 1 B=O (^) B=l A=O 1 1 A=l 1 1 A=2 1 1 Bloco 4 B=O B=l A=O 1 1 A=l 1 1 A=2 1 1

Bloco 2 B=O A=O 1 A=l 1 A= 2 1 Bloco 5 B=O A=O 1 A=l 1 A=2 1

b Parte não ortogonal Bloco 1 Bloco 2 B=O B=l B=O 1 O=O 2 1 1 O=0 1 1 O=l 1 2 1 C=l 2

Bloco 4 Bloco 5 B=O (^) B=l B=O

1 O=O 1 2 1 C=O^2

10=1 2 1 1 C=l 1

Bloco 3 B=l B=O B=l 1 A=O^1 1 A=l 1 1 (^1) A=^2 1 1 Bloco 6 B=l B=O B=l 1 A=O 1 1 1 A=l (^1 ) 1 A=2 1 1

Bloco 3 B=l B=O B=l (^2) 10=0 2 1 (^1) 10=1 l 2 Bloco 6 B=l B=O^ B=l (^1) 1 O=0 l 2 (^2) 10=1 2 1

O que foi constatado no artigo de Preece (1977) é que há uma diferença entre delineamentos ortogonais e delineamentos onde apenas parte da estrutura é ortogonal. No exemplo dado, apenas os efeitos principais são ortogonais entre si. Este tipo de delineamento, ou seja, com ortogonalidade entre efeitos principais, foi discutido também por Addelman (1962). O autor mostra que é possível ocorrer a ortogonalidade entre efeitos principais nos delineamentos com vários fatores e, por conseguinte, a estimação não viesada dos efeitos principais quando a interação não está presente. Entretanto, o

7

compromisso de se pressupor que não há interação para que as estimativas sejam não viesadas dificulta a modelagem e a interpretação dos resultados. Claustriaux & Iemma (1999) generalizam a discussão de Preece (1977) incluindo uma discussão sobre os termos completo, ortogonal e balanceado em análise de variância, uma vez que esta trilogia parece confundir autores e pesquisadores. Os autores focalizam a definição de delineamentos ortogonais para modelos com dois fatores, com e sem interação, ampliando as definições anteriores que se fixavam em modelos sem interação. Mostram, ainda, a característica principal de um delineamento ortogonal que é apresentar hipóteses do tipo I iguais às hipóteses do tipo II, provando a propriedade de que sob ortogonalidade, médias ponderadas são iguais a médias ponderadas ajustadas. Esta característica já havia sido discutida sobre um outro enfoque por Yates (1933) citado por Pearce (1963;1983) mostrando que num delineamento ortogonal as médias de tratamentos não eram afetadas pelas diferenças entre blocos. Em termos de hipóteses isso significa que, as funções estimáveis para os efeitos de tratamentos não contêm parâmetros dos blocos. Azais (1994) faz um amplo comentário sobre modelos ortogonais e não ortogonais, mostrando o que o autor chama de decomposições do tipo I, II, III e IV, além de outros tipos de decomposições. O autor também apresenta, de maneira didática, o que acontece com as decomposições quando o número de observações por casela não é constante ou mesmo quando há casela vazia. Iemma & Claustriaux (1999) enfatizam a nomenclatura, e propiciam uma ampla discussão sobre a análise de variância a dois fatores de classificação com delineamentos ortogonais e não ortogonais, enfocando as funções estimáveis dos tipos I, II, III e IV fornecidas pelos sistemas SAS (X,

  1. e Minitab (X, 1996). Uma grande contribuição do artigo consiste na apresentação de uma figura resumo (Figura 1), contendo tipos de hipóteses associadas às estruturas dos delineamentos e dos dados.

9

2.2 Funções estimáveis e hipóteses testáveis

No planejamento de delineamentos experimentais é importante que o pesquisador defina, antecipadamente, quais são as hipóteses de maior interesse. Na verdade, conforme a relação modelo-dados, muitas das hipóteses de interesse em sua pesquisa podem não ser testáveis. Para que uma hipótese seja testável é necessário que a função paramétrica que a descreve seja estimável. Segundo Rao (1945) uma função linear paramétrica Â-^10 é dita estimável no modelo (^) y =X0+e, Gauss Markov normal ordinário, se e somente se, existe uma combinação linear das observações, a'y , tal que E[a'y]=À-^10 (Iemma, 1990). Se 11,^1 0 é estimável, ela apresenta vários estimadores não viesados, dentro os quais um único é classificado como melhor. Seja o modelo de Gauss Markov e sejam as possíveis combinações a'y tais que: E[a'y]=À-^1 0. Então ª^ - y é o melhor estimador não viesado de 11,'0, se e somente se, var[a·y]=min var[a'y], Va'y: E[a'yJ=À^1 0. Nesse contexto, segundo o teorema

de Gauss-Markov, seu BLUE é obtido de modo único, através de Â.^1 0 = Â.^10 °^ ,

onde 0°^ é qualquer solução das equações normais. Sua variância é dada por:

var [11,'0} = var (ts'0º^ } = À 1 (X�Yf Ào-^2 A definição apresentada por Rao ( 1945) tem grande importância nas demonstrações teóricas, mas tem de pouco valor prático, uma vez que depende da dimensão dos dados. Isto levou ao estabelecimento de regras práticas de estimabilidade. Dentre as regras de estimabilidade mais importantes estão as funções básicas estimáveis incorporadas pelo Proc GLM do SAS, que constrói uma forma geral para as funções estimáveis através das

linhas não nulas de L=(XX)^92 XX (Mondardo, 1994). Assim, a forma geral

apresentada pelo sistema SAS (X, 1990) das funções estimáveis envolve todos os parâmetros do modelo e à cada linha não nula, linearmente independente,

de (XX)^92 XX é associado um símbolo L, de modo que o número de L's

10

diferentes representa o posto máximo da hipótese testada. O procedimento GLM do sistema estatístico SAS tem como padrão construir a matriz L, utilizando como inversa generalizada de XX , a inversa reflexiva g2. A matriz L é a mesma matriz H descrita por Iemma (1987). No sistema SAS (X, 1990) são incorporados quatro tipos de funções estimáveis: funções sobre médias ponderadas não ajustadas (Tipo I), funções sobre médias ponderadas ajustadas (Tipo II), funções sobre médias não ponderadas ajustadas (Tipo III) e funções sobre médias não ponderadas ajustadas, segundo as caselas vazias (Tipo IV) (Iemma, 1991). A escolha das funções estimáveis do tipo I para os efeitos principais pode envolver parâmetros do outro fator quando na presença de caselas vazias ou mesmo em conjuntos completos não ortogonais de modelos sem interação, além de parâmetros da interação nos modelos com interação. Essa característica dificulta sobremaneira a interpretação dos resultados pelo pesquisador. Já as funções estimáveis do tipo II por serem ajustadas para o outro fator, podem testar hipóteses de maior interesse do pesquisador quando não há caselas vazias. As funções estimáveis do tipo III são importantes no estudo de modelos com interação, mas quando o número de caselas vazias e o número de níveis do fator aumenta, elas podem ser complexas e mesmo fugir do interesse do pesquisador (Mondardo, 1994). Diante disso, Camarinha Filho (1995) discute que é indispensável que os manuais de pacotes estatísticos seJam mais esclarecedores, minimizando os erro -de interpretações das hipóteses na análise dos dados. Acrescenta Santos (1994) a importância da interpretação correta das hipóteses devido a grande diversidade de programas computacionais, principalmente na presença de caselas vazias. Aliado ao problema da interpretação das hipóteses está a escolha do modelo. Os modelos superparametrizados, conhecidos como modelo-S são de grande interesse pois mostram explicitamente os parâmetros. Entretanto, segundo Hocking (1985), Searle (1987) e Iemma (1989;1991) entre outros, esses modelos apresentam o inconveniente de apresentar mais parâmetros do que médias de caselas. Diante do problema, o modelo de média de caselas