Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Análise Estatística de Dados Multivariados: Modelo Linear Misto, Notas de aula de Crescimento

Este documento explica o processo de análise de dados multivariados utilizando um modelo linear misto. O texto aborda a seleção de efeitos fixos, identificação de efeitos aleatórios e escolha da melhor estrutura para a matriz de covariância. Além disso, são apresentados exemplos de análises univariadas e multivariadas utilizando o software r.

O que você vai aprender

  • Quais são as vantagens de utilizar um modelo linear misto em análises multivariadas?
  • Qual é a finalidade da análise de dados multivariada?
  • Como é selecionado o melhor modelo de covariância em análises multivariadas?
  • Como é interpretado o resultado da análise multivariada?
  • Quais etapas são seguidas na análise de dados multivariada utilizando um modelo linear misto?

Tipologia: Notas de aula

2022

Compartilhado em 07/11/2022

Homer_JS
Homer_JS 🇧🇷

4.5

(41)

222 documentos

1 / 109

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
WEDERSON LEANDRO FERREIRA
ANÁLISE DE DADOS COM MEDIDAS
REPETIDAS EM EXPERIMENTO COM
INGESTÃO DE CAFÉ
LAVRAS - MG
2012
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Pré-visualização parcial do texto

Baixe Análise Estatística de Dados Multivariados: Modelo Linear Misto e outras Notas de aula em PDF para Crescimento, somente na Docsity!

WEDERSON LEANDRO FERREIRA

ANÁLISE DE DADOS COM MEDIDAS

REPETIDAS EM EXPERIMENTO COM

INGESTÃO DE CAFÉ

LAVRAS - MG

WEDERSON LEANDRO FERREIRA

ANÁLISE DE DADOS COM MEDIDAS REPETIDAS EM

EXPERIMENTO COM INGESTÃO DE CAFÉ

Dissertação apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós- Graduação em Estatística e Experimentação Agropecuária, área de concentração em Estatística e Experimentação Agropecuária, para a obtenção do título de Mestre.

Orientador Dr. Augusto Ramalho de Morais

LAVRAS - MG

WEDERSON LEANDRO FERREIRA

ANÁLISE DE DADOS COM MEDIDAS REPETIDAS EM

EXPERIMENTO COM INGESTÃO DE CAFÉ

Dissertação apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós- Graduação em Estatística e Experimentação Agropecuária, área de concentração em Estatística e Experimentação Agropecuária, para a obtenção do título de Mestre.

APROVADA em 8 de fevereiro de 2012.

Dr. Adriano Ferreti Borgatto UFSC

Dr. José Airton Rodrigues Nunes UFLA

Dr. João Domingos Scalon UFLA

Dr. Augusto Ramalho de Morais Orientador

LAVRAS - MG

A minha família, em especial Maria, minha mãe, que jamais mediu esforços em valorizar todas as etapas educacionais que alcancei até o momento.

A todos os amigos que deram, e ainda me dão, exemplos de caráter, honestidade e bom senso, contribuindo, dessa forma, para as vitórias até aqui alcançadas.

DEDICO

RESUMO

Este trabalho se propôs a abordar técnicas de análise de medidas repetidas no tempo, com ênfase prioritária no ajuste de curvas polinomiais de crescimento para o peso de animais (ratos) submetidos a diferentes dietas alimentares, com e sem extrato aquoso de café da espécie Coffea arabica. Os animais foram avaliados durante 15 semanas. Para o estudo dos pesos dos animais, foram utilizadas diferentes técnicas estatísticas. Análise exploratória, análise univariada, utilizando o delineamento inteiramente casualizado em esquema de parcelas subdivididas no tempo, que impõe forte restrição quanto à matriz de covariâncias do erro experimental, análise multivariada que permite o uso de uma matriz de covariâncias não estruturada e modelo linear misto, que permite selecionar as estruturas de covariâncias que melhor se adéquam ao perfil de correlação dos dados. No ajuste de curvas de crescimento, usando modelo linear misto, utilizaram-se diferentes estruturas de covariâncias para descrição da correlação presente em uma mesma unidade experimental. Em todas as técnicas utilizadas, houve resultados significativos para os tratamentos. Procedendo-se ao ajuste das curvas polinomiais de crescimento do peso médio dos animais para as diferentes dietas ao longo das semanas, constatou-se que a estrutura de covariâncias UN (não estruturada) relacionada aos parâmetros de efeitos aleatórios e a estrutura VC (componente de variância) relacionada ao erro experimental, que possui variâncias iguais e correlações nulas, foram as mais adequadas, por ambos os critérios de informação, Akaike e BIC. Somente na dieta (NORM), que recebeu ração de biotério enriquecida com ração para cães, o uso do café apresentou tendência a diminuir o peso dos animais, ao longo das semanas avaliadas.

Palavras-chave: Dados longitudinais. Modelo linear misto. Análise de perfil. Critério de informação.

ABSTRACT

This study intended to approach the analysis of repeated measures technique, with an emphasis on the fitting of polynomial growth curves for the weight of animals (rats) submitted to diets with or without aqueous extract of Arabian coffee ( Coffea Arabica ). The animals were evaluated for 15 weeks. To study the weights of the animals, we used different statistical techniques. Exploratory analysis, univariate analysis utilizing a randomized design with a split-plot on time arrangement, which constraints the covariance matrix of the experimental error; multivariate analysis, which enables the use of a non-structured covariance matrix and a linear mixed model, which enables the selection of covariance structures that best fit the data correlation profile. In the setting of growth curves, using linear mixed model, we used different covariance structures for describing the correlation present in the same experimental unit. In all techniques, there were significant results for the treatments. Following the fitting of polynomial growth curves for the average weight of animals under different diets over the weeks, it was found that the unstructured (UN) covariance structure related to the random effect parameters as well as the VC structure (variance component) related to experimental error, which has equal variances and null correlations, were the most appropriate to both information criteria; Akaike and BIC. Only under the diet (NORM), which received bioterio ration enriched with dog ration, the use of coffee tended to decrease the weight of the animals along the evaluated weeks.

Keywords: Longitudinal data. Linear mixed model. Profile analysis. Information criterion.

LISTA DE TABELAS

Tabela 1 Esquema para análise da variância, esperanças dos quadrados médios e teste F para as hipóteses de interesse do modelo de experimento no delineamento inteiramente casualizado em esquema de parcelas subdividas no tempo....................................... 23 Tabela 2 Resultado da análise de variância univariada da variável peso por animal (grama), considerando o delineamento inteiramente casualizado e com o fator grupos de dietas nas parcelas e os períodos de avaliação nas subparcelas.............................................. 68 Tabela 3 Resultado do teste de esfericidade de Mauchly ............................... 69 Tabela 4 Resultado da análise univariada de perfil corrigida em um delineamento inteiramente casualizado para os efeitos intraindivíduos do peso do animal submetido a 6 dietas, aferido no período de 15 semanas, a partir da 4a^ semana de vida ..................... 70 Tabela 5 Resultado da análise multivariada da variável peso (grama) por animal, considerando o delineamento inteiramente casualizado e testando o efeito nulo do fator semanas............................................ 73 Tabela 6 Resultado da análise multivariada da variável peso (grama) por animal, considerando o delineamento inteiramente casualizado e testando efeito nulo da interação de semanas dietas..................... 74 Tabela 7 Estimativas, erros padrões, valor do teste , nível de significância (valor-p) para os parâmetros dos modelos das curvas polinomiais ajustadas para pesos dos animais (em gramas), no período de 15 semanas e coeficiente de determinação para as seis dietas .............. 77

Tabela 8 Estimativas dos critérios de seleção das estruturas da matriz de covariâncias para G, variação entre indivíduos e R, variação intra indivíduo, considerando o modelo maximal e o método de estimação da máxima verossimilhança restrita (MVR) ................... 80 Tabela 9 Teste para os efeitos fixos para o ajuste do modelo selecionado dos pesos dos animais, em gramas, aferidos no período de 15 semanas, a partir da 4a^ semana de vida, para as 6 dietas.................. 82 Tabela 10 Estimativas e avaliação de contrastes formados por dietas que receberam e não receberam extrato aquoso de café, utilizando a estatística ....................................................................................... (^83) Tabela 11 Estimativas e teste para os parâmetros do modelo das curvas polinomiais ajustadas pelo modelo linear misto para pesos dos animais, em gramas, aferidos no período de 15 semanas, a partir da 4a^ semana de vida, para as 6 dietas alimentares ....................... 84

4.4.3 Ajuste das matrizes de covariâncias, testes, estimação dos parâmetros e diagnóstico do modelo......................................

........................

39 79 5 CONCLUSÕES .......................................................................

..... ............................................. ..........

87 6 TRABALHOS FUTUROS .....................................................

........ ........................ ................... ..... ........................ ...................... .. ............... ..... .....

88 REFERÊNCIAS .......................................................................

........................................

89 ANEXOS ..................................................................................

......................................... ....

96

13

1 INTRODUÇÃO

Muitos são os campos da pesquisa nos quais são realizadas várias observações sobre a mesma unidade experimental, como ocorre, por exemplo, na avaliação do crescimento do peso de espécies animais. Planejamentos desse tipo permitem que se avaliem as mudanças que ocorrem ao longo do tempo. Como as medidas são realizadas nas mesmas unidades experimentais e, em geral, de modo sistemático, é de se esperar que ocorra correlação não nula entre as medidas no tempo, bem como, exista certa heterogeneidade de variâncias. Nesse caso, é possível considerar que as respostas de tempos mais próximos sejam mais correlacionadas do que aquelas de tempos mais distantes, tornando, quase sempre, característica comum a dados mensurados ao longo do tempo (LITTELL et al., 2006). Tendo em vista este aspecto, é primordial uma abordagem apropriada à análise estatística dos dados que leve em consideração essa possível correlação presente entre as observações em uma mesma unidade experimental porque, caso contrário, todas as inferências realizadas podem ser inválidas ou distorcidas da realidade. A análise estatística de dados com essa característica pode ser feita utilizando-se técnicas uni ou multivariadas que, geralmente, são direcionadas a dados obtidos nos mesmos instantes de tempo para todos os tratamentos e também com ausência de parcelas perdidas (BARBOSA, 2009). Outro procedimento estatístico que pode ser adotado é a construção de curvas de crescimento, utilizando, por exemplo, modelos lineares mistos. Ao analisar dados por meio de um modelo univariado utilizando-se o esquema de parcela subdividida no tempo, deve-se analisar a estrutura da matriz de variâncias e covariâncias, pois há a pressuposição de homogeneidade de variâncias e correlações nulas quanto ao uso desta estrutura. Este fato contraria a

15

2 REFERENCIAL TEÓRICO

Nesta seção são apresentados conceitos e métodos que foram utilizados para atingir o objetivo deste trabalho.

2.1 Evolução histórica do café

Não há evidência real sobre a descoberta do café, mas há muitas lendas que relatam sua possível origem. Uma das mais aceitas e divulgadas é a do pastor Kaldi, que viveu na Absínia, hoje Etiópia, há cerca de mil anos. Ela conta que Kaldi, observando suas cabras, notou que elas ficavam alegres e saltitantes e que esta energia extra se evidenciava sempre que mastigavam os frutos de coloração amarelo-avermelhada dos arbustos existentes em alguns campos de pastoreio. A planta de café é originária da Etiópia, onde, ainda hoje, faz parte da vegetação natural. Foi a Arábia a responsável pela propagação da cultura do café. O nome café não é originário da Kaffa, local de origem da planta, e sim da palavra árabe qahwa , que significa vinho. Por esse motivo, o café era conhecido como "vinho da Arábia", quando chegou à Europa, no século XIV (ASSOCIAÇÃO BRASILEIRA DAS INDÚSTRIAS DE CAFÉ - ABIC, 2011). Ainda segundo a ABIC (2011), o hábito de tomar café foi desenvolvido na cultura árabe. No início, era conhecido apenas por suas propriedades estimulantes e a fruta era consumida fresca, sendo utilizada para alimentar e estimular os rebanhos durante viagens. Com o tempo, o café começou a ser macerado e misturado com gordura animal, para facilitar o consumo durante as viagens. Em 1000 d.C., os árabes começaram a preparar uma infusão com as cerejas, fervendo-as em água. Entretanto, foi no século XIV que o processo de torrefação foi desenvolvido e, finalmente, a bebida adquiriu um aspecto mais parecido com o dos dias de hoje.

16

Devido à sua grande aceitação na Europa, inicialmente em Veneza, os colonizadores europeus foram responsáveis pela vinda do café ao Suriname, São Domingos, Cuba, Porto Rico e Guianas, chegando, logo em seguida, ao norte do Brasil. No Brasil, devido às condições climáticas, o cultivo de café se espalhou rapidamente, passando pelo Maranhão, Bahia, Rio de Janeiro, São Paulo, Paraná e Minas Gerais. Num espaço de tempo relativamente curto, o café passou de uma posição relativamente secundária para a de produto-base da economia, tornando o Brasil o maior produtor atualmente, respondendo por cerca de 30% do mercado internacional (ABIC, 2011). Como mercado consumidor, perde apenas para os Estados Unidos. Seu mercado possui previsão de movimentar em 2011 cerca de R$ 7,5 bilhões, somente no mercado nacional (ABIC, 2011). No mundo, esse mercado perde apenas para o de petróleo. Algumas pesquisas indicam que o consumo médio de café está aumentando, fato muito justificado pelo seu fator estimulante e seu sabor forte e próprio. Cecon et al. (2008) relatam que, atualmente, o café é produzido em mais de 60 países, predominantemente em países menos desenvolvidos, sendo atividade de grande aspecto socioeconômico no mundo. E é consumido em países mais ricos, algo que faz com que a sua qualidade se aprimore cada vez mais.

2.1.1 Café na nutrição funcional

O café é uma bebida muito apreciada, especialmente por suas características de sabor e aroma. Além disso, algumas de suas propriedades relacionadas ao bem-estar e à manutenção do estado de alerta também são mencionados pelos autores (MACHADO; DÓREA; COSTA, 2011). No entanto,

18

Estudos envolvendo medidas repetidas abrangem, entre outros, os delineamentos com parcelas divididas (“split-plot") e delineamentos com intercâmbio (“crossover"), além dos estudos longitudinais (NOBRE; SINGER, 2007). Os esquemas em parcelas divididas são comuns em ciências agrárias, em que há dois estágios na casualização: primeiramente, casualizam-se os níveis de um fator (tratamento) e, em um segundo estágio, há casualização dos níveis de um segundo fator em todos os níveis do primeiro. Já nos planejamentos do tipo “crossover", as unidades experimentais recebem sequências de tratamentos, ou seja, todos os tratamentos são aplicados às mesmas unidades experimentais, após agrupá-las em grupos de número igual ao número de tratamentos. Faraway (2006) descreve que um planejamento é dito longitudinal quando houver repetição da medida ao longo do tempo, tornando-se, assim, um caso particular de medidas repetidas. O mesmo autor ainda menciona que o principal objetivo no estudo de dados longitudinais é descrever as alterações de uma ou mais variáveis resposta na evolução do tempo e, também, estudar a influência de outros fatores ou covariáveis sobre a variável resposta na unidade experimental, surgindo, assim, centros de interesse da dependência dessa variável ao longo do tempo. Por esta razão, espera-se uma dependência entre as observações referentes a uma mesma unidade experimental. Em planejamentos longitudinais, as variáveis resposta podem ser contínuas ou discretas, como, por exemplo, ganho de peso e número de folhas. As unidades experimentais podem ser constituídas de um ou mais fatores ou tratamentos e cada uma dessas unidades pode gerar unidades observacionais, em que cada um desses conjuntos de observações pode ser entendido como um perfil individual de resposta para a variável em estudo. O estudo desses perfis individuais pode ser um indício inicial para a inclusão de efeito aleatório no modelo (ROCHA, 2010).

19

Os dados longitudinais são tidos como regulares quando o intervalo entre duas medidas consecutivas quaisquer for constante ao longo do tempo. E, se as observações forem feitas nos mesmos instantes de tempo em todas as unidades experimentais, tem-se uma estrutura balanceada em relação ao tempo (AMADOR, 2010). Dados do tipo longitudinais apresentam, conforme Singer, Rocha e Nobre (2004), algumas vantagens, tais como: i) permitem estudar o comportamento da variável resposta média da unidade experimental sobre cada tratamento; ii) exige menos unidades experimentais (as medidas são feitas nas mesmas parcelas); iii) permite verificar existência de dependência da variável resposta em relação às covariáveis existentes; iv) diminuição do erro experimental (aumenta do número de dados); v) melhora na precisão das estimativas dos parâmetros. Pela própria obtenção sistemática dos dados longitudinais, é de se esperar que as observações sobre uma mesma unidade experimental tendam a ser correlacionadas. E tal correlação pode ser modelada, explicada por meio da utilização de uma estrutura de covariâncias para os dados observados. E é imprescindível que esse procedimento seja realizado, para que sejam válidas as inferências realizadas (ROCHA, 2010). Para dados completos, ausência de parcelas perdidas, e balanceados as metodologias de análise de perfil e a análise de curvas de crescimento são técnicas clássicas para análises de dados longitudinais. A análise de perfil pode ser realizada utilizando-se técnicas univariadas ou multivariadas e o ajuste de curvas de crescimento pode ser realizado, além das técnicas anteriores, por meio do modelo linear misto unifatorial que é o foco deste trabalho, no que se refere ao ajuste de curvas para o experimento real aqui tratado.