Baixe Análise Estatística de Dados: Hipóteses sobre Médias de Amostras e outras Notas de aula em PDF para Metodologia, somente na Docsity!
Universidade Estadual de Santa Cruz
Departamento de Ciências Exatas e Tecnológicas
CET076 - Metodologia e Estatística Experimental
Curso de Agronomia
Notas de aulas expandidas.
Prof. José Cláudio Faria
Ilhéus – Bahia
Índice
- NOTAS DO AUTOR
- LITERATURA RECOMENDADA
- RECURSOS DISPONÍVEIS NA WWW
- LABORATÓRIOS VIRTUAIS DISPONÍVEIS NA INTERNET
- SITE PARA ANÁLISES ON-LINE
- EXEMPLOS DE RECURSOS DISPONÍVEIS NA WWW
- SIMBOLOGIA ADOTADA NO CURSO
- CALCULADORAS E APROXIMAÇÕES EM ESTATÍSTICA
- 1.1. CALCULADORA ADEQUADA
- 1.2. COMENTÁRIOS SOBRE OS RECURSOS BÁSICOS
- 1.3. APROXIMAÇÕES
- 1.4. UM TESTE
- 1.5. O QUE NÃO DEVE SER FEITO
- REVISÃO DOS CURSOS PRELIMINARES
- 2.1. MÉDIA ARITMÉTICA
- 2.1.1. O QUE É
- 2.1.2. O QUE QUANTIFICA
- 2.1.3. SIMBOLOGIA E CÁLCULO
- 2.1.3.1. Cálculo
- 2.1.4. UNIDADE DE EXPRESSÃO
- 2.2. VARIÂNCIA
- 2.2.1. O QUE É
- 2.2.2. O QUE QUANTIFICA
- 2.2.3. SIMBOLOGIA E CÁLCULO
- 2.2.3.1. Cálculo
- 2.2.4. UNIDADE DE EXPRESSÃO
- 2.2.5. CONCEITO
- 2.2.6. FORMAS DE CÁLCULO
- 2.3. DESVIO PADRÃO
- 2.3.1. O QUE É
- 2.3.2. O QUE QUANTIFICA
- 2.3.3. SIMBOLOGIA E CÁLCULO
- 2.3.3.1. Cálculo
- 2.3.4. UNIDADE DE EXPRESSÃO
- 2.4. DESVIO PADRÃO RELATIVO E COEFICIENTE DE VARIAÇÃO
- 2.4.1. O QUE SÃO
- 2.4.2. O QUE QUANTIFICAM
- 2.4.3. SIMBOLOGIA E CÁLCULOS
- 2.4.3.1. Cálculos
- 2.4.4. JUSTIFICATIVAS PARA O USO E UNIDADES DE EXPRESSÃO
- 2.5. DEMONSTRAÇÕES
- 2.6. COVARIÂNCIA
- 2.6.1. O QUE É
- 2.6.2. O QUE QUANTIFICA
- 2.6.3. SIMBOLOGIA E CÁLCULO
- 2.6.3.1. Cálculo
- 2.6.4. UNIDADE DE EXPRESSÃO
- 2.6.4.1. Conceito
- 2.6.5. EXEMPLOS DE CÁLCULO E VISUALIZAÇÃO DAS ASSOCIAÇÕES
- 2.6.5.1. Variáveis com associação positiva e elevada
- 2.6.5.2. Variáveis com associação negativa e elevada
- 2.6.5.3. Variáveis não associadas
- 2.7. TEOREMA CENTRAL DO LIMITE
- 2.7.1. O QUE É
- 2.7.2. O QUE SIGNIFICA
- 2.7.3. COMO É USADO
- 2.8. TESTE DE HIPÓTESES
- 2.8.1. HIPÓTESE: O QUE É
- 2.8.2. TESTE DE HIPÓTESES: O QUE É
- 2.8.3. TIPOS DE HIPÓTESES
- 2.8.4. TIPOS DE ERROS
- 2.9. DISTRIBUIÇÃO F
- 2.9.1. O QUE É
- 2.9.2. O QUE SIGNIFICA
- 2.9.3. COMO É USADA
- 2.9.4. EXATIDÃO E PRECISÃO
- 2.9.5. EXEMPLO BÁSICO DE APLICAÇÃO DA DISTRIBUIÇÃO F - COMPARAÇÃO DE PRECISÃO
- 2.9.5.1. Mecanismo de decisão
- ANÁLISE DE VARIÂNCIA
- 3.1. INTRODUÇÃO
- 3.2. CONCEITOS E USO
- 3.2.1. O QUE É?
- 3.2.2. PARA QUE É USADA?
- 3.2.3. QUAL DECISÃO É POSSÍVEL TOMAR?
- 3.2.4. EXEMPLO
- 3.2.4.1. Teste de hipóteses
- 3.2.4.2. Procedimentos para a análise
- 3.2.5. PRESSUPOSTOS DA ANÁLISE DE VARIÂNCIA
- 3.2.6. DEMONSTRAÇÃO DA APLICAÇÃO DO TEOREMA CENTRAL DO LIMITE (TCL) NA ANOVA
- NOÇÕES BÁSICAS DE EXPERIMENTAÇÃO
- 4.1. INTRODUÇÃO
- 4.2. PÚBLICO
- 4.3. PRINCIPAIS CONCEITOS
- 4.4. A ORIGEM AGRÍCOLA
- 4.5. PRINCÍPIOS BÁSICOS DA EXPERIMENTAÇÃO
- 4.5.1. REPETIÇÃO
- 4.5.2. CASUALIZAÇÃO
- 4.5.3. CONTROLE LOCAL
- 4.6. CONTROLE DE QUALIDADE DE EXPERIMENTOS
- 4.7. TIPOS DE ERROS EM EXPERIMENTOS
- 4.7.1. PRINCIPAIS FONTES DE ERRO E RESPECTIVOS CUIDADOS
- 4.7.1.1. Heterogeneidade das condições ambientais
- 4.7.1.2. Heterogeneidade do material experimental
- 4.7.1.3. Condução diferenciada das unidades experimentais
- 4.7.1.4. Competição intraparcelar
- 4.7.1.5. Competição interparcelar
- 4.7.1.6. Pragas, doenças e acidentes
- 4.8. PLANEJAMENTO DE EXPERIMENTOS
- DELINEAMENTO INTEIRAMENTE CASUALIZADO - DIC
- 5.1. INTRODUÇÃO
- 5.2. PRINCÍPIOS UTILIZADOS
- 5.2.1. REPETIÇÃO
- 5.2.2. CASUALIZAÇÃO
- 5.2.3. VANTAGENS E DESVANTAGENS
- 5.2.3.1. Vantagens
- 5.2.3.2. Desvantagens
- 5.3. MODELO ESTATÍSTICO
- 5.4. ESQUEMA DE CASUALIZAÇÃO DOS TRATAMENTOS
- 5.5. COLETA DE DADOS
- 5.6. ANÁLISE DE VARIÂNCIA
- 5.6.1. ESQUEMA DA ANÁLISE DE VARIÂNCIA
- 5.6.2. TESTE DE HIPÓTESES
- 5.7. EXEMPLO COM UM MESMO NÚMERO DE REPETIÇÕES
- 5.7.1. RESÍDUO
- 5.7.2. O COEFICIENTE DE VARIAÇÃO E SUA INTERPRETAÇÃO
- 5.7.3. TESTES DE COMPARAÇÃO DE MÉDIAS MÚLTIPLAS
- 5.7.4. HIPÓTESES PARA OS CONTRASTES
- 5.7.5. DESDOBRAMENTO DOS GL ASSOCIADOS A TRATAMENTOS EM CONTRASTES ORTOGONAIS
- 5.8. EXEMPLO COM NÚMERO DIFERENTE DE REPETIÇÕES
- 5.8.1. DESDOBRAMENTO DOS GL ASSOCIADOS A TRATAMENTOS EM CONTRASTES ORTOGONAIS
- 5.8.2. ESTIMAÇÃO E TESTE DE HIPÓTESES PARA OS CONTRASTES
- 5.9. CONSIDERAÇÕES FINAIS
- 5.10. DEMONSTRAÇÕES E ILUSTRAÇÕES
- TESTES DE COMPARAÇÃO DE MÉDIAS MÚLTIPLAS
- 6.1. INTRODUÇÃO
- 6.2. O FUNDAMENTO DOS TESTES
- 6.3. OS TESTES
- 6.3.1. TESTE DE DUNCAN
- 6.3.1.1. Obtenção da dms
- 6.3.1.2. Aplicação do teste
- 6.3.1.2.1. Para contrastes que abrangem 4 médias
- 6.3.1.2.2. Para contrastes que abrangem 3 médias
- 6.3.1.2.3. Para testar contrastes que abrangem 2 médias
- 6.3.1.3. Apresentação dos resultados e conclusão
- 6.3.2. TESTE DE DUNNETT
- 6.3.2.1. Obtenção da dms
- 6.3.2.2. Aplicação do teste
- 6.3.2.3. Apresentação dos resultados e conclusão
- 6.3.3. TESTE DE TUKEY
- 6.3.3.1. Obtenção da dms
- 6.3.3.2. Aplicação do teste
- 6.3.3.3. Apresentação dos resultados e conclusão
- 6.3.4. TESTE DE STUDENT – NEWMAN – KEULS (SNK)
- 6.3.4.1. Obtenção da dms
- 6.3.4.2. Aplicação do teste
- 6.3.4.2.1. Para contrastes que abrangem 4 médias
- 6.3.4.2.2. Para contrastes que abrangem 3 médias
- 6.3.4.2.3. Para contrastes que abrangem 2 médias
- 6.3.4.3. Apresentação dos resultados e conclusão
- 6.3.5. TESTE DE SCHEFFÉ
- 6.3.5.1. Obtenção da dms
- 6.3.5.2. Teste de Scheffé - médias de tratamentos
- 6.3.5.3. Teste de Scheffé - grupos de médias de tratamentos
- 6.4. EXEMPLO DE APLICAÇÃO EM EXPERIMENTOS DESBALANCEADOS
- 6.4.1. TESTE DE DUNCAN
- 6.4.1.1. Para contrastes que abrangem 4 médias: 4 vs. 4 repetições
- 6.4.1.2. Para contrastes que abrangem 3 médias: 4 vs. 4 repetições
- 6.4.1.3. Para contrastes que abrangem 3 médias: 4 vs. 5 repetições
- 6.4.1.4. Para testar contrastes que abrangem 2 médias: 4 vs. 5 repetições
- 6.4.1.5. Para testar contrastes que abrangem 2 médias: 4 vs. 4 repetições
- 6.4.2. TESTE DE TUKEY
- 6.4.2.1. Para testar contrastes que abrangem 2 médias: 5 vs. 4 repetições
- 6.4.2.2. Para testar contrastes que abrangem 2 médias: 4 vs. 4 repetições
- ESTUDO E APLICAÇÃO DE CONTRASTES
- 7.1. INTRODUÇÃO
- 7.2. DEFINIÇÃO
- 7.3. CONTRASTES ENTRE TOTAIS DE TRATAMENTOS COM UM MESMO NÚMERO DE REPETIÇÕES
- 7.3.1. CÁLCULO DA SOMA DE QUADRADOS DOS DESVIOS
- 7.3.2. ORTOGONALIDADE
- 7.4. CONTRASTES ENTRE TOTAIS DE TRATAMENTOS COM NÚMERO DIFERENTES DE REPETIÇÕES
- 7.4.1. CÁLCULO DA SOMA DE QUADRADOS DOS DESVIOS
- 7.4.2. ORTOGONALIDADE
- 7.5. REGRAS PARA OBTENÇÃO DE CONTRASTES ORTOGONAIS
- 7.5.1. CONTRASTES COM UM MESMO NÚMERO DE REPETIÇÕES
- 7.5.2. CONTRASTES COM NÚMERO DIFERENTE DE REPETIÇÕES
- 7.6. VARIÂNCIA DE CONTRASTES
- 7.7. COMPREENSÃO DO CÁLCULO AS SOMA DE QUADRADOS DOS DESVIOS DE CONTRASTES
- 7.7.1. COM MÉDIAS DE TRATAMENTOS
- 7.7.2. COM OS TOTAIS DE TRATAMENTOS
- REFLEXÕES SOBRE A ANÁLISE DE VARIÂNCIA
- 8.1. INTRODUÇÃO
- 8.2. REFLEXÕES
- 8.3. BLOCO DE PERGUNTAS
- 8.4. BLOCO DE PERGUNTAS
- 8.5. ANÁLISE COMPUTACIONAL DE UM EXPERIMENTO
- 8.5.1. PROGRAMA PARA A ANÁLISE
- 8.5.2. RESULTADOS FORNECIDOS
- 8.5.2.1. Análise de variância
- 8.5.2.2. Testes de comparação de médias
- 8.5.2.2.1. Teste de Tukey
- 8.5.2.2.2. Teste de Duncan
- 8.5.2.2.3. Teste de Dunnett
- 8.5.2.2.4. Teste de Student – Newman – Keuls
- 8.6. BLOCO DE PERGUNTAS
- DELINEAMENTO EM BLOCOS CASUALIZADOS - DBC
- 9.1. INTRODUÇÃO
- 9.2. PRINCÍPIOS UTILIZADOS
- 9.2.1. REPETIÇÃO
- 9.2.2. CASUALIZAÇÃO
- 9.2.3. CONTROLE LOCAL
- 9.2.4. EXEMPLOS DE CONTROLE LOCAL
- 9.3. VANTAGENS E DESVANTAGENS
- 9.3.1. VANTAGENS
- 9.3.2. DESVANTAGENS
- 9.4. MODELO ESTATÍSTICO
- 9.5. ESQUEMA DE CASUALIZAÇÃO DOS TRATAMENTOS
- 9.6. COLETA DE DADOS
- 9.7. ANÁLISE DE VARIÂNCIA
- 9.7.1. ESQUEMA DA ANÁLISE DE VARIÂNCIA
- 9.7.2. TESTE DE HIPÓTESES
- 9.8. EXEMPLO COM UM MESMO NÚMERO DE REPETIÇÕES
- 9.8.1. TESTES DE COMPARAÇÃO DE MÉDIAS MÚLTIPLAS
- 9.8.2. DESDOBRAMENTO DOS GL ASSOCIADOS A TRATAMENTOS EM CONTRASTES ORTOGONAIS
- 9.9. CONSIDERAÇÕES FINAIS
- DELINEAMENTO EM QUADRADO LATINO - DQL
- 10.1. INTRODUÇÃO
- 10.2. PRINCÍPIOS UTILIZADOS
- 10.2.1. REPETIÇÃO
- 10.2.2. CASUALIZAÇÃO
- 10.2.3. CONTROLE LOCAL
- 10.2.4. EXEMPLOS DE CAUSAS DE VARIAÇÃO CONTROLADAS POR ESTE DELINEAMENTO
- 10.3. VANTAGENS E DESVANTAGENS
- 10.3.1. VANTAGENS
- 10.3.2. DESVANTAGENS
- 10.4. MODELO ESTATÍSTICO
- 10.5. ESQUEMA DE CASUALIZAÇÃO DOS TRATAMENTOS
- 10.6. COLETA DE DADOS
- 10.7. ANÁLISE DE VARIÂNCIA
- 10.7.1. ESQUEMA DA ANÁLISE DE VARIÂNCIA
- 10.7.2. TESTE DE HIPÓTESES RELATIVAS AOS TRATAMENTOS
- 10.8. EXEMPLO COM UM MESMO NÚMERO DE REPETIÇÕES
- 10.8.1. TESTES DE COMPARAÇÃO DE MÉDIAS MÚLTIPLAS
- 10.8.2. DESDOBRAMENTO DOS GL DE TRATAMENTOS EM CONTRASTES ORTOGONAIS
- 10.9. CONSIDERAÇÕES FINAIS
- EXPERIMENTOS FATORIAIS
- 11.1. INTRODUÇÃO
- 11.2. CLASSIFICAÇÃO DOS EFEITOS
- 11.2.1. EFEITO PRINCIPAL
- 11.2.2. EFEITO DA INTERAÇÃO
- 11.3. VANTAGENS E DESVANTAGENS
- 11.3.1. VANTAGENS
- 11.3.2. DESVANTAGENS
- 11.4. MODELO ESTATÍSTICO
- 11.5. COLETA DE DADOS
- 11.6. ANÁLISE DE VARIÂNCIA
- 11.6.1. ESQUEMA DA ANÁLISE DE VARIÂNCIA
- 11.6.2. TESTES DE HIPÓTESES
- 11.7. EXEMPLOS
- 11.7.1. EXPERIMENTO MONTADO NO DIC COM INTERAÇÃO NÃO SIGNIFICATIVA
- 11.7.2. EXPERIMENTO MONTADO NO DIC COM INTERAÇÃO SIGNIFICATIVA
- 11.7.3. EXPERIMENTO MONTADO NO DBC COM INTERAÇÃO SIGNIFICATIVA
- 11.7.4. EXPERIMENTO MONTADO NO DIC COM INTERAÇÃO SIGNIFICATIVA
- EXPERIMENTOS EM PARCELAS SUBDIVIDIDAS
- 12.1. INTRODUÇÃO
- 12.2. FATORIAL VS. PARCELA SUBDIVIDIDA
- 12.3. CLASSIFICAÇÃO DOS EFEITOS
- 12.3.1. EFEITO PRINCIPAL
- 12.3.2. EFEITO DA INTERAÇÃO
- 12.4. VANTAGENS E DESVANTAGENS
- 12.4.1. VANTAGENS
- 12.4.2. DESVANTAGENS
- 12.5. MODELO ESTATÍSTICO
- 12.6. COLETA DE DADOS
- 12.7. ANÁLISE DE VARIÂNCIA
- 12.7.1. TESTE DE HIPÓTESES
- 12.8. EXEMPLO: PARCELA SUBDIVIDIDA NO ESPAÇO
- 12.8.1. TESTE DE TUKEY APLICADO AOS EFEITOS PRINCIPAIS
- 12.9. EXEMPLO: PARCELA SUBDIVIDIDA NO TEMPO
- 12.9.1. DESDOBRAMENTO DA INTERAÇÃO
- CORRELAÇÃO LINEAR SIMPLES
- 13.1. INTRODUÇÃO
- 13.2. DEFINIÇÃO
- 13.3. CONCEITOS E COMPREENSÃO A PARTIR DE UM EXEMPLO
- 13.4. PRESSUPOSIÇÕES DA CORRELAÇÃO
- INTRODUÇÃO AO ESTUDO DE REGRESSÃO LINEAR SIMPLES
- 14.1. INTRODUÇÃO
- 14.1.1. CRITÉRIOS PARA SE AJUSTAR UMA RETA
- 14.1.2. AJUSTANDO UMA RETA
- 14.2. ANÁLISE DE VARIÂNCIA DA REGRESSÃO
- 14.2.1. CÁLCULOS ALTERNATIVOS DA SOMA DE QUADRADOS DOS DESVIOS
- 14.2.2. COEFICIENTE DE DETERMINAÇÃO DA REGRESSÃO
- 14.2.3. RELAÇÃO ENTRE O COEFICIENTE DE DETERMINAÇÃO E O COEFICIENTE DE CORRELAÇÃO
- 14.2.4. OBSERVAÇÕES A RESPEITO DA REGRESSÃO
- 14.2.5. ANÁLISE DE REGRESSÃO DE DADOS PROVENIENTES DE DELINEAMENTOS EXPERIMENTAIS
- 14.3. CRITÉRIOS PARA DECISÃO DE UM MODELO AJUSTADO E CONSIDERAÇÕES FINAIS
- 14.4. EXEMPLO DE ANÁLISE COMPLETA DE UM EXPERIMENTO
- TRANSFORMAÇÃO DE DADOS
- 15.1. INTRODUÇÃO
- 15.2. TRANSFORMAÇÃO ANGULAR
- 15.2.1. PRESSUPOSIÇÕES
- 15.2.2. USO
- 15.2.3. RECOMENDAÇÕES
- 15.1. TRANSFORMAÇÃO RAIZ QUADRADA
- 15.1.1. PRESSUPOSIÇÕES
- 15.1.2. USO
- 15.1.3. RECOMENDAÇÕES
- 18.1.1. DICAS ÚTEIS
- 15.2. TRANSFORMAÇÃO LOGARÍTMICA
- 15.2.1. PRESSUPOSIÇÕES
- 15.2.2. USO
- 15.2.3. RECOMENDAÇÕES
- 15.2.1. DICAS ÚTEIS
Literatura recomendada
BANZATTO, D.A & KRONKA, S.N. Experimentação agrícola. Jaboticabal: FUNEP,
1989. 247p.
COCHRAN, W.G & COX, G.M. Experimental design. 2. Ed. New York: John Wiley, 1957.
462p.
KACHIGAN, S.K. Statistical analysis: an interdisciplinary introduction to univariate &
multivariate methods. New York: Radius Press. 1986. 589p.
STORK, L.; GARCIA, D.C; LOPES, S.J. ESTEFANEL,V. Experimentação vegetal.
Santa Maria: Ed. UFSM, 2000. 198p.
ZAR, J.H. Biostatistical analysis. 4 ed. New Jersey: Prentice Hall. 1999. 663p. app 1-
Observações:
A literatura recomendada está listada por ordem alfabética dos autores.
Em caso da opção para aquisição textos de referência na língua portuguesa, para
compor a biblioteca pessoal, recomenda-se BANZATTO, D.A & KRONKA, S.N, e
ou, STORK et al.
ZAR, J.H. possui a seguinte referência na biblioteca da UESC:
o 574.
o Z 36 bio
Recursos disponíveis na WWW
Em função dos recursos didáticos avançados, recomenda-se que os laboratórios
virtuais de estatística disponíveis na WWW sejam regularmente usados, pois são de
inestimável valia para o aprendizado da estatística.
Os laboratórios indicados, além das experiências virtuais disponíveis,
disponibilizam programas e links que permitem análises de dados em tempo real,
podendo ser usados para o aprendizado, resoluções de exercícios e avaliações.
Laboratórios virtuais disponíveis na Internet
http://www.ruf.rice.edu/~lane/rvls.html
http://www.kuleuven.ac.be/ucs/java/
http://www.stat.vt.edu/~sundar/java/applets/
http://www.isds.duke.edu/sites/java.html
Site para análises on-line
http://www.stat.sc.edu/webstat/
Exemplos de recursos disponíveis na WWW
Distribuições amostrais
Figura 0.1 - Excelente para entender o teorema central do limite.
http://www.ruf.rice.edu/~lane/stat_sim/sampling_dist/index.html
Distribuição normal
Análise de variância – ANOVA
Figura 0.4 – Indispensável para entender os fundamentos da ANOVA permitindo a
simulação de dados com o uso do mouse.
http://www.ruf.rice.edu/~lane/stat_sim/one_way/index.html
Simbologia adotada no curso
Medida Populacional
Amostral
(estimativa ou estatística)
Média μ m
Mediana Md md
Moda Mo mo
Variância σ^2 s^2
Desvio padrão σ s
Desvio padrão relativo DPR dpr
Coeficiente de variação CV cv
Número de elementos N n
Correlação ρ r
Covariância COV cov
Parâmetro genérico^ θ θ
Variável Valor observado Valor estimado
Variável aleatória Y Y
Sigla/Símbolo Significado
GL , gl ou j Graus de liberdade
SQD Soma do quadrado dos desvios em relação à média
QMD Quadrado médio dos desvios em relação à média
O termo parâmetro ( θ ) refere-se a toda e qualquer característica medida em populações, enquanto a estimativa do parâmetro ( θ
) é o correlato obtido em amostras
representativas.
O termo grau de liberdade (GL, gl ou j) geralmente nos informa sobre o tamanho
da amostra a partir da qual alguma estimativa ou estatística foi calculada. Na análise de
contrastes a cada um é atribuído 1 GL e o mesmo é feito na análise de regressão onde
cada parâmetro estimatido no modelo recebe também 1 GL.
Calculadoras e aproximações em estatística
aproximações sucessivas levam a distorções consideráveis no resultado final, podendo
levar a conclusões equivocadas.
Em geral 2 ou 3 casas decimais são suficientes para a maioria dos problemas
acadêmicos. Imagine que você está analisando algo que foi medido em metro (m), por
exemplo 1 m, com uma casa decimal você estaria dando importância a um decímetro
(1,0 m), com duas casas decimais você já estaria fazendo o mesmo com a um centímetro
(1,00 m), com 3 casas decimais ao milímetro (1,000 m) e assim por diante. Bem, na
grande maioria dos casos, quando estamos medindo algo em metro, aproximações finais
em nível de centímetro ou milímetro são satisfatórias. Mais que isto, por exemplo,
1,000000000 m, poderia ser considerado desnecessário pois você estaria dando
importância ao nanomêtro, visível apenas com o auxílio de microscópios potentes.
1.4. Um teste
Vamos supor duas séries de dados com 15 elementos cada uma:
B {14,1316,9411,5513,3618,1713,2814,1916,2812,1718,4612,5511,3412,1314,22 18,11} A {12,3114,5213,2314,7116,8219,3314,9917,9813,6714,1614,8514,6313,2417,6513,26} = =
Os seguintes procedimentos são necessários:
a. Calcular a média aritmética simples de cada série
m 14, m 15, B A = =
b. Diminuir cada valor das séries de suas respectivas médias
B {(14,13-14,46)(16,94-14,46)...(18,11- 14,46)} A {(12,31-15,02)(14,52-15,02)...(13,26-15,02)} = =
c. Para cada série elevar ao quadrado as diferenças e efetuar o somatório
B {(-0,33) (2,48) ... (3,65) } A {(-2,71) (-0,50) ... (-1,77) } 2 2 2 2 2 2 = + + + = + + +
d. Dividir cada resultado da etapa anterior (c) por 14
6 , 28 14 87, B 4 , 10 14 57, A = = = =
e. Dividir o maior pelo menor valor dos encontrados na etapa anterior (d) e
expressar o resultado final com duas casas decimais
Calculadoras e aproximações em estatística 1 , 53 4 , 10 6 , 28 =
Este é o resultado trabalhando com todos os resultados intermediários em
variáveis de memória. Deve-se realizar o teste acima considerando que afastamentos do
valor indicado (1,63) implicaram na adoção de procedimentos inadequados que
necessitam ser revistos e melhorados.
1.5. O que não deve ser feito
a. Não armazenar os valores das médias em variáveis de memória.
b. Subtrair os valores das médias aproximadas (15,02 e 14,46) e não dos valores
reais (15,02333... e 14,458666...).
c. Redigitar as diferenças aproximadas para elevar ao quadrado e depois redigitar
novamente os valores para efetuar o somatório.
d. Redigitar novamente os resultados anteriores para efetuar a divisão por 14.
e. Redigitar os valores aproximados anteriores para efetuar a divisão final.
É fácil perceber que devido às aproximações de resultados intermediários pode-
se chegar a resultados bem diferentes do real. Adicionalmente, as digitações ocasionam
erros (adicionais aos das aproximações) além da fadiga desnecessária.
Alguns estudantes realizam cálculos armazenando os valores das médias em
variáveis de memória, digitam cada valor da série, que é subtraído da média, elevado e
armazenado na memória de soma (M+). Posteriormente a soma final é recuperada e
dividida por 14. Embora seja um paliativo, este procedimento encontra-se muito aquém do
uso eficiente dos recursos disponíveis. Nas resoluções de exercícios toma muito tempo e
via de regra compromete as avaliações.
Existem varias formas alternativas de realizar os cálculos anteriores utilizando os
recursos das calculadoras científicas. A mais simples e usual é informar o valor de cada
série na memória estatística e solicitar a medida estatística de dispersão dos dados em
torno da média (variância amostral), armazenar cada valor (4,10 e 6,28) em variáveis de
memória e posteriormente realizar a divisão entre elas.
Outra forma interessante é trabalhar com as séries na forma de listas.
Exemplo:
4 , 10 14 57 , 40 {12,31 14,52...13,26}-15,02= {− 2 , 71 − 0 , 50 ...− 1 , 76 }^2 ={ 7 , 360 , 25 ... 3 , 11 }∑ → = Lista
Deve-se ter em mente que, além da necessidade da calculadora dispor dos
recursos necessários, é importante saber usá-los adequadamente. Assim, cada usuário
deve estudar o manual de instruções de sua calculadora pessoal a fim de que possa ter
clareza e domínio sobre os recursos disponíveis.
Revisão
2.1.3. Simbologia e cálculo
É simbolizada por μμμμ para populações e m para amostras.
2.1.3.1. Cálculo
N
∑^ y μ =
n
y
m
∑
Amostra A:
m
n
y
m A 1 , 69
∑
Amostra B:
m
n
y
m B 1 , 66
∑
2.1.4. Unidade de expressão
A unidade de expressão é a mesma da variável aleatória em questão. Para o
exemplo dado na Figura 2.1, altura de plantas, a unidade é o metro, m:
m
número
m m
Noun
y
ou m =
∑ ... μ
2.2. Variância
2.2.1. O que é
É uma medida estatística da dispersão dos dados em relação à média aritmética.
É definida como a esperança matemática da soma de quadrados dos desvios em
relação à média aritmética, ΣD
2
2.2.2. O que quantifica
Quantifica a dispersão dos dados em relação à média aritmética.
Permite distinguir séries de dados em relação à homogeneidade:
Séries homogêneas ⇒ menor valor da variância
Séries heterogêneas ⇒ maior valor da variância
Revisão
2.2.3. Simbologia e cálculo
É simbolizada por
σ 2
para populações e s^2 para amostras.
2.2.3.1. Cálculo
i. Populações :
N
∑^ D
2 σ 2 onde D = y − μ ou
N
N
y
y
2 2 2
σ =
ii. Amostras :
a. μ é conhecido (caso raro):
n
∑^ D
2 σ 2 onde D = y − μ ou
n
n
y
y
s
2 2 2
b. μ é desconhecido (caso comum):
2 2
n
d
s
onde d^ =^ y − m ou
2 2 2
n
n
y
y
s
2.2.4. Unidade de expressão
A unidade de expressão é a mesma da variável aleatória em questão, porém,
elevada ao quadrado. Para o exemplo dado na Figura 2.2, altura de plantas, a unidade é
o metro elevado ao quadrado, m
2
2 (^2222)
m
número
m m
Nou n
D ou d
ou s =
σ
2.2.5. Conceito
É muito comum a dificuldade do estudante compreender o significado das
medidas absolutas de dispersão (variância e do desvio padrão). Ou seja, compreender o
conceito, o fundamento, antecedendo a qualquer cálculo: