Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Estatitística Básica, Exercícios de Estatística

Para realizar os cálculos solicitados, sugere-se aos alunos que usem um programa de computador. O próprio Excel possui uma ferramenta de análise de dados que pode ser usada, mas poderiam ser utilizados SPSS, SAS, R, e

Tipologia: Exercícios

2024

Compartilhado em 15/06/2025

leonardo-evangelista-7
leonardo-evangelista-7 🇧🇷

4

(1)

5 documentos

1 / 21

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
1
DD118 ESTATÍSTICA BÁSICA
CASO PRÁTICO
Aluno: Leonardo Evangelista Ribeiro
Disciplina: DD118- Estatística Básica
Nome do mestrado ou especialização: Mestrado de infraestrutura e Engenharia Civil
Data: 07/07/2024
1.Situação.
No arquivo coches.xlsx, as características de 193 carros clássicos de várias marcas são
fornecidas de acordo com os dados publicados no Anuário Automobilístico Ward de 1985, com
o preço ajustado pela inflação em 2019.
Instruções para o desenvolvimento da atividade
A partir das informações fornecidas, responda às seguintes perguntas:
1. Pesquise qual marca de carro é a mais cara. Justifique a resposta.
2. Calcular um intervalo de confiança para o preço médio ajustado pela inflação de
cada marca.
3. Contraste a hipótese, para um nível de significância estatística de 99%, de que o
preço da Mazda e Subaru são diferentes.
4. Compare a hipótese, para um nível de significância de 95%, de que o preço dos
carros a diesel da Mercedes-Benz é mais alto que os carros a gasolina da própria
marca.
5. Desenvolva um modelo de regressão linear que permita estimar a variável
preço_inflação a partir das variáveis Capacidade_motor, Cavalos_potência,
Comprimento e peso. Qual das variáveis analisadas melhor explica o preço?
Esclarecimento: Para realizar os cálculos solicitados, sugere-se aos alunos que usem um
programa de computador. O próprio Excel possui uma ferramenta de análise de dados que pode
ser usada, mas poderiam ser utilizados SPSS, SAS, R, etc.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15

Pré-visualização parcial do texto

Baixe Estatitística Básica e outras Exercícios em PDF para Estatística, somente na Docsity!

DD118 – ESTATÍSTICA BÁSICA

CASO PRÁTICO

Aluno: Leonardo Evangelista Ribeiro Disciplina: DD118- Estatística Básica Nome do mestrado ou especialização: Mestrado de infraestrutura e Engenharia Civil Data : 07 /0 7 /

1.Situação.

No arquivo coches.xlsx, as características de 193 carros clássicos de várias marcas são fornecidas de acordo com os dados publicados no Anuário Automobilístico Ward de 1985, com o preço ajustado pela inflação em 2019.

Instruções para o desenvolvimento da atividade

A partir das informações fornecidas, responda às seguintes perguntas:

  1. Pesquise qual marca de carro é a mais cara. Justifique a resposta.
  2. Calcular um intervalo de confiança para o preço médio ajustado pela inflação de cada marca.
  3. Contraste a hipótese, para um nível de significância estatística de 99%, de que o preço da Mazda e Subaru são diferentes.
  4. Compare a hipótese, para um nível de significância de 95%, de que o preço dos carros a diesel da Mercedes-Benz é mais alto que os carros a gasolina da própria marca.
  5. Desenvolva um modelo de regressão linear que permita estimar a variável preço_inflação a partir das variáveis Capacidade_motor, Cavalos_potência, Comprimento e peso. Qual das variáveis analisadas melhor explica o preço? Esclarecimento: Para realizar os cálculos solicitados, sugere-se aos alunos que usem um programa de computador. O próprio Excel possui uma ferramenta de análise de dados que pode ser usada, mas poderiam ser utilizados SPSS, SAS, R, etc.

Embora o software de análise estatística seja usado para realizar os cálculos, a entrega será feita por meio de um relatório de resultados. Na resposta a cada pergunta, o aluno deve justificar teoricamente o método de solução escolhido e, em seguida, os cálculos feitos.

2. Estrutura do trabalho:

1. Pesquise qual marca de carro é a mais cara. Justifique a resposta. R. Para A Análise Da Marca de Carro Mais Cara, vamos analisar pelo preço médio dos carros disponíveis no arquivo base, conforme a tabela abaixo:

Tabela 1 - Preço médios dos carros

Marcas de carro Média de precio_inflacion alfa-romero 38300, audi 44135, bmw 64546, chevrolet 14844, dodge 19251, honda 20226, isuzu 22035, jaguar 85506, mazda 24346, mercedes-benz 83150, mercury 40783, mitsubishi 22833, nissan 25739, peugot 38277, plymouth 19679, porsche 77599, saab 37620, subaru 21107, toyota 24430, volkswagen 24904, volvo 44638, Fonte: (O autor adaptado dos arquivos bases Funiber,2024)

Pode ser mais representativo quando há variações significativas nos preços dos carros; Desvantagens: Uma média pode-se ser influenciada por valores atípicos, principalmente se dentro de uma mesma marca houverem diferentes padrões de preços, indo de um modelo mais barato ao mais caro. Pelo Preço mais alto individual Vantagens: Identifica o preço mais alto dentro todos os carros listados independentemente da média, é útil se o objetivo for qual modelo de carro e maior independentemente da distribuição de preços dentro da marca. Desvantagens: Não leva em conta a variação de preços dentro de cada marca, um preço alto pode ser apenas um modelo em específico, ao não referir o custo médio geral da marca. Portanto,a melhor solução dentro das listadas acima, dependerá de qual o contexto que for abordado para a análise, se for uma visão geral do custo médio, a média de preços mostra-se útil se o interesse foi entender o padrão dos preços médios, porém se a ideia for analisar qual o modelo é o mais caro individualmente, para saber o modelo de carro mais carro, como consequência a sua marca, a solução mais apropriada é o custo individual. Além do mais, ambas as análises são relevantes, sendo relevante ter acesso aos ambos dados para a compreensão mais completa da distribuição de preços e das características do amostra de modelos de carros disponíveis. 2.Calcular um intervalo de confiança para o preço médio ajustado pela inflação de cada marca. R. Para o cálculo do intervalo de confiança para o preço média ajustado pela infração de cada marca, incialmente, deve-se organizar a amostra pelas colunas, marca, preços médio, desvio padrão e contagem dos modelos de carros de cada marca, portanto, devemos seguir os seguintes passos: I. Calcular a média de cada marca II. Calcular o desvio padrão; utilizando III. Determinar o tamanho da amostra; Portanto, com o auxílio do excel, encontra-se o seguinte resultados: Tabela 3 - Marcas dos carros MARCAS DE CARRO

MÉDIA DE

PRECIO_INFLACION

DESVPAD DE

PRECIO_INFLACION

CONTAGEM DE

PRECIO_INFLACION

ALFA-ROMERO 38300,67 4287,40 3,

AUDI 44135,00 8531,68 6,

BMW 64546,13 22893,32 8,

CHEVROLET 14844,67 1864,70 3,

DODGE 19251,50 5808,09 8,

HONDA 20226,46 5094,99 13,

ISUZU 22035,00 7450,08 2,

JAGUAR 85506,00 5059,71 3,

MAZDA 24346,83 10792,64 12,

MERCEDES-

BENZ

MERCURY 40783,00 #DIV/0! 1,

MITSUBISHI 22833,77 7520,07 13,

NISSAN 25739,83 11064,80 18,

PEUGOT 38277,45 5552,19 11,

PLYMOUTH 19679,71 5919,95 7,

PORSCHE 77599,00 16134,52 4,

SAAB 37620,83 7069,63 6,

SUBARU 21107,75 4794,73 12,

TOYOTA 24430,41 7920,37 32,

VOLKSWAGEN 24904,33 5383,75 12,

VOLVO 44638,82 8191,36 11,

IV. Escolher o nível de confiança para o intervalo de confiança, geralmente utiliza-se um nível de 95% (o que significa há uma probabilidade de 95% de que o intervalo contenha o verdadeiro valor) V. Calcular o erro padrão da média, pela equação: Onde: S= desvio padrão N=tamanho da amostra VI. Calcular o intervalo da confiança, pela equação: Onde: X= é Z= é o valor crítico da distribuição normal padrão para o nível de confiança desejada. S= desvio padrão

Desse modo, é possível encontrar o valor do intervalo de confiança, conforme a tabela abaixo, na qual, utiliza-se o Excel com a fórmula: =INT.CONFIANÇA(alfa, desvio padrão, tamanho da amostra), calcula-se também o valor inferior e o valor superior. Tabela 4 - Intervalo de confiança Marcas de carro Média de precio_ inflacion Desv Pad de precio_ inflacio n Contag em de precio_ inflacio n alfa Inter_ confiança Lim_inf_ Confiança Lim_sup confiança alfa- romero

audi 44135,00^ 8531,68^ 6,00^ 0,05^ 6826,641273^ 37308,36^ 50961, bmw 64546,13^ 22893, 2

chevrol et

dodge 19251,50^ 5808,09^ 8,00^ 0,05^ 4024,725417^ 15226,77^ 23276, honda 20226,46^ 5094,99^ 13,00^ 0,05^ 2769,618421^ 17456,84^ 22996, isuzu 22035,00^ 7450,08^ 2,00^ 0,05^ 10325,09027^ 11709,91^ 32360, jaguar 85506,00^ 5059,71^ 3,00^ 0,05^ 5725,491597^ 79780,51^ 91231, mazda 24346,83^ 10792, 4

merce des- benz

mercur y

40783,00 #DIV/0! 1,00 0,

mitsub ishi

nissan 25739,83^ 11064, 0

peugot 38277,45^ 5552,19^ 11,00^ 0,05^ 3281,073379^ 34996,38^ 41558, plymo uth

porsch e

saab 37620,83^ 7069,63^ 6,00^ 0,05^ 5656,780502^ 31964,05^ 43277, subaru 21107,75^ 4794,73^ 12,00^ 0,05^ 2712,822053^ 18394,93^ 23820,

toyota 24430,41^ 7920,37^ 32,00^ 0,05^ 2744,218709^ 21686,19^ 27174, volksw agen

volvo 44638,82^ 8191,36^ 11,00^ 0,05^ 4840,698161^ 39798,12^ 49479, 3.Contraste a hipótese, para um nível de significância estatística de 99%, de que o preço da Mazda e Subaru são diferentes. R. Para análise de dados da questão, vamos organizar os dados da marca Mazda e Subaru, criando assim a tabela abaixo, com o auxílio do software Excel, selecionamos os dados necessário para as Hipótese, segue a tabela 5. Tabela 5 - Tabela questão 5 Marcas de carro Média de precio_inflacion DesvPad de precio_inflacion Contagem de precio_inflacion mazda 24346,83 10792,64 12, subaru 21107,75 4794,73 12, Portanto, segue os passos para o desenvolvimento das atividades: I. Existem duas hipóteses a serem trabalhadas, conforme mencionado abaixo: Onde a primeira, nos diz a respeito que a médio de preços do Subaru e Mazda, são iguais E a segunda nos diz a respeito que a média de preços são diferentes. II. Nível de significância (alfa): Confiança de 99 % (1 – confiança) = 1 – 0,99= 0,

Fonte: Proeducacional,

Portanto o valor de gl infinito, significa ser a distribuição normal, com a confiança

é de 99%, trace os eixos para encontrar o valor de Z, cujo o valor corresponde é de 2,576.

Se o valor-Z, calculado estiver além do +- 2,576, isso significa que os resultados

observados são tão extremos que ocorreriam com uma probabilidade menor que 0,005( ou

0,5%) se a hipótese nula fosse verdadeira.

Desse modo, rejeita-se a hipótese nula, em favor da hipótese alternativa:

Como o valor calculado de Z foi de 0,955 é muito menor que os 2,576. Indica que não a

evidências suficientes para rejeitar a hipótese nula de que os preços médios são iguais,

dado o nível de significância de 99%.

4. Compare a hipótese, para um nível de significância de 95%, de que o preço dos carros a diesel da Mercedes-Benz é mais alto que os carros a gasolina da própria marca. R. Com o Auxílio do software Excel, seleciona-se os fabricantes, tipo de combustível e o preço de inflação para auxiliar nos cálculos da hipótese. Tabela 6 - Marca VS combustível Vs preço da inflação fabricanfate combustible precio_inflacion mercedes- benz diesel 78092 mercedes- benz diesel 69631 mercedes- benz diesel 69808 mercedes- benz diesel 63146 mercedes- benz gas 112195 mercedes- benz gas 101223 mercedes- benz gas 86632 mercedes- benz gas 84478 Para melhorar os dados, selecionamos as marcas, com a contagem, média de preços e calculamos o desvio padrão da questão: Tabela 7 - Resumo dos dados Marcas de carro Contagem de combustible Média de precio_inflacion DesvPad de precio_inflacion Diesel 4 70169,25 6124, Gás 4 96132 13038,

V. Encontra o valor de Z crítico na tabela do teste bicaudal, no qual corresponde a área encontrada acima, portanto para a distribuição normal padrão onde a área sob a curva à direita. Z= 1, Como z calculado de - 1,599 é bem menor que 1,645, não podemos rejeitar a hipótese nula, portanto, não podemos concluir que o preço médio dos carros a diesel da Mercedes-Benz é maior significativamente que o preços dos carros a gasolina, com o nível de significância de 95%.

5. Desenvolva um modelo de regressão linear que permita estimar a variável preço_inflação a partir das variáveis Capacidade_motor, Cavalos_potência, Comprimento e peso. Qual das variáveis analisadas melhor explica o preço? R. Organiza-se os dados solicitados perante as variáveis solicitadas, entende-se que a varíavel dependente é o ( preço_inflação) e as demais variáveis são independentes (variáveis Capacidade_motor, Cavalos_potência, Comprimento e peso), para o modelo de regressão linear, com a utilização do software Excel, deverá ser acrescentado uma coluna com o valor 1, necessária para os cálculos. Tabela 8 - Dados questão 5 FABRICANTE LONGITU D PESO CAPACIDAD_ MOTOR CABALLOS_POTENCIA CO PRECIO_INFLACION ALFA- ROMERO

ALFA-

ROMERO

ALFA-

ROMERO

AUDI 176,6 2337 3,4 102 1 34475

AUDI 176,6 2824 3,4 115 1 43124

AUDI 177,3 2507 3,4 110 1 37687

AUDI 192,7 2844 3,4 110 1 43766

AUDI 192,7 2954 3,4 110 1 46756

AUDI 192,7 3086 3,4 140 1 59002

BMW 176,8 2395 2,8 101 1 40603

BMW 176,8 2395 2,8 101 1 41826

BMW 176,8 2710 3,19 121 1 51822

BMW 176,8 2765 3,19 121 1 52156

BMW 189 3055 3,19 121 1 60706

BMW 189 3230 3,39 182 1 76016

BMW 193,8 3380 3,39 182 1 102100

BMW 197 3505 3,39 182 1 91140

CHEVROLET 141,1 1488 3,03 48 1 12729

CHEVROLET 155,9 1874 3,11 70 1 15556

CHEVROLET 158,8 1909 3,11 70 1 16249

DODGE 157,3 1876 3,23 68 1 13770

DODGE 157,3 1876 3,23 68 1 15760

DODGE 157,3 2128 3,39 102 1 19664

DODGE 157,3 1967 3,23 68 1 15393

DODGE 157,3 1989 3,23 68 1 16538

DODGE 157,3 1989 3,23 68 1 18804

DODGE 174,6 2535 3,46 88 1 22046

DODGE 173,2 2811 3,9 145 1 32037

HONDA 144,6 1713 3,41 58 1 16011

HONDA 144,6 1819 3,41 76 1 16940

HONDA 150 1837 3,07 60 1 13342

  • MITSUBISHI 157,3 2145 3,39
  • MITSUBISHI 173 2370 3,46
  • MITSUBISHI 173 2328 3,46
  • MITSUBISHI 173,2 2833 3,86
  • MITSUBISHI 173,2 2921 3,86
  • MITSUBISHI 173,2 2926 3,86
  • MITSUBISHI 172,4 2365 3,46
  • MITSUBISHI 172,4 2405 3,46
  • MITSUBISHI 172,4 2403 3,46
  • MITSUBISHI 172,4 2403 3,46
  • NISSAN 165,3 1889 3,29
  • NISSAN 165,3 2017 3,47
  • NISSAN 165,3 1918 3,29
  • NISSAN 165,3 1938 3,29
  • NISSAN 170,2 2024 3,29
  • NISSAN 165,3 1951 3,29
  • NISSAN 165,6 2028 3,29
  • NISSAN 165,3 1971 3,29
  • NISSAN 170,2 2037 3,29
  • NISSAN 162,4 2008 3,29
  • NISSAN 173,4 2324 3,47
  • NISSAN 173,4 2302 3,47
  • NISSAN 181,7 3095 3,27
  • NISSAN 184,6 3296 3,27
  • NISSAN 184,6 3060 3,27
  • NISSAN 170,7 3071 3,27
  • NISSAN 170,7 3139 3,27
  • NISSAN 178,5 3139 3,27
  • PEUGOT 186,7 3020 3,19
  • PEUGOT 186,7 3197 3,52
  • PEUGOT 198,9 3230 3,19
  • PEUGOT 198,9 3430 3,52
  • PEUGOT 186,7 3075 2,19
  • PEUGOT 186,7 3252 3,52
  • PEUGOT 198,9 3285 2,19
  • PEUGOT 198,9 3485 3,52
  • PEUGOT 186,7 3075 3,19
  • PEUGOT 186,7 3252 3,52
  • PEUGOT 186,7 3130 3,21
  • PLYMOUTH 157,3 1918 3,23
  • PLYMOUTH 157,3 2128 3,39
  • PLYMOUTH 157,3 1967 3,23
  • PLYMOUTH 167,3 1989 3,23
  • PLYMOUTH 167,3 2191 3,23
  • PLYMOUTH 174,6 2535 3,46
  • PLYMOUTH 173,2 2818 3,86
  • PORSCHE 168,9 2778 3,11
  • PORSCHE 168,9 2756 2,9
  • PORSCHE 168,9 2756 2,9
  • PORSCHE 168,9 2800 2,9
  • SAAB 186,6 2658 3,07
  • SAAB 186,6 2695 3,07
  • SAAB 186,6 2707 2,07
  • SAAB 186,6 2758 3,07
  • SAAB 186,6 2808 3,07
  • SAAB 186,6 2847 3,07
  • SUBARU 156,9 2050 2,36
  • SUBARU 157,9 2120 2,64
  • SUBARU 157,3 2240 2,64
  • SUBARU 172 2145 2,64
  • SUBARU 172 2190 2,64
  • SUBARU 172 2340 2,64
  • SUBARU 172 2385 2,64
  • SUBARU 172 2510 2,64
  • SUBARU 173,5 2290 2,64
  • SUBARU 173,5 2455 2,64
  • SUBARU 173,6 2420 2,64
  • SUBARU 173,6 2650 2,64
  • TOYOTA 158,7 1985 3,03
  • TOYOTA 158,7 2040 3,03
  • TOYOTA 158,7 2015 3,03
  • TOYOTA 169,7 2280 3,03
  • TOYOTA 169,7 2290 3,03
  • TOYOTA 169,7 3110 3,03
  • TOYOTA 166,3 2081 3,03
  • TOYOTA 166,3 2109 3,03
  • TOYOTA 166,3 2275 3,35
  • TOYOTA 166,3 2275 3,35
  • TOYOTA 166,3 2094 3,03
  • TOYOTA 166,3 2122 3,03
  • TOYOTA 166,3 2140 3,03
  • TOYOTA 168,7 2169 3,03
  • TOYOTA 168,7 2204 3,03
  • TOYOTA 168,7 2265 3,08
  • TOYOTA 168,7 2300 3,08
  • TOYOTA 176,2 2540 3,5
  • TOYOTA 176,2 2536 3,5
  • TOYOTA 176,2 2551 3,5
  • TOYOTA 176,2 2679 3,5
  • TOYOTA 176,2 2714 3,5
  • TOYOTA 176,2 2975 3,5
  • TOYOTA 175,6 2326 3,54

I. Selecionar os dados e utilizar a ferramenta análise de dados: II. Na opção Y- selecionar as variáveis dependentes ( preço); III. Na opção X as variáveis independentes e a coluna constante; IV. Marcar a opção Rótulo e gere a regressão. Desse modo, o excel apresentará os seguintes resultados: RESUMO DOS RESULTADOS Estatística de regressão R múltiplo

R-Quadrado

R-quadrado ajustado

Erro padrão

Observações 193

ANOVA

gl SQ MQ F F de significação Regressão 5

2 1,19E+10 127,835927 2,22225E- 58

Resíduo 187

Total 192

Coeficientes Erro padrão Stat t valor-P Interseção - 24993,51096 16997,07324 - 1,47046 0, longitud - 64,07125015 123,7591745 - 0,51771 0, peso 21,49836103 3,689334965 5,827164 2,4261E-^08 capacidad_motor - 2565,616874 2250,887278 - 1,13982 0, caballos_potencia 215,1170807^ 29,49174691 7,294145 8,2768E-^12 Constante 0 0 65535 95% inferiores 95% superiores Inferior 95,0% Superior 95,0% Interseção - 58524,16482 8537,142893 - 58524,16482 8537, longitud - 308,2148144 180,0723141 - 308,2148144 180, peso 14,22029545 28,77642661 14,22029545 28, capacidad_motor - 7006,012061 1874,778313 - 7006,012061 1874, caballos_potencia 156,9377964 273,2963651 156,9377964 273, Constante 0 0 0 0 Para a analise dos resultados: I. Para interpretar os resultados, observe principalmente os coeficientes (indicam a direção e magnitude da relação entre cada variável preditora e a variável de resposta) e os valores p (indicam a significância estatística das variáveis preditoras). II. Com base nos coeficientes e nos valores p, identifique qual das variáveis Capacidade_motor, Cavalos_potencia, Longitud, Peso melhor explica Preço_inflação a escolha da variável será a de um coeficiente maior em magnitude (positivo ou negativo) e um valor p menor (geralmente < 0.05) é considerada mais significativa. Tendo como base as considerações acima, a variável peso e caballos de potência apresentam maiores coeficientes e o p menor que 0,05, logo a que melhor representa é a variável caballos potência. sentam