Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Heterocedasticidade em Regressão Linear: Conceito, Detecção e Correção, Provas de Estatística

Este documento aborda o conceito de heterocedasticidade em regressão linear, explicando que representa uma violação da hipótese de homocedasticidade. O texto discute como a heterocedasticidade pode ser detectada através do teste de breusch-pagan ou white, e apresenta exemplos de análises de regressão com e sem heterocedasticidade. Além disso, o documento discute a importância de erros-padrão robustos e mínimos quadrados ponderados para lidar com heterocedasticidade.

Tipologia: Provas

2022

Compartilhado em 07/11/2022

Picapal_amarelo
Picapal_amarelo 🇧🇷

4.6

(169)

224 documentos

1 / 6

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
1
1
Heterocedasticidade
y =
β
0+
β
1x1+
β
2x2+ . . .
β
kxk+ u
2
O que heterocedasticidade?
Lembre-se da hipótese de homocedasticidade:
condicional às variáveis explicativas, a variância
do erro, u, é constante.
Se isso não for verdade, ou seja, se a variância de
ué diferente para diferentes valores de x’s, então
os erros são heterocedásticos.
Exemplo: pense no gasto das famílias com
alimentação em função da renda; à medida que a
renda aumenta, aumenta a variância dos gastos em
alimentação.
3
.
xx1x2
f(y|x)
Exemplo of heterocedasticidade
x3
..E(y|x) =
β
0+
β
1x
4
Por que se preocupar com
heterocedasticidade?
MQO continua não tendencioso e
consistente, mesmo sem a hipótese de
homocedasticidade.
Mas os erros-padrão dos coeficientes
estimados serão viesados se há
heterocedasticidade.
Se os erros-padrão são viesados, não
podemos utilizar as estatísticas t,Fe LM
usuais.
5
Variância com
heterocedasticidade
( )
( )
( )
( ) ( )
( )
MQO. de resíduo o é
ˆ
onde ,
ˆ
é, quando válido,estimador Um
. onde ,
ˆ
e ,
ˆ
simples,linear regressão da caso o para O
2
2
2
22
i
2
2
2
2
1
2
11
i
x
ii
ix
x
ii
i
ii
u
SQT
uxx
xxSQT
SQT
xx
Var
xx
uxx
=
=
+=
σσ
σ
β
ββ
6
Variância com
heterocedasticidade (cont.)
( )
( )
regressão. dessa resíduos
dos quadrados dos soma a é e tes,independen
variáveisoutras as todasem de regressão
da resíduo o é
ˆ
onde ,
ˆˆ
ˆ
ˆ
é sticidadeheteroceda com
ˆ
da
válidoestimador um múltipla,linear regressão a Para
2
2
j
j
ij
j
iij
j
j
SQT
x
ésimoir
SQT
ur
rVa
Var
=
β
β
pf3
pf4
pf5

Pré-visualização parcial do texto

Baixe Heterocedasticidade em Regressão Linear: Conceito, Detecção e Correção e outras Provas em PDF para Estatística, somente na Docsity!

1

Heterocedasticidade

y = β 0 + β 1 x 1 + β 2 x 2 +... β kxk + u

2

O que heterocedasticidade?

Lembre-se da hipótese de homocedasticidade: condicional às variáveis explicativas, a variância do erro, u , é constante. Se isso não for verdade, ou seja, se a variância de u é diferente para diferentes valores de x ’s, então os erros são heterocedásticos. Exemplo: pense no gasto das famílias com alimentação em função da renda; à medida que a renda aumenta, aumenta a variância dos gastos em alimentação.

3

x 1 x 2 x

f( y|x )

Exemplo of heterocedasticidade

x 3

E( y | x ) = β 0 + β 1 x

4

Por que se preocupar com

heterocedasticidade?

MQO continua não tendencioso e

consistente, mesmo sem a hipótese de

homocedasticidade.

Mas os erros-padrão dos coeficientes

estimados serão viesados se há

heterocedasticidade.

Se os erros-padrão são viesados, não

podemos utilizar as estatísticas t , F e LM

usuais.

5

Variância com

heterocedasticidade

( ) ( )

( ) ( )

( ) ,ondeˆéoresíduodeMQO.

Umestimadorválido,quando ,é

ˆ ,onde.

ˆ ,e

Oparaocasodaregressãolinearsimples,

2

(^22)

2 2 i

2 2

(^22) 1

(^112)

i x

i i

x i x

i i

i

i i

u SQT

x x u

SQT x x SQT

x x Var

x x

x xu

6

Variância com

heterocedasticidade (cont.)

resíduosdessa regressão.

independentes,e éasomadosquadradosdos

regressãode emtodasasoutrasvariáveis

,ondeˆéo resíduoda

da ˆ comheterocedasticidadeé

Paraaregressãolinearmúltipla,umestimadorválido

2

2

j

j

ij j

iji j

j

SQT

x

r i ésimo SQT

ru Var

Var

β

β

7

Erros-padrão robustos

Agora que temos uma estimativa consistente da variância, sua raiz quadrada será uma estimativa do erro-padrão. Tais erros-padrão são chamados de erros-padrão robustos. Às vezes a variância estimada é corrigida pelos graus de liberdade, pela multiplicação por n /( n – k – 1 ). Quando n → ∞, essa correção faz pouca diferença.

8

Erros-padrão robustos (cont.)

É importante lembrar que esses erros-

padrão robustos têm justificativa apenas

assintótica – com amostras pequenas, as

estatísticas t ´s obtidas com os erros-padrão

robustos não terão distribuição próxima da

t , e as inferências não serão corretas.

No Gretl há a opção de se calcular tais

erros-padrão robustos.

9

Teste de heterocedasticidade

Queremos testar se H 0 : Var( u|x 1 , x 2 ,…, xk ) = σ^2 , que é equivalente a H 0 : E( u^2 |x 1 , x 2 ,…, xk ) = E( u^2 ) = σ^2. Se assumirmos que a relação entre u^2 e x j é linear, podemos testar uma restrição linear. Logo, para u^2 = δ 0 + δ 1 x 1 +…+ δ k xk + v , isso significa testar: H 0 : δ 1 = δ 2 = … = δ k = 0 (modelo é homocedástico).

10

O teste de Breusch-Pagan Não observamos o erros, mas podemos utilizar suas estimativas: os resíduos da regressão por MQO. Após fazer a regressão dos quadrados dos resíduos em todos os x ’s, podemos utilizar o R^2 para obter um teste F ou LM. A estatística F é simplesmente a estatística F da significância da regressão: F = [ R^2 / k ]/[(1 – R^2 )/( n – k – 1)], que tem distribuição Fk, n – k – 1. A estatística LM é LM = nR^2 , que tem distribuição χ^2 k.

11

Exemplo

Banco de dados Hprice1.gdt Verificar a heterocedasticidade em uma equação simples de preços de imóveis. Após fazer a regressão original, geramos os resíduos e o quadrado destes resíduos em todos os x ’s (Gravar Resíduos Quadrados – cria uma nova variável no banco de dados chamada usq1 ).

12

Exemplo

Modelo 1: Estimativas OLS usando as 88 observações 1- Variável dependente: price Variável Coeficiente Erro Padrão estatística-t p-valor const -21,7703 29,475 -0,7386 0, lotsize 0,00206771 0,000642126 3,2201 0,00182 *** sqrft 0,122778 0,0132374 9,2751 <0,00001 *** bdrms 13,8525 9,01015 1,5374 0, Média da variável dependente = 293, Desvio padrão da variável dependente = 102, Soma dos resíduos quadrados = 300724 Erro padrão dos resíduos = 59, R^2 não-ajustado = 0, R^2 ajustado = 0, Estatística-F (3, 84) = 57,4602 (p-valor < 0,00001) Verosimilhança-Logarítmica = -482, Critério de informação de Akaike = 973, Critério Bayesiano de Schwarz = 983, Critério de Hannan-Quinn = 977,

19

Exemplo Modelo 6: Estimativas OLS usando as 88 observações 1- Variável dependente: usq Variável Coeficiente Erro Padrão estatística-t p-valor const 5,04683 3,345 1,5088 0, yhat -1,70922 1,16333 -1,4692 0, yhatsqr 0,145135 0,100992 1,4371 0,

Média da variável dependente = 0, Desvio padrão da variável dependente = 0, Soma dos resíduos quadrados = 0, Erro padrão dos resíduos = 0, R^2 não-ajustado = 0, R^2 ajustado = 0, Estatística-F (2, 85) = 1,73275 (p-valor = 0,183) Verosimilhança-Logarítmica = 106, Critério de informação de Akaike = -207, Critério Bayesiano de Schwarz = -200, Critério de Hannan-Quinn = -204,

LM=88.(0,0392) P-valor 0,

20

Mínimos quadrados ponderados

Embora seja possível estimar os erros-padrão robustos para os estimadores de MQO, se soubermos alguma coisa sobre a forma específica da heterocedasticidade, poderemos obter estimadores mais eficientes que os de MQO. Como devemos especificar a natureza da heterocedasticidade, o processo de estimação é mais trabalhoso. A idéia básica é transformar o modelo em outro cujos erros sejam homocedásticos.

21

Exemplo de mínimos quadrados

ponderados

Suponha que a heterocedasticidade seja dada por Var( u| x ) = σ^2 h ( x ). h ( x ) é uma função das variáveis explicativas e determina a forma da heterocedasticidade, ou seja, como a variância dependerá de x. h ( x ) > 0 , pois a variância é positiva e h ( x ) é conhecida. O parâmetro populacional σ^2 não é conhecido, mas pode ser estimado através do uso dos dados.

22

Exemplo de mínimos quadrados

ponderados

Neste caso, a variância do erro é proporcional ao nível de renda. Quanto maior o nível de renda, maior a variância do termo de erro, ou seja, maior a variabilidade da poupança.

23

Exemplo de mínimos quadrados

ponderados

Como usamos a informação sobre o formato da heterocedasticidade para estimar os parâmetros do modelo e fazer inferência? Modelo original heterocedástico:

Temos que transformar esta equação de forma que os erros virem homocedásticos.

24

Exemplo de mínimos quadrados

ponderados

E( u i/√ h i| x ) = 0, pois h i é apenas uma função de x , e Var( u i/√ h i| x ) = σ^2. Logo, se dividirmos toda a equação por √ h i, teremos um modelo com erros homocedásticos.

25

Exemplo de mínimos quadrados

ponderados

Podemos obter os estimadores de tal forma que as propriedades de eficiência destes estimadores MQO sejam melhores do que no modelo anterior com presença de heterocedasticidade. No exemplo da poupança:

O novo modelo satisfaz as hipóteses do modelo linear clássico.

26

Mínimos quadrados

generalizados

A estimação da equação transformada por

MQO é um exemplo de mínimos quadrados

generalizados, MQG (ou GLS, em inglês).

MQG será BLUE neste caso.

MQG é igual aos mínimos quadrados

ponderados, MQP (ou WLS, em inglês)

onde cada resíduo ao quadrado é ponderado

pelo inverso da Var( ui| x i ).

27

Mínimos quadrados ponderados

(cont.)

A idéia é minimizar a soma dos quadrados

ponderados por 1/ h i.

Dá-se menos peso para as observações com

maior variância.

MQO é ótimo se conhecermos Var( ui| x i ).

Mas, em geral, não a conhecemos.

28

MQG Factível

Quando não conhecemos a forma da

heterocedasticidade, precisamos estimar

h ( x i).

Em geral, iniciamos com uma hipótese

flexível, tal como:

Var( u| x ) = σ^2 exp( δ 0 + δ 1 x 1 + …+ δk x k)

Precisamos, então, estimar os δ ´s.

29

MQGF (cont.)

Nossa hipótese implica que u^2 = σ^2 exp( δ 0 +

δ 1 x 1 + …+ δk x k) v ,

onde E( v| x ) = 1; então se E( v ) = 1:

ln( u^2 ) = α 0 + δ 1 x 1 + …+ δk x k + e ,

onde E( e ) = 1 e e é independente dos x ´s.

Agora, podemos substituir u por û , e

estimar a equação por MQO.

30

MQGF (cont.)

A estimativa de h é obtida por ĥ = exp( ĝ ); o peso será o inverso dessa estimativa. Resumindo: Faça a regressão por MQO da equação original, salve os resíduos, û , eleve-os ao quadrado e tire o log. Faça a regressão de ln( û^2 ) em todas as variáveis independentes o obtenha o valor ajustado ĝ. Faça a regressão por MQP utilizando 1/exp( ĝ ) como ponderador.