Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Capitulo 9 Teoria dos Jogos Jogos na Forma Normal, Notas de aula de Teoria dos Jogos

No curso de Microeconomia 1 nós estudamos a teoria da decisão individual. Isto é, nós estudamos como um agente econômico isolado faz suas escolhas.

Tipologia: Notas de aula

2022

Compartilhado em 07/11/2022

Pernambuco
Pernambuco 🇧🇷

4.2

(45)

225 documentos

1 / 39

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Capítulo 9
Teoria dos Jogos - Jogos na Forma
Normal
9.1 Introdução
No curso de Microeconomia 1 nós estudamos a teoria da decisão individual. Isto é, nós
estudamos como um agente econômico isolado faz suas escolhas. Na primeira parte do curso
de Microeconomia 2 nós nos concentramos na teoria do equilíbrio geral. Embora a teoria
de equilíbrio geral aceite a presença de diversos agentes, a hipótese é que os diversos
agentes econômicos desconsideram o efeito que as suas decisões vão ter nas decisões dos
outros agentes. Desta forma, a teoria do equilíbrio geral ignora completamente quaisquer
considerações estratégicas que um agente possa ter na hora de tomar uma decisão.
A teoria do equilíbrio geral é muito útil e tem diversas aplicações em economia, mas
algumas situações econômicas relevantes são inerentemente estratégicas, o que nos faz ter
interesse em teorias que possam ser aplicadas a tais situações. Considere os seguintes
exemplos:
Exemplo 9.1 (Problema dos Sorveteiros).Suponha que tenhamos uma praia que seja
atendida por dois sorveteiros. Para simplicar, suponha que as pessoas estejam distribuídas
de maneira igual por toda a praia. Onde será que os dois sorveteiros vão se posicionar? Tal
problema ainda não está totalmente especicado, mas nós podemos perceber que este é
um problema totalmente estratégico. O lucro do sorveteiro vai depender de onde ele e de
onde o seu concorrente estiverem posicionados. Mais ainda, o sorveteiro sabe disto, o seu
concorrente sabe disto, ele sabe que o seu concorrente sabe disto, etc.. Fica claro, que as
teorias que estudamos até agora não são capazes de lidar com tal problema.
Exemplo 9.2 (Duopólio).Suponha que somente duas empresas vendam o produto y. Existe
um grande número de consumidores no mercado, de modo que os consumidores vão agir como
tomadores de preço. O problema das duas empresas agora é escolher que preço eles devem
cobrar pelo produto yde modo a maximizar os seus lucros. Novamente, o problema acima
ainda não está totalmente especicado, mas nós podemos perceber que ele também é um
problema estratégico. O lucro de cada uma das empresas vai depender do preço que ela
está cobrando e do preço que a sua concorrente está cobrando. Por outro lado, ambas as
101
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27

Pré-visualização parcial do texto

Baixe Capitulo 9 Teoria dos Jogos Jogos na Forma Normal e outras Notas de aula em PDF para Teoria dos Jogos, somente na Docsity!

Capítulo 9

Teoria dos Jogos - Jogos na Forma

Normal

9.1 Introdução

No curso de Microeconomia 1 nós estudamos a teoria da decisão individual. Isto é, nós estudamos como um agente econômico isolado faz suas escolhas. Na primeira parte do curso de Microeconomia 2 nós nos concentramos na teoria do equilíbrio geral. Embora a teoria de equilíbrio geral aceite a presença de diversos agentes, a hipótese lá é que os diversos agentes econômicos desconsideram o efeito que as suas decisões vão ter nas decisões dos outros agentes. Desta forma, a teoria do equilíbrio geral ignora completamente quaisquer considerações estratégicas que um agente possa ter na hora de tomar uma decisão. A teoria do equilíbrio geral é muito útil e tem diversas aplicações em economia, mas algumas situações econômicas relevantes são inerentemente estratégicas, o que nos faz ter interesse em teorias que possam ser aplicadas a tais situações. Considere os seguintes exemplos:

Exemplo 9.1 (Problema dos Sorveteiros). Suponha que tenhamos uma praia que seja atendida por dois sorveteiros. Para simpli car, suponha que as pessoas estejam distribuídas de maneira igual por toda a praia. Onde será que os dois sorveteiros vão se posicionar? Tal problema ainda não está totalmente especi cado, mas nós já podemos perceber que este é um problema totalmente estratégico. O lucro do sorveteiro vai depender de onde ele e de onde o seu concorrente estiverem posicionados. Mais ainda, o sorveteiro sabe disto, o seu concorrente sabe disto, ele sabe que o seu concorrente sabe disto, etc.. Fica claro, que as teorias que estudamos até agora não são capazes de lidar com tal problema.

Exemplo 9.2 (Duopólio). Suponha que somente duas empresas vendam o produto y. Existe um grande número de consumidores no mercado, de modo que os consumidores vão agir como tomadores de preço. O problema das duas empresas agora é escolher que preço eles devem cobrar pelo produto y de modo a maximizar os seus lucros. Novamente, o problema acima ainda não está totalmente especi cado, mas nós já podemos perceber que ele também é um problema estratégico. O lucro de cada uma das empresas vai depender do preço que ela está cobrando e do preço que a sua concorrente está cobrando. Por outro lado, ambas as

102 CAPÍTULO 9. TEORIA DOS JOGOS - JOGOS NA FORMA NORMAL

empresas sabem que a sua decisão de preço vai afetar a decisão de preço da concorrente. Como saber o que vai acontecer em tal situação?

Os dois exemplos acima mostram que nós precisamos de novas ferramentas para podermos estudar situações econômicas em que situações estratégicas estejam envolvidas. A ferramenta usada em economia para tanto é conhecida como Teoria dos Jogos.

9.2 O Conceito de Jogo

Nesta seção nós estudaremos o conceito de jogo. Um jogo para nós consistirá de três elementos. Primeiramente, nós temos um conjunto de jogadores, digamos J := f 1 ; 2 ; :::; N g. Para cada jogador i 2 J nós associamos um conjunto de ações ou estratégias Ai. Finalmente, nós precisamos de algo que represente as regras do jogo. Para nós as regras do jogo vão ser representadas pelo que nós chamamos de funções de ganho dos agentes. A função de ganho do agente i, por exemplo, é simplesmente uma função que nos diz qual o prêmio que o agente i recebe dadas as estratégias usadas por todos os jogadores. Ou seja, dado um vetor (a 1 ; a 2 ; :::; aN ) em que para cada j, aj 2 Aj , a função de ganho U i^ do agente i associa um número real U i^ (a 1 ; :::; aN ) que representa o prêmio que o agente i recebe em tal situação. Em geral, nós chamamos um vetor de estratégias (a 1 ; a 2 ; :::; aN ), de per l de estratégias.

Exemplo 9.3 (Problema do Sorveteiro Revisitado). Uma forma de modelar o problema dos sorveteiros como um jogo é representar a praia simplesmente como um segmento de reta ou intervalo. Digamos que nós representemos a praia como o intervalo fechado [0; 1]. Agora o problema de cada um dos sorveteiros é simplesmente escolher uma posição, ou número, entre 0 e 1. Ou seja, em tal problema os conjuntos de estratégias dos jogadores são dados por A 1 = A 2 = [0; 1]. Finalmente, para completar a descrição do jogo nós só precisamos de duas funções U 1 e U 2 que para cada par de de números a 1 e a 2 entre 0 e 1 nos diga qual o ganho de cada agente. Isto é, U 1 (a 1 ; a 2 ) nos dirá qual o ganho do sorveteiro 1 quando o sorveteiro 1 se coloca na posição a 1 e o sorveteiro 2 se coloca na posição a 2. De forma similar, U 2 (a 1 ; a 2 ) nos diz qual o ganho do sorveteiro 2 nesta mesma situação.9.

Figura 9.1: Representação grá ca do problema dos sorveteiros

9.1 (^) Dependendo da nossa modelagem o ganho de cada um dos sorveteiros pode ser, por exemplo, o seu lucro

ou número de sorvetes vendidos. Quanto cada sorveteiro vende dada as suas posições na praia vai depender de hipóteses adicionais que nós incorporaremos ao modelo no futuro.

104 CAPÍTULO 9. TEORIA DOS JOGOS - JOGOS NA FORMA NORMAL

seus primórdios a teoria dos jogos dedicou bastante atenção a tais jogos, nem tanto por sua importância econômica, mas sim por ser este um dos únicos tipos de jogo que eles sabiam analisar satisfatoriamente. Após a introdução do conceito de equilíbrio de Nash, que nós estudaremos mais a frente, a importância relativa dos jogos de soma zero diminuiu bastante.

Consideremos mais um exemplo.

Exemplo 9.6 (Batalha dos Sexos). Suponha agora que os jogadores 1 e 2 sejam um casal. Os jogadores têm que decidir aonde ir no sábado a noite. Jogador 1 é a mulher e ela prefere ir para uma discoteca. Já o jogador 2 prefere ir para o seu bar favorito. Como eles são um casal muito apaixonado, caso ambos vão para locais diferentes eles não derivam nenhuma utilidade. Tal situação pode ser representada pelo seguinte jogo:

Homem

Mulher

D B

D 3 ; 1 0 ; 0

B 0 ; 0 1 ; 3

9.4 Jogos Resolvíveis por Dominância

Acima nós vimos que algumas situações econômicas relevantes podem ser representadas pelo conceito de jogo. É claro que uma teoria só é útil se nós pudermos usá-la para fazer previsões. No caso de uma jogo, nós estamos principalmente interessados em saber que estratégias serão usadas pelos jogadores naquele contexto. Na linguagem de teoria dos jogos, em geral nós estamos interessados em saber qual é a solução do jogo. Vários conceitos de solução já foram discutidos na literatura. O mais famoso, é claro, é o conceito de equilíbrio de Nash. Nós estudaremos tal conceito mais tarde. Agora nós nos concentraremos em um conceito de solução mais básico que, embora não possa ser aplicado para todos os jogos, quando aplicável gera previsões claras, intuitivas, e empiricamente consistentes.

9.4.1 Estratégia Dominante

Suponha que tenhamos um jogo em que o conjunto de jogadores seja dado por J = f 1 ; :::; N g. Dado um jogador qualquer i, nós dizemos que uma estratégia a i 2 Ai é uma estratégia estritamente dominante para o jogador i se, independentemente das estratégias que os outros jogadores estejam jogando, a estratégia a i é a única melhor estratégia para o jogador i. Formalmente, a i é uma estratégia estritamente dominante para o jogador i se para qualquer per l de estratégias (a 1 ; :::; aN ), com aj 2 Aj para todo j e ai 6 = a i ,

U i^ (a 1 ; :::; a i ; :::; aN ) > U i^ (a 1 ; :::; ai; :::; aN ).

Ou seja, não importa o que os outros jogadores estejam jogando, jogar a i é estritamente melhor para o jogador i do que jogar qualquer outra estratégia.

9.4. JOGOS RESOLVÍVEIS POR DOMINÂNCIA 105

9.4.2 Solução por Estratégias Estritamente Dominantes

Suponha agora que todos os jogadores tenham uma estratégia estritamente dominante. É de se esperar que neste caso todos os jogadores usem exatamente as suas estratégias dominantes. Quando isto acontece nós dizemos que o jogo é resolvível por estratégias estritamente dominantes.

Exemplo 9.7 (Dilema dos Prisioneiros). Dois indivíduos são presos por um crime grave e colocados em celas separadas. O delegado tenta obter uma con ssão. Cada um deles, separadamente, recebe a seguinte informação: se um deles confessar e o outro não, quem confessou receberá uma pena leve de apenas um ano e o que não confessou receberá uma pena de dez anos. Caso ambos confessem, os dois receberão uma pena de cinco anos. Se ninguém confessar ainda é possível condenar ambos por um crime menor. Neste caso ambos recebem uma pena de dois anos. Tal situação pode ser representada pelo seguinte jogo em forma matricial:

Prisioneiro 2

Prisioneiro 1

C N

C 5 ; 5 1 ; 10

N 10 ; 1 2 ; 2

No jogo acima, independentemente do que o jogador (prisioneiro) 2 esteja jogando, a melhor estratégia para o jogador 1 é confessar. A mesma coisa acontece para o jogador 2. Portanto, o jogo acima é resolvível por estratégias estritamente dominantes e sua solução é (C; C). Ou seja, o conceito de solução por estratégias estritamente dominantes nos diz que dado o jogo acima os dois prisioneiros confessariam. De fato, dada a matriz de ganhos acima, é difícil imaginar que os jogadores agiriam de forma diferente.

No exemplo acima, embora o jogo tenha uma solução bem natural, nós podemos observar que o ganho nal dos agentes não parece ser muito bom, dadas as opções que eles tinham. Em particular, caso ambos não confessassem os dois obteriam um ganho estritamente maior. Ou seja, em termos de ganhos, a solução do jogo não é e ciente no sentido de Pareto. Esta é uma característica marcante de situações estratégicas. Nós vamos ver que em geral, independentemente do conceito de solução usado, as soluções de jogos não têm que ser e cientes.

Jogos resolvíveis por estratégias estritamente dominantes são a melhor situação que podemos encontrar em teoria dos jogos. A solução de tais jogos é simples, intuitiva e geralmente corresponde ao que esperaríamos que ocorresse na vida real. O único problema com tal conceito de solução é que poucos jogos podem ser resolvidos desta maneira. Por exemplo, considere o exemplo do par ou ímpar acima. Suponha que o jogador que pediu ímpar esteja jogando um número ímpar. Neste caso a melhor estratégia para o jogador Par é jogar também um número ímpar. Por outro lado, se o jogador Ímpar estiver jogando um número par, então é melhor para par jogar um número par. Nós vemos que o jogador par não tem uma estratégia dominante neste caso. Uma análise similar mostra que o jogador ímpar também não tem uma estratégia dominante. Também no jogo Batalha dos Sexos nenhum jogador tem uma estratégia dominante. Você consegue ver isto?

9.5. ELIMINAÇÃO ITERATIVA DE ESTRATÉGIAS DOMINADAS 107

Exemplo 9.9 (Amigo do Juiz). Considere a seguinte variação do dilema dos prisioneiros:

Prisioneiro 2

Prisioneiro 1

C N

C 5 ; 5 1 ; 10

N 10 ; 1 0 ; 2

A estória agora (admitidamente um pouco boba) é que o prisioneiro 1 é amigo do juiz. Desta forma, quando nenhum dos prisioneiros confessa, ele consegue escapar sem nenhuma pena. Nas demais situações os ganhos de ambos são exatamente iguais aos ganhos no jogo original. Observe que agora confessar não é mais uma estratégia estritamente dominante para o jogador 1. Quando o jogador 2 não estiver confessando a melhor coisa para o jogador 1 seria não confessar. Portanto, agora o jogo não é mais resolvível por dominância. Mas considere a análise que zemos acima. Ao olhar as opções do jogador 2, o jogador 1 percebe que a estratégia N é estritamente dominada pela estratégia C para aquele jogador. Portanto, sendo o jogador 1 alguém extremamente racional, ele desconsiderará a possibilidade de que o jogador 2 possa jogar N. Mas agora o jogo simpli ca-se para

Prisioneiro 2

Prisioneiro 1

C

C 5 ; 5

N 10 ; 1

Mas agora jogar C é uma estratégia estritamente dominante para o jogador 1, ou, alternativamente, N é estritamente dominada por C para o jogador 1. Se eliminarmos N do jogo acima camos, novamente, com a previsão única de que os dois jogadores vão confessar.

Nos dois exemplo acima a eliminação de uma única estratégia estritamente dominada já foi su ciente para simpli car o jogo até um ponto que este pudesse ser resolvido por dominância. Em geral, os nossos agentes em economia são bem mais racionais do que isto e nós assumimos que eles podem aplicar o conceito de eliminação de estratégias estritamente dominadas inúmeras vezes. Considere o seguinte exemplo, aparentemente complexo, mas na verdade simples:

Jogador 2

Jogador 1

A B C D

E 0 ; 7 2 ; 5 4 ; 0 2 ; 1

F 5 ; 2 3 ; 3 5 ; 2 0 ; 1

G 7 ; 0 2 ; 5 0 ; 7 0 ; 1

H 0 ; 0 0 ; 0 0 ; 0 9 ; 1

Se você tiver paciência, você pode checar que nenhum jogador tem uma estratégia dominante no jogo acima. Por outro lado, vemos que a estratégia D é estritamente dominada pela estratégia B. Portanto, se aplicarmos o raciocínio de eliminação de estratégias estritamente

108 CAPÍTULO 9. TEORIA DOS JOGOS - JOGOS NA FORMA NORMAL

dominadas nós podemos simpli car o jogo acima para

Jogador 2

Jogador 1

A B C

E 0 ; 7 2 ; 5 4 ; 0

F 5 ; 2 3 ; 3 5 ; 2

G 7 ; 0 2 ; 5 0 ; 7

H 0 ; 0 0 ; 0 0 ; 0

Mas agora, no jogo simpli cado acima, vemos que a estratégia H é estritamente dominada pela estratégia F. Novamente, aplicando o conceito de eliminação de estratégias estritamente dominadas nós obtemos o seguinte jogo, ainda mais simples:

Jogador 2

Jogador 1

A B C

E 0 ; 7 2 ; 5 4 ; 0

F 5 ; 2 3 ; 3 5 ; 2

G 7 ; 0 2 ; 5 0 ; 7

Continuando com o mesmo procedimento, agora observe que a estratégia E é estritamente dominada pela estratégia F. O jogo reduz-se para

Jogador 2

Jogador 1

A B C

F 5 ; 2 3 ; 3 5 ; 2

G 7 ; 0 2 ; 5 0 ; 7

Agora a estratégia que é estritamente dominada é do jogador 2. Observe que A é estritamente dominada por B, o que nos dá o seguinte jogo:

Jogador 2

Jogador 1

B C

F 3 ; 3 5 ; 2

G 2 ; 5 0 ; 7

Agora G é estritamente dominada por F e o jogo simpli ca-se para

Jogador 2

Jogador 1

B C

F 3 ; 3 5 ; 2

Finalmente, agora C é estritamente dominada por B, o que nos dá a previsão única de que no jogo acima os jogadores acabarão jogando F e B.

9.5.3 Eliminação de Estratégias Fracamente Dominadas

A primeira vista, a nossa de nição de uma estratégia estritamente dominada parece ser muito restritiva. Lembre-se que tal de nição considera uma estratégia estritamente dominada

110 CAPÍTULO 9. TEORIA DOS JOGOS - JOGOS NA FORMA NORMAL

de solução por dominãncia. Isto é, todo jogo que é resolvível por dominância é também resolvível por eliminação iterativa de estratégias estritamente dominadas e a solução é a mesma.9. Mesmo sendo mais geral do que o método de solução por dominância, ainda existem vários jogos em que o processo de eliminação iterativa de estratégias estritamente dominadas não nos dá uma solução. Algumas vezes, como no jogo (9.5) acima, tal método até simpli ca o jogo, mas não nos fornece uma previsão clara do que os dois jogadores vão fazer. Nesta seção nós estudaremos o conceito de equilíbrio de Nash. Tal conceito nos fornecerá o método de solução mais utilizado em teoria dos jogos. Nós começamos com o conceito de uma melhor resposta.

9.6.1 Melhores Respostas

Suponha que tenhamos um jogo com N jogadores. Fixe um jogador i qualquer e considere um per l de estratégias (a 1 ; :::; ai 1 ; ai+1; :::; aN ) dos outros jogadores. Nós podemos fazer a seguinte pergunta: dado que os outros jogadores estão jogando (a 1 ; :::; ai 1 ; ai+1; :::; aN ) qual a melhor estratégia (ou as melhores estratégias) para o jogador i. Ou seja, nós podemos tentar encontrar as estratégias ai 2 Ai que resolvem o seguinte problema de maximização:

max ai 2 Ai

U i^ (a 1 ; :::; ai; :::; aN )

As estratégias do jogador i que resolvem o problema acima são chamadas de melhores respostas do jogador i a (a 1 ; :::; ai 1 ; ai+1; :::; aN ). É interessante termos uma notação para representar, dado um per l de estratégias dos outros jogadores, as melhores respostas do jogador i. De na a correspondência de melhores respostas Bi^ do jogador i, como um mapa que associa a cada per l de estratégias dos outros jogadores, o conjunto de alternativas do jogador i que são melhores respostas àquele per l. Formalmente, dado um per l de estratégias (a 1 ; :::; ai 1 ; ai+1; :::; aN ) para os outros jogadores, de na Bi^ (a 1 ; :::; ai 1 ; ai+1; :::; aN ) como o conjunto de estratégias do jogador i que resolvem o problema de maximização acima.

Exemplo 9.10. Considere o seguinte jogo:

Jogador 2

Jogador 1

A B C D

E 0 ; 7 2 ; 5 4 ; 0 2 ; 1

F 7 ; 2 3 ; 2 5 ; 2 0 ; 1

G 7 ; 0 2 ; 5 0 ; 7 0 ; 1

H 0 ; 0 0 ; 0 0 ; 0 9 ; 1

É fácil ver que no exemplo acima B^1 (B) = fF g, ou seja, a única melhor resposta do jogador 1 à estratégia B é exatamente F. Por outro lado, B^1 (A) = fF; Gg, ou seja, tanto F quanto G são melhores respostas para o jogador 1 quando 2 joga A. Para nalizar, observe que B^2 (F ) = fA; B; Cg, ou seja, A; B e C são melhores respostas para o jogador 2 quando 1 joga F.

9.2 (^) Se o jogador i tem uma estratégia estritamente dominante, então todas as suas outras estratégias são

estritamente dominadas por tal estratégia e, portanto, serão eliminadas.

9.6. EQUILÍBRIO DE NASH 111

9.6.2 Equilíbrio de Nash

Considere o seguinte jogo: Jogador 2

Jogador 1

E D

C 5 ; 1 4 ; 0

M 6 ; 0 3 ; 1

B 6 ; 4 3 ; 4

No jogo acima, em termos de melhores respostas, nós temos B^1 (E) = fM; Bg, B^1 (D) = fCg, B^2 (C) = fEg, B^2 (M ) = fDg e B^2 (B) = fE; Dg. Observe que B é uma melhor resposta para o jogador 1 quando 2 joga E e E é uma melhor resposta para o jogador 2 quando 1 joga B. De certa forma, existe um certo equilíbrio no per l de estratégias (B; E). Mesmo se 2 já tivesse observado que 1 jogou B, não haveria razão para 2 mudar de estratégia. De forma similar, mesmo que 1 já tivesse observado que 2 jogou E, não haveria motivo para 1 desejar mudar de estratégia. Quando um per l de estratégias satisfaz tal tipo de condição nós dizemos que tal per l é um equilíbrio de Nash do jogo. Formalmente, considere um jogo com N jogadores. Um per l de estratégias (a 1 ; :::; a N ) é um equilíbrio de Nash do jogo se para todo jogador i, a i 2 Bi^

a 1 ; :::; a i 1 ; a i+1; :::; a N

. Ou seja, em um equilíbrio de Nash todos os jogadores estão fazendo o melhor que eles poderiam fazer dadas as estratégias que estão sendo jogadas pelos outros jogadores.

Exemplo 9.11 (Dilema dos Prisioneiros revisitado). Considere o dilema dos prisioneiros original, isto é: Prisioneiro 2

Prisioneiro 1

C N

C 5 ; 5 1 ; 10

N 10 ; 1 2 ; 2

Observe que B^1 (C) = fCg e B^2 (C) = fCg. Ou seja, para qualquer um dos jogadores, se o outro estiver jogando C, então a melhor coisa que ele tem a fazer é jogar C, também. Portanto, o per l (C; C) é um equilíbrio de Nash do jogo Dilema dos Prisioneiros.

Vimos no exemplo acima que o per l de estratégias (C; C) é um equilíbrio de Nash para o jogo dilema dos prisioneiros. Lembre-se que tal per l também era a solução por dominância do jogo. De fato, tal propriedade é geral, como a proposição abaixo mostra:

Proposição 9.1. Suponha que um per l (a 1 ; :::; a N ) seja a solução por dominância de um determinado jogo. Então, tal per l é também um equilíbrio de Nash do jogo.

Demonstração da Proposição. Fixe um jogador qualquer i. Como, por hipótese, a i é uma estratégia estritamente dominante para i, sabemos que para qualquer estratégia ai 2 Ai, com ai 6 = a i nós temos que ter

U i^ (a 1 ; :::; a i ; :::; a N ) > U i^ (a 1 ; :::; ai; :::; a N ) :

Mas isto implica que Bi^

a 1 ; :::; a i 1 ; a i+1; :::; a N

= fa i g. Como isto é válido para todos os jogadores i, nós vemos que (a 1 ; :::; a N ) satisfaz a condição que de ne um equilíbrio de Nash. k

9.7. APLICAÇÕES 113

Finalmente, agora nós observamos que E é estritamente dominada por F , o que nos dá o jogo ainda mais simpli cado

Jogador 2

Jogador 1

A B C

F 7 ; 2 3 ; 2 5 ; 2

G 7 ; 0 2 ; 5 0 ; 7

Agora nenhum dos jogadores tem mais estratégias estritamente dominadas. No entanto, observe que para o jogo simpli cado acima B^1 (B) = fF g e B^2 (F ) = fA; B; Cg. Ou seja, o per (F; B) ainda é um equilíbrio de Nash do jogo acima.

Novamente, o fenômeno acontecido acima é geral. Isto é, se simpli carmos um jogo usando eliminação iterativa de estratégias estritamente dominadas, o conjunto de equilíbrios de Nash do jogo simpli cado é o mesmo do jogo original. Tal resultado é formalizado na proposição abaixo.

Proposição 9.3. Suponha que tenhamos um jogo qualquer e xe um per l qualquer (a 1 ; :::; a N ) deste jogo. Suponha agora que simpli quemos o jogo usando o método de eliminação iterativa de estratégias estritamente dominadas. O per l (a 1 ; :::; a N ) é um equilíbrio de Nash do jogo original se e somente se ele for um equilíbrio de Nash do jogo simpli cado.

A proposição acima nos mostra que se estivermos interessados em encontrar os equilíbrios de Nash de um determinado jogo e este tiver estratégias estritamente dominadas, então é uma boa idéia primeiro usar o método de eliminação iterativa de estratégias estritamente dominadas para simpli car o jogo o máximo possível para só então tentar encontrar os equilíbrios de Nash do jogo diretamente.

9.7 Aplicações

9.7.1 Equilíbrio de Cournot

Suponha que o mercado de produção de um determinado bem seja dividido entre duas empresas, rma F 1 e rma F 2. Suponha que os custos de produção das duas rmas sejam dados simplesmente por Ci (y) = cy:

Ou seja, as duas rmas têm o mesmo custo marginal constante e igual a c. Finalmente, suponha que a curva de demanda inversa pelo bem seja dada por

p (y) = a by:

Quanto será que cada uma das rmas vai produzir em tal situação? Primeiramente, observe que a situação acima pode ser descrita por um jogo. Obviamente o conjunto de jogadores é dado por J = fF 1 ; F 2 g. As estratégias de cada uma das rmas serão escolher as quantidades que elas vão produzir. Ou seja, A 1 = A 2 = [0; 1 ). E as funções de ganhos de cada uma das

rmas serão dadas pelo seu lucro, ou seja, para a rma i,

U i^ (y 1 ; y 2 ) = p (y 1 + y 2 ) yi cyi:

114 CAPÍTULO 9. TEORIA DOS JOGOS - JOGOS NA FORMA NORMAL

Agora que já temos a descrição completa do nosso jogo, nós podemos tentar analisar a situação acima sob uma visão de teoria dos jogos. Suponha, por exemplo, que a rma 2 esteja produzindo uma quantidade qualquer y 2. Qual seriam as melhores respostas da rma 1 a tal estratégia. Para descobrir isto nós temos que resolver o seguinte problema:

max y 1 p (y 1 + y 2 ) y 1 cy 1

A condição de primeira ordem do problema acima pode ser escrita como

p^0 (y 1 + y 2 ) y 1 + p (y 1 + y 2 ) = c:9.

Que utilizando as funções que de nimos acima pode ser escrita como

by 1 + a b (y 1 + y 2 ) = c:

Resolvendo a equação acima para y 1 nós obtemos:

y 1 =

a by 2 c 2 b

Portanto, a correspondência de melhores respostas para o jogador 1 neste caso é dada simplesmente por

B^1 (y 2 ) =

a by 2 c 2 b

Nós podemos repetir a mesma análise acima para o jogador 2, o que vai nos dar a seguinte correspondência de melhores respostas para tal jogador:

B^2 (y 1 ) =

a by 1 c 2 b

Será que existe algum equilíbrio de Nash para este jogo? Isto é, será que existe um per l de estratégias (y 1  ; y 2  ) tal que y 1  2 B^1 (y 2 ) e y 2 2 B^2 (y 1  )? Como em todas as situações os dois jogadores têm apenas uma única melhor resposta, um per l que seja equilíbrio de Nash para tal jogo tem que satisfazer as sesguintes condições:

y 1  =

a by 2 c 2 b e

y 2  =

a by 1 c 2 b

Mas as duas equações acima nos dão um sistema linear que pode ser facilmente resolvido. Resolvendo o sistema acima nós obtemos:

y 1  = y 2 =

a c 3 b

Isto é, o per l de estratégias

ac 3 b ;^

ac 3 b

é o único equilíbrio de Nash do jogo acima. 9.3 (^) Observe que esta é a velha condição receita marginal é igual ao custo marginal. A diferença agora é que a receita marginal depende do que a empresa F 2 está produzindo. 9.4 (^) Na verdade, para valores de y 2 muito altos a escolha ótima da rma F 1 será produzir zero. Formalmente,

a correta correspondência de melhores respostas da rma F 1 é dada por B^1 (y 2 ) = max

n (^) aby 2 c 2 b ;^0

o

. Nós vamos ignorar tal fato, já que não fará muita diferença para a nossa discussão no texto.

116 CAPÍTULO 9. TEORIA DOS JOGOS - JOGOS NA FORMA NORMAL

 (^) = + 0; 05 (ver gura 9.3). Deste modo, ele conquistará todos os clientes a sua direita

mais 0,025, que corresponde à metade dos clientes entre ele e o sorveteiro 2. Como < 0 ; 5 isto dará um número de sorvetes vendidos maior do que 1 = 2. Portanto é melhor escolher tal posição do que escolher =. Se ele escolhesse um valor de > , então o número de clientes a sua direita iria diminuir. Como ele só ca com metade dos clientes entre ele e o sorveteiro 2, isto signi ca que ele estaria perdendo clientes (ver gura 9.3). Finalmente, se ele escolhesse um valor de < , então ele estaria conquistando os clientes a sua esquerda mais metade dos clientes entre ele e o sorveteiro 2. Como < 0 ; 5 isto dará um número de sorvetes vendidos menor do que 1 = 2 (ver gura 9.3). Nós veri camos, então, que realmente a melhor resposta neste caso é escolher ^ = + 0; 05.

Figura 9.3: Resposta ótima do sorveteiro 1

Uma análise exatamente simétrica ao caso < 0 ; 5 nos mostra que se o sorveteiro 2 estiver jogando um valor de > 0 ; 5 , então a melhor resposta do sorveteiro 1 é escolher a posição ^ = 0 ; 05. E se o jogador 2 estiver posicionado exatamente no meio? Neste caso é fácil ver que qualquer valor de > = 0; 5 dá um ganho para o sorveteiro 1 menor do que 1 = 2 (ver gura 9.4). Similarmente, qualquer valor de < = 0; 5 também dá um ganho para o sorveteiro 1 menor do que meio (ver gura 9.4). Ou seja, a melhor resposta para o jogador 1 neste caso é também se posicionar no meio da praia. Isto é, sua melhor resposta é escolher ^ = 0; 5. Resumindo a análise acima, nós chegamos à seguinte correspondência de melhores respostas para o sorveteiro 1:

B^1 ( ) =

  • 0; 05 se < 0 ; 5 0 ; 5 se = 0; 5 0 ; 05 se > 0 ; 5

A situação do sorveteiro 2 é absolutamente simétrica, portanto, a sua correspondência de melhores respostas é dada por

B^2 ( ) =

  • 0; 05 se < 0 ; 5 0 ; 5 se = 0; 5 0 ; 05 se > 0 ; 5

9.8. EXERCÍCIOS 117

Figura 9.4: Respostas não ótimas do sorveteiro 1 quando 2 está no centro da praia

Agora que já conhecemos as melhores respostas de ambos os jogadores, nós podemos tentar descobrir se este jogo tem algum equilíbrio de Nash. Será que existe algum equilíbrio de Nash em que o sorveteiro 1 escolhe uma posição ^ < 0 ; 5? Se ^ < 0 ; 5 , então a única melhor resposta do sorveteiro 2 é escolher = ^ + 0; 05. Observe que, por construção, tal valor de é menor ou igual a 0 ; 5. Mas para  0 ; 5 a melhor resposta do jogador 1 será escolher ou = 0; 5 , no caso em que = 0; 5 , ou = + 0; 05 , no caso em que < 0 ; 5. Mas tanto = 0; 5 como = + 0; 05 = ^ + 0; 05 + 0; 05 são estritamente maiores do que . Nós concluímos que não existe equilíbrio de Nash em tal situação. Será que existe equilíbrio de Nash em que o sorveteiro 1 escolhe um valor ^ > 0 ; 5? Se  (^) > 0 ; 5 , então a melhor resposta do sorveteiro 2 é escolher =  (^) 0 ; 05. Novamente, por

construção, tal valor de é maior ou igual a 0 ; 5. Mas para valores de  0 ; 5 , a melhor resposta do sorveteiro 1 é = 0; 5 , quando = 0; 5 , e = 0 ; 05 , quando > 0 ; 5. De novo, tanto = 0; 5 , como = 0 ; 05 = ^ 0 ; 05 0 ; 05 são estritamente menores do que . Nós concluímos que também neste caso não existe equilíbrio de Nash. Só nos resta testar uma última alternativa. Será que existe equilíbrio de Nash em que o jogador 1 joga ^ = 0; 5. Neste caso, a melhor resposta do sorveteiro 2 é também se posicionar na posição ^ = 0; 5. Ainda, se o sorveteiro 2 estiver posicionado no centro da praia, a melhor resposta do sorveteiro 1 é, de fato, também se posicionar no centro da praia. Ou seja, ^ = 0; 5 é realmente uma melhor resposta para o sorveteiro 1 quando  (^) = 0; 5. Acabamos de mostrar, então, que o único equilíbrio de Nash do jogo dos sorveteiros

é exatamente o per l em que ambos os sorveteiros se posicionam no centro da praia.

9.8 Exercícios

Exercício 9.1 (Jogo da Produção de Armas Nucleares). Dois países vizinhos estão considerando a possibilidade de construir armas nucleares. Se ambos construírem armas nucleares, então a situação será ruim para os dois, já que isto implica em um alto custo nanceiro, além do risco que um vizinho detentor de armas nucleares representa. Caso apenas um dos países construa armas nucleares, então o país construtor desfrutará de uma grande vantagem estratégica e esta acaba sendo a melhor situação possível para ele. Por outro lado, o país que não construir cará numa situação muito ruim, já que cará praticamente submisso ao vizinho. Esta é a pior situação possível para ele. Finalmente, se ninguém construir armas nucleares, a situação é boa para os dois, já que ambos economizam bastante dinheiro e

Capítulo 10

Teoria dos Jogos - Estratégias Mistas

10.1 Introdução

Agora que nós já conhecemos o conceito de equilíbrio de Nash, nós discutiremos a existência de equilíbrio de Nash. Em geral, é possível que um determinado jogo não tenha equilíbrio de Nash. Mesmo jogos matriciais simples muitas vezes não possuem nenhum equilíbrio. Para escapar de tal situação nós introduziremos o conceito de estratégias mistas. Admitindo a possibilidade de uso de estratégias mistas, jogos matriciais sempre têm equilíbrio de Nash. Por simplicidade, ao estudarmos estratégias mistas nós nos concentraremos em jogos matriciais 2x2. Isto é, jogos com 2 jogadore em que cada um dos jogadores tem apenas duas estratégias puras.

10.2 Estratégias Mistas e Existência de Equilíbrio

Voltemos a um dos primeiros jogos que estudamos: o jogo do par ou ímpar. A matriz de ganhos daquele jogo era dada por

Jogador Ímpar

Jogador Par

P I

P 1 ; 1 1 ; 1

I 1 ; 1 1 ; 1

Olhando para a matriz de ganhos acima nós vemos que quando o jogador Ímpar joga P , a melhor resposta para o jogador Par é P. Mas se o jogador Par joga P , a melhor resposta para o jogador Ímpar é I. De forma similar, se o jogador Ímpar joga I, a melhor resposta para o jogador Par é I. Mas quando o jogador Par joga I a melhor resposta do jogador Ímpar é P. Nós acabamos de veri car que o jogo acima não tem nenhum equilíbrio de Nash. O jogo de par ou ímpar não tem nada de especial. Na verdade, vários outros jogos não têm equilíbrio de Nash. Esta situação é aparentemente problemática. Se nem mesmo um jogo tão simples como o jogo de par ou ímpar tem equilíbrio de Nash, qual a utilidade de tal conceito, então? A solução que temos para tal problema vem da própria forma como o jogo de par ou ímpar é jogado na vida real. Na vida real, se o jogador Par jogasse sempre P , então o jogador Ímpar

120 CAPÍTULO 10. TEORIA DOS JOGOS - ESTRATÉGIAS MISTAS

iria acabar descobrindo isto e iria sempre jogar I, ganhando o jogo em todas as ocasiões. A mesma coisa aconteceria se qualquer um dos jogadores jamais variasse a sua estratégia. Por causa disto, o que nós observamos na prática? Na prática, nós observamos que os jogadores de par ou ímpar costumam variar as suas jogadas de forma mais ou menos aleatória. A idéia de uma escolha aleatória de ações motivou o conceito de estratégias mistas. A idéia agora é trabalhar com um conjunto de estratégias maior para ambos os jogadores. Os jogadores não estarão mais limitados a escolher jogar P ou I, mas poderão, também, escolher jogar P com uma probabilidade e I com uma probabilidade (1 ). Formalmente, nós estamos usando a matriz de ganhos acima para de nir um novo jogo em que o conjunto de estratégias dos dois jogadores agora é dado por A 1 = A 2 = [0; 1]. A interpretação aqui é que 2 A 1 é a probabilidade com que o jogador Par joga P. Por construção, isto implica que ele joga I com probabilidade 1 . Nós ainda faremos a hipótese adicional de que no novo jogo os ganhos dos dois jogadores serão dados pelos seus ganhos esperados, dados os ganhos do jogo original. Por exemplo, se Par está jogando a estratégia e Ímpar está jogando a estratégia , então o ganho de Par no novo jogo é dado por

U P ar^ ( ; ) = U P ar^ (P; P ) + (1 ) U P ar^ (P; I) (1 ) U P ar^ (I; P ) + (1 ) (1 ) U P ar^ (I; I) =  1 + (1 )  (1) + (1 )  (1)

  • (1 ) (1 )  1 = 1 + 4 2 2 :10.

De forma similar, o ganho do jogador Ímpar no novo jogo é dado por

U Impar ( ; ) = U Impar (P; P ) + (1 ) U Impar (P; I) (1 ) U Impar (I; P ) + (1 ) (1 ) U Impar (I; I) =  (1) + (1 )  1 + (1 )  1

  • (1 ) (1 )  (1) = 2 + 2 1 4 :10.

O nosso novo jogo está, portanto, completamente especi cado. É válido perguntarmos, por exemplo, se este novo jogo tem algum equilíbrio de Nash. Nós estudaremos este tipo de jogo na próxima subseção.

10.2.1 Equilíbrio de Nash em Estratégias Mistas

Acima, nós aprendemos como construir, a partir de um jogo em forma matricial, um novo jogo em que as estratégias dos jogadores agora consistem das probabilidades com que cada jogador está jogando cada uma de suas estratégias. Quando fazemos isto dizemos que estamos

10.1 (^) Nós estamos cometendo um pequeno abuso de notação aqui. Nós estamos usando U P ar (^) para denotar tanto o ganho do jogador Par no novo jogo, como os ganhos de par representados na matriz de ganhos original. Como os argumentos de U P ar^ são diferentes nos dois casos, tal abuso de notação não gera confusão. 10.2 (^) Novamente, nós estamos cometendo um abuso de notação aqui.