Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Introdução à Teoria de Jogos: Conflitos e Estratégias, Provas de Teoria dos Jogos

Este documento fornece uma introdução à teoria de jogos, uma abordagem matemática para conflitos de interesse. A teoria de jogos é atribuída a john von neumann e emile borel, e tem aplicações em diversas áreas, como economia, ciências sociais e jogos. O documento aborda conceitos como jogos de soma zero, jogos de soma não-zero, jogos de informação perfeita, estratégias puras e mistas, o teorema minimax e o dilema do prisioneiro. Além disso, é apresentado um exemplo de jogo de soma zero e a solução para jogos de soma zero com estratégias mistas.

O que você vai aprender

  • Como definir jogos de soma zero e jogos de soma não-zero?
  • Como resolver jogos de soma zero com estratégias mistas?
  • O que é o dilema do prisioneiro e quais são suas implicações?
  • O que é a teoria de jogos e quais são suas origens?
  • Qual é a importância do teorema minimax na teoria de jogos?

Tipologia: Provas

2022

Compartilhado em 07/11/2022

Florentino88
Florentino88 🇧🇷

4.7

(31)

223 documentos

1 / 19

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Introdução à teoria de jogos
-o que é a teoria de jogos
O que é a Teoria dos Jogos?
Teoria dos jogos é a abordagem matemática moderna para conflitos de interesse, e geralmente é atribuída a John
von Neumann em seus artigos de 1928 ("Zur Theorie der Gesellshaftsspiele") e 1937 ("A Model of General
Economic Equilibrium"), embora Emile Borel tenha publicado antes, entre 1921 e 1927, quatro notas introduzindo
os conceitos de estratégias puras e mistas e a solução minimax, a qual é fundamental para a teoria dos jogos.
Entretanto, Borel considerou que o teorema minimax era em geral falso, apesar de tê-lo comprovado para casos
especiais. Von Neumann provou o teorema para condições gerais e ainda criou a teoria dos jogos com mais de
dois jogadores.
Em 1944, von Neumann e o economista Oskar Morgenstern publicaram o livro clássico Theory of Games and
Economic Behavior, apresentando o teorema minimaxcomo solução para jogos de soma zero com dois
jogadores, além da fundamentação da teoria da utilidade, a qual é muito útil para situações de incerteza em
economia.
Em 1950, baseado no trabalho de MelvinDresher e Merrill Flood, Albert Tucker criou o Dilema do Prisioneiro, o
mais conhecido problema na área de teoria dos jogos e aquele com maior influência
nas ciências sociais.
Entre 1950 e 1953, John Nash publicou quatro artigos importantes para a teoria de jogos não cooperativos e para
a teoria de barganha. Em Equilibrium Points in N-Person Games (1950) e Non-cooperative Games (1951), Nash
provou a existência de um equilíbrio estratégico para jogos não cooperativos -o equilíbrio de Nash -e sugeriu
uma abordagem de estudo de jogos cooperativos a partir de sua redução para a forma não cooperativa. Nos
artigos
The Bargaining
problem e Two-Person Cooperative Games, criou a teoria de barganha e provou a existência da solução de
barganha de Nash.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13

Pré-visualização parcial do texto

Baixe Introdução à Teoria de Jogos: Conflitos e Estratégias e outras Provas em PDF para Teoria dos Jogos, somente na Docsity!

  • o que é a teoria de jogos
  • O que é a Teoria dos Jogos?

Teoria dos jogos é a abordagem matemática moderna para conflitos de interesse, e geralmente é atribuída a John von Neumann em seus artigos de 1928 (" Zur Theorie der Gesellshaftsspiele") e 1937 ("A Model of General Economic Equilibrium"), embora Emile Borel tenha publicado antes, entre 1921 e 1927, quatro notas introduzindo os conceitos de estratégias puras e mistas e a solução minimax, a qual é fundamental para a teoria dos jogos. Entretanto, Borel considerou que o teorema minimax era em geral falso, apesar de tê-lo comprovado para casos especiais. Von Neumann provou o teorema para condições gerais e ainda criou a teoria dos jogos com mais de dois jogadores.

Em 1944, von Neumann e o economista Oskar Morgenstern publicaram o livro clássico Theory of Games and Economic Behavior, apresentando o teorema minimax como solução para jogos de soma zero com dois jogadores, além da fundamentação da teoria da utilidade, a qual é muito útil para situações de incerteza em economia.

Em 1950, baseado no trabalho de Melvin Dresher e Merrill Flood, Albert Tucker criou o Dilema do Prisioneiro, o mais conhecido problema na área de teoria dos jogos e aquele com maior influência nas ciências sociais.

  • Entre 1950 e 1953, John Nash publicou quatro artigos importantes para a teoria de jogos não cooperativos e para a teoria de barganha. Em Equilibrium Points in N-Person Games (1950) e Non-cooperative Games (1951), Nash provou a existência de um equilíbrio estratégico para jogos não cooperativos - o equilíbrio de Nash - e sugeriu uma abordagem de estudo de jogos cooperativos a partir de sua redução para a forma não cooperativa. Nos artigos
  • The Bargaining problem e Two-Person Cooperative Games, criou a teoria de barganha e provou a existência da solução de barganha de Nash.
  • características do jogo -

. Há pelo menos dois jogadores

. Jogada é a maneira segundo a qual o jogo progride de um estágio a outro.

Podem ser alternadas entre os jogadores de uma forma especificada ou

ocorrer simultaneamente. Uma jogada consiste de uma decisão de um dos

participantes ou de um resultado de um evento probabilístico.

. No fim do jogo, cada jogador obtém um payoff. Podemos associar este

número ao montante que foi ganho ou perdido, ou dizer, por exemplo, que o

payoff é +1 para o ganhador, 0 se há um empate, e -1 para o perdedor.

  • Uma estratégia é uma lista das escolhas ótimas para um jogador. Nesta lista

já estão previstas todas as possíveis situações que o jogador poderá

enfrentar. Assim, tendo uma estratégia, ele saberá o que fazer em qualquer

estágio, não importando o que seu oponente faça nem os resultados dos

eventos probabilísticos.

  • Exemplo de um jogo de soma zero com dois jogadores

Duas empresas concorrentes produzem um mesmo produto e têm custos fixos de Euros 5000,00 por período, independente de quanto conseguem vender. Ambas competem pelo mesmo mercado e devem escolher entre um preço alto (Euros 2,00) e um preço baixo (Euros 1,00). Regras do jogo:

A Euros 2,00, o mercado consome 5000 unidades ao custo de Euros 10000,

A Euros 1,00, o mercado consome 10000 unidades ao custo de Euros 10000,

Se ambas empresas aplicarem o mesmo preço, vendas serão divididas entre elas

Se aplicarem preços diferentes, aquela com menor preço vende toda a quantidade e a outra nada

Payoffs são os lucros - revenda menos custos fixos

Matriz de payoffs

Euros 2 (-5000, 5000) (0,0)

Euros 1 (0,0) (5000, -5000)

EMPRESA 2 Euros 1 Euros 2

EMPRESA 1

- Exemplo de um jogo de soma zero com estratégias mistas

• Considerar dois jogadores, cada um com

duas alternativas de escolha: par ou

ímpar. Dependendo a combinação de

escolhas dos dois, os jogadores obtêm

ganho (representado por 1) ou perda (-1).

O jogador Par obterá ganho se ambos

fizerem a mesma escolha, e neste caso

Ímpar receberá -1. e as escolhas forem

diferentes, os ganhos invertem-se.

PAYOFF MATRIX

IMPAR (-1, 1) (1, -1)

PAR (1,-1) (-1, 1)

JOGADOR 2 PAR IMPAR

JOGADOR 1

Cálculo dos valores percentuais óptimos do jogo par ou ímpar

  • Raciocínio para o jogador 1 (equivalente para jogador 2)
    • estratégia deve ser óptima contra ambas as jogadas de Ímpar, ou seja, a soma dos payoffs

contra a estratégia "par" deve ser igual à soma dos mesmos contra a estratégia "ímpar" do

jogador Ímpar.

Considerando que x é o percentual ótimo para a estratégia "par" e 1-x é o percentual ótimo para a

estratégia "ímpar",

x.1 + (1-x).-1 é a soma dos payoffs contra a estratégia "par", e

x.-1 + (1-x).1 é a soma dos payoffs contra a estratégia "ímpar"

Então, x.1 + (1-x).-1 = x.-1 + (1-x).

x - 1 + x = -x + 1 - x

4x = 2

x = 0,5 = 50%. Logo, 1-x = 0,5 = 50% também. Cada estratégia deve ser escolhida 50% das

vezes para que o jogador consiga um payoff mínimo de -1/2. Usando uma estratégia pura neste

caso, o payoff mínimo seria -1.

Outro exemplo de estratégia mista

  • Um outro exemplo de estratégia mista ocorre no jogo de

pôquer, no qual é melhor nãofazer “bluff” sempre, nem

dizer sempre a verdade. Há problema em usar

estratégia mista quando o jogo não é repetido, pois

neste caso será seleccionada uma estratégia pura.

Em jogos de soma zero com dois jogadores, é possível

mostrar na matriz somente os payoffs de um jogador e

considerar que os payoffs do outro são o inverso, uma

vez que sua soma é zero. Considera-se, então, que o

primeiro jogador busca maximizar seu payoff mínimo,

enquanto que o segundo procura minimizar o payoff

máximo do primeiro (equivalente a maximizar seu payoff

mínimo). A matriz para o jogo par ou ímpar seria então a

seguinte:

Jogos dominantes e dominados

  • Jogos podem apresentar estratégias dominadas, as quais

racionalmente nunca são escolhidas, pois oferecem um payoff

menor do que outra(s) em qualquer situação, independente da

estratégia dos outros jogadores. Estas estratégias dominadas

podem ser removidas do jogo, simplificando-o sem alterar sua

solução.

  • A matriz de payoff abaixo, por exemplo, representa um jogo de

soma zero com dois jogadores e mais de duas estratégias para

cada um. Algumas das estratégias são dominadas e podem ser

retiradas. É importante notar que a matriz apresenta somente os

payoffs de I.

  • Assim, as estratégias dominadas de I são aquelas que oferecem

sempre menor payoff, independente da jogada de e II, enquanto

que as estratégias dominadas de II são as que oferecem maior

payoff para I em qualquer situação.

Jogos dominantes e dominados

I3 2 4 5 5 5

I2 4 2 3 4 4

I1 4 5 6 4 4

EMPRESA I II1 II2 II3 II4 II

EMPRESA II

  • Conclusão
  • A solução apresentada por von Neumann está limitada a problemas de soma zero,

que não correspondem à maioria dos conflitos de interesse, principalmente em decisões econômicas e sociais. Jogos nestas áreas costumam apresentar somas não constantes, e são chamados jogos de soma não zero.

  • Esta restrição foi vencida pelo trabalho de John Nash durante a década de 50.

Atualmente, busca-se o equilíbrio de Nash, ou seja, um conjunto tal de estratégias usadas pelos jogadores em um jogo que, para cada agente i, dadas as estratégias dos demais jogadores, i não tem incentivo para mudar sua estratégia (quer dizer que i escolheu a melhor estratégia, dadas as estratégias dos demais). De acordo com Nash, todo jogo de soma não zero com dois jogadores apresenta pelo menos um equilíbrio, em estratégia pura ou mista.

  • Equilíbrios de Nash são estáveis, mas nem sempre desejáveis; o Dilema do

Prisioneiro, por exemplo, que é a instância de jogo mais conhecida e discutida, apresenta como único equilíbrio uma situação na qual ambos os jogadores obtêm um mau resultado, dadas suas funções de utilidade.

  • Dilema do prisioneiro
  • Neste jogo, dois ladrões são presos próximo à cena de um roubo e

precisam escolher entre duas estratégias: confessar o roubo, implicando também o companheiro, ou não confessar na expectativa de reduzir sua pena.

  • A matriz de payoff abaixo mostra os ganhos possíveis para cada estratégia

escolhida pelos jogadores (na verdade são perdas, e maximizar o payoff neste caso implica em obter a menor pena). Considerando que ambos os ladrões têm conhecimento da matriz, para cada um o raciocínio é o mesmo: se o outro confessar, é melhor confessar também, pois assim fica preso 9 anos ao invés de 10. Se o outro não confessar, também assim é melhor confessar, pois então sairá livre.

  • Desta forma, confessar é a estratégia dominante para cada jogador, e o

equilíbrio do jogo é encontrado nas estratégias dominantes. Sendo racionais, os jogadores optarão por confessar, obtendo ambos payoff de -9.

  • Entretanto, se agissem irracionalmente, poderiam obter um resultado

melhor, pagando uma pena de um só ano de prisão. Este é um jogo não cooperativo, ou seja, os jogadores não estão preocupados em obter o melhor resultado em conjunto, mas sim o melhor ganho individual que puderem.

  • Dilema do prisioneiro
  • O facto de açções racionais individuais levarem a um mau

resultado em termos de interesse próprio é o motivo da importância

deste dilema em questões sociais. É importante observar que

o Dilema do Prisioneiro é uma simplificação de conflitos

reais, e várias modificação podem ser aplicadas a

ele:

repetição de interacções

aumento do número de jogadores - jogos não cooperativos

com mais de 2 jogadores são uma generalização dos

jogos com 2 jogadores, e todo jogo de n jogadores ( n finito)

tem pelo menos um equilíbrio