Qual é o dilema do viajante?
O dilema do viajante, na teoria dos jogos, é um jogo sem soma zero em que dois jogadores tentam maximizar seu próprio retorno, sem levar em consideração o outro. O jogo demonstra o "paradoxo da racionalidade" - a ironia de que tomar decisões de forma ilógica ou ingênua geralmente produz uma recompensa melhor na teoria dos jogos.
Principais Takeaways
- O dilema do Viajante é um jogo em que dois jogadores oferecem um lance proposto e ambos recebem o lance mais baixo, mais ou menos um pagamento de bônus. De acordo com a teoria dos jogos, a estratégia racional para ambos os jogadores é escolher o menor retorno possível. Isso resulta em ambos os jogadores receberem retornos mais baixos do que poderiam alcançar, seguindo uma estratégia irracional. Em estudos experimentais, as pessoas sempre escolheram retornos mais altos e obtiveram melhores resultados do que a estratégia racional prevista pela teoria dos jogos.
Compreendendo o dilema do viajante
O jogo do dilema do viajante, formulado em 1994 pelo economista Kaushik Basu, apresenta um cenário em que uma companhia aérea danifica severamente antiguidades idênticas compradas por dois viajantes diferentes. O gerente da companhia aérea está disposto a compensá-los pela perda das antiguidades, mas como ele não tem idéia do valor deles, ele pede aos dois viajantes que anotem separadamente sua estimativa do valor como qualquer número entre US $ 2 e US $ 100 sem consultar um deles. outro.
No entanto, existem algumas ressalvas:
- Se ambos os viajantes anotarem o mesmo número, ele reembolsará cada um deles. Se escreverem números diferentes, o gerente assumirá que o preço mais baixo é o valor real e que a pessoa com o número mais alto está trapaceando. Enquanto ele pagará a ambos o valor mais baixo, a pessoa com o número mais baixo receberá um bônus de US $ 2 por honestidade, enquanto quem escreveu o número mais alto receberá uma multa de US $ 2.
A escolha racional, em termos do equilíbrio de Nash, é de US $ 2. O raciocínio é o seguinte. O primeiro impulso do viajante A pode ser anotar US $ 100; se o viajante B também anotar US $ 100, esse será o valor que ambos receberão do gerente da companhia aérea. Mas, pensando bem, o Viajante A raciocina que, se ele escrever $ 99 e B colocar $ 100, então A receberá $ 101 (bônus de $ 99 + $ 2). Mas A acredita que essa linha de pensamento também ocorrerá para B, e se B também colocar $ 99, ambos receberão $ 99. Então A seria realmente melhor colocando $ 98 e recebendo $ 100 (bônus de $ 98 + $ 2) se B escrever $ 99. Mas como esse mesmo pensamento de escrever US $ 98 poderia ocorrer para B, A considera colocar US $ 97 e assim por diante. Essa linha de indução reversa levará os viajantes até o menor número permitido, que é de US $ 2.
As pessoas realmente escolhem o equilíbrio de Nash?
Em estudos experimentais, contrariamente às previsões da teoria dos jogos, a maioria das pessoas escolhe US $ 100 ou um número próximo a ela, sem pensar no problema ou com plena consciência de que está se afastando da escolha racional. Portanto, embora a maioria das pessoas sinta intuitivamente que selecionaria um número muito superior a US $ 2, essa intuição parece contradizer o resultado lógico previsto pela teoria dos jogos - que cada viajante selecionaria US $ 2. Rejeitando a escolha lógica e agindo de forma ilógica, escrevendo um número maior, as pessoas acabam recebendo um retorno substancialmente maior.
Esses resultados concordam com estudos semelhantes usando outros jogos, como o dilema do prisioneiro e o jogo de bens públicos, em que sujeitos experimentais tendem a não escolher o equilíbrio de Nash. Com base nesses estudos, os pesquisadores propuseram que as pessoas parecem ter uma atitude natural e positiva em favor da cooperação. Essa atitude leva a equilíbrios cooperativos que proporcionam maiores retornos para todos os jogadores em jogos únicos ou repetidos, e podem ser explicados por pressões evolutivas seletivas que favorecem esses tipos de estratégias aparentemente irracionais, mas benéficas.
No entanto, os estudos do dilema do viajante também mostraram que, quando a penalidade / bônus é maior ou quando os jogadores consistem em equipes de várias pessoas que tomam uma decisão comum, então os jogadores optam mais frequentemente por seguir a estratégia racional que leva ao equilíbrio de Nash. Esses efeitos também interagem, pois equipes de jogadores não apenas escolhem a estratégia mais racional, mas também respondem ainda mais ao tamanho da penalidade / bônus que os jogadores individuais. Esses estudos sugerem que estratégias desenvolvidas que tendem a criar resultados sociais benéficos podem ser compensadas por estratégias mais racionais que tendem ao equilíbrio de Nash, dependendo da estrutura dos incentivos e da presença de divisões sociais.
