Равновесное
Jun. 16th, 2009 09:37 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
В теории игр есть такой классный парадокс: дилемма заключенного (ДЗ).
Классический вид и все детали можно в википедии, например, посмотреть, я их материалами активно пользовался. Но тут я ее в немного переработанном варианте приведу, превращу в дилемму коммерсанта. Допустим, мы оранизовали некий бизнес с кем-то на пару. Бизнес хороший, на каждый внесенный рубль приносит еще один. Каждый из нас вложил в дело по рублю, соответственно, если мы оба честны - то каждый получит выигрыш в один рубль. Однако каждый партнер может кинуть другого и скрыться со всей кассой. В этом случае кидала получает выигрыш аж в три рубля - два рубля совместной прибыли, и рубль, вложенный партнером. Партнер, соответственно, остается в минусах: проигрыш в один рубль. И, наконец, если оба попытаются кинуть друг друга - то бизнес вообще не пойдет, но каждый останется при своих (выигрыш равен нулю).*
Как видите - довольно реалистичная ситуация, с более или менее похожими мы в жизни постоянно сталкиваемся.
Так вот. В случае, если коммерсы не очень уверены друг в друге, а бизнес - разовый, наиболее рациональной стратегией для каждого из них является кидалово. Парадокс состоит в том, что, действуя в соответствии с рациональной индивидуальной стратегией, вместе стороны остаются с нулем на руках **.
Но именно по этой стратегии построен почти весь бизнес в постсоветской России. Т.е. он, конечно, работает, и даже не всегда с нулем или минусами на выходе, но любые сделки организуются с учетом того, что их участники будут рациональны, то бишь постараются прокинуть друг друга при первой же возможности.
На самом же деле, конечно, при повторяющихся сделках выгоднее сотрудничать - общий выигрыш будет выше. Но... пока кто-нибудь не кинет - в этом случае он резко максимимзирует свой индивидуальный выигрыш.
Дальше - интереснее.
В ситуации, когда в эту игру играет много игроков, регулярно совершая сделки и, что существенно, запоминая их результаты, дело меняется. Идеальной стратегии нет, но удалось выявить некоторые общие закономерности. Оптимальная стратегия должна быть (сперто из вики):
По-моему, этот математически выверенный моральный кодекс либертарианца куда круче всяких там сомнительных 10 или 365 заповедей и прочих проповедей, хотя местами и пересекается с оными.
НО! Все это работает только в том случае, если все игроки по-прежнему пытаются вести себя оптимально. Если среди населения все друг друга обманывают, то в такой популяции оптимальная стратегия — всегда предавать. Именно поэтому мы никак из жопы и не выберемся.
Но дальше - еще интереснее.
Тупые пендосы регулярно устраивают чемпионат по ПДЗ (повторяющейся дилемме заключенного) между программами, реализующими ту или иную стратегию. Так вот, однажды одни университествкие яйцеголовые выставили на турнир сразу несколько программ, которые, действуя сообща, всех отымели.
Тут есть хитрость. По условиям игры участники не могут обмениваться никакой информацией, а только получают сведения о результатах сделок (это вполне жизненно - вступая в сделку с незнакомым коммерсом или общаясь с чиновником мы тоже в большистве случаев вынуждены действовать вслепую). Поэтому для того, чтобы программы-соучастники могли друг друга опознать, первые несколько сделок они совершали по определенной схеме, по ней и опознавали друг друга (бриджистам такая схема взаимодействия хорошо знакома, на ней строится вся торговля). После этого одна программа всегда всех предавала, а другие - всегда с ней сотрудничали, что давало максимум очков предателю и, в итоге, максимум очков - альма матер. Ну и, естественно, все в команде дружно кидали "чужих".
По-моему, эта схема очень хорошо описывает явление под названием "Патриотизм".
1. Все патриоты должны совершать определенные ритуальные танцы для взаимоопознания, без танцев невозможна нация.
2. На уровне группы стратегия часто дает большой выигрыш по сравнению с эгоистичными стратегиями (за счет дружного прокидывания окружающих).
3. А вот на уровне индивидуама один ("лидер нации") - выигрывает, зато все остальные патриоты - сидят в глубокой жопе, жертвуя всем ради Родины.
--
* строго математически для того, чтобы эта задача точно соответствовала формальным условиям классической ДЗ, в варианте "один кинул, другой нет" нужно чуть уменьшить выигрыш, скажем, в виде "но 20 копеек придется отдать ментам для отмаза", но это не столь существенно для сути вопроса.
** специально для
zharkovsky - это как раз случай, кода равновесие Нэша не совпадает с оптимумом Парето, т.е. достижение этого равновесия означает не Мир Полдня, как вы предполагали, а вовсе даже мир в жопе :)
Классический вид и все детали можно в википедии, например, посмотреть, я их материалами активно пользовался. Но тут я ее в немного переработанном варианте приведу, превращу в дилемму коммерсанта. Допустим, мы оранизовали некий бизнес с кем-то на пару. Бизнес хороший, на каждый внесенный рубль приносит еще один. Каждый из нас вложил в дело по рублю, соответственно, если мы оба честны - то каждый получит выигрыш в один рубль. Однако каждый партнер может кинуть другого и скрыться со всей кассой. В этом случае кидала получает выигрыш аж в три рубля - два рубля совместной прибыли, и рубль, вложенный партнером. Партнер, соответственно, остается в минусах: проигрыш в один рубль. И, наконец, если оба попытаются кинуть друг друга - то бизнес вообще не пойдет, но каждый останется при своих (выигрыш равен нулю).*
Как видите - довольно реалистичная ситуация, с более или менее похожими мы в жизни постоянно сталкиваемся.
Так вот. В случае, если коммерсы не очень уверены друг в друге, а бизнес - разовый, наиболее рациональной стратегией для каждого из них является кидалово. Парадокс состоит в том, что, действуя в соответствии с рациональной индивидуальной стратегией, вместе стороны остаются с нулем на руках **.
Но именно по этой стратегии построен почти весь бизнес в постсоветской России. Т.е. он, конечно, работает, и даже не всегда с нулем или минусами на выходе, но любые сделки организуются с учетом того, что их участники будут рациональны, то бишь постараются прокинуть друг друга при первой же возможности.
На самом же деле, конечно, при повторяющихся сделках выгоднее сотрудничать - общий выигрыш будет выше. Но... пока кто-нибудь не кинет - в этом случае он резко максимимзирует свой индивидуальный выигрыш.
Дальше - интереснее.
В ситуации, когда в эту игру играет много игроков, регулярно совершая сделки и, что существенно, запоминая их результаты, дело меняется. Идеальной стратегии нет, но удалось выявить некоторые общие закономерности. Оптимальная стратегия должна быть (сперто из вики):
- Добрая, то есть не предавать, пока этого не сделает оппонент. Чисто эгоистичная стратегия по чисто эгоистическим причинам не будет первой «бить» соперника.
- Мстительная. Успешная стратегия не должна быть слепым оптимистом. Она должна всегда мстить.
- Прощающая. Отомстив, стратегия должна вернуться к сотрудничеству, если оппонент не продолжает предавать. Это предотвращает бесконечное мщение друг другу и максимизирует выигрыш.
- Не завистливая. Не пытаться набрать больше очков, чем оппонент.
По-моему, этот математически выверенный моральный кодекс либертарианца куда круче всяких там сомнительных 10 или 365 заповедей и прочих проповедей, хотя местами и пересекается с оными.
НО! Все это работает только в том случае, если все игроки по-прежнему пытаются вести себя оптимально. Если среди населения все друг друга обманывают, то в такой популяции оптимальная стратегия — всегда предавать. Именно поэтому мы никак из жопы и не выберемся.
Но дальше - еще интереснее.
Тупые пендосы регулярно устраивают чемпионат по ПДЗ (повторяющейся дилемме заключенного) между программами, реализующими ту или иную стратегию. Так вот, однажды одни университествкие яйцеголовые выставили на турнир сразу несколько программ, которые, действуя сообща, всех отымели.
Тут есть хитрость. По условиям игры участники не могут обмениваться никакой информацией, а только получают сведения о результатах сделок (это вполне жизненно - вступая в сделку с незнакомым коммерсом или общаясь с чиновником мы тоже в большистве случаев вынуждены действовать вслепую). Поэтому для того, чтобы программы-соучастники могли друг друга опознать, первые несколько сделок они совершали по определенной схеме, по ней и опознавали друг друга (бриджистам такая схема взаимодействия хорошо знакома, на ней строится вся торговля). После этого одна программа всегда всех предавала, а другие - всегда с ней сотрудничали, что давало максимум очков предателю и, в итоге, максимум очков - альма матер. Ну и, естественно, все в команде дружно кидали "чужих".
По-моему, эта схема очень хорошо описывает явление под названием "Патриотизм".
1. Все патриоты должны совершать определенные ритуальные танцы для взаимоопознания, без танцев невозможна нация.
2. На уровне группы стратегия часто дает большой выигрыш по сравнению с эгоистичными стратегиями (за счет дружного прокидывания окружающих).
3. А вот на уровне индивидуама один ("лидер нации") - выигрывает, зато все остальные патриоты - сидят в глубокой жопе, жертвуя всем ради Родины.
--
* строго математически для того, чтобы эта задача точно соответствовала формальным условиям классической ДЗ, в варианте "один кинул, другой нет" нужно чуть уменьшить выигрыш, скажем, в виде "но 20 копеек придется отдать ментам для отмаза", но это не столь существенно для сути вопроса.
** специально для
![[livejournal.com profile]](https://www.dreamwidth.org/img/external/lj-userinfo.gif)