Читать книгу "Эта странная математика. На краю бесконечности и за ним - Дэвид Дарлинг"
Шрифт:
Интервал:
Закладка:
Из примера с покером может возникнуть впечатление, что во всех играх с “несовершенной информацией” имеется элемент случайности, никак не зависящий от участников. Но это не так. Во всем знакомой игре “камень, ножницы, бумага” значение имеет только то, какие фигуры показывают игроки: никакой случайности, все по воле состязающихся. И все же информация в ней несовершенна. Суть игры, в которой участники делают синхронные жесты руками, ничуть не изменится, если те будут находиться в разных помещениях и записывать выбираемые фигуры на бумажке, не зная о решениях оппонента.
В игре с совершенной информацией всегда есть какая-то “чистая” стратегия – некая последовательность ходов, которая приводит к наиболее благоприятному исходу. Скажем, в любой шахматной позиции существует лучший ход или, чаще, серия выигрышных ходов, и всякий раз, когда такая позиция возникает на доске, оптимальнее разыгрывать именно их. В случае с игрой “камень, ножницы, бумага” все с точностью до наоборот. Чистая стратегия здесь не работает: если, например, каждый раз показывать “камень” или в одной и той же последовательности “камень”, “ножницы” и бумагу”, вас в два счета обыграют. Лучше всего в подобных играх использовать так называемую смешанную стратегию, при которой в каждой из возникающих позиций с разной вероятностью предпринимаются различные действия. Просчитывание такой игры, как “камень, ножницы, бумага” или покер на двоих, заключается в нахождении оптимальной смешанной стратегии, гарантирующей наиболее высокую вероятность победы. Стратегия “всегда показывать «камень»” будет иметь вероятность выигрыша 100 %, если оппонент настолько несообразителен, что всегда будет разыгрывать “ножницы”. С другой стороны, если второй игрок быстро раскусит первого (а так, скорее всего, и будет) и станет все время показывать “бумагу”, то вероятность выигрыша с помощью “каменной” стратегии тут же упадет до нуля. Так что нет ничего удивительного в том, что игра “камень, ножницы, бумага” была просчитана, причем решение совершенно тривиально. Оптимальная стратегия: треть времени разыгрывать “камень”, треть – “бумагу” и треть – “ножницы”. Если считать ничью за полпобеды, вероятность выигрыша составляет как минимум 50 % – это лучшая из всех возможных стратегий. Есть, конечно, эксперты и более высокого уровня, но они полагаются не столько на теорию игры, сколько на психологию, извлекая выгоду из того факта, что человеку, как правило, плохо удаются по-настоящему случайные ходы, как мы уже видели в третьей главе. В целом, лучшая стратегия в играх с несовершенной информацией – смешанная.
В таких играх есть понятие, которое называют равновесием Нэша – в честь американского математика и экономиста Джона Нэша, внесшего важный вклад в развитие теории игр (ему даже была посвящена книга – а позже и фильм – “Игры разума”). Сильное равновесие Нэша означает, что у каждого участника есть своя стратегия, любое отклонение от которой (в случае если остальные этого не делают) ухудшает его шансы на победу. Есть также слабое равновесие Нэша, когда игрок может отклониться от выбранной стратегии и никак не изменить этим свои шансы, однако невозможно изменением стратегии улучшить свою позицию в игре. Равновесие Нэша – ключевое понятие в теории игр.
В игре с совершенной информацией равновесие Нэша возникает, когда обе стороны придерживаются оптимальной стратегии. Оно может быть сильным или слабым, в зависимости от того, существует ли одна или несколько оптимальных стратегий. В игре с несовершенной информацией ситуация та же. Однако вполне возможно существование нескольких равновесий Нэша. Чтобы определить, все ли мы нашли, нам потребуется еще одно понятие – игра с нулевой суммой (частный случай игры с постоянной суммой).
В игре с нулевой суммой один из участников выигрывает ровно столько, сколько проигрывает другой. Более общий случай – игра с постоянной суммой, в которой общий фонд не меняется. Один из примеров – шахматы. Участники могут сыграть вничью, заработав каждый по пол-очка, или один из них выиграет – и тогда победитель получает одно очко, а проигравший – ничего. А вот футбол, в отличие от шахмат, нельзя назвать игрой с постоянной суммой, поскольку в случае ничьей каждая из команд зарабатывает по очку, но если одна из них побеждает, то она получает три очка, а проигравшая – ноль. Сумма очков, таким образом, может быть 2 или 3. Все игры с постоянной суммой можно превратить в игры с нулевой суммой, добавляя или отнимая некоторое количество очков. Например, если бы у шахматных соперников удерживалось по пол-очка, то сумма игры была бы нулевой. По этой причине результаты, применимые к играм с нулевой суммой, обычно распространяются и на игры с постоянной суммой.
В играх с нулевой или постоянной суммой равновесия Нэша возникают только тогда, когда оба участника используют оптимальную стратегию. В играх же, не относящихся к этой категории, дело обстоит иначе: в них может быть множество других равновесий Нэша. В играх с непостоянной суммой на передний план выходит другой фактор – оптимальность по Парето. Оптимальным по Парето считается такое множество стратегий, в котором невозможно изменить их все в пользу одного из игроков, не ухудшив при этом положение кого-то из других участников. В игре с нулевой суммой любое множество стратегий оптимально по Парето. Но в общем случае это не так. Даже равновесие Нэша может не быть оптимальным по Парето, что демонстрирует нам проблема, известная как “дилемма заключенного”.
Двое заключенных по отдельности осуждены за преступление, предусматривающее тюремный срок в один год. Но кроме того, есть свидетельские показания, согласно которым оба причастны к более серьезному преступлению, грозящему сроком в шесть лет. Каждому из заключенных предоставляют выбор: молчать или тайно сдать подельника. Причем ни один из них не узнает о том, что сделал другой, пока не будет вынесен окончательный приговор. Если оба предадут друг друга, каждый получит по четыре года тюрьмы (по году за первое преступление и по три – за второе, более серьезное). Если только один из них предаст второго, он выйдет на свободу, а второй получит полные семь лет за оба преступления. Если все молчат, обоих приговаривают только на один год – за менее серьезное преступление. Удивительно, но получается, что, как бы ни поступил один, другому всегда выгоднее предать его, чем молчать. Единственно возможное равновесие Нэша в этом случае – взаимное предательство и по четыре года тюрьмы для каждого. Но такой вариант не оптимален по Парето, поскольку лучшим выходом для обоих было бы смолчать и отсидеть всего по году. Дилемму заключенного можно разыгрывать подряд сколько угодно, всякий раз вырабатывая стратегию на основе предыдущего опыта (этот вариант так и называется – повторяющаяся дилемма заключенного), тогда задача становится еще сложнее. Лучшие стратегии для повторяющегося варианта обычно предусматривают упорное молчание, при условии что вторая сторона поступает так же, и ответ предательством на предательство. Такие стратегии позволяют игрокам, с одной стороны, получить преимущество оптимальности по Парето в противостоянии друг другу, а с другой – избежать наихудшего исхода, делая выбор в пользу равновесия Нэша в тех случаях, когда ясно, что стратегия второго игрока – предательство.
Большинство людей предпочитает игры, которые продолжаются не слишком долго, скажем, час или два – пока участники не устали, не проголодались или не начали зевать от скуки. Международной шахматной федерацией для всех крупных турниров установлен лимит времени: 90 минут на первые 40 ходов плюс 30 минут на оставшуюся часть игры. А вот самая длинная из зафиксированных партий состоялась в 1989 году в Белграде между Иваном Николичем и Гораном Арсовичем: она продолжалась больше 20 часов и после 269 ходов закончилась ничьей по так называемому правилу 50 ходов. Оно гласит: партия может быть признана закончившейся вничью, если последние 50 ходов были сделаны игроками без перемещения пешек и без взятия фигур. Игрок, за которым очередь хода, вправе также потребовать объявления ничьей в том случае, если одна и та же позиция на доске повторилась три раза. При использовании правила 50 ходов самая протяженная партия может длиться чуть меньше 6000 ходов.
Внимание!
Сайт сохраняет куки вашего браузера. Вы сможете в любой момент сделать закладку и продолжить прочтение книги «Эта странная математика. На краю бесконечности и за ним - Дэвид Дарлинг», после закрытия браузера.