Блог им. MrVincent
Неопределенность: будет ли изменение первоначального выбора двери наилучшим решением в реальном игровом шоу?
Задача Монти Холла, сформулированная Мэрилин Савант и другими исследователями, имеет отношение к миру риска, а не к миру неопределенности. Теория вероятностей дает наилучший ответ, только когда правила игры четко определены, когда все альтернативные варианты, последствия и вероятности известны или могут быть рассчитаны. Так будет ли изменение первоначального варианта выбора наилучшим решением в реальном игровом шоу?
И тут встает очень важный вопрос: всегда ли Монти предоставлял своим гостям возможность поменять начальный выбор? (Об этом обстоятельстве не упоминалось в исходной задаче Мэрилин, но здесь речь идет о другом.) Например, если бы Монти был по натуре вредным человеком, он мог бы делать такое предложение, только когда участники выбирали дверь, за которой стоял главный приз. Изменение первоначального выбора означало бы, что участники гарантированно получат козу, что позволило бы NBC сохранить «кадиллак» для следующей передачи. Но предоставлял ли Монти каждому участнику возможность изменить свой выбор?
Барри Нейлбаф одним из первых написал о задаче Монти Холла. Он вспоминал, что видел, как Монти предлагал изменять выбор. Но он не мог вспомнить, «действительно ли Монти предоставлял такую возможность каждый раз, и вообще было ли его предложение связано с тем, правильно ли участник выбрал дверь или нет». Кэрол Эндрюс, многолетняя помощница Монти, напротив, утверждала, что Монти никогда не предоставлял участникам возможность изменить первоначальный выбор. Сам Монти Холл вспоминал, что он редко это предлагал, и не мог вспомнить, как часто его предложение принималось. О том, что происходило в действительности, мы можем никогда не узнать. Из-за судебной тяжбы по поводу прав на передачу немногие записи остаются доступными широкой публике.
Источником неопределенности является не только несовершенная память Монти и его коллег. Реальное игровое шоу непосредственно зависело от характера Монти Холла, который время от времени принимал спонтанные решения, а не строго следовал заданному сценарию. Другими словами, интрига в игре поддерживалась неуверенностью участников в мотивах действий ведущего, и эта интрига исчезла бы, если бы в каждой передаче он действовал по одним и тем же правилам. «Где написано, что я должен позволять вам менять ваш выбор каждый раз? В этом шоу я сам себе хозяин». Монти дал ясно понять, что правила, подразумеваемые задачей Монти Холла, неприменимы лично к нему. «Если ведущий обязан каждый раз открывать дверь и предлагать вам изменить ваш выбор, то вы вынуждены принимать решение. Но если он имеет право предлагать или не предлагать вам такую возможность, то берегитесь. Caveat emptor. Все зависит от настроения ведущего».
Останется ли наилучшее решение в условиях известного риска наилучшим в реальном шоу? Как объяснял сам Монти, оно может оказаться наихудшим. Однажды, после того как один участник выбрал дверь 1, Монти открыл дверь 3, за которой была коза. В то время как участник размышлял над предложением отказаться от начального выбора и выбрать дверь 2, Монти предложил ему 3 тыс. долларов наличными за то, что тот сохранит свой первоначальный выбор.
«Я бы изменил свой выбор», – настаивал участник.
«Три тысячи долларов, – повторил Монти Холл. – Наличными. Живыми деньгами. Там может быть машина, но там может быть и коза. Четыре тысячи».
Участник устоял и перед этим искушением: «Я хочу выбрать дверь 2».
«Четыре тысячи пятьсот. Четыре тысячи семьсот. Четыре тысячи восемьсот. Мое последнее предложение: пять тысяч долларов».
«Давайте откроем дверь», – настаивал участник, вновь отвергая предложение Монти.
«Тогда вы получаете козу, – сказал Монти Холл, открывая дверь. Затем он воскликнул: – Теперь вы видите, что случилось! Чем больше денег я предлагал, тем сильнее вы были уверены в том, что за дверью 2 находится машина. Я хотел убедить вас отказаться от начального выбора, так как знал, что машина стоит за дверью 1. Я делаю такие штуки, когда имею возможность контролировать ход игры».
В реальной игре знания одной теории вероятности недостаточно. Необходима также хорошая интуиция, обрести которую бывает труднее, чем выполнить расчеты. Один из способов уменьшить неопределенность заключается в том, чтобы больше полагаться на простые практические правила. Например, правило минимакса гласит:
Выбирайте альтернативный вариант, исключающий получение худшего результата.
Получить в итоге козу и добровольно отказаться от денег – это худший из всех результатов. Он возможен только в том случае, если участник изменит свой выбор. Поэтому правило минимакса советует брать деньги и держаться первоначального выбора двери 1. Оно называется так потому, что нацелено на минимизацию ваших потерь в случае реализации максимально неблагополучного сценария (в данном случае открывания двери, за которой стоит коза). Это простое правило обезопасило бы участника от психологических инсинуаций Монти и позволило бы получить деньги – и машину в придачу.
Интуитивные правила не защищают от случайных ошибок, но от них не защищают и расчеты. Второй способ уменьшить неопределенность состоит в том, чтобы разгадать мотивацию Монти. А это довольно трудно сделать, особенно когда нервничающий участник стоит в свете прожекторов перед телекамерой. Этот способ требует умения поставить себя на место ведущего. Монти, по-видимому, предлагал менять начальный выбор, так как знал, что участник выбрал дверь, за которой стоит машина. Психологический анализ ситуации поможет вам сохранить верность начальному выбору двери, как и применение правила минимакса. Фактически сам Монти предлагал версию минимакса: «Если вы сможете убедить меня предложить вам 5 тыс. долларов за то, чтобы не открывать дверь, забирайте деньги и ступайте домой».
Размышляя в неопределенном мире об известных рисках, вы можете получить козу
Задача Монти Холла иллюстрирует три темы, затрагиваемые в этой книге: как понимать риск, как иметь дело с неопределенностью и, что самое важное, как не путать эти два понятия. Многие люди недооценивают свои шансы на выигрыш в задаче Монти. Однако существует простое средство решить эту проблему: надо преобразовать вероятности в естественную частоту, чтобы увидеть, какой вариант действий является наилучшим. Эта частота называется «естественной», потому что отражает способ получения информации людьми и животными на протяжении своей истории – до изобретения книг и теории вероятности. И тогда станет легче размышлять. Не менее важное значение имеет различие между миром риска (задача Монти Холла) и миром неопределенности (реальная телепередача «Давайте заключим сделку»). Действие лучшее в мире риска не обязательно будет лучшим в реальном игровом шоу. В реальной жизненной ситуации применение теории вероятностей к неопределенному миру может оставить вас с козой – еще один вариант иллюзорной убежденности индюка в том, что риски могут быть рассчитаны.
Тем не менее в большинстве статей, посвященных задаче Монти Холла, различие между риском и неопределенностью практически полностью игнорируется.
Просто Вам надо было написать бросаем 6 раз. Ну или бросаем 100 раз.
При 100000 бросках уже очень много чего нивелируется.
С уважением
Однако, если лотерея проводится раз в неделю (а реально раз в неделю разыгрывается несколько выпусков) на протяжении 18 лет, и в нее играют, скажем, 20,000,000 человек, то шанс появления четырехкратного призера вполне себе неплохой.
Встречный вопрос (на интуицию): в классе учится 30 человек. Какова вероятность, что 2 из них родились в один день одного месяца? (возможно, разного года)
С уважением
Это сейчас она известная. А когда мне ее в 8-м классе задали — я весь вечер над ней просидел… И калькуляторов тогда удобных не было, чтобы просто посчитать...
С уважением
P.S. Там критическое число (для 50%) — 26 человек вроде. На 30 точно больше будет.
Пусть ведущий может молчать и говорить (предлагать сменить дверь). Право сменить дверь у игрока никто не отнимает. Очевидно, что оптимальная стратегия для игрока остается прежней.
Теперь рассмотрим варианты:
1. Ведущий открывает дверь и предлагает игроку сменить дверь, если он выбрал дверь с призом. В противном случае молчит. Действуя по оптимальной стратегии, игрок всегда проиграет.
2. Ведущий открывает дверь и предлагает игроку сменить дверь, если он выбрал дверь без приза. В противном случае молчит. Действуя по оптимальной стратегии, игрок всегда выиграет.
Допустим, игрок знает, что ведущий может как молчать, так и говорить.
Ведущий открывает дверь и молчит. Какова оптимальная стратегия у игрока? Каково матожидание выигрыша?
Поскольку мы не знаем, какая стратегия у ведущего, вероятность 1/2, а дверь можно и не менять.
Дальше — хуже. Ведущий открывает пустую дверь и предлагает игроку сменить выбор. Поскольку мы не знаем, какая стратегия у ведущего, вероятность 1/2, а дверь можно и не менять.
Вопрос — как полнота лексикона ведущего может повлиять на стратегию игрока?
В этом и парадокс.
Фраза «ведущий убеждает игрока сменить выбор» не имеет смысла вне понимания стратегии ведущего.
Вопросы.
1. Сколько лет даст судья ведущему за незаконный отлов снежной козы, находящейся за дверью?
2. Какой налог заплатит игрок за машину — 13 или 40 процентов?
3. Стоит ли битая девятка пяти тысяч долларов?
4. Сколько платят остальным участникам шоу? Всем одинаково? Почасовая оплата или фиксированная?
5. Транслируется ли шоу по телевизору? Каждый день одно и то же? Проводится на (в) Украине?
6. Какое время затратит исследователь на проведение 100000 бросков кости с фиксацией результатов и их последующей обработкой? А сколько ему заплатят за эксперимент?
Правильный ответ — на 100 ТЫСЯЧАХ бросков вероятность значительных отклонений выпадения стороны от 1/6 мизерная. Вероятность же того, что какая-то из сторон выпадет половину раз из 100 тысяч — непредставимо мала, уходя за много сигм нормального распределения.