Как математические способности Казановы привели к удачной лотерее?
Джакомо Казанова печально известен как любовник, азартный игрок и авантюрист, но менее известны его грозные способности в области математики и теории вероятности. В книге "Лотерея Казановы " Стивен Стиглер описывает, как, оказавшись в Париже в 1757 году после своего знаменитого побега из тюрьмы в Венеции, Казанова использовал свои аналитические способности и силу убеждения, чтобы возглавить сотрудничество по организации государственной национальной лотереи, предназначенной для оплаты Военной школы. 9. В основе лотереи лежало "колесо фортуны", содержащее шары с номерами от 1 до 90, из которых случайным образом должны были быть вытянуты пять шаров - сейчас это известно как лотерея 5/90. Игроки могли делать ставки на то, что выпадет один, два или три номера, и в случае выигрыша получали фиксированную выплату. Казанова дал понять, что правительство не будет получать прибыль при каждом розыгрыше, но утверждал, что в долгосрочной перспективе они гарантированно выиграют при предложенных им выплатах.
Это было бы безрассудным предложением, если бы Казанова не имел представления о том, каковы шансы получить прибыль. К счастью, к середине 1700-х годов были разработаны методики расчета шансов на выигрыш в лотерею с использованием формул для комбинаций, описанных выше, и навыков Казановы было достаточно, чтобы рассчитать шансы, приведенные в таблице 3.3, и рекомендовать выплаты, которые должны принести прибыль. 10
Предположим, вы купили билет, в котором указаны два числа, скажем 20 и 42. Существует 90C2 = 4 005 возможных билетов с двумя числами, которые вы могли бы купить. fn14 Из них выигрыши выпадут в пяти выбранных шарах, так что существует 5C2 = 10 выигрышных пар. Таким образом, 10⁄ 4 005, или 1 из 400,5, двухчисловых билетов окажутся выигрышными, и это шанс, что вы выбрали одну из выигрышных пар.
Таблица 3.3
Лотерея Казановы, в которой нужно выбрать одно, два или три числа от 1 до 90. Вытягиваются пять шаров, и билет выигрывает, если в нем выпали выбранные числа.
Казанова тщательно выбирал выплаты. Например, из билетов с тремя номерами стоимостью, скажем, один ливр каждый, мы ожидаем, что выиграет 1 из 11 748, и этот билет выиграет 5 200 ливров, что означает , что в среднем только 44 % денег, поставленных на билеты с тремя номерами, будут выплачены в качестве призов. Таким образом, в долгосрочной перспективе лотерея обязательно принесет прибыль, хотя это и не гарантировано в каждом тираже. В целом лотерея выплачивала 72 % своих выигрышей, что намного больше, чем у современных британских лотерей, которые выплачивают около половины поставленных денег. 11
Лотерея Казановы была очень успешной, приносила огромные доходы правительству - в какой-то момент она обеспечивала 4% национального дохода. С относительно небольшими изменениями она проводилась с 1758 по 1836 год: розыгрыш не был нарушен ни штурмом Бастилии в 1789 году, ни казнью Людовика XVI в 1791 году, хотя был временный перерыв, когда все лотереи были запрещены на три года в период революционного террора. Сайт стал убедительной демонстрацией важности тщательной оценки вероятностей.
Казанова продолжал вести странствующий образ жизни, предаваясь филантропии, азартным играм и неудачным деловым предприятиям, и благодаря своим пикантным мемуарам добился вечной славы, хотя, к сожалению, не благодаря своим математическим способностям.
В этой главе рассматривались только ситуации, в которых мы можем предположить равновероятные исходы и оценить вероятности событий простым перечислением числа возможных "благоприятных" исходов. Но это очень ограниченно, и к началу 1700-х годов швейцарский математик Якоб Бернулли дал свое имя испытанию Бернулли, которое представляет собой случайную переменную, принимающую значение 1, если событие происходит, и 0, если не происходит, с вероятностью p; например, p будет равно 1⁄ 6, если мы бросаем кости и нас интересует только , выпадет ли шестерка. Если p не равно 1⁄ 2, то все возможные последовательности уже не являются равновероятными, и общее число появлений интересующего нас события задается биномиальным распределением для общего p. fn15 Эта формула позволяет нам вычислить, например, вероятность выпадения ровно двух шестерок при двенадцати бросках костей (которая равна 0,3). fn16
Бернулли также разработал знаменитый закон больших чисел, который гласит, что если мы наблюдаем все большее число независимых испытаний Бернулли, то пропорция, в которой происходит событие, стремится к p. Например, если 30% населения верят, что Земля плоская, то если мы возьмем достаточно большую случайную выборку и спросим их мнение, то наблюдаемая пропорция плоских землян в нашей выборке будет близка к 30%. Разумеется, этот предполагает, что мы систематически не искажаем нашу выборку, например, опрашивая людей на съезде сторонников плоской Земли.
По мере увеличения размера выборки наблюдаемая доля будет сильно колебаться, пока не приблизится к 30%. Заблуждение азартного игрока предполагает, что существует некий магический процесс, с помощью которого выравнивается любой первоначальный дисбаланс. Классический пример - утверждения о том, что определенный номер в лотерее или цвет на колесе рулетки "должен" выпасть, поскольку этого не происходило в течение некоторого времени. На самом деле, лучше всего думать о том, что первоначальный дисбаланс скорее сглаживается, чем исправляется.
Теория вероятностей может сказать нам, насколько близко мы должны быть к неизвестному истинному значению p, и на основании этого мы можем построить оценки и интервалы для p. Таким образом, статистическая наука - это способ принять неопределенность, подразумеваемую в выборке, и использовать теорию вероятностей для получения выводов об основных состояниях мира. fn17 Это великое достижение, основанное на необычной работе нескольких блестящих людей, анализировавших азартные игры более 300 лет назад.
Теория вероятности добилась дальнейших успехов, в том числе основные правила были более строго сформулированы русским математиком Андреем Колмогоровым в 1930-х годах. Но хотя это может привести в порядок математику, это ничего не дает для ответа на более важный вопрос
Что такое вероятность?!
Предупреждаем, остальная часть этой главы будет немного философской, но постарайтесь продержаться.
Традиционный взгляд, которому обучались многие поколения студентов, рассматривает вероятность как объективное свойство мира, накладывающее некоторую закономерность на кажущиеся непредсказуемыми события. Предложения о ее значении включают
Классическая вероятность основана на симметрии, как мы видели на примере монет, игральных костей или лотерей, что позволяет анализировать азартные игры путем перечисления равновероятных событий. Но это круговое определение, поскольку оно требует суждения о "равновероятности".
Фреквентистская вероятность, которая представляет собой теоретическую долю событий, которые будут наблюдаться в бесконечно большом количестве повторений по сути одинаковых ситуаций. Этот подход широко используется в якобы "объективных" научных исследованиях. При применении к конкретной ситуации каждое отдельное событие должно быть помещено в референтный класс событий, которые, как предполагается, имеют одинаковую вероятность; это может быть ясно в повторяющихся контекстах, таких как рулетка или лотереи, но в целом выбор референтного класса неизбежно является суждением, даже если это редко делается явно.
Склонность" - это идея о том, что существует некая истинная тенденция, лежащая в основе конкретного события, которое произойдет в определенном контексте, например, у меня случится сердечный приступ в ближайшие десять лет. Хотя эта довольно мистическая и непроверяемая идея в принципе позволяет считать уникальные вероятности объективными, она не может применяться к эпистемическим вероятностям.
Логическая вероятность - это объективная степень, в которой набор предпосылок логически подразумевает вывод, и поэтому в принципе может привести, скажем, к обоснованной вере в то, что подброшенная и закрытая монета окажется головой. Но это применимо только к очень ограниченным ситуациям.
Обратите внимание, что все эти, казалось бы, "объективные" интерпретации вероятности требуют существенных суждений, чтобы действительно присвоить им числовые значения.
Принципиально иная точка зрения, которой мы придерживаемся с самого начала этой книги, заключается в том, что вероятность - это субъективная количественная оценка личной неопределенности, или то, что называется "частичной верой". Но это все равно оставляет нас перед проблемой определения того, что мы имеем в виду, когда говорим, например, что вероятность того, что Дональд Трамп победит на президентских выборах в США в 2024 году, оценивается примерно в 40 %, исходя из данных бирж ставок на момент написания этой книги (это декабрь 2023 года - я намеренно выбрал пример, для которого читатели, находящиеся достаточно далеко в будущем, будут знать правду).
Первые определения связаны с принятием "рациональных" решений.
Безразличие к ставкам на событие с "известной" вероятностью : Как и в случае с классической вероятностью, мы допускаем идею "одинаковой вероятности", в данном случае генератор случайных чисел выдает число, которое с равной вероятностью может оказаться в диапазоне от 0 до 1. Затем мы можем проверить, будет ли нам безразлично, ставить ли на то, что Трамп станет следующим президентом, или на то, что генератор выдаст число 0,4 или меньше. Это электронный эквивалент картонного колеса вероятности, о котором говорилось в главе 2.
Разумные коэффициенты ставок: В 1926 году Фрэнк Рэмси fn18 показал, что все законы вероятности могут быть выведены из выраженных предпочтений для конкретных азартных игр. Исходам присваиваются "полезности", и ценность азартной игры выражается ее ожидаемой полезностью, где веса в ожидании определяются субъективными числами, выражающими частичную веру, то есть нашими личными вероятностями. Таким образом, принимая во внимание нашу личную оценку денег (глава 15), наши вероятности определяются шансами, которые мы готовы принять в азартной игре на выборах 2024 года. 12
Вероятности ставок и коэффициентов Рэмси не были произвольными. Он ожидал, что они будут выверены, в том смысле, который мы видели в главе 2, так что из всех событий, которым он приписывает вероятность 0,4, он ожидает, что произойдет 40 %; он писал: "Учитывая привычку определенной формы, мы можем хвалить или порицать ее соответственно тому, насколько степень веры, которую она производит, близка или далека от фактической пропорции, в которой эта привычка приводит к истине".
Максимизация ожидаемого "балла": Если представить, что результат президента - это вопрос на конкурсе прогнозов, где ваши вероятности должны оцениваться по правилу, подобному тому, что описано в главе 2, то для максимизации ожидаемого балла вы назначите вероятность 0,4. В общем случае, чтобы максимизировать ожидаемую оценку, ваши вероятности должны подчиняться правильным законам.
Другие интерпретации могут считаться "субъективными частотными", поскольку, хотя они и являются личными суждениями, они представляют собой ожидаемые пропорции повторяющихся случаев.
Ожидаемая доля схожих ситуаций: физик Ричард Фейнман определил вероятность как "наше суждение о наиболее вероятной доле случаев, в которых происходит событие", 13 что явно субъективно и относится к последовательности схожих событий. Алан Тьюринг использовал похожую идею: "Вероятность события при определенных доказательствах - это доля случаев, в которых это событие, как можно ожидать, произойдет, учитывая эти доказательства" 14. Как и в случае частотной интерпретации вероятности, эти определения требуют, чтобы текущее суждение было встроено в некоторый более широкий класс, но предположительно можно считать, что это все ситуации, в которых вероятность 0,4 или 40%. Таким образом, Фейнман и Тьюринг, по сути, говорят, что ожидают, что их вероятности будут откалиброваны в серии суждений.
Ожидаемая доля "возможных вариантов развития событий": Вместо того чтобы встраивать конкретную вероятность в набор повторяющихся оценок, мы можем напрячь воображение и подумать о том, что могло бы произойти, если бы текущие обстоятельства повторялись снова и снова. Так, например, мы можем предположить, что Дональд Трамп будет избран в 40 % "возможных вариантов развития событий", которые могут сложиться в период с декабря 2023 по декабрь 2024 года. Лично я нахожу эту концепцию полезной, хотя и метафоричной, и она даже может подойти для "многомировой интерпретации", о которой мы поговорим позже.
Конечно, некоторые из этих субъективных "частичных убеждений" будут обоснованы сильнее, чем другие. Если я внимательно изучил монету перед тем, как подбросить ее, а она упала на твердую поверхность и хаотично подпрыгнула, я буду чувствовать себя более оправданным с моим суждением 50:50, чем если какой-нибудь сомнительный персонаж вытащит монету и даст ей несколько оборотов, прежде чем поймать ее. Поэтому мы можем с большей уверенностью относиться к некоторым суждениям, как мы увидим в главе 9.
Для тех, кто изучал математику вероятности, может оказаться неожиданностью, что до сих пор нет единого мнения о том, что же это такое на самом деле. И существует ли она вообще, как мы сейчас считаем, .
Когда я изучал математику в университете в 1970-х годах, мой наставник Адриан Смит fn19 переводил с итальянского оригинала "Теорию вероятности" Бруно де Финетти 15 . Де Финетти разработал идеи субъективной вероятности в 1930-х годах, fn20 совершенно независимо от Рэмси, и начал свою книгу с провокационного заявления
Вероятность не существует.
Это может показаться крайностью, и, хотя обсуждение того, что значит "существовать", выходит за рамки моей философской компетенции, я интерпретирую это как то, что де Финетти просто провозгласил, что вероятность не является объективным свойством мира. Я полностью проникся этим чувством в юности и за пятьдесят лет так и не отошел от мнения, что вероятности - это субъективные суждения, даже если они основаны на рассуждениях о физических симметриях, анализе данных или сложных моделях. Единственное возможное исключение - субатомный квантовый уровень, где можно утверждать, что существуют действительно объективные и определенные вероятности (см. главу 6).
Это означает, что вероятности принципиально отличаются от других чисел, которые мы используем повседневно, например, от чисел, обозначающих время, расстояние и температуру. Как мы уже упоминали в главе 2, огромные интеллектуальные ресурсы были вложены в измерение с помощью часов, линеек, термометров и других приборов, чтобы полученные числа были признаны адекватным описанием внешнего мира с той точностью, которая требуется. Но где же "вероятностный метр", который позволяет нам измерить вероятность? Его нет, за исключением, возможно, весьма ограниченного теоретического случая бесконечно повторяющихся одинаковых испытаний. Действительно, вероятность можно считать виртуальной величиной.
Но если мы признаем, что вероятности строятся на основе личных суждений, значит ли это, что любые старые числа подходят, если они подчиняются правилам, изложенным ранее? Могу ли я просто сказать, что вероятность того, что я могу слететь с крыши, составляет 99,9%? Ну, я могу, , но если я попытаюсь это сделать, то вскоре окажусь плохим оценщиком вероятностей. И вот тут-то и приходит на помощь объективный, внешний мир - в оценке вероятностей при их проверке на соответствие реальности, скажем, с помощью правильного правила подсчета очков. Или скорой помощи.
К счастью, как мы рассмотрим далее в главе 6, на практике нам не нужно решать, существуют ли объективные "шансы" в повседневном, не квантовом мире - мы можем использовать прагматичный подход, просто действуя так, как будто они существуют. По иронии судьбы, самый убедительный аргумент в пользу того, чтобы действовать так, как будто шансы существуют, привел сам де Финетти в своей работе 1931 года о "взаимозаменяемости". 16 Последовательность событий считается взаимозаменяемой, если наши убеждения о каждой последовательности не зависят от порядка наблюдений; например, при оценке вероятности извержения гейзера в каждый из множества дней фактические даты не имеют значения, а предполагаемые наблюдения могут быть в любом порядке. Де Финетти блестяще доказал, что если мы сделаем это предположение о взаимозаменяемости, то математически это эквивалентно тому, чтобы действовать так, как если бы события в каждый день были независимыми, каждое из которых имеет некоторую истинную базовую вероятность извержения, а наша неопределенность относительно этой неизвестной вероятности выражается субъективным эпистемическим распределением. Это замечательно и довольно красиво - из чисто субъективного выражения убеждений следует, что мы должны действовать так, как если бы событиями управляли объективные шансы.
Теория вероятности лежит в основе всей статистической науки и значительной части научной и экономической деятельности, и необычно, что столь важная работа возникла на основе того, чего, как можно утверждать, просто не существует.
Резюме
Люди играли в азартные игры тысячелетиями, но, что примечательно, идея вероятности была разработана лишь в 1600-х годах.
Правила вероятности можно интуитивно вывести из рассмотрения того, что, как мы ожидаем, произойдет при большом количестве повторений.
Условные вероятности, которые меняются по мере изменения ситуации, возникают естественным образом, когда мы делаем выборку без замены.
Если мы можем предположить физический процесс, который генерирует одинаково вероятные исходы, то оценка вероятностей сводится к подсчету "удачных" исходов, которые приводят к интересующему нас событию.
Формулы и приближения для подсчета "удачных" исходов позволяют установить вероятность успеха в азартных играх, лотереях и так далее.
Вероятность интерпретируется по-разному: и как объективное свойство мира, и как субъективное суждение.
Если мы признаем, что вероятность отличается от других мер, которые обычно используются, и строится на основе субъективного суждения, то мы все равно можем использовать объективный мир для оценки качества этих вероятностей.
Однако объективные "шансы" могут существовать на субатомном квантовом уровне, и может быть полезно действовать так, как будто они существуют в повседневной жизни.
ГЛАВА 4. Сюрпризы и совпадения
В главе 1 я определил неопределенность как "сознательное осознание незнания", а викторина в главе 2 и упражнения на определение вероятности в главе 3 показали, как мы можем выразить в цифрах нашу сознательную неопределенность в отношении событий. Но большую часть своей жизни мы не столь сознательны - мы идем по какому-то приблизительному плану, не задумываясь обо всех возможностях , которые могут произойти, подстраивая свое поведение под намеченный путь, как одинокий моряк, автоматически делающий небольшие поправки, чтобы не сбиться с курса.
Но время от времени нас выводит из состояния самодовольства неожиданное событие. Это может быть неожиданное несчастье, как у того моряка, которого ударило причудливой волной, но может быть и благотворное и удачное стечение обстоятельств - часто называемое совпадением - которое приводит нашу неуверенность в сознание. Несчастные случаи или катастрофы могут шокировать или навредить нам, но большинство совпадений заставляют нас улыбаться - их можно считать "плюсом" неопределенности. Меня завораживают совпадения, хотя они почти никогда не случаются со мной. Поэтому несколько лет назад, когда я делал программу о случайностях для BBC, наша команда в Кембридже создала "Кембриджскую коллекцию совпадений ", которая в итоге содержит около 5 000 историй, присланных публикой. 1
И так до брюк Рона Бидермана. 2 Некий человек, которого мы будем называть Дагом, рассказал, что в хостеле для бэкпекеров в Майами у него украли всю одежду и что некто по имени Рон Бидерман любезно предоставил ему полосатую рубашку из Израиля. Несколько лет спустя Даг остановился в другом хостеле в Лондоне и завел разговор об Израиле с девушкой, сидевшей напротив него в кафе. Первым совпадением, которое они заметили, было то, что они оба встречались с Роном Бидерманом, а вторым - то, что на Даге в тот момент была рубашка Рона. Затем девушка встала и показала, что на ней надеты подходящие брюки, подаренные ей Роном Бидерманом в кибуце.
Честно говоря, я думал, что это немного надуманно, пока не получил письмо с просьбой написать мне на - от самого Рона Бидермана! Он подтвердил, что отдал эту одежду, прислал мне свою фотографию с брюками и был так рад, что получатели встретились. Очень приятная связь.
Люди любят говорить о совпадениях, с которыми им довелось столкнуться, но что такое совпадение? В классической научной работе статистики Перси Диаконис и Фредерик Мостеллер использовали такое определение:
Совпадение: "удивительное совпадение событий, воспринимаемое как значимо связанное, без очевидной причинно-следственной связи". 3
Он содержит три необходимых элемента:
Событие связано с неожиданной связью.
Она вырывается из повседневных обстоятельств и приковывает наше внимание - возможно, мы запомним ее на всю жизнь.
Непосредственного объяснения тому, почему это произошло, нет - хотя, как мы увидим позже, существует множество теорий, почему это происходит.
Среди наиболее распространенных тем в нашей коллекции совпадений в Кембридже
Найдите связь с кем-то, кого вы встретили: например, двое незнакомцев, разговаривая в отеле в Риме, обнаружили, что у них обоих сыновья работают в одной компании, позвонили им и выяснили, что они сидят за соседними столами.
Встреча со знакомым человеком в маловероятном месте: , например, Мик Престон во время отпуска в Пиренеях отправляется на почту с открыткой для своего друга Алана, а по дороге встречает Алана.
Предмет, появляющийся вновь: например, вы отдыхаете в Португалии и находите вешалку, которая принадлежала вашему брату сорок лет назад. 4
Некоторые истории не так легко классифицировать. Например, пара, которая обнаружила, что оба родились в одной и той же деревне в Германии, где была только одна маленькая больница и одна кровать, на которой рождались все дети. Поэтому они решили, что оба родились в одной кровати. 5
Все эти странные события требуют ответа на очевидный вопрос: "Какова вероятность этого?!". К сожалению, большинство совпадений не поддается формальному анализу, но некоторые из них мы можем попытаться оценить в цифрах. И одно из них произошло со мной на сайте .
Как я уже сказал, я редко сталкиваюсь с совпадениями. Я слишком ненаблюдателен, и поэтому никогда бы не стал, как сообщали другие люди, отмечать, что неоднократно видел одного и того же человека во время прогулок по Лондону. Кроме того, будучи типичным англичанином, я не разговариваю с незнакомцами, пока меня не представят, так что я мог бы часами сидеть в поезде рядом со своим давно потерянным близнецом и никогда бы этого не заметил. На самом деле самое большое совпадение в моей жизни (пока что) произошло в 2018 году во время записи материала для радиопрограммы BBC, которая, что весьма примечательно, была посвящена совпадениям. 6
Я рассказывал случайную историю, связанную с днем рождения, который пришелся на 27 января. Наступила пауза, и интервьюер сказал: "Дэвид, пока вы рассказывали мне эту интересную историю о дне рождения 27 января, продюсер Кейт только что говорила мне на ухо, что не только ее день рождения 27 января, но и у инженера, с которым она сейчас работает в студии, записывая это интервью, тоже день рождения 27 января". Ну и какова вероятность этого?
Разумная вероятность того, что у Кейт был этот день рождения, равна 1⁄ 365, а если предположить, что продюсер не был ее близнецом, то вероятность того, что оба родились 27 января, равна 1⁄ 365 1 × ⁄ 365, то есть примерно 1 к 133 000. Так что это было действительно довольно удивительно, хотя, возможно, и не так странно, как некоторые истории в этой главе. И, что очень приятно, это было заснято на пленку и показано в программе - редкий случай, когда совпадение было запечатлено в момент, когда оно произошло.
Тот же расчет применим к истории, которая довольно часто появляется в СМИ (предположительно, предоставленной агентством в слабый новостной день), о семье с тремя детьми, которые разного возраста, но имеют один и тот же день рождения.fn1 Если мы предположим, что дни рождения происходят случайным образом в течение года, то день рождения "назначает" старший ребенок, и вероятность того, что два их брата или сестра родились в один и тот же день, снова равна 1⁄ 365 1 × ⁄ 365 1 ≈ ⁄ 133 000, как и в случае с необычным совпадением дней рождения во время моей радиозаписи. Иногда СМИ ошибаются, 7 обычно включая в расчет первый день рождения и умножая на 1⁄ 365, чтобы получить 1 к 48 миллионам (если вероятность действительно так мала, возможно, им стоит задуматься, почему эта история появляется так часто).
Популярная радиопрограмма BBC "Больше или меньше", посвященная статистике, 8 обратилась ко мне с просьбой ответить на аналогичный вопрос, заданный слушателем Дэвидом, который родился 6 февраля, как и двое из его троих детей.
Какова разумная вероятность того, что в семье из двух родителей и трех детей (без близнецов) у одного из родителей день рождения совпадает с днем рождения двух детей?
На первый взгляд может показаться, что вероятность снова будет равна 1⁄ 365 1 × ⁄ 365 1 ≈ ⁄ 133 000. Но у Дэвида трое детей, и поэтому существует 3C2 = 3 возможных пары, которые могут совпасть, а также есть выбор из двух родителей, и поэтому я пришел к выводу, что вероятность будет примерно 6⁄ 133 000 ≈ 1 к 22 000. Поскольку в Великобритании насчитывается около 1 миллиона семей с тремя детьми до восемнадцати лет, я мог сказать Дэвиду, что его семья входит в число примерно 1 000 000⁄ 22 000 ≈ 45 подобных семей в стране. Так что они были необычными, но, конечно, не уникальными.
Все эти расчеты предполагают, что каждый день с равной вероятностью является днем рождения. Это не так. Во-первых, семья может планировать рождение детей в определенное время года. fn2 Во-вторых, меньше рождений приходится на праздничные дни, а больше - на сорок недель после рождественских каникул - 27 сентября является самым распространенным днем рождения в году. Но эти отклонения от чистой случайности не настолько велики, чтобы сильно повлиять на расчеты, и в любом случае делают совпадение еще более вероятным. 9
Эти примеры, которые, как я признаю, не имеют мирового значения, иллюстрируют стандартную технику анализа необычных на первый взгляд событий:
Оцените, если возможно, вероятность для конкретного рассматриваемого экземпляра.
Оцените общее количество возможностей для того, чтобы подобное событие произошло в определенном контексте за определенный период времени.
Перемножьте ответы на вопросы (A) и (B), чтобы получить ожидаемое количество событий.
Используйте это ожидание, чтобы определить, насколько "удивительно" услышать о таком событии.
Эти методы можно использовать как для кластеров катастроф, так и, как мы сейчас увидим, для трогательных семейных историй.
Некоторые истории разворачиваются на протяжении всей жизни, как показано на необычном мемориале , посвященном мистеру и миссис Хантроддс в Уитби, Йоркшир, 10 , представленном на рисунке 4.1.
Как видите, они оба родились 19 сентября 1600 года, поженились 19 сентября, имели двенадцать детей, а затем умерли в течение пяти часов друг от друга в свой совместный восьмидесятый день рождения 19 сентября 1680 года. Впечатляющее совпадение.
Насколько необычным был бы сегодня общий день рождения Хантроддов? 11 В Англии и Уэльсе насчитывается около 13 миллионов сожительствующих пар 12 , так что, если дни рождения не играют никакой роли в том, что люди собираются вместе, по случайности можно ожидать, что примерно 13 000 000⁄ 365 ≈ 36 000 пар будут иметь общий день рождения. Около 9 % пар, заключивших брак в 2001 году, были одного возраста. Таким образом, опять же при условии случайного подбора пар, более 3000 пар могли бы разделить один праздничный торт с одинаковым количеством свечей. fn3 Примечательный пример - Джойс и Рон Пулсфорд из Пагама, Западный Суссекс, которые родились 8 августа 1928 года и отметили свой совместный восьмидесятый день рождения 08/08/08. 13
Вы можете не считать, что Хантродды - это совпадение. В конце концов, они сами выбирали, когда и за кого выходить замуж, и поэтому действительно странно, что оба они умерли в совместный день рождения . Часто говорят, что дни рождения связаны с повышенным риском, хотя на статистику могут влиять как дети, которые, к сожалению, умерли сразу после рождения, так и регистрационные ошибки, когда день рождения ошибочно копируется как день смерти. Но была ли чума в Уитби в 1680 году? Случился ли несчастный случай на их дне рождения? Было бы здорово узнать. Должно быть, они были местными героями, имея так много детей, одинаковые дни рождения, и будучи такими старыми для того времени. Они заслуживают своего мемориала.
Рисунок 4.1
Памятник Фрэнсису и Мэри Хантроддам в церкви Святой Марии, Уитби, Йоркшир, родившимся, поженившимся и умершим 19 сентября.
Всегда существовали теории о том, почему происходят совпадения, и многие предполагали, что существует некая внешняя сила, которая приводит к этим "удивительным совпадениям". Пол Каммерер развил идею серийности, утверждая, что "наряду с причинностью классической физики, во Вселенной существует второй основной принцип, стремящийся к единству; сила притяжения, сравнимая с универсальной гравитацией". Аналогичным образом психиатр и психоаналитик Карл Юнг предложил существование синхронистичности, "акаузального связующего принципа", который объясняет не только физические совпадения, но и предчувствия. Аналогичная идея морфического резонанса принадлежит исследователю парапсихологии Руперту Шелдрейку , который предположил, что "морфогенетические поля работают, накладывая паттерны на случайные или неопределенные схемы активности" 14 , и это может объяснить такие явления, как ощущение, что на вас смотрят, собаки знают, когда их хозяева возвращаются домой, и так далее.
Боюсь, я скептически отношусь к этим теориям о некой внешней силе. Я бы утверждал, что несомненное возникновение необычайно удивительных событий обычно объясняется тремя основными причинами:
Закон действительно больших чисел: 15 Если существует достаточно большое количество возможностей, то даже очень редкие события в конце концов произойдут.
Быть избирательным: запоминать только удивительные совпадения и игнорировать все не относящиеся к делу предсказания, сны и предчувствия , которые не произошли. Об этом свидетельствует множество "ясновидящих" животных, предсказывающих результаты спортивных соревнований.
Придумывание истории, чтобы сделать событие более удивительным: например, в тестах на экстрасенсорное восприятие, щедрость в объявлении "совпадения" между рисунками двух разных людей.
Возможно, самый необычный аспект совпадений - это то, как мало о них сообщается. На каждое выявленное должно приходиться огромное количество незамеченных совпадений: возможно, я сидел рядом со своим давно потерянным близнецом, разлученным при рождении. Эти "скрытые" совпадения должны происходить с нами постоянно, если бы мы только знали о возможных связях с людьми, с которыми мы сталкиваемся.
Классическая проверка закона действительно больших чисел включает в себя симов и одного известного драматурга.
Напишет ли группа обезьян на пишущих машинках в конце концов Полное собрание сочинений Шекспира?
Для программы BBC Horizon 2010 года о бесконечности 16 я установил программу-симулятор обезьян 17 и оставил ее работать в моем офисе на несколько дней. 18 После 113 миллионов воображаемых нажатий клавиш (что эквивалентно примерно 26 дням работы 50 обезьян, печатающих по одному символу в секунду) лучшее, что удалось сделать виртуальным обезьянам , - это девять символов "we lover", которые появляются в "Love's Labour's Lost", акт 2, сцена 1, в речи Бойе: "With that we lovers entitle affected.
В Полном собрании сочинений около 5 миллионов знаков, и, даже не учитывая верхний и нижний регистр и пунктуацию, мы подсчитали, что каждый раз, когда обезьяна начинает печатать, шанс закончить Шекспира составляет 1 к 107 500 000. Поскольку 107 500 000 ≈ 225 000 000, это примерно такой же шанс, как подбросить честную монету 25 миллионов раз, и каждый раз она будет выпадать головой вверх, или выигрывать в лотерею каждую неделю в течение 20 000 лет. Маловероятно, но не логически невозможно, и поэтому, возможно, стоит попробовать. Поэтому в 2003 году, получив 2 000 фунтов стерлингов от Совета по искусству, исследователи установили клавиатуру на четыре недели в зоопарке Пейгнтона в клетке с шестью макаками - Элмо, Жвачкой, Вереском, Холли, Омелой и Роуэном. К сожалению, они создали всего пять страниц текста, в основном на букву S, а затем испачкали клавиатуру. fn4
Закон действительно больших чисел гласит, что совпадения происходят потому, что возможностей много, и это может привести к тому, что сюрпризы случаются удивительно часто. Один из классических примеров, который даже иногда называют "парадоксом вероятности" , гласит, что в группе из 23 случайных людей как минимум в половине случаев найдется хотя бы одна пара с одинаковыми днями рождения. Это означает, например, что более чем в половине футбольных матчей два человека на поле (из 22 игроков и судьи) будут иметь общий день рождения.
По случайному совпадению, в составах команд на чемпионатах мира по футболу участвуют ровно 23 игрока, поэтому из 32 команд, которые примут участие в женском чемпионате мира 2023 года , мы ожидали, что в 16 будут игроки с одинаковыми днями рождения . А оказалось... 17! Два нигерийских футболиста, которых зовут Глори Огбонна и Кристи Учейбе, родились в Рождество. 19 На самом деле мы могли бы ожидать еще больше пар, поскольку элитные спортивные игроки, как правило, находятся в старшей возрастной группе.
Это еще один пример "задачи на совпадение", когда у нас есть группа людей или других предметов, и мы хотим получить вероятность того, что хотя бы одна пара будет обладать определенной характеристикой. Если мы хотим вычислить вероятность совпадения, то первый урок заключается в том, что всегда лучше вычислить вероятность отсутствия совпадения, когда все люди разные, и вычесть ее из 1.
Чтобы получить эту вероятность, мы можем сделать либо довольно сложный точный расчет, либо , либо аккуратное сокращение. Сначала точный расчет. Представьте себе 23 человека в очереди, и нам нужна вероятность того, что у всех них разные дни рождения. День рождения первого человека может быть любым; второй день рождения должен отличаться от первого, и это имеет вероятность 364⁄ 365; fn5 третий день рождения должен отличаться от первого и второго, и это имеет вероятность 363⁄ 365, и так далее - по сути, это пример выборки без замены, и поэтому условные вероятности меняются. Таким образом, вероятность того, что все 23 дня рождения отличаются друг от друга, равна
Каждое из этих 22 чисел близко к 1, что говорит о том, что у каждого конкретного человека в линии, скорее всего, "неиспользованный" день рождения. Но когда множество этих чисел перемножается вместе, результат оказывается меньше половины - это числовое явление и является источником неинтуитивного результата.
Как и было обещано, существует альтернативный, чрезвычайно полезный способ получения таких вероятностей, который позволит вам удивить своих друзей и, возможно, выиграть у них деньги.
Правило: Предположим, что мы находимся в условиях, когда есть много возможностей для того, чтобы произошел определенный тип редкого события. Тогда, если мы ожидаем в среднем m редких событий, вероятность того, что ни одно из них не произойдет, равна e− m.
Здесь e - экспоненциальная константа 2,718 ..., полученная как предел при увеличении n до бесконечности. Это чрезвычайно полезное число, впервые открытое (или изобретенное, в зависимости от вашей философии математики) Якобом Бернулли в 1683 году при работе над сложными процентами и легшее в основу идеи экспоненциального роста, которая существенно поднялась во время пандемии Ковида. fn6 Правило выше может быть получено непосредственно fn7 из определения e.
Давайте вернемся к задаче о дне рождения и посмотрим более прямой способ показать, что вероятность совпадения у 23 человек составляет более 50 %. Если мы возьмем любую пару людей в группе из 23 человек, то вероятность того, что у них совпадет день рождения, составит 1⁄ 365. Но существует множество возможных пар, в действительности 23C2 = (23 × 22)⁄ 2 = 253 - это количество рукопожатий, необходимое, если бы каждому человеку было сказано пожать руку всем остальным . Таким образом, существует 253 возможности для совпадения, каждая из которых имеет вероятность 1/365, поэтому ожидаемое число совпадений составляет 253⁄ 365 = 0,693. fn8 Используя правило выше, калькулятор показывает, что приблизительная вероятность отсутствия совпадений составляет e-0,693 = 0,499, и поэтому это простое приближение дает правильный ответ, что вероятность того, что двое будут иметь общий день рождения, чуть больше 50%.
В табл. 4.1 приведены некоторые примеры простого правила для конкретных значений ожидаемых чисел событий, которое может быть использовано для решения многих видов задач на соответствие.
Предположим, спортивная команда отдает ключи от своих шкафчиков на хранение судье, который сваливает их в кучу. Затем судья наугад передает ключи обратно, и каждый из команды пробует тот ключ, который ему дали. Какова разумная вероятность того, что хотя бы одному игроку удастся открыть свой шкафчик? fn9
Ожидаемое количество событий (м)
Приблизительная вероятность того, что никаких событий не произойдет: e-m
Приблизительная вероятность того, что произойдет ровно одно событие: m e-m
Приблизительная вероятность того, что произойдет хотя бы одно событие: 1 - e-m
0.693
50%
35%
50%
1
37%
37%
63%
2
14%
27%
86%
3
5%
15%
95%
4
2%
7%
98%
Таблица 4.1
Предположим, что существует множество возможностей для возникновения редких событий, и известно их ожидаемое число m. В столбцах приведены приблизительные вероятности для отсутствия событий, одного события и хотя бы одного события. Вероятность одного события получена из приближения Пуассона, о котором речь пойдет ниже, а числа подлежат округлению.
Это может показаться безответным, поскольку я не сказал, насколько велика команда. Но важнейшее наблюдение состоит в том, что, независимо от числа игроков, ожидаемое число ключей, возвращенных законному владельцу, равно 1 fn10 - по сути, с увеличением числа игроков вероятность того, что каждый отдельный игрок получит свой ключ, уменьшается, но игроков становится больше, и поэтому общее ожидаемое число совпадений остается прежним. Таким образом, из таблицы 4.1 вероятность того, что никто не получит нужный ключ, равна приблизительно e-1 1 = ⁄ e = 0,37 или 37 %, а значит, вероятность того, что хотя бы один игрок сможет открыть свой шкафчик, равна 63 %. Это приближение очень точно при условии, что в команде не менее пяти человек.
Все это известно уже 300 лет, с тех пор как французский математик Пьер Раймон де Монморт в 1700-х годах проанализировал игру Treize. Это была разновидность игры в трельяж, в которой каждый из двух игроков тасовал полную масть из тринадцати карт, , скажем, одну Червы и одну Пики, а затем одновременно переворачивал свои карты по одной, заявляя о совпадении, если они оба переворачивали карты с одинаковыми номерами, скажем, пятерку Червы и пятерку Пики. Позднее методы Монморта были усовершенствованы знаменитыми математиками Николаем Бернулли (племянником Якоба) и Леонгардом Эйлером 20 для разного количества карт в игре; они показали, что вероятность совпадения очень быстро приближается к 1 - e-1 = 0,6321 ...: для примера, когда у каждого игрока всего по пять карт, вероятность совпадения составляет 0,63. В этой простой игре всегда выигрывает тот, кто ставит на то, что матч состоится.
Если бы вы были таким человеком, как бы вы могли использовать эти идеи, чтобы отнимать деньги у людей? Во-первых, вы, возможно, захотите сыграть в Treize или Snap, предполагая, что победа будет за вами: если вы всегда ставите на то, что будет совпадение, вы будете выигрывать в 63 % случаев, независимо от количества карт в игре.
Ваш оппонент может довольно быстро это понять, и вот вам несколько других приемов. Диаконис и Мостеллер дают простое приближение fn11 к количеству людей, необходимых для того, чтобы быть уверенным в близком совпадении дней рождения. 21 В таблице 4.2 показано, как это можно использовать для определения того, сколько людей необходимо для того, чтобы с вероятностью 50 % или 95 % совпали дни рождения с разницей до трех дней. Например, если мы готовы объявить совпадение, если дни рождения находятся на расстоянии всего одного дня друг от друга, то, как следует из таблицы 4.2, нам нужно всего 13 человек, чтобы вероятность совпадения была примерно 50 %. fn12 И снова мы видим, что у 23 человек вероятность точного совпадения дней рождения будет 50 %, а также существует по крайней мере 95 %-ная вероятность того, что у двух из них дни рождения будут находиться между двумя днями друг от друга, скажем 6 и 8 июня (для 21 человека это будет почти точно 95 %, а для 23 - еще выше). Так что вы почти наверняка выиграете это пари, хотя оно и не покажется вам таким уж впечатляющим.
Промежуток между днями рождения
Вероятность того, что 2 случайных человека "совпадут": 1 из K
Число, необходимое для того, чтобы вероятность совпадения составляла примерно 50 %: 1.2 √K
Число, необходимое для того, чтобы вероятность совпадения составляла около 95 %: 2.5 √K
В тот же день
1 из 365
23
48
+/− 1 день
1 из 122
13
28
+/− 2 дня
1 из 71
10
21
+/− 3 дня
1 из 52
9
Таблица 4.2
Примерное количество людей, необходимое для того, чтобы с вероятностью 50% или 95% получить определенную степень совпадения дней рождения. Предположим, что вероятность совпадения между двумя людьми составляет 1⁄ K, тогда для 50-процентной вероятности совпадения нам потребуется около 1,2√K человек, а для 95-процентной вероятности совпадения - около 2,5√K человек.
Еще один способ озадачить и удивить своих друзей - попросить их назвать две последние цифры их телефонных номеров и посмотреть, есть ли среди них два совпадающих. В табл. 4.3 показано, что, например, в группе из 15 человек ожидаемое число совпадений равно 1,05, fn13 и так Приблизительная вероятность хотя бы одного совпадения составляет 65 %, что близко к точной вероятности в 67 %.
Я играл в эту игру с группами по двадцать человек, в которой просил их выбрать случайное число от 1 до 100, и выигрывал, если двое из них выбирали одно и то же число. Если они действительно выбирают наугад, вероятность моего выигрыша составляет 87 %, и это может быть очень впечатляющим, когда совпадения продолжаются. fn14
Но людям крайне сложно выбрать случайные числа, и они, как правило, выбирают любимые, такие как 7 и 99, что значительно повышает шансы на выигрыш, но делает фокус менее удивительным. Телефонные номера будут более случайными, но их можно сыграть только один раз. Или, во время долгих и скучных поездок с детьми на машине, попросите их записать две последние цифры на регистрационных знаках, которые они видят, и поспорьте с ними на карманные деньги, что в следующих двадцати машинах они найдут повторяющиеся номера. fn15 Вероятность выигрыша должна составлять 87 %, а также вы преподадите им ценный урок о ставках.
Количество человек
Ожидаемое количество совпадений между двумя последними цифрами их телефонных номеров (m)
Приблизительная вероятность того, что между двумя последними цифрами их телефонных номеров есть хотя бы одно совпадение 1 - e-m
Точная вероятность хотя бы одного совпадения двух последних цифр их телефонных номеров
2
0.01
1%
1%
5
0.1
10%
10%
10
0.45
36%
37%
15
1.05
65%
67%
20
1.90
85%
87%
25
3.00
95%
96%
30
4.35
99%
Таблица 4.3
Приблизительные и точные вероятности совпадения двух последних цифр телефонных номеров людей. При наличии двадцати человек вероятность совпадения составляет 87 %.
Входите, барон Пуассон!
До сих пор мы рассматривали только вероятность того, что не произойдет ни одного события, но нас также может интересовать вероятность того, что произойдет ровно одно, два или более событий. Если мы предположим, что существует n независимых возможностей для наступления события, каждая из которых имеет вероятность p, то мы можем использовать биномиальное распределение, введенное в главе 3. Рассмотрим вопрос о том, чтобы опросить выборку из ста человек об определенной характеристике - скажем, любят ли они мармит. fn16 Предположим, что истинная доля в популяции составляет 10 % или 1 %, и сделаем смелое предположение, что опрос проведен идеально, то число респондентов, которым нравится мармит, будет соответствовать биномиальному распределению, показанному черным цветом на рисунке 4.2.
В 1711 году Абрахам де Муавр показал, что при больших n и малых p биномиальные вероятности могут быть хорошо аппроксимированы более простой формой, позже названной распределением Пуассона, после формального вывода барона Симеона Дени Пуассона в 1837 году.fn17 Распределение Пуассона полностью определяется его ожиданием m, которое в данных случаях равно m = np = 10 или 1, и применяется в ситуациях, когда существует большое количество возможностей для редкого события, например количество убийств в день в Англии и Уэльсе, 22 количество прусских офицеров, ежегодно забиваемых до смерти своими лошадьми, и, как мы увидим в главе 11, количество голов в футбольном матче. Распределение позволяет оценить вероятности наступления любого количества событий, fn18 и поэтому может быть использовано для ответа на следующий тип совпадений, который является менее безобидным, чем предыдущие примеры.
Рисунок 4.2
Биномиальные распределения для n = 100 и p = 0,1 (10%) и p = 0,01 (1%) в сравнении с пуассоновскими распределениями со средними 10 и 1.
Насколько необычно, что три крупных авиакатастрофы произошли в течение восьми дней?
В 2014 году 17 июля над Украиной был сбит рейс 17 авиакомпании Malaysia Airlines, 23 июля рейс 222 авиакомпании TransAsia врезался в здания на Тайване, а 24 июля в Мали заглох и разбился самолет рейса 5017 авиакомпании Air Algérie . Насколько удивительно такое трагическое скопление?
На необычном сайте PlaneCrashInfo 23 сообщается, что за предыдущие 10 лет (2004-13 гг.) разбился 91 коммерческий рейс с 18 и более пассажирами, то есть в среднем один раз в 40 дней. fn19
Рассмотрим любой конкретный промежуток времени в 8 дней. Если самолеты разбиваются совершенно непредсказуемым образом с частотой 91 за 10 лет (3 650 дней), то мы ожидаем 8 × 91⁄ 3 650 = 0,2 крушения в любом конкретном 8-дневном окне. Если использовать распределение Пуассона с таким средним значением, то разумная вероятность того, что произойдет хотя бы три аварии, составит примерно 1 к 1000. Поэтому очень удивительно, что в период с 17 июля по 24 июля 2014 года произошло три аварии.
Но это не тот вопрос, который нужно задавать. В этих конкретных восьми днях нет ничего особенного , и нас интересует только этот конкретный период из-за аварий. Скорее, нас должно интересовать, является ли такое скопление удивительным на каком-то более длительном интервале, скажем, за десять лет. Довольно сложная корректировка "скан-статистики", которая позволяет учесть все возможные восьмидневные окна за этот период, увеличивает вероятность до 0,59. 24 Таким образом, вероятность того, что мы увидим такое большое скопление за десятилетний период, составляет примерно шесть из десяти, и поэтому совсем не удивительно, что такое скопление иногда случается. И, что обнадеживает, количество крупных авиакатастроф со смертельным исходом неуклонно снижается.
Статистический анализ быстро разрушил любые представления об общей причине авиакатастроф в 2014 году, но другие скопления трагических событий могут вызвать подозрения в злонамеренном поведении. Было несколько судебных дел, в которых ряд смертей или серьезных событий связывали с конкретным человеком, что приводило к подозрениям в "убийстве по медицинским показаниям". Иногда базовый статистический анализ ясно показывает, что картина событий не может быть объяснена только случайностью, как в случае с доктором Гарольдом Шипманом, британским семейным врачом, который в итоге был уличен в убийстве как минимум 215 своих пациентов за 20-летний период - как я описываю в книге "Искусство статистики", его можно было бы определить как крайне необычного после примерно 40 смертей, если бы только кто-то обратил внимание на данные.
Шипман был крайним примером настоящего серийного убийцы, , но другие случаи показывают, что необходимо проявить осторожность, прежде чем суд придет к выводу о злонамеренности происходящего. Люсия де Берк была педиатрической медсестрой в Нидерландах, которая в 2004 году была осуждена за убийство семи детей и попытку убийства еще троих. После того как она попала под подозрение, тщательная проверка выявила ряд неблагоприятных событий у пациентов, находившихся под ее наблюдением. На суде над ней было выдвинуто утверждение, что вероятность того, что такое количество смертей произошло в то время, когда она находилась на службе, была всего лишь 1 к 342 миллионам.
Высокопоставленные статистики повторно изучили доказательства и пришли к выводу, что более разумная вероятность может составлять 1 к 25, и после появления дополнительных медицинских свидетельств де Берк был повторно привлечен к суду в 2010 году и освобожден. В докладе Королевского статистического общества позже утверждалось, что профессиональные статистики должны участвовать в критике любого подобного заявления о "слишком малой вероятности , чтобы быть просто совпадением". 25 Мы рассмотрим подобные судебные ошибки в главе 10.
На протяжении всей этой книги я постоянно подчеркиваю, что любые оценки вероятности зависят от предположений, и мы должны постоянно спрашивать себя, являются ли они разумными, сомнительными или даже абсолютно неверными. В качестве иллюстрации осторожности, необходимой перед тем, как погрузиться в сложные расчеты, рассмотрим еще одну классическую историю о совпадениях, которая регулярно появляется в дни отсутствия новостей, и которая касается человека, купившего коробку крупных яиц и обнаружившего, что все они имеют двойной желток. Как обычно, это приводит к вопросу "Какова вероятность этого?". В примере из 2010 года 26 кто-то из "Яичного совета" сказал, что только 1 из 1000 яиц имеет двойной желток, и поэтому шанс получить 6 таких яиц в коробке был заявлен как 1 из 1 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 (1⁄ 1 000 умножить 6 раз).
Для начала нужно проверить, насколько правдоподобно это число. Ежегодно в Великобритании продается около 2 миллиардов (2 000 000 000 000) полудюжин яиц, но даже при таком огромном количестве мы могли бы ожидать, что такое редкое событие произойдет лишь раз в 500 000 000 лет. А оно только что произошло, так что этот сразу же наводит на мысль, что заявленная вероятность безнадежно ошибочна. Очевидной ошибкой является предположение, что яйца в коробке независимы, в то время как они, как правило, происходят из одного стада, и поэтому получение одного яйца с двойным желтком увеличивает вероятность получения другого в той же коробке.
Но, возможно, существует более фундаментальная проблема с нашими предположениями. Я продемонстрировал это, купив коробку яиц , открыв их и обнаружив, что все они двухжелтковые! Необыкновенно!
А может, и нет - на рисунке 4.3 показано, что я купил коробку с надписью "с двумя желтками". Оказывается, такие яйца можно легко обнаружить, поднеся их к свету, и отобрать для включения в коробку, поэтому шесть яиц в оригинальной истории, предположительно, были отсортированы, а затем помещены в обычную коробку, возможно, после того, как был выполнен заказ на двухжелтковые яйца. Мы понятия не имеем, как часто это происходит, но уж точно не раз в 500 000 000 лет.
Этот до смешного банальный пример иллюстрирует важную мысль. Мы должны постоянно подвергать сомнению свои предположения и смиренно признавать, что вся основа нашего мышления может быть неверной.
Рисунок 4.3
Я купил коробку яиц, и все они были с двойными желтками! Но это было неудивительно.
В этой главе мы рассмотрели совпадения и показали, что удивительные на первый взгляд события случаются на удивление часто. Наши примеры иногда были скорее забавными, чем важными. Но многие редкие и неожиданные события не вызовут у нас улыбки, будь то финансовые крахи, экологические катастрофы, столкновения с астероидами и так далее, вплоть до длинного списка основных бед, с которыми мы можем столкнуться. Такие катастрофы могут отличаться от всего, что происходило ранее, и поэтому нам требуются изобретательные подходы к работе с неопределенностью, как мы увидим в главе 12.
Резюме
Людей завораживают совпадения - удивительные совпадения событий, которые остаются в нашей памяти.
Иногда мы можем оценить вероятность совпадений, особенно если они связаны с совпадениями.
Важно различать небольшую вероятность наступления конкретного события и гораздо большую вероятность того, что аналогичное событие произойдет в какой-то момент в течение определенного периода .
Приближение Пуассона удобно тем, что требует только ожидаемого количества событий за определенный период времени.
Необходим тщательный анализ, чтобы определить, является ли доказательством злонамеренного поведения на первый взгляд очень необычная серия трагических событий, таких как смерть медицинских пациентов.
Все анализы удивительных событий основаны на сильных предположениях, и мы должны быть бдительны в отношении их правдоподобности.
ГЛАВА 5
.
Удача
"Развивается или не развивается рак у облученного человека - это в основном вопрос удачи; не повезло, если несколько необходимых изменений произойдут в одной стволовой клетке, когда в зоне риска находятся несколько тысяч таких клеток, повезло, если нет. Лично я считаю, что в этом есть смысл, но многие люди, по-видимому, так не считают.' 1
- Ричард Долл, эпидемиолог, который помог подтвердить связь между курением и раком.
Около полудня 19 августа 1949 года под облаком густого тумана самолет DC-3 (Dakota) авиакомпании British European Airways, выполнявший рейс из Белфаста в Манчестер, врезался в склон холма на болоте Сэддлворт близ Олдхэма в Ланкашире. 2 Весь экипаж и двадцать один из двадцати девяти пассажиров погибли при столкновении или вскоре после него. Восемь пассажиров выжили, включая маленького мальчика и его родителей, хотя, к несчастью, их младший ребенок погиб. Этот выживший мальчик стал моим другом и коллегой по статистике, профессором Стивеном Эвансом.
На Рождество 1971 года 17-летняя Юлиана Кёпке летела рейсом 508 авиакомпании LANSA над джунглями Амазонки, когда в самолет ударила молния. Ее выбросило, и она, все еще пристегнутая ремнями к своему креслу, упала на 3 000 метров. Однако густой полог джунглей остановил ее падение, и она выжила, хотя девяносто других людей, включая ее мать, погибли. 3
Сразу же хочется сказать, что Стивену Эвансу и Юлиане Кёпке очень повезло. Но что такое хорошее или плохое везение? Насколько велика доля удачи в вашей жизни? И как признание удачи связано с верой в нее, которая, возможно, более известна как суеверие? Хотя мы часто говорим об удаче, мы никогда не задаемся вопросом, что она на самом деле означает и какую роль играет в нашей жизни.
Что такое "удача" и каково ее влияние?
Анализируя произошедшие события, мы можем сказать, что кому-то повезло или не повезло, если ему помогло или навредило то, что находится вне его контроля и часто воспринимается как маловероятное случайное событие. Автор и азартный игрок Дэвид Флусфельдер называет удачу "действием случая, принимаемого на свой счет". 4
Решающим элементом является отсутствие контроля, хотя часто, когда мы смотрим на "удачные" исходы, мы понимаем, что люди могли контролировать ситуацию больше, чем кажется на первый взгляд. Например, в радиоинтервью со Стивеном Эвансом, 5 , он рассказал мне, что опыт службы его отца в RAF заставил его настоять на том, чтобы семья сидела в задней части самолета - и единственные выжившие были посажены сзади. А Джулиана Кёпке не только выжила после падения, но и прожила одиннадцать дней в джунглях, самостоятельно найдя дорогу к лагерю и спасателям - ей это удалось только потому, что она выросла в Амазонии и обладала необходимыми навыками как для навигации, так и для ухода за ранами.
Также могут быть серьезные, но непредсказуемые последствия маловероятных случайных событий, которые мы можем назвать "удачей". Стивен Эванс вновь посетил место крушения и сообщил, что испытывает "огромное чувство благодарности за то, что остался жив, и размышляет о многих хороших вещах, которые появились в результате того, что, очевидно, было трагедией для нашей семьи и гораздо хуже для многих других". После длительного восстановления после травм компенсация позволила ему получить хорошее образование и вести, по его мнению, чрезвычайно привилегированную жизнь. fn1
Возможно, самым известным примером влияния случайного события является Гаврило Принцип, который был одним из команды убийц, поджидавших эрцгерцога Франца Фердинанда в Сараево в июне 1914 года. После неудачной первой попытки они отказались от своей миссии, но позже в тот же день водитель эрцгерцога свернул с дороги и застопорил машину прямо перед деликатесами Шиллера, где стоял Принцип. Принцип быстро среагировал и убил и эрцгерцога, и его жену, что, возможно, было удачей для Принципа, но несчастьем для его жертв и миллионов людей, которые были втянуты в последующую мировую войну.
В отличие от него, Уинстону Черчиллю посчастливилось спастись в декабре 1931 года, когда он был сбит и серьезно ранен в Нью-Йорке после того, как не туда посмотрел при переходе Пятой авеню. 6 В почти современном, но, к сожалению, непроверенном параллельном случае Джон Скотт-Эллис (впоследствии лорд Говард де Уолден) рассказал, что в августе 1931 года, за несколько месяцев до аварии Черчилля, он ехал по Мюнхену и сбил кого-то - позже он утверждал, что это был Адольф Гитлер. 7 Нет нужды говорить, что ход истории мог бы быть совсем другим, если бы любой из этих несчастных случаев оказался фатальным.
Существуют ли разные виды удачи?
Со времен Аристотеля философы спорили о том, следует ли хвалить или винить людей за события, которые происходят вне их личного контроля, - так называемое "моральное везение". 8 Классический мысленный эксперимент касается двух друзей Алана и Билла, которые отправляются на одну и ту же вечеринку, напиваются одинаково , едут домой одним и тем же маршрутом, но Билл внезапно сталкивается с ребенком, который переходит дорогу перед его машиной и погибает. Кто из двух друзей заслуживает большей вины? Билл, скорее всего, будет осужден более сурово, чем Алан, но в каком-то смысле они были одинаково виновны, а Алану просто повезло.
Эти рассуждения выходят за рамки данной книги, но они привели к полезной классификации типов удачи. 9
Результативная удача, когда люди оказываются в одинаковых ситуациях, но некоторые из них имеют хороший, а некоторые - плохой результат из-за факторов, не зависящих от них. Например, выигрыш в лотерею, выживание в пехотной атаке Первой мировой войны или Билл и Алан едут домой.
Косвенное везение, при котором решающим фактором является то, что вы оказались в нужном месте в нужное время или в неправильном месте в неправильное время - например, в самолете, который вот-вот упадет.
Конститутивная удача, которая является свойством того, кем вы родились - ваши родители, происхождение, гены и черты характера.
Стивен Эванс испытал все эти ощущения. Ему повезло в том, что он выжил в катастрофе, не повезло в том, что он оказался в самолете, и повезло в том, что у него были разумные и заботливые родители.
Другим повезло меньше. Вспомните, что случилось с 55-летней Фелисити Чилкотт 9 января 1951 года. Она ехала в автобусе к себе домой в Камберленд-Мьюз рядом с Риджентс-парком, не зная, что шимпанзе по имени мистер Чолмондли (произносится "Чамли") тем временем сбежал из санатория в зоопарке Риджентс-парка. Автобусы тогда имели открытый задний вход, что позволило мистеру Чолмондли попасть в автобус. Затем он дважды укусил Фелисити за ногу.
Эта история fn2 сочетает в себе невезение от того, что вы оказались не в том автобусе и не в то время, и от того, что мистер Чолмондели случайно придирается к вам. Может быть, вы вспомните об этом, когда почувствуете, что у вас выдался неудачный день.
Мы можем пойти еще дальше в рассмотрении нашей удачи. Экзистенциальная удача возникает благодаря простому рождению; буддизм учит, что переродиться в человека - такая же редкость, как черепаха, всплывающая раз в сто лет и случайно просовывающая голову сквозь единственное золотое кольцо. Затем мы можем задуматься о том, повезло ли нам, что жизнь возникла на нашей планете или что наша Солнечная система вообще существует. Хотя, учитывая, что мы существуем, можно усомниться в том, что все эти экзистенциальные проблемы имеют смысл (см. главу 16).
Удача не обязательно связана с тем, что с нами происходят хорошие или плохие события. Мы можем эпистемическое везение, если у нас есть правильное убеждение, но по неправильным причинам; например, если мы утверждаем, что уверены в ответе на вопрос викторины из главы 2 на десять из десяти, и это оказывается правильным, но у нас было такое убеждение только потому, что мы неправильно поняли вопрос.
На мой взгляд, конститутивная удача - самая важная. Вы не можете контролировать ситуацию, связанную с вашим рождением и ранним воспитанием, , и все же очевидно, что эти факторы оказывают подавляющее влияние на траекторию вашей жизни. Лично мне очень повезло: мои добрые родители, крепкое здоровье, а также то, что я родился в мирный период и в условиях, когда было много возможностей и хорошая послевоенная государственная поддержка.
Приписывая себе причины успеха, люди склонны переоценивать роль своих усилий и приобретенных навыков, в то время как в основном они должны быть благодарны за то, что при рождении им выпала удача - их конституциональное везение.
Иногда удача не очевидна в тот момент. Моему деду Сесилу Шпигельхальтеру не повезло в том, что он родился в 1880-х годах, как раз к началу Первой мировой войны, и еще больше не повезло в том, что он был офицером газовой службы в секторе Ипра. Он, вероятно, не считал себя счастливчиком, когда 29 января 1918 года рядом с ним разорвался немецкий снаряд, о чем я рассказывал во Введении, но оказалось, что благодаря этому везению его не отправили в одно из самых опасных мест Первой мировой войны.
Или вспомните астронавтов первых миссий американского космического корабля "Спейс Шаттл". Во время двадцать пятого полета 28 января 1986 года на глазах у миллионов телезрителей взорвался шаттл "Челленджер", в результате чего погибли все семь членов экипажа. Ричард Фейнман был членом комиссии Роджерса по расследованию аварии "Челленджера", и после наглядной иллюстрации влияния отрицательных температур при запуске на гибкость кольцевых уплотнений, fn3 написал в личном приложении к отчету комиссии: "Оказывается, что существуют огромные расхождения во мнениях относительно вероятности отказа с потерей аппарата и человеческих жизней. Оценки варьируются от примерно 1 к 100 до 1 к 100 000. Более высокие цифры исходят от рабочих инженеров, а очень низкие - от руководства" 10. Но даже Фейнман, возможно, недооценивал риски, которым подвергались экипажи.
В 2011 году Управление по обеспечению безопасности и миссий НАСА провело ретроспективный анализ рисков 135 полетов "Шаттла" за тридцать лет, объяснив в радиоинтервью, что "мы берем наши сегодняшние знания и применяем их к конфигурации корабля в то время".11 Они пришли к выводу, что риски были значительно выше, чем оценивалось в то время, а вероятность катастрофических потерь при первых запусках составляла примерно 10 %, что в десять раз превышало наихудшую цифру Фейнмана. 12 Вероятность того, что двадцать пятый запуск (Challenger) пройдет без потерь, оценивалась ими всего в 6 %, и они заключили: "Нам повезло, было несколько близких случаев". Первые экипажи "Шаттлов" не понимали, насколько им повезло.
Порядок игры в международном крикете определяется броском монеты, и когда он был капитаном сборной Англии по крикету, Насер Хусейн умудрился проиграть четырнадцать бросков подряд. 13 Это считалось невезением с вероятностью 1⁄ 214 = 1 к 16 000, но как быть с этим, казалось бы, удивительным событием?
В одной из телепередач иллюзиониста Деррена Брауна засняли, как он подбрасывает десять голов подряд. Повезло ему или не повезло?
Это произошло в программе "Система", 14 , и Браун признался позже в программе, что показанный фрагмент был снят в конце девятичасовой съемки его попыток выполнить это задание - прекрасный пример обмана зрителя путем тщательного отбора показанного. Но повезло ему или не повезло, что ему потребовалось так много времени, чтобы получить свои десять голов?
Для этого необходимо проанализировать время, необходимое для наступления события. Рассмотрим простую задачу - бросать кубик до тех пор, пока не выпадет шестерка. Сколько бросков вам потребуется? Мы можем предположить, что каждый бросок независим, а кубик хорошо симметричен, и поэтому, если я бросал кубик без успеха до сих пор, вероятность того, что при следующем броске выпадет шестерка, равна 1⁄ 6. Какова же вероятность того, что я получу свою первую шестерку, скажем, на третьем броске? Это означает, что я не получил шестерку на первых двух бросках (вероятность этого равна 5 6 5⁄ × ⁄ ) 6, но затем я получаю шестерку на третьем броске (с вероятностью 1⁄ 6), так что общая вероятность равна 5 6 5 6 1⁄ × ⁄ × ⁄ = 625⁄ 216 = 0,12. Это показано на рисунке 5.1 вместе с вероятностями всех остальных возможностей.
Такое распределение называется геометрическим. fn4 Среднее значение распределения на рисунке 5.1 равно 6, так что если я хочу бросить шестерку, то в среднем мне потребуется 6 бросков, а если я хочу бросить 100 шестерок, то могу рассчитывать на 600 бросков. Полезное общее правило заключается в том, что если мы пытаемся чего-то достичь с шансом p на успех при каждой независимой попытке, то в среднем нам понадобится 1⁄ p попыток, хотя есть 37 % вероятности, что нам понадобится больше. fn5 Медиана распределения равна 4, поскольку в 51 % попыток мне понадобится 4 или меньше бросков , чтобы получить шестерку - это, вероятно, можно считать "типичным" количеством необходимых бросков.
Мода распределения - наиболее вероятный бросок для получения первой шестерки - это самый первый бросок. Это может показаться довольно неинтуитивным, но при постоянном шансе наступления каждой попытки наиболее вероятное время для следующего события - сразу же. Это может помочь объяснить, почему кажущиеся случайными события имеют тенденцию группироваться, как мы видели в главе 4. Если не связанные между собой редкие события, такие как радиоактивный распад или (большинство) авиакатастроф, имеют постоянную вероятность произойти в каждую единицу времени, то промежутки между ними будут иметь экспоненциальное распределение. Нет такой силы, которая побуждала бы их располагаться на равном расстоянии друг от друга - после авиакатастрофы наиболее вероятное время для следующей - немедленно.
Рисунок 5.1
Геометрическое распределение вероятностей для первого броска кубика, при котором выпадает шестерка. Среднее значение распределения равно 6, медиана - 4, а мода - 1.
Теперь вернемся к Деррену Брауну, который подбрасывал монету в течение девяти часов. Если рассматривать "попытку" как подбрасывание монеты до тех пор, пока не выпадет решка, то вероятность успешного выпадения 10 голов подряд равна 1 2 1⁄ × ⁄ 2 ... × 1⁄ 2 (10 раз), что составляет 1⁄ 1,024 . Поэтому, исходя из того, что мы знаем о геометрическом распределении, в среднем потребуется 1024 попытки.
Мы можем подсчитать, что он сделал около 1600 попыток, прежде чем дошел до 10 голов, fn6 , и поэтому Браун, похоже, потратил больше времени, чем в среднем. Вероятность того, что ему понадобится столько же времени, чтобы добиться успеха, составляет около 21 %, fn7 так что ему немного не повезло, но не сильно. И очень впечатляет, что даже после девяти часов съемок он смог выглядеть так, как будто это была его первая попытка, и сохранять спокойствие, когда он приблизился к десяти головам, что, должно быть, принесло ему огромное облегчение.
Мой коллега Джеймс Грайм снял этот подвиг на пленку 15 и потратил на это всего час, добившись успеха с 234-й попытки. Шанс достичь этого так быстро составляет около 20 %, так что ему повезло настолько же, насколько не повезло Деррену Брауну. Джеймс мужественно решил продолжить до 1024 попыток , на что у него ушло еще пять часов, и ему не удалось повторить свой успех. Это серьезное стремление продемонстрировать игру случая.
Выигрышные номера в лотереях выбираются случайным образом, и поэтому, когда в 2022 году на сайте 16 чаще всего появлялся шар 39, было бы разумно назвать 39 "самым удачливым номером лотереи" (хотя главе 6 мы увидим, что 39 был наименее удачливым номером в первых пятидесяти тиражах лотереи). Но, в отличие от лотереи, спорт не является делом случая, и поэтому может показаться странным, что исследователи задают такие вопросы, как
Насколько велика доля различий в высших футбольных лигах, обусловленных везением?
В стандартном сезоне футбольной лиги каждая команда играет с каждой другой командой дважды - один раз на своем поле и один раз на выезде. Победа приносит команде три очка, а ничья - по одному. По ходу сезона очки суммируются, и в сезоне английской премьер-лиги 2022-3 получается окончательное распределение очков, показанное серыми блоками на рисунке 5.2. На рисунке 5.2 наложена кривая, показывающая, каким должно было бы быть распределение, если бы матчи зависели только от удачи.
Как же определить, каким будет это распределение, если результаты будут определяться чистой случайностью? 17 В ведущих футбольных лигах примерно 50 % матчей выигрывает команда, играющая на своем поле, около 25 % - вничью, и около 25 % - команда, играющая на выезде - мы можем назвать это распределением 50/25/25. Предположим, что в начале каждого матча вместо того, чтобы монета просто определяла направление игры, она фактически решает исход матча. Если выпадает голова, то побеждает команда хозяев. Если же выпадает решка, то монету подбрасывают еще раз, и на этот раз, если выпадает решка, то матч объявляется ничейным, а если решка, то побеждает команда гостей.
Рисунок 5.2
Серые блоки представляют собой распределение очков, набранных в английской премьер-лиге в сезоне 2022-3; "Манчестер Сити" занял первое место с 89 очками, а "Саутгемптон" - второе с 25. Сглаженная кривая показывает распределение, которое можно было бы ожидать, если бы результаты каждого матча определялись только случайностью, в соответствии с наблюдаемыми пропорциями домашних побед, ничьих и выездных побед.
Это сэкономило бы много времени и сил, и, хотя это, возможно, не станет захватывающим зрелищем для зрителей или телезрителей, в итоге получится правильное распределение 50/25/25, которое наблюдается на практике. Все команды будут по сути равны, так как игры решаются случайно, но в конце сезона все равно будет полная таблица очков, с командой на вершине и командой на дне - кто-то должен быть на вершине, даже если это просто удача. Альтернативный мысленный эксперимент, который должен обеспечить равенство команд, заключается в том, что каждую неделю каждая команда будет выбираться случайным образом из числа всех игроков Премьер-лиги.
Если бы игры решались случайным образом, то, используя фактическую пропорцию, наблюдавшуюся в Премьер-лиге в 2022-3 годах, которая составляла 48 % побед дома, 23 % ничьих и 29 % побед на выезде, мы можем оценить, каким было бы распределение очков, которое показано на рисунке 5.2 в виде плавной кривой.
В конце сезона некоторые команды явно выходят за пределы "случайного" распределения, поэтому можно сделать вывод о наличии реальных различий между командами, хотя значительная часть разброса итоговых очков объясняется исключительно случайностью. Есть разные способы обобщить эту долю; например, можно сказать, что 45 % стандартного отклонения очков Премьер-лиги обусловлено случайностью или удачей. Проще говоря, мы можем посмотреть на наблюдаемый разброс очков (от 25 до 89, или диапазон 64) и сравнить его с разбросом, который можно было бы ожидать от матчей, решившихся случайно (от 39 до 66, или разброс 27). Таким образом, 27/64 = 42 % наблюдаемого разброса объясняется случайностью, что составляет почти половину.
В таблице 5.1 этот анализ повторен с использованием результатов 2022-3 для основных европейских лиг, 18 , упорядоченных по последнему столбцу - доле наблюдаемого спреда, которая объясняется случайностью или удачей.
В тех лигах, которые находятся в верхней части таблицы и имеют наименьшую долю разброса, объяснимого случайностью, как правило, есть несколько выдающихся команд, которые доминируют в лиге, например, "Рейнджерс" и "Селтик" в шотландской Премьер-лиге. В отличие от них, в лигах, расположенных в нижней части таблицы, соотношение команд гораздо более равномерное - почти две трети итогового разброса очков в чемпионате Шотландии (их второй лиге) объясняется случайностью.
Примечательно, что нижняя половина таблицы, где команды более равны между собой, почти полностью состоит из лиг второго дивизиона. Исключение составляет немецкая Бундеслига 1, в которой 58 % разброса очков объясняется случайностью, что говорит о значительном сходстве между немецкими командами высшего дивизиона.
Английская Премьер-лига находится примерно в середине турнирной таблицы, что, пожалуй, является "золотой серединой", когда разница между командами достаточна, чтобы выявить явных победителей, и в то же время не настолько различна, чтобы сделать игры слишком предсказуемыми. Но раньше, до массового вливания средств в некоторые команды, в Премьер-лиге было гораздо теснее: например, в сезоне 1996-7 годов "Манчестер Юнайтед" занимал первое место в таблице, но имел всего 75 очков, а "Ноттингем Форест" - 34, причем 62 % этого разброса объяснялось случайностью, как и в нынешних вторых дивизионах.
Таблица 5.1
Анализ основных европейских футбольных лиг для сезона 2022-3, показывающий % домашних побед, ничьих и выездных побед, нижние и верхние команды и их очки, наблюдаемый разброс в очках, ожидаемый разброс в играх, которые были решены случайно, и отношение ожидаемого к наблюдаемому разбросу. Команды упорядочены по последнему столбцу - доле спреда очков, объясняемой случайностью.
Как мы можем оценить "качество" каждой команды?
Сумма очков по итогам сезона характеризует, насколько хорошо выступила каждая команда; например, в сезоне 2022-3 английской Премьер-лиги "Манчестер Сити" сыграл 38 матчей и получил в общей сложности 89 очков, в среднем 89⁄ 38 = 2,34 очка за игру, по сравнению с 25⁄ 38 = 0,66 очками "Саутгемптона". Это можно рассматривать как оценку некоторого абстрактного показателя базового "качества" - при некотором воображении можно представить, что это среднее количество очков, которое каждая команда набирала бы за игру, если бы сезон продолжался бесконечно; эта концепция базового "истинного" среднего количества очков за игру аналогична идее "истинного мастерства" игрока, оцениваемого по результатам соревнований в видеоиграх. 19 Мы можем рассчитать предел ошибки для этой оценки, , и таким образом установить интервал неопределенности вокруг каждого наблюдаемого среднего количества очков за игру, как показано на рисунке 5.3.
Значительное дублирование команд означает, что было сыграно недостаточно матчей, чтобы с уверенностью судить об "истинном" качестве каждой из них. Однако мы можем с уверенностью сказать, что пять команд превосходят средний уровень (пунктирная линия), а пять - хуже среднего.
Используя те же идеи, мы можем даже исследовать нашу неопределенность относительно "истинного" рейтинга каждой команды, который можно представить как место, которое они заняли бы в воображаемой турнирной таблице, если бы сезон продолжался бесконечно.
Рисунок 5.3
Точки - это наблюдаемые средние очки за игру для каждой команды английской Премьер-лиги в конце сезона 2022-3. Диапазоны показывают 95-процентный интервал вероятности того, где в итоге окажутся "средние очки за игру", если сезон будет продолжаться бесконечно. Пунктирная линия в центре - это среднее значение средних.
Рисунок 5.4 показывает, что существует огромная неопределенность в отношении истинного положения команд на сайте . Есть пять команд, которые можно с уверенностью отнести к верхней половине, в то время как только четыре команды можно с уверенностью отнести к нижней половине, включая три низшие команды, которые были исключены.
Мы также можем исследовать вероятность того, что победитель сезона, "Манчестер Сити", действительно был лучшей командой. Мы оцениваем ее в 67 % по сравнению с 27 % у "Арсенала", что можно интерпретировать как вероятность того, что "Арсенал" действительно окажется на первом месте в турнирной таблице, если сезон будет продолжаться бесконечно. А действительно ли команды, которые выбыли из чемпионата, были тремя худшими командами? Вероятность оказаться в тройке худших по "качеству" оценивается в 88 % для "Саутгемптона", 58 % для "Лидса" и 47 % для "Лестера". Эвертон" едва избежал выбывания, и, по нашим оценкам, вероятность того, что они действительно окажутся в тройке худших команд, составляла 28 %.
Эти методы определения неопределенности в рейтинге были применены к клиникам ЭКО, 20 хирургическим отделениям и школам. 21 Подобные анализы позволяют взглянуть на таблицы рейтингов со здоровой и скептической точки зрения; в целом в рейтингах существует огромная неопределенность, и если кто-то занимает первое место, это не обязательно означает, что он точно лучший - мы знаем, что в его успехе участвовала значительная доля удачи.
Рисунок 5.4
Точки - это наблюдаемые ранги команд в конце сезона. Диапазоны показывают 95%-ный интервал вероятности для их возможного места, если бы сезон продолжался бесконечно.
Удача в будущем
До сих пор мы рассматривали события прошлого и оценивали, насколько сильно удача повлияла на то, как все сложилось. Но многие люди, похоже, верят в удачу как во внешнюю силу, влияющую на будущее . А это значит, что мы вступаем на мутную территорию суеверий, благоприятных случаев, предзнаменований, фетишей, амулетов, кристаллов, астрологии, нумерологии и так далее. Я не намерен занимать драгоценное место этими темами.
Конечно, некоторые действия могут казаться простым суеверием, но при этом играть полезную практическую роль. Например, многие звезды спорта регулярно совершают ритуалы. Перед каждым мячом, полученным во время игры в крикет, игрок Эд Смит вытирает лоб большим пальцем, касается козырька шлема, отжимает липучку каждой перчатки и переставляет подушечку бедра. Он мог делать это до 200 раз за день и говорил: "Наверное, я что-то делал, когда чесал и возился перед каждым мячом". Предположительно, он сохранял концентрацию внимания во время повторяющихся перерывов в интенсивной деятельности, хотя он готов признать роль удачи в своей жизни - он встретил свою жену в поезде. 22
Даже если мы не верим в некий мистический процесс, который принесет нам удачу, можем ли мы повысить свои шансы на то, что события повернутся в нашу пользу? Первым шагом должно стать совершенствование наших знаний и навыков, следуя изречению (которое обычно приписывают игроку в гольф Гэри Плейеру) : "Чем больше тренируешься, тем больше везет". Помимо этой очевидной тактики, психолог Ричард Уайзман пришел к выводу, что так называемые "везучие" люди, как правило, следуют четырем основным принципам. 23
Они замечают и используют любые возможности.
Они обладают хорошей интуицией в отношении правильных действий.
У них есть позитивные ожидания, что придает им уверенности в своих действиях.
Они обладают стойкостью , чтобы справиться с неблагоприятными событиями и обратить их себе на пользу.
Юлиана Кёпке наглядно продемонстрировала эти черты, когда выжила в своем путешествии по джунглям. Людям, которые совершают незапланированные открытия - процесс, называемый "серендипити", - не просто повезло. В 1928 году Александр Флеминг открыл пенициллин, заметив, что какая-то плесень препятствует распространению бактерий в посуде , оставленной во время отпуска, но он был занят интенсивной исследовательской программой по борьбе с бактериями. Затем потребовались годы усилий для разработки полезных антибиотиков, а фармацевтическая компания Pfizer обеспечила массовое производство пенициллина во время Второй мировой войны.
Позже компания Pfizer совершила собственное сенситивное открытие, изучая препараты для расширения кровеносных сосудов сердца, когда валлийские шахтеры, участвовавшие в клинических испытаниях, сообщили, что силденафил неожиданно повлиял на кровоток в другой части их анатомического тела. Компания поняла, что может переименовать это соединение в средство для лечения эректильной дисфункции, и на свет появилась виагра. Позже силденафил был также одобрен для лечения легочной артериальной гипертензии, что подтвердило первоначальный план.
В каждом из этих случаев открытие было частью длительного расследования, а распознавание и использование удивительных наблюдений потребовало воображения, проницательности и инвестиций. Так что это не просто удача.
Как мы можем деликатно рассказать о роли "удачи"?
Несколько лет назад я участвовал в создании сайта о детях, которым была сделана операция на сердце 24 , который разрабатывался в тесном сотрудничестве с семьями пострадавших . Статистика выживаемости объяснялась, например, так: "Из 100 детей, перенесших эту операцию, мы ожидаем, что 98 выживут, а двое, к сожалению, не выживут", но мы с трудом находили слова для объяснения причин, по которым некоторые дети выживают, а некоторые нет. Можно ли назвать это везением? Шанс, удача, судьба? Все эти слова казались очень нечувствительными. Технические термины вроде "биномиальная вариация" и "случайная вариация" были еще хуже. Ближе всего было "неизбежная непредсказуемость", но оно казалось слишком неуклюжим.
Мы выясняли мнения по этому поводу, и в конце концов один из студентов предложил сказать, что некоторые дети умирают из-за "непредвиденных факторов". Мы сразу же приняли этот термин, и он был хорошо принят родителями. Так что теперь я использую эту фразу во всех подобных случаях.
После рассмотрения всех историй, приведенных в этой главе, я пришел к выводу, что удача - это не какая-то мистическая сила, что настоящее везение случается, когда вы рождаетесь, а после этого все зависит от того, насколько удачно вам выпала рука перед лицом неконтролируемых внешних событий. Так что если рассматривать случайность как неизбежную непредсказуемость, то я согласен с тем, что "удача - это случайность, принимаемая на свой счет". События получают ярлык как "удача" в ретроспективе; Эд Смит случайно завел разговор с женщиной в поезде, но, предположительно, это стало считаться удачей только в ретроспективе, особенно когда они решили пожениться.
Я начал эту главу с цитаты Ричарда Долла о роли удачи в заболевании раком. Казалось бы, это классический случай неудачного исхода - стволовая клетка случайно развивается определенной мутации и запускает первую стадию опухоли, - но некоторым людям не везет в том, что они рождаются с генетическим дефектом, который вызывает рак. Я понял это, когда это случилось с моим сыном, и, возможно, это причина, по которой я не ищу объяснений всему происходящему и стараюсь принимать удачу и неопределенность так, как они складываются, к добру или к худу. Как показывает история, рассказанная на сайте в начале следующей главы.
Резюме
Мы можем назвать действие случайности "удачей", и такие случайные события могут иметь серьезные последствия.
Философы выделяют "результирующую", "косвенную" и "конституирующую" удачу. Возможно, самая важная форма удачи связана с обстоятельствами вашего рождения, над которыми вы не имеете никакого контроля.
Иногда мы можем количественно оценить степень удачи в прошлых событиях.
Изучив роль случайности в турнирных таблицах, мы можем оценить неопределенность в отношении "истинного" места каждой команды или организации.
Многие люди верят в удачу как в активную силу, влияющую на будущие события. Но даже без этой веры некоторые модели поведения и отношения связаны с тем, что люди воспринимаются как "везучие".
Необходимо деликатно объяснять роль случайности в важных событиях.
ГЛАВА 6
.
Все это немного случайно
В 2016 году у меня был диагностирован рак простаты, что дополнило обширную историю онкологических заболеваний среди моих близких родственников. Будучи отцом двух дочерей, я был обеспокоен тем, что могу быть носителем гена BRCA2, который значительно повышает вероятность развития рака груди и других видов рака. Я рассказал об опыте своей семьи консультанту-генетику, который ввел данные в специализированную программу BOADICEA , оценивающую вероятность наличия конкретных генетических отклонений на основе семейных историй рака. 1 В результате была получена оценка вероятности носительства гена BRCA2 в 33 %, что более чем в 100 раз превышает фоновый уровень и достаточно высоко, чтобы я прошел тестирование.
У меня либо есть ген, либо нет, и поэтому "вероятность 33%" - это классический пример эпистемической неопределенности, как и подброшенная монета, которую скрыли. Но в основе этого числа лежат другие вероятности, включая предположения о распределении гена в популяции и его связи с риском различных видов рака. Очень важно, что эта вероятность зависит от предположений о менделевском наследовании, которое предписывает фиксированные шансы унаследовать ген от своих родителей.
Каждый человек имеет двадцать три пары хромосом, каждая из которых представляет собой длинную молекулу ДНК, находящуюся в ядре клетки. Гены - это участки на паре хромосом, где у отдельных особей есть пара версий гена, называемых аллелями. При нормальном размножении человека потомство появляется из яйцеклетки и сперматозоида, каждый из которых содержит одну из родительских пар хромосом (или их комбинацию ). fn1 Таким образом, в определенном участке вероятность того, что потомство унаследует любой из аллелей от каждого родителя, составляет 50:50, как при подбрасывании монеты.
На рисунке 6.1 показана базовая модель наследования муковисцидоза (МВ) - заболевания, которое возникает только в том случае, если оба варианта генов CFTR являются "CF", хотя примерно 1 из 25 человек имеет только один ген CF и известен как носитель. Базовая симметрия наследования означает, что вероятности различных возможных исходов могут быть легко рассчитаны.
Аналогично, если один из моих родителей несет ген BRCA2 на любой хромосоме, вероятность того, что я унаследую его, составляет 50 %, и это предположение вносит свой вклад в расчетную 33 %-ную вероятность быть носителем гена BRCA2.
Я с облегчением, ради своих дочерей, узнала, что не являюсь носителем BRCA2. Но для меня это вызвало вопрос: действительно ли "50-процентная вероятность" наследования означает, что существует некий действительно случайный механизм, который решает, какую хромосому я унаследую? Или это просто очень сложный, но механический процесс, симметрия которого означает, что шансы равны 50:50?
Рисунок 6.1
Человек, имеющий только один ген МВ, называется носителем МВ, у него нет заболевания, но он может передать его по наследству. Если у обоих родителей есть заболевание, то их ребенок обязательно унаследует два гена МВ и будет болеть МВ. Если оба родителя являются носителями, существует 25 % вероятность того, что их ребенок унаследует гены МВ и будет болен, 50 % вероятность того, что ребенок станет носителем, и 25 % вероятность того, что он не унаследует ни один из генов МВ и даже не будет носителем. Если у одного из родителей есть заболевание, а другой является носителем, то вероятность того, что у ребенка будет МВ, составляет 50 %, а вероятность того, что он будет носителем, - 50 %. На рисунке показано, чего можно ожидать, если у каждого из родителей будет по четыре ребенка. Адаптировано Фондом муковисцидоза. 2
OceanofPDF.com
Очень многое из того, что происходит в мире природы, является неопределенным. То, как молекулы воды создают течения и волны в море, кристаллы льда, образующие бесчисленное множество снежинок, и точные характеристики всего живого - все это непредсказуемо. Но сколько в этом истинной случайности, иногда называемой стохастической? А сколько обусловлено тем, что система настолько сложна, что огромное количество мелких воздействий приводит к возникновению вариаций, неотличимых от случайности, даже если процесс полностью детерминирован? А может быть, это так называемая хаотическая система, в которой крошечные различия в начальных условиях усиливаются и имитируют случайность, хорошо известную по классическому образу бабочки, хлопающей крыльями, которая спустя несколько недель может вызвать торнадо. Является ли непредсказуемость следствием "случайности" или следствием "сложности"?
Это большой вопрос. Например, эволюция происходит, когда геном в клетках родителей мутирует и эти мутации передаются потомству. Если окружающая среда по каким-то причинам благоприятствует особям с такими мутациями, они производят больше потомства, и, следовательно, мутация передается и усиливается в последующих поколениях. fn2 Мутации происходят из-за микроскопических воздействий внешних факторов или ошибок в репликации клеток, и поэтому их невозможно отследить до конкретных скрытых причин. Поэтому эволюцию нельзя однозначно отнести к случайности или сложности, стохастике или детерминизму.
Подобным образом эпидемиологи, такие как Джордж Дейви-Смит, установили, что большая часть вариаций здоровья людей в течение жизни не объясняется никакими измеримыми факторами риска, том числе их генами. Генетически идентичные люди могут иметь в итоге совершенно разные и непредсказуемые результаты - я уже цитировал Ричарда Долла, который говорил, что заболеет человек раком или нет - это в значительной степени удача. Писатель и телеведущий (и основатель организации "Больше или меньше") Майкл Бластленд называет это скрытой половиной, как во фразе "вы не знаете и половины", представляя "загадочную вариативность - множество тайн и сюрпризов, которые смиряют человеческое понимание". 3
Что же лежит в основе этой необыкновенной необъяснимой изменчивости? Мы подходим к большому философскому вопросу...
Является ли мир в своей основе детерминированным или стохастическим?
Когда в 1814 году Пьер-Симон Лаплас писал о вероятности, 4 французский гений представил себе "интеллект, который в определенный момент бы знал все силы, приводящие природу в движение, и все положения всех предметов, из которых состоит природа; если бы этот интеллект был также достаточно обширен, чтобы подвергнуть эти данные анализу, он бы охватил одной формулой движения величайших тел Вселенной и движения мельчайших атомов; Для такого интеллекта ничто не было бы неопределенным, и будущее, как и прошлое, могло бы присутствовать его глазах.'
Другими словами, если бы мы были неким всезнающим существом, которое знает все о текущем мире и обо всех законах, которые им управляют, то будущее можно было бы предсказать точно. Этот мысленный эксперимент стал известен как демон Лапласа и представляет собой крайний детерминизм, в смысле веры в то, что вещи происходят в соответствии с фиксированными механистическими законами; Лаплас утверждал, что идея вероятности была необходима для того, чтобы справиться с нашим личным незнанием огромной сложности вселенной с часовым механизмом.
Около ста лет назад появилась квантовая механика, которая, по всей видимости, разрушила этот аргумент. Работы физиков Нильса Бора, Вернера Гейзенберга и других пришли к выводу, что на самом глубоком субатомном уровне мир в основе своей стохастичен - частицы имеют лишь вероятностное распределение возможных положений и скоростей, пока их не наблюдают, а затем это распределение сводится к одной точке.
Одним из следствий этой фундаментальной неопределенности является непредсказуемость радиоактивного распада, когда ядро большого и нестабильного атома спонтанно распадается без видимой причины, испуская частицу и оставляя после себя (как правило, более стабильную) уменьшенную атомную структуру. Вероятность распада конкретного атома за определенный промежуток времени в общем случае не зависит от возраста атома, температуры или каких-либо внешних явлений, поэтому ее можно рассматривать как определенную вероятность, объективное свойство мира, не зависящее ни от наблюдателя, ни от чего-либо еще, так что по ней можно перевести часы - что мы, конечно, и делаем, используя "атомные часы", основанные на резонансных частотах атомов цезия. Это резко контрастирует с субъективными вероятностями, которые в остальном подчеркиваются в этой книге.
Всегда существовали аргументы против этой идеи о несводимых, определенных вероятностях. Говоря о Боге, Эйнштейн заметил: "Я убежден, что Он не играет в кости". Продолжали существовать теории "скрытых переменных", которые скрываются за частицами и контролируют их будущее состояние, хотя Нобелевская премия была присуждена группе, которая утверждает, что опровергла эту идею. 5 Существует также "многомировая интерпретация", или мультивселенная, в которой все, что может произойти, происходит, а мы просто оказываемся в одном из исходов.
Но если принять основное мнение о квантовом мире, то естественно спросить, влияет ли эта существенная стохастичность, лежащая в основе материи, на то, что мы наблюдаем в нашей жизни. Общее мнение заключается в том, что "квантовая неопределенность" усредняется, когда речь идет о таких больших вещах, как молекулы, и, конечно, о биологических клетках, но другие утверждают, что квантовые эффекты в мозге могут влиять даже на подбрасывание монет. 6 Это было бы замечательно, поскольку связало бы субатомную случайность со случайностью, как мы ее на самом деле ощущаем.
Хотя все эти дебаты, несомненно, увлекательны и важны, они выходят далеко за рамки моей компетенции, и если вам интересно, читайте в другом месте. К счастью, поскольку я определяю неопределенность как отношение между наблюдателем и событием, я могу не высказывать своего мнения по поводу того, является ли огромная и необъяснимая изменчивость между биологическими организмами (такими как люди) обусловлена подлинной случайностью или детерминированными, но неизвестными влияниями. Для меня это просто не имеет практического значения. Действительно, мир может полностью управляться волей Бога и быть полностью предопределенным, но поскольку мы не знаем этой воли, мы все равно остаемся с нашей эпистемической неопределенностью.
Но даже если нам удастся избежать споров о том, является ли мир действительно стохастическим или детерминированным, нам все равно нужно решить, как относиться к различным явлениям. fn3 Полезно начать с самого базового уровня и постепенно увеличивать масштаб.
Обычно предполагается, что субатомные частицы являются стохастическими.
Можно предположить, что отдельные молекулы детерминированы и подчиняются законам механики Ньютона.
Как только молекул становится больше двух, мы не можем рассчитать их относительные движения, а результаты оказываются чрезвычайно чувствительными к начальным условиям. Поэтому поведение множества молекул газа можно рассматривать как стохастическое, что отражено в теории статистической механики.
Большие тела из газа или твердых тел подчиняются законам Бойля и Ньютона, поэтому их можно рассматривать как детерминированные.
Поведение отдельных организмов или людей рассматривается как стохастическое, как в генетике.
Большие группы людей становятся (почти) детерминированными в некоторых отношениях, например, количество самоубийств в целом предсказуемо. Это стало известно как "статистический фатализм" в 1800-х годах, когда такие исследователи, как Адольф Кетеле, выявили очевидные "законы", управляющие поведением групп, которые, по сути, являются закономерностью распределения Пуассона.
Развитие обществ имеет непредсказуемость, которую, возможно, лучше всего рассматривать как стохастическую.
Таким образом, когда мы расширяем наше видение от субатомного уровня до целых обществ, оказывается, что существует повторяющийся паттерн стохастических событий на микроуровне, которые агрегируются и дают закономерность, которую можно рассматривать детерминистически, а затем становятся стохастическими на более высоком уровне и так далее. На каждом уровне мы предполагаем модель мира, которая помогает справиться с поставленной задачей - такие модели не являются реальностью, но, как мы увидим в главе 8, могут быть очень полезны.
Мой прагматический подход означает, что когда я говорю о том, что что-то является случайным, я имею в виду, что оно эффективно случайное, в смысле практически неотличимо от чего-то, что взято из некоторого известного распределения вероятностей. И такая эффективная случайность имеет множество применений.
Почему для Манхэттенского проекта требовались случайные числа?
Плутоний-239 - это искусственный изотоп с периодом полураспада 24 100 лет, то есть периодом , за который половина атомов распадется до урана-235, или, эквивалентно, периодом, за который вероятность распада конкретного атома составляет 50%. Это звучит довольно стабильно, но при наличии критической массы частицы, испускаемые при распаде одного атома, могут вызвать распад соседних атомов, что приведет к цепочке распадов и огромному выделению энергии. Во время Второй мировой войны в рамках Манхэттенского проекта - программы создания атомной бомбы в Лос-Аламосе (США) - ученые бились над математическими решениями для моделирования таких цепных реакций в критической массе радиоактивного материала. Это было слишком сложно.
Одним из ученых был Станислав Улам, который вместе с Эдвардом Теллером создал первую водородную бомбу. Блестящий польско-еврейский физик-ядерщик, ему посчастливилось уехать из Польши в США 29 августа 1939 года, всего за три дня до нацистского вторжения. Улам любил азартные игры и с удовольствием играл в пасьянс (разновидность пасьянса), а также пытался с помощью своей элегантной математики вычислить вероятность выигрыша в таких играх. Ему это не удалось, но он нехотя понял, что может использовать грубую силу: сыграть в игру сто раз со "случайными" тасовками и просто подсчитать, сколько раз игра может быть закончена. Затем он сделал блестящий шаг и применил эти методы "статистического моделирования" для понимания сложных атомных цепных реакций, многократно моделируя отдельные воображаемые процессы цепных реакций и наблюдая за тем, в какой пропорции достигается критический предел. По-видимому, у Улама был дядя, который одалживал деньги, чтобы он мог "съездить в Монте-Карло" поиграть в азартные игры, и так родился метод Монте-Карло, в котором сложные вычисления заменяются многократным моделированием возможных последовательностей событий. fn4
Ученые из Лос-Аламоса обнаружили, что если в канистре содержится много маленьких кусков плутония-239, а затем они внезапно взрываются в один кусок весом около 6 кг, происходит цепная реакция, и распад перестает следовать стандартной медленной схеме. Именно это и произошло, когда "Толстяк", вторая ядерная бомба, сброшенная на Японию, взорвалась над Нагасаки в 11.02 утра 9 августа 1945 года. Около 1 кг плутония-239 распалось за долю секунды, выделив энергию, эквивалентную примерно 21 000 тонн тротила - около 35 000 человек погибли сразу после взрыва, и примерно столько же умерли от травм и радиационного облучения позже.
При нормальных условиях этому 1 кг (16 % от общего количества) потребовалось бы около 6000 лет, чтобы распасться. fn5 Этот отрезвляющий пример показывает, что, хотя вероятности атомного распада обычно считаются "объективными", они все же могут зависеть от контекста, в данном случае от близкого соседства других распадающихся атомов.
Анализ Монте-Карло стал более осуществимым с созданием более быстрых компьютеров, но метод требовал хорошего запаса случайных чисел. В 1947 году недавно созданный исследовательский институт RAND решил сконструировать "генератор случайных цифр", основанный на радиоисточнике, производящем около 10 000 импульсов в секунду - они подсчитывались электронным способом, и после каждой секунды последняя цифра подсчета записывалась на перфокарты. 7 В итоге RAND изготовил 20 000 карт, каждая из которых содержала 50 цифр, что в общей сложности составило 1 000 000 "случайных" цифр. 8
Конечно, RAND провела множество тестов , чтобы проверить, были ли эти цифры действительно случайными, в смысле удовлетворяющими статистическим тестам, которые, как мы ожидаем, должны проходить действительно случайные числа. Они были разочарованы, обнаружив, что блок из 125 000 цифр, созданный 7 и 8 июля 1947 года, после непрерывной работы системы в течение месяца, имел небольшой избыток нечетных чисел. 9 Они решили эту проблему, объединив соседние карты, чтобы устранить любые четные смещения fn6 и, после дальнейших успешных проверок, цифры были наконец опубликованы в 1955 году. Это книга, состоящая из страницы за страницей цифр - возможно, самая утомительная книга, которую только можно себе представить. Но, как я сказал в документальном фильме BBC "Tails You Win", 10 "Говорите об этом что хотите, по крайней мере, сюжет непредсказуем".
Хотя невозможно узнать, какой будет следующая цифра, тем не менее существует множество предсказуемых закономерностей . Например, вероятность того, что любая конкретная последовательность из 5 цифр будет 12345, составляет 1 к 100 000, поэтому в книге из 1 000 000 цифр можно ожидать 10 таких строк. На самом деле эта последовательность встречается 13 раз, что вполне соответствует распределению Пуассона со средним значением 10. Мы также ожидаем одну последовательность из 7 одинаковых цифр: приближение Пуассона говорит, что вероятность того, что будет именно такая, составляет 37 %, а вероятность того, что будет хотя бы одна такая последовательность, - 63 %. На самом деле существует ровно одна такая последовательность, состоящая из 6666666, как показано на рисунке 6.2. Это было очень приятно, хотя и несколько озадачивает, если вы случайно выберете эту позицию для начала своего "случайного" набора чисел.
Рисунок 6.2
Определение 7 последовательных цифр в книге из 1 000 000 случайных цифр: мой палец из BBC's Tails You Win.
Когда в конце 1980-х годов проблемы статистического моделирования стали слишком сложными для аккуратной математики, статистики обратились к анализу методом Монте-Карло. Усовершенствованная модель под названием "Марковская цепь Монте-Карло" (MCMC) вышла за рамки простого моделирования будущих наблюдений, а также смоделировала правдоподобные значения для неизвестных величин, которые, как предполагается, лежат в основе данных. В сочетании со стремительным развитием вычислительной техники это позволило сделать ранее непрактичные анализы обычным делом. Это нововведение изменило мою карьеру, и я провел около пятнадцати лет, работая над методами и программным обеспечением MCMC. Так что я многим обязан одержимости Стэна Улама карточными играми.
Насколько случайны современные генераторы случайных чисел?
Случайные числа стали неотъемлемой частью современных технологий, будь то игры, симуляторы или онлайн-безопасность, хотя вас может удивить тот факт, что большинство современных генераторов случайных чисел, по сути, полностью детерминированы.
Нельзя просто попросить компьютер выдать строку случайных чисел - для этого должен быть определенный алгоритм. Генераторы случайных чисел обычно начинают с "затравки", скажем, с - какого-нибудь запоминающегося числа, например 111. Затем они умножают его на известное большое число, добавляют еще одно большое число, удаляют все цифры, кроме последней , и называют это случайным числом. Затем процесс повторяется, и в итоге получается последовательность чисел, которая проходит любую проверку на случайность. И все же весь процесс можно точно воспроизвести, просто зная начальное число и начав весь процесс заново - этот чрезвычайно полезен при необходимости точного повторения симуляций, как мы обнаружили в нашей работе с MCMC.
Эти алгоритмы правильнее называть генераторами псевдослучайных чисел, поскольку они не содержат никакой неопределенности. Но последовательность чисел все равно остается по сути непредсказуемой из-за двух факторов. Во-первых, переход от одного числа к другому крайне "нелинеен", то есть он не следует устойчивой постепенной схеме, а может идти по дикому и непредсказуемому пути. Во-вторых, это означает, что они чрезвычайно чувствительны к "начальным условиям" - если бы мы выбрали корень 112, то получили бы совершенно другой и несвязанный ряд. Это классические свойства хаотической системы, которые мы рассмотрим позже.
Эти идеи лежат в основе многих привычных способов генерирования "случайности", , таких как подбрасывание монет, бросание симметричных костей, вращение колеса рулетки или выборка лотерейных шаров из хорошо перемешанного барабана. Эти механизмы подчиняются законам классической физики и, по сути, являются детерминированными, но их чрезвычайная сложность делает их непредсказуемыми, и эта непредсказуемость означает, что они, как правило, будут достаточно случайными для любых практических целей.
Перси Диаконис, с которым мы познакомились в главе 4, анализируя совпадения, был странствующим фокусником, ставшим профессором теории вероятности. Он обучил себя подбрасывать монету и ловить ее головой (если он этого хотел) вверх, а затем его команда построила машину для бросания монет, которую можно было настроить так, чтобы монета падала в чашку по желанию. 11 Оба способа демонстрируют, что подбрасывание монеты по сути детерминировано. fn7
Любой, у кого есть маленькие дети, быстро поймет, что "справедливость" - важная часть их мира. Исследования показывают, что примерно к восьми годам многие дети могут понять, что "случайный выбор" - один из способов обеспечить такую справедливость. 12 Это называется сортировкой и используется для демонстрации равных возможностей со времен отбора присяжных в Древних Афинах.
Конечно, это справедливо только в том случае, если выбор фактически случаен и карты не сложены против вас. В 2011 году ошибка в программировании лотереи Green Card США привела к тому, что 90 % победителей оказались в первые два из тридцати дней, отведенных на регистрацию, 13 и ее пришлось перерисовывать, что, должно быть, вызвало большое разочарование среди тех, кто подал заявку раньше. Еще более печально известной стала лотерея 1969 года для призыва в США на войну во Вьетнаме, когда в результате очень неслучайной выборки 26 человек из 31 родившегося в декабре были призваны в армию, в то время как в январе - только 14. 14
Неудивительно, что, как хорошо знал Казанова (глава 3), лотереи всегда подвергались тщательному контролю на предмет случайности розыгрышей, поскольку любой намек на манипуляцию вызывал возмущение недовольных участников. Что приводит к вопросу
Является ли лотерея в Великобритании действительно случайной?
Основная лотерея UK Lotto стартовала в 1994 году как лотерея 6/49, в которой шары с номерами от 1 до 49 перемешиваются в барабане, а затем шесть шаров извлекаются в последовательности, и их номера составляют основу призов. К октябрю 2015 года, когда был осуществлен переход на 59 шаров, было проведено 2 065 розыгрышей. На рисунке 6.3 показано распределение частоты выбора каждого из 49 номеров после 50, 500, 1 000 и 2 065 розыгрышей. 15
После пятидесяти тиражей наблюдался значительный разброс между выпадениями: шар 39 появился только один раз, в то время как другие числа появлялись одиннадцать раз. Это неизбежно привело к заявлениям о том, что 39 "должен", и действительно, после большего числа тиражей распределение частот стало более ровным, и 39 "догнал". Но, как мы видели в главе 3, важно подчеркнуть, что это произошло не из-за какого-то магического компенсационного механизма - между 50-м и 1000-м тиражами шар 39 появился 110 раз, что близко к ожидаемым 116 появлениям. Важнейший момент, как мы видели ранее, заключается в том, что этого оказалось достаточно, чтобы сгладить прежнее неравенство. Увеличение плавности отражает уменьшение относительной изменчивости , хотя абсолютная разница в подсчетах продолжала расти: максимальный итоговый подсчет составил 282 тиража для номера 23, в то время как номера 13 и 20 отстали на шестьдесят семь тиражей - 215.
Подобно тому, как это сделала компания RAND с миллионом случайных цифр, мы можем применить статистические методы для проверки эффективной случайности лотерейных розыгрышей. Самый простой метод - проверить, совместимы ли распределения на рисунке 6.3 с базовым равномерным распределением, представляющим собой предположение, что все числа с одинаковой вероятностью будут вытянуты. 16 Данные хорошо проходят этот тест - разброс между подсчетами примерно такой, какой мы ожидали бы. fn8
Рисунок 6.3
Частота встречаемости номеров лотереи, начиная с первого тиража в ноябре 1994 года и заканчивая последним тиражом в формате 6/49 в октябре 2015 года, после которого произошел переход на 59 шаров. Распределения соответствуют тому, что мы могли бы ожидать от случайности.