Решения задач

1. Решение задачи о ящике с носками

Рассмотрим сначала численный пример. Пусть в ящике 5 красных и 2 черных носка; вероятность того, что первый вынутый носок — красный, равна 5/(5 + 2). Если первый носок — красный, то условная вероятность того, что второй носок также красный, равна 4/(4 + 2), так как один красный носок уже вынут. Произведение этих двух чисел дает вероятность того, что оба носка красные:

Это число близко к ½, но в условии задачи фигурирует ровно ½. Подойдем теперь к задаче алгебраически.

Пусть в ящике r красных и b черных носков. Вероятность того, что первый носок — красный, равна r/(r + b) и при осуществлении этого события условная вероятность того, что второй вынутый носок также красный, есть (r − 1)/(r + b − 1). Согласно условиям задачи вероятность того, что оба носка — красные, равняется ½, или

Можно начать со значения b = 1 и искать нужное значение r, затем перейти к случаю b = 2 и рассмотреть различные значения r и т. д. Это довольно быстро приводит к решению. Но можно подойти к задаче и на более солидном математическом уровне.

Заметим, что

при b > 0.

Отсюда следует неравенство

Извлекая квадратные корни, для r > 1 получаем

Из первого неравенства имеем

или

Из второго неравенства находим

так что

Для b = 1 получаем

2.414 < r < 3.414,

так что можно взять r = 3. При r = 3, b = 1 имеем

Таким образом, минимальное число носков есть 4.

Рассмотрим теперь четные значения b.

b r между Подходящее r P(2 красных носка)
2 4,9; 5,8 5 (5·4)/(7·6) ≠ 1/2
4 9,7; 10,7 10 (10·9)/(14·13) ≠ 1/2
6 14,5; 15,5 15 (15·14)/(21·20) = 1/2

Таким образом, минимальное число носков в ящике есть 21 при условии, что b четно. Если интересоваться всеми значениями r и b такими, что вероятность извлечения двух красных носков равна ½, то следует использовать методы теории чисел. Этот вопрос приводит к знаменитому уравнению Пелла[4]. Возьмите, например, r = 85, b = 35.

2. Решение задачи о последовательных выигрышах

Поскольку чемпион играет лучше отца, сыну следует играть с ним поменьше партий. С другой стороны, вторая партия — основная, так как сын не может выиграть дважды подряд, не выиграв вторую партию. Пусть C означает чемпиона, F — отца, W и L — выигрыш и проигрыш сына. Пусть, далее, f есть вероятность того, что сын выиграет у отца, а c — вероятность того, что он выиграет у чемпиона. Считается, что выигрыши сына независимы. В следующей ниже таблице приводятся возможные результаты и их вероятности.

Схема FCF Схема CFC
F C F Вероятности C F C Вероятности
W W W fcf W W W cfc
W W L fc(1 − f) W W L cf(1 − c)
L W W (1 − f)cf L W W (1 − c)cf
Общая вероятность выигрыша fc(2 − f) Общая вероятность выигрыша fc(2 − c)

Так как отец играет хуже чемпиона, f > c и (2 − f) < (2 − c), так что сыну нужно выбрать вариант CFC. Например, если f = 0.8, c = 0.4, то вероятность получить приз при схеме FCF равна 0.384, а при схеме CFC — 0.512. Таким образом, бо́льшая вероятность выигрыша второй партии перевешивает невыгоды игры два раза с чемпионом.

Многие предполагают, что чем больше математическое ожидание числа успехов, тем больше вероятность выиграть приз, и часто такой подход бывает правильным. Но в данной задаче есть условия, нарушающие такие рассуждения по аналогии.

Среднее число выигрышей по схеме CFC равно 2c + f, и оно меньше, чем среднее число побед для схемы FCF, 2f + c. В нашем числовом примере при f = 0.8 и c = 0.4 эти средние равны, соответственно, 2 и 1.6. Такое «противоречие» придает задаче специальный интерес.

3. Решение задачи о легкомысленном члене жюри

Оба типа жюри имеют одинаковую вероятность вынести правильное решение. В самом деле, два серьезных члена жюри будут голосовать за справедливое решение с вероятностью p·p = p², при этом результат голосования третьего члена жюри не существен. Если же эти судьи расходятся во мнениях, вероятность чего равна p(1 − p) + (1 − p)p = 2p(1 − p), то для нахождения вероятности правильного решения это число надо умножить на ½. Таким образом, полная вероятность вынесения справедливого решения жюри из трех человек равна p² + p(1 − p) = p, что совпадает с соответствующей вероятностью для жюри из одного человека.

4. Решение задачи об испытаниях до первого успеха

Кажется ясным, что ответ должен быть 6. Чтобы это проверить, обозначим через p вероятность появления шестерки. Тогда вероятности первого успеха при данном испытании равны (q = 1 − p):

Испытания 1 2 3...
Вероятность первого успеха p pq pq² ...

Сумма вероятностей равна

p + pq + pq² + ... = p(1 + q + q² + ...) = p/(1 − q) = p/p = 1.

Среднее число испытаний m до первого успеха по определению равно

m = p + 2pq + 3pq² + 4pq³ + ...

Для нахождения суммы такого ряда применим обычный прием суммирования геометрических рядов

qm = pq + 2pq² + 3pq³ + ...

Вычитая второе выражение из первого, находим

mqm = p + pq + pq² + ...

или

m(1 − q) = 1, mp = 1, m = 1/p.

В нашем примере p = 1/6, так что m = 6.

Предыдущие вычисления были проведены подробно, так как геометрическое распределение часто встречается в этой книге. Красивый способ решения этой задачи дается следующим рассуждением: если первое испытание закончилось неудачей, то условное среднее число испытаний равно 1 + m, а если первое испытание закончилось успехом, то условное среднее число испытаний равно 1. Поэтому

n = p·1 + q(1 + m) = 1 + qm и m = 1/p.

5. Решение задачи о монете в квадрате

Когда мы бросаем монету на стол, то некоторые области положения центра тяжести монеты вероятнее других, но если квадрат достаточно мал, можно считать, что распределение вероятностей равномерно. Это означает, что вероятность попадания центра в какую-либо область квадрата пропорциональна площади этой области; она равна площади области, деленной на площадь квадрата. Так как радиус монеты равен 3/8 дюйма, то для выигрыша игрока центр не должен находиться ближе, чем 3/8 дюйма от сторон квадрата (рис. 3). Этому ограничению отвечает квадрат со стороной 1/4 дюйма, внутри которого должен лежать центр монеты. Так как вероятности пропорциональны площадям, то вероятность выигрыша равна (1/4)² = 1/16. Разумеется, монета вообще может не попасть на стол, и вероятность вы выигрыша на самом деле еще меньше. Квадраты также могут быть уменьшены за счет утолщения разделяющих линий. Если эти линии имеют толщину и 1/16 дюйма, то выигрышной области соответствует вероятность (3/16)² = 9/236, или меньше 1/28.

Рис. 3. Заштрихованная область отвечает случаю, когда игрок выигрывает.

6. Решение задачи «Попытай счастья»

Подсчитаем ущерб, возникающий в следующих случаях: (а) номера всех трех костей различны, (б) имеются ровно два одинаковых номера и (в) все три номера одинаковы. Предположим для простоты, что на каждый номер поставлена единичная ставка. Пусть для начала выпало три различных номера, скажем, 1, 2 и 3. Тогда игорный дом получает три единичные ставки на выигравших номерах 4, 5, 6 и расплачивается ими за три проигравших номера: 1, 2, 3. В этом случае нет ни выигравших, ни проигравших. Ясно, что так будет всегда, когда выпадают три различных номера.

Предположим теперь, что после подбрасывания костей выпало ровно два одинаковых номера, например, 1, 1 и 2. В этом случае игорный дом может использовать ставки, поставленные на номера 3 и 4, как расплату с номером 1, а ставку с номера 5 уплатить номеру 2. Деньги же, поставленные на нономер 6, таким образом, остаются игорному дому. Итак, игорный дом в этом случае выигрывает одну ставку, а игрок ее теряет, так что при единичной ставке ущерб последнего равен 1/6.

Наконец, пусть на всех костях выпало одно и то же число, скажем, 1, 1, 1. Тогда игорный дом выплачивает сумму, равную утроенной ставке, из денег, поставленных на номера 2, 3, 4, оставляя себе ставки, соответствующие номерам 5 и 6. В этом случае потеря игрока, рискующего одной ставкой, равна 2/6. Любопытно заметить, что в среднем игроки теряют больше всего в случаях двух и трехкратной выплаты.

Для определения среднего ущерба, соответствующего единичной ставке, нужно найти вероятности рассмотренных случаев. Пусть игральные кости различаются по цвету, скажем, красная, зеленая и синяя. Они могут выпасть 6·6·6 = 216 способами.

Скольким из этих способов отвечают три различных номера? Если для красной кости имеется 6 вариантов, то для зеленой уже только 5, так как номер, выпавший на красной кости, не должен повториться. Зеленая кость может выпасть по аналогичным соображениям лишь одной из четырех граней, отличных от предыдущих. Итак, всего существует 6·5·4 = 120 возможных вариантов.

Оставим на время второй случай и перейдем к рассмотрению третьего — когда выпадает три одинаковых номера. Число таких вариантов равно 6, так как красная кость может выпасть шестью различными способами, зеленая же и синяя только одним, а именно тем, которым выпала красная.

Это означает, что существует 216 − 126 = 90 комбинаций, при которых выпадает ровно два одинаковых номера. В этом, впрочем, можно убедиться и непосредственно. Возможны следующие сочетания костей с одинаковыми номерами: красно-зеленая, красно-синяя и зелено-синяя. Для нахождения общего числа комбинаций определим число возможных вариантов, скажем, для сочетания красно-зеленая, и умножим его на три. Красная кость может выпасть шестью способами, зеленая — только одним и синяя — пятью, т. е. всего существует 30 таких вариантов. Окончательный результат 3·30 = 90 совпадает с почученным ранее.

Средний ущерб получается суммированием произведений вероятностей отдельных случаев на ущерб, им соответствующий:

120/216 · 0 + 90/216 · 1/6 + 6/216 · 2/6 = 17/216 ≈ 0.079[5].

Итак, в среднем игрок теряет 8 % своей ставки. Учитывая, что игра продолжается около 30 секунд, а по государственным облигациям выплачивается менее 4 % доли прибыли за год, такую игру можно назвать чудовищно несправедливой.

Проведенные расчеты верны лишь для правильных костей. Иногда вместо костей употребляется крутящееся колесо со стрелкой, которое после остановки показывает на участок окружности, отвечающий определенной комбинации из трех цифр. При этом относительные длины этих участков плохо согласуются с вероятностями появления соответствующих комбинаций при подбрасывании костей. Наблюдения показывают, что для таких колес двух- и трехкратные выплаты встречаются чаще и, значит, средний ущерб еще больше.

7. Решение задачи о переубеждении упрямого игрока

Если Браун выиграет хоть один раз за 36 игр, он не потерпит убытка. Вероятность проиграть все 36 раз равна

Математическое ожидание выигрыша в одной игре есть

а в 36 играх:

При игре против благожелательного друга математическое ожидание выигрыша Брауна равно

20·0.617 − 20·0.383 = 4.68.

В итоге Браун в среднем получит 4.68 − 1.89 = 2.79 доллара за 36 игр и будет в выигрыше. Возможно, доброжелательный друг будет сам переубежден. Разумеется, если Браун проиграет все 36 игр, то потеряет 56 долларов, что весьма неприятно.

8. Решение задачи о «масти» при игре в бридж

Эта вероятность ничтожно мала. Так как колода хорошо перетасована, можно считать, что 13 карт сняты сверху. Для получения 13 карт одной масти нужно, вытащив сначала любую из 52 карт, извлечь затем все карты той же масти (которых всего 13 штук). Итак, число способов получения «масти» равно

52·12·11·10·9·8·7·6·5·4·3·2·1 = 52·12!

Общее же число способов извлечения 13 карт из 52 равно

52·51·50·49·48·47·46·45·44·43·42·41·40 = 52!/39!

Искомая вероятность равна 52·12!/(52!/36!) = 12!·39!/51! Обратная величина может трактоваться как среднее число игр до появления «масти».

Из таблиц[6] находим:

lg 12! = 8.68034, lg 51! = 66.19065,

lg 39! = 46.30959, lg (12!·39!) = 54.98993,

lg (12!·39!) = 54.98993, lg(12!·39!/51!) = 11.20072,

12!·39!/51! = 1.588·10−11.

При вычислениях такого рода точный ответ часто приводит в замешательство. Что из того, что в одном из 160 миллиардов случаев имеется возможность получить «масть»? Сколь часто должны мы были бы слышать о таком событии? Явно завышая числа, предположим, что в США в бридж играют 10 миллионов, и что каждый игрок играет 10 раз всякий день в году. Это дает 36½ миллиардов игр в год, так что исключительную сдачу можно ожидать один раз в 4 года (причем о некоторых из них заведомо не будет объявлено публично). Даже в два раза большее количество игроков, которые играют к тому же в два раза чаще, привело бы лишь к одной такой сдаче в течение года.

Чем можно объяснить значительную большую частоту сообщений о появлении «масти»? Многими причинами, среди которых следует назвать склеивание карт и плохое тасование. (Нашумевший случай «масти», действительно имевший место, произошел при первой раздаче новой колоды.)

Несомненно также, что некоторые репортеры стали жертвами шуток и мистификаций. Если вы подстроили своей бабушке «масть» в день ее рождения и хотите потом сознаться в этом, то вы, наверное, все же промолчите, после того как об этом исключительном событии будут оповещены все родственники, друзья и. репортеры. С другой стороны, ввиду внимания к столь редким явлениям, кажется неправдоподобным, чтобы такую комбинацию подстраивали шулера.

Несколько другим путем решения этой задачи является применение биномиальных коэффициентов, которые равны числу различных способов размещений a элементов одного рода и b элементов другого в строку. Например, 3 буквы a и 2 буквы b могут быть записаны подряд 10 различными способами, что нетрудно проверить на пальцах, начиная с aaabb и кончая bbaaa. Биномиальный коэффициент записывается в этом случае как и равен числу способов различного упорядочения пяти предметов, два из которых одного рода и три другого. С помощью факториалов этот коэффициент перепишется в виде

В более общей ситуации, когда имеется n предметов, из которых a одного рода, и na — другого, число способов их упорядочения дается формулой

В нашей задаче число способов выбрать 13 карт из полной колоды равно

Тринадцать пик можно получить

способом, так как 0! = 1. Учитывая, что имеется четыре масти, получим окончательно вероятность в виде 4×13!·39!/52!, как уже было установлено ранее.

Биномиальные коэффициенты обсуждаются в в цитированной выше книге Мостеллера, Рурке и Томаса «Вероятность» на стр. 33–39.

9. «Крэпс»

Эта игра, как мы скоро увидим, удивительно близка к безобидной, хотя все же и невыгодна для игрока.

Подсчитаем сначала вероятности для полного числа очков на двух костях. Сделаем кости различимыми, окрасив их, скажем, в красный и зеленый цвета. Тогда подбрасывание 2-х костей имеет 6×6 = 36 равновероятных исходов, которые приведены ниже в таблице.

Зеленая кость
1 2 3 4 5 6
Красная кость 1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12

В клетках указана соответствующая сумма очков.

Простым подсчетом мы находим распределение вероятностей суммы очков при одновременном подбрасывании двух костей.

Сумма 2 3 4 5 6 7 8 9 10 11 12
P(суммы) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

Здесь P обозначает вероятность появления соответствующей суммы очков.

Вероятность выигрыша после первого бросания равна

Вероятность проигрыша после первого бросания равна

Для дальнейших бросаний нам надо знать вероятность того, что выпадет «пойнт». Так как нам важны лишь очки, отвечающие «пойнт» или 7, то можно вычислять условные вероятности выбросить «пойнт» при условии, что при первом бросании появился «пойнт». Иногда этот метод называется методом «приведенного выборочного пространства», так как хотя в принципе возможны все варианты от 2 до 12 очков, мы рассматриваем лишь «пойнт» и 7.

Например, если выпало 4 очка, то существует 3 возможных способа их появления и 6 способов для появления 7 очков. Таким образом, условная вероятность выбросить «пойнт» равна 3/(3 + 6) = 3/9.

Аналогично условные вероятности других очков «пойнт» равны

Для определения безусловной вероятности выигрыша при данной сумме «пойнт» надо умножить вероятность получения «пойнт» при первом бросании на условную вероятность выигрыша. Суммируя эти величины, находим вероятность выигрыша для суммы «пойнт»:

Прибавляя к этому значению вероятность выигрыша при первом бросании 8/36 ≈ 0.22222, видим, что полная вероятность выигрыша игрока равна 0.49293. Его средний ущерб равен 0.50707 − 0.49293 = 0.01414 или 1.41 %. Автор считает, что это наиболее справедливая игра без стратегии, которая практикуется в игорных домах.

Некоторым читателем может показаться слишком искусственным подход, связанный с условными вероятностями. Мы дадим и другой метод, связанный с суммированием бесконечных рядов.

Пусть P обозначает вероятность получить «пойнт», а R — вероятность появления суммы очков, при которой игра продолжается (R = 1 − P − 1/6). Здесь 1/6, конечно, имеет смысл вероятности появления 7. Игрок выигрывает при r + 1 бросании, если игра продолжалась r шагов, и при r + 1 шаге появился «пойнт». Вероятность этого события равна RrP, r = 0, 1, 2, ... Суммируя по r, получаем

P + RP + R²P + ... = P(1 + R + R² + ...)

или

вероятность получить «пойнт» = P/(1 − R).

Например, если «пойнт» равен 4,

что согласуется с полученным ранее.

Сам автор решал сначала эту задачу с помощью суммирования бесконечного ряда и был обрадован, когда несколько дней спустя обнаружил указанный здесь более простой подход.

10. Обсуждение эксперимента по психологии азартных игроков

Трудно сказать, какой предварительный взнос вы сочтете подходящим для себя. Хотя математическое ожидание выигрыша в первой игре равно пяти долларам, вы можете не захотеть платить взнос, близкий к 5 долларам, за право игры. Потеря 3 или 4 долларов может весьма много значить для игроков. Вы можете, например, предложить взнос, в 75 центов.

Кажется естественным, однако, что взнос для участия во второй игре должен быть по крайней мере таким же, как и для их первой игры. Цвет всегда может быть выбран случайным бросанием монеты, что дает 50 % шансов правильного решения и математическое ожидание выигрыша, равное 5 долларам. Кроме того, если вы располагаете информацией о склонностях вашего друга, то она может быть использована для увеличения вероятности выигрыша.

Большинство людей склонно скорее к первой игре, так как условия второй представляются им менее определенными. Автор обязан этой задачей Г. Райфа; последний сообщил ему, что идея задачи принадлежит Д. Элсбергу.

11. Обсуждение задачи о молчаливом союзе

Автор не встречал еще ни одного человека, который загадал бы многозначное число, при этом, как правило, называют числа 1, 3 и 7. В большинстве случаев была выбрана единица, но встречались также 3 и 7.

12. Обсуждение задачи «Куда идешь?»

Когда этот вопрос был задан моей дочери, она живо ответила: «Ну конечно же, им надо встретиться в самом известном месте Нью-Йорка». — «Прекрасно, но где же именно?» — спросил автор. «Откуда я знаю? Ведь мне всего девять лет».

Что же приходит в голову? Крыша здания Эмпайр Стейт Билдинг[7], аэропорты, бюро справок на железнодорожных станциях, статуя Свободы[8], Таймс Сквер[9]. Статую Свободы следует исключить сразу же по выяснении того, как трудно до нее добраться. Аэропорты не подходят по причине их многочисленности и удаленности от города. Тот факт, что в городе два крупных вокзала, по-видимому, исключит и их. Остаются Эмпайр Стейт Билдинг и Таймс Сквер. Я бы выбрал Эмпайр Стейт Билдинг, потому что Тайме Сквер сейчас разросся до неопределенных размеров.

Автору кажется, что если бы свидание было назначено в Сан-Франциско или в Париже, решить эту задачу было бы легче.

13. Решение дилеммы узника

Из всех задач, о которых пишут автору, настоящая доставила наибольшее количество писем.

Ошибка в рассуждении А состоит в том, что он не перечислил всех возможных событий должным образом. Выражаясь математически, узник неправильно построил пространство элементарных событий. Он считает, что опыт имеет три возможных исхода: освобождение пар AB, AC, BC с равными вероятностями. С точки зрения заключенного — это правильно построенное пространство элементарных событий для эксперимента, проводимого администрацией, которая освобождает двух узников из трех. Но эксперимент A включает еще один момент — ответ охранника. Возможные исходы для такого эксперимента и разумные вероятности для них будут:

1) A и B освобождаются, и охранник говорит B, вероятность 1/3.

2) A и C освобождаются, и охранник говорит C, вероятность 1/3.

3) B и C освобождаются, и охранник говорит B, вероятность 1/6.

4) B и C освобождаются, и охранник говорит C, вероятность 1/6.

Если на вопрос A охранник отвечает B, то апостериорная вероятность освобождения А равна вероятности исхода 1, деленной на сумму вероятностей исходов 1 и 3. Таким образом, вероятность освобождения A равна (1/3)/(1/3 + 1/6) = 2/3, так что математический расчет в конце концов отвечает здравому смыслу.

14. Решение задачи о выборе купонов

Из первой коробки мы достаем один купон. Далее, вероятность получить новый номер из второй коробки равна 4/5. Используя ответ задачи 4, видим, что приобретение нового номера потребует в среднем (4/5)−1 = 5/4 коробок. Третий номер потребует (3/5)−1 = 5/3, четвертый 5/2, пятый — 5 коробок.

Таким образом, среднее число коробок равно

Формула Эйлера для сумм гармонического ряда

Хотя в данном случае указанные дроби сложить, но когда в комплекте большое число купонов, удобно применить формулу Эйлера для частичных сумм гармонического ряда:

(Число C = 0.57721... называется постоянной Эйлера.) В случае комплекта из n купонов среднее число коробок приближенно равно

n·log n + 0.577n + ½.

Поскольку log 5 ≈ 1.6094, формула Эйлера при n = 5 дает 11.43, что весьма близко к 11.42. Членом 1/2n в формуле Эйлера часто пренебрегают.

15. Решение задачи о театре

Например, если ряд заполнен следующим образом

BBMMBBMBMBMBBMM

(здесь B обозначает юношу, а M — девушку), то имеется 9 пар BM и MB.

Нас интересует среднее число таких пар. Если первые два места в ряду заняты лицами разных полов, то у нас уже имеется искомая пара. Вероятность этого события равна

Более того, 8/15 есть и среднее число пар на первых двух местах, так как

Такое же рассуждение применимо к каждой паре смежных мест.

Для определения среднего числа пар молодых людей эту величину надо умножить на число смежных мест, равное 14, что дает 112/15.

Более общим образом, если есть b объектов одного рода и m другого, располагаемых случайным образом в ряд, то среднее число пар, составленных из различных объектов, равно

В нашем примере b = 8, m = 7, и ответ равен 112/15.

Здесь мы существенным образом использовали тот факт, что математическое ожидание суммы случайных величин равно сумме математических ожиданий слагаемых. Мы нашли среднее число пар BM или MB для каждых двух смежных мест и просуммировали по всем таким двойкам.

16. Рещение задачи о распределении призовых мест

Ответ равен 4/7. Второй по мастерству игрок может занять второе место лишь в том случае, когда он находится в половине турнирной лестницы, не занимаемой лучшим игроком.

Если в турнире участвуют 2n игроков, то в половине турнирной лестницы, не занимаемой лучшим игроком, 2n − 1 начальных ступеней, а всего имеется 2n − 1 начальных ступеней (кроме занятой лучшим игроком). Таким образом, в турнире с 2n игроками второй по мастерству может с вероятностью 2n − 1/(2n − 1) занять второе место.

17. Решение задачи о рыцарях-близнецах

(а). Обозначим близнецов через A к B. Пусть A занимает высшую ступень турнирной лестницы. Если B занимает смежное место, что происходит с вероятностью 1/7, то они заведомо встретятся в первом туре. Вероятность того, что B находится в паре, соседней с парой A, равна 4/7, и вероятность того, что они встретятся в этом случае, равна 1/7, так как для осуществления этого события каждый должен победить в первом поединке. Наконец, вероятность того, что B находится в нижней половине, равна 4/7, и в этом случае вероятность встречи равна 1/24 = 1/16, так как оба должны выиграть в двух турах. Таким образом, полная вероятность встречи равна

(б). Заметим, что в турнире двух рыцарей близнецы заведомо встретятся. При 2² = 4 участниках вероятность такого поединка равна ½, для случая 2³ = 8 рыцарей, как уже было подсчитано, вероятность равна 1/4 = 1/2n. Кажется естественным предположить, что в турнире 2n рыцарей искомая вероятность равна 1/2n − 1.

Докажем справедливость этого предположения с помощью метода математической индукции. Рассмотрим сначала случай, когда рыцари находятся в разных половинах турнирной лестницы. Как известно из задачи о теннисных турнирах, эта вероятность равна 2n − 1/(2n − 1). Если A и B находятся в разных половинах турнирной лестницы, то они могут встретиться лишь в финальном поединке. Вероятность выйти в финал для каждого рыцаря есть 1/2n − 1, так как для осуществления этого события необходимо выиграть во всех предыдущих турах. Вероятность того, что A и B достигнут финала, равна (1/2n − 1)² = 1/22n − 2. Итак, вероятность встречи рыцарей из разных половин таблицы равна

[2n − 1/(2n − 1)]·(1/2n − 2).

К этой вероятности следует прибавить вероятность поединка близнецов, которые оказались записанными в одну и ту же половину таблицы. Вероятность последнего события равна (2n − 1 − 1)/(2n − 1), и, согласно индукционному предположению, вероятность схватки между близнецами в турнире из n − 1 тура равна 1/2n − 2. Итак, вероятность встречи равна

что и доказывает наше утверждение.

18. Решение задачи о равновесии при бросании монет

Расположим 100 монет в ряд слева направо и будем бросать каждую. Вероятность какой-то заданной последовательности, составленной из 100 гербов и решек, равна (1/2)100 в силу независимости испытаний. Например, вероятность того, что вначале выпадет 50 гербов и затем 50 решек, равна (1/2)100. Сколькими способами можно расположить 50 гербов и 50 решек в строку? В решении задачи 8 мы видели, что это число равно соответствующему биномиальному коэффициенту. Мы получаем

Следовательно, вероятность равного числа гербов и решек равна

Используя таблицы, получаем 0.07959 ≈ 0,08.

Формула Стирлинга

Для расчета больших значений факториалов часто пользуются формулой Стирлинга

где e — основание натуральных логарифмов. Относительная погрешность этой формулы приблизительно равна 100/(12n) %. Применим формулу Стирлинга к расчету вероятности равновесия

Так как 1/√2π ≈ 0.4, то наша приближенная формула дает 0.08, как и раньше. Более точное приближение с точностью до четвертого знака дает 0.0798 вместо 0.0796. Вывод формулы Стирлинга имеется в любом учебнике по дифференциальному и интегральному исчислению.

19. Решение задачи Сэмуэля Пепайса

Когда-то Сэмуэль Пепайс послал Ньютону длинное и запутанное письмо по поводу новых игр с костями, которые он собирался опробовать. Для выяснения, какая из них выгоднее, Пепайсу нужен был ответ на сформулированный в условии задачи вопрос. Детали истории можно найти, например, в статье «Samuel Pepys, Isaac Newton and Probability», в журнале «American Statistician», Vol. 14, № 4, Oct., 1960. На эту тему есть и другая литература. Насколько я знаю, решение этой задачи — единственная работа Ньютона по теории вероятностей.

Так как при бросании 6 костей в среднем появляется одна шестерка, при бросании 12 костей это среднее равно двум и при бросании 18 костей — трем, то часто считают, что вероятности указанных событий равны. Иногда полагают, что эта вероятность равна 1/2. Здесь довольно ясно видна разница между математическими ожиданиями и вероятностями. Если подбрасывается большое число костей, то вероятность того, что число шестерок не меньше среднего числа их появлений, действительно совсем немного превосходит 1/2. Таким образом, это эвристическое соображение оправдывается при большом числе подбрасываний, но при относительно малом их числе ситуация совсем другая. Для значительного числа костей распределение появления шестерок приближенно симметрично относительно среднего, и вероятность появления этого среднего мала. При небольшом же числе костей распределение асимметрично, и кроме того, вероятность появления числа шестерок, в точности равного его математическому ожиданию, достаточно велика.

Начнем с вычисления вероятности появления ровно одной шестерки при 6 бросаниях. Вероятность появления одной шестерки и пяти других очков в некотором определенном порядке равна . Искомая вероятность получается умножением этого количества на число возможных способов упорядочения одной шестерки и пяти других очков. В задаче 18 мы нашли, что это число равно . Таким образом, вероятность появления ровно одной шестерки равна

Аналогично, вероятность появления ровно x шестерок при бросании шести костей равна

x = 0, 1, 2, 3, 4, 5, 6.

Вообще вероятность появления x шестерок при n бросаниях равна

x = 0, 1, 2, 3, ..., n.

Эта формула задает вероятности, отвечающие так называемому биномиальному закону.

Вероятность появления хотя бы одной шестерки при шести бросаниях равна

При бросании 6n костей вероятность появления не менее n шестерок равняется

Ньютону пришлось самому вычислять эти вероятности. Мы же можем прибегнуть к помощи таблиц (см., например, Ф. Мостеллер, Р. Рурке, Дж. Томас, Вероятность, стр. 325 и 398). Наша табличка дает вероятности получения числа шестерок, не меньшего, чем математическое ожидание числа их появления, в 6n бросаниях.

6n 6 12 18 24 30 96 600 900
n 1 2 3 4 5 16 100 150
P 0.665 0.619 0.597 0.584 0.576 0.542 0.517 0.514

Итак, Пепайсу следовало предпочитать пари с шестью бросаниями пари с бо́льшим числом бросаний.

Биномиальное распределение рассматривается в уже цитированной книге «Вероятность», гл. VI.

20. Решение задачи о трехсторонней дуэли

У дуэлянта A мало оснований для оптимизма по поводу настоящей дуэли. Если он стреляет первым, то при попадании в C наверняка B попадет в него, поэтому A не должен стрелять в C. Если же A выстрелит в B и промахнется, то B, наверное, выведет из строя более опасного C первым и A сможет стрелять в B с вероятностью попадания 0.3. Если же A промахнется, то его песенка спета. С другой стороны, предположим, что A попадет в B. Тогда C и A будут перестреливаться до первого попадания. Шансы выигрыша A равны

(0.5)·(0.3) + (0.5)²·(0.7)·(0.3) + (0.5)³·(0.7)²·(0.3) + ...

Каждое слагаемое отвечает последовательности промахов C и A, заканчивающихся успехом A. Суммируя геометрический ряд, получаем

Таким образом, попасть в B и затем покончить с C — стратегия, дающая для A меньшую вероятность выигрыша, чем пропуск первого выстрела. Поэтому A должен стрелять в воздух, а затем стараться попасть в B.

Обсуждая эту задачу с Т. Лерером, я спросил его, благородно ли это решение с точки зрения кодекса о дуэлях. Лерер возразил, что подобный кодекс для дуэлей с тремя участниками не разработан, так что мы с полным основанием можем простить A преднамеренный промах.

21. Решение задачи о выборке с возвращением

Если первый вытянутый шар — красный, то неважно, из какой урны он вынут, так как теперь в этой урне будет поровну красных и черных шаров и второй шар не даст оснований для решения. Поэтому, если сначала вытянут красный шар, следует вернуть его в урну перед вторым извлечением. Если же вынут черный шар, то лучше не возвращать его в урну.

При такой стратегии вероятность правильного ответа равна:

Урна A Урна B Решение
Оба красные 1/2·2/3·2/3 1/2·101/201·101/201 ≈ 1/8 Урна A
Красный, черный 1/2·2/3·1/3 1/2·101/201·100/201 ≈ 1/8 Урна B
Черный, красный 1/2·1/3·1 1/2·100/201·101/201 ≈ 1/8 Урна A
Оба черные 1/2·1/3·0 1/2·100/201·99/200 ≈ 1/8 Урна B

Полная вероятность правильного решения приближенно равна (заменяя 100/201 на 1/2 и т. д.):

Если вытягивать оба шара без возвращения, то вероятность угадать приблизительно равна 5/8, а при возвращении 21.5/36 (0.625 < 0.597).

22. Решение задачи о выборах

При a = 3 и b = 2 всеми возможными равновероятными последовательностями извлечения бюллетеней являются следующие:

АААВВ *ААВВА *АВВАА

*АВАВА *ВАВАА *ВААВА

*ВВААА ААВАВ *АВААВ

*ВАААВ,

где звездочкой отмечены комбинации, в которых имеет место равновесное положение. Таким образом, в нашем случае искомая вероятность равна 8/10.

Перейдем теперь к общей ситуации произвольных a и b. Рассмотрим сначала те последовательности, в которых первое равновесное положение достигается в случае, когда подсчитаны 2n бюллетеней, nb. Каждой последовательности, в которой A лидирует до первого ничейного результата, соответствует единственная последовательность, в которой лидирует B. Так, при n = 4 последовательности

ААВАВАВВ

с лидером A отвечает последовательность

ВВАВАВАА

в которой лидирует B. Эта последовательность получается из первой заменой A на B и B на A.

Итак, число последовательностей, в которых A лидирует до первой ничьей, равно числу последовательностей с лидером B. Задача сводится, таким образом, к вычислению вероятности равновесного положения, до которого лидирует B.

Так как за A подано большее количество голосов, то рано или поздно A становится лидером. Если первый бюллетень подан за B, то ничья неизбежна. Единственной возможностью ничьей с B, лидирующим в начале, является случай, когда первый бюллетень подан за B. Вероятность того, что это так, равна b/(a + b). Но это же значение равно вероятности ничьей с лидирующим в начале A, и, таким образом, вероятность ничейного положения равна

где r = a/b. Заметим, что если a много больше, чем b, т. е. когда r велико, вероятность ничьей мала (что интуитивно вполне понятно). Формула верна также и при b = a, так как в этом случае вероятность ничьей равна единице.

23. Решение задачи о ничьих при бросании монеты

Ниже мы обобщим метод решения задачи 22 и покажем, что вероятность отсутствия ничейного результата (при N четном и N нечетном) равна

Эти формулы показывают, что указанная вероятность одна и та же для четного N и для следующего за ним нечетного числа N + 1. Например, когда N = 4, надо применить вторую формулу. Шестнадцатью возможными исходами являются

ААAA BAAA ABBA BABB

*AAAB AABB BABA *BBAB

*AABA ABAB BBAA *BBBA

ABAA BAAB ABBB *BBBB

где звездочкой отмечены комбинации с равновесным положением.

Поскольку число сочетаний из 4 по 2 равно 6, то вторая формула действительно верна для этого значения N.

При N = 2n вероятность x выигрышей A есть . Если xn, то вероятность ничьей есть 2x/N (на основании задачи 22), а при xn эта вероятность равна 2·(Nx)/N. Чтобы получить вероятность ничьей, находим вероятность x выигрышей, умножим ее на условную вероятность ничьей при x выигрышах и просуммируем полученные выражения, что дает

(1)

Если подставить в это выражение формулу для биномиальных коэффициентов и произвести необходимые сокращения, то с точностью до слагаемого

получим , где суммирование ведется по всем возможным значениям x. Следовательно, мы можем переписать выражение (1) в виде

(2)

Отсюда видно, что вероятность отсутствия ничьей есть

,

что после небольших преобразований может быть записано в виде

,

как было указано выше.

24. Решение задачи о странном метро

Поезда в направлении к невесте останавливаются у перрона, куда приходит Мэрвин, скажем, в 300, 310, 320 и т. д., поезда в противоположном направлении в 301, 311, 321 и т. д. Чтобы поехать к матери, Мэрвин должен попасть в одноминутный интервал между поездами указанных типов.

25. Некоторые возможные решения задачи о длинах случайных хорд

Пока выражение «наудачу» не уточнено, задача не имеет определенного ответа. Следующие три возможных предположения с соответствующими тремя различными вероятностями иллюстрируют неопределенность понятия «наудачу», часто встречающуюся в геометрических задачах. Мы не можем гарантировать, что эти результаты должны согласовываться с некоторым физическим процессом, который мог бы быть использован для выбюра случайных хорд. Иначе задача могла бы быть проверена эмпирически.

Пусть радиус круга равен r.

(а). Допустим, что расстояние хорды от центра круга равномерно распределено между 0 и r. Поскольку правильный шестиугольник со стороной r можно вписать в круг, для определения искомой вероятности найдем расстояние d стороны этого шестиугольника от центра и разделим на величину радиуса. Заметим, что d — высота правильного треугольника со стороной r. Из планиметрии известно, что

Следовательно, искомая вероятность равна

(б). Пусть середина хорды равномерно распределена во внутренности круга. Из чертежа (рис. 4) видно, что хорда длиннее радиуса, когда середина хорды находится на расстоянии, меньшем d, от центра. Таким образом, все точки круга радиуса d, концентрического с исходным кругом, являются геометрическим местом точек середины хорд. Площадь этого круга, деленная на площадь исходного, равна

Эта вероятность равна квадрату выражения, полученного в случае (а).

Рис. 4.

(в). Допустим, что хорда определяется двумя точками на окружности исходного круга. Пусть первая точка попала в A (рис. 4). Для того чтобы хорда была короче радиуса, вторая точка должна попасть на дугу BAC, длина которой есть 1/3 длины окружности. Следовательно, вероятность того, что хорда длиннее радиуса, равна 1 − 1/3 = 2/3.

26. Решение задачи о нетерпеливых дуэлянтах

Рис. 5.

Пусть x и y обозначают время прибытия 1-го и 2-го дуэлянтов соответственно, измеренное в долях часа, начиная с 5 часов. Заштрихованная площадь квадрата (рис. 5) отвечает случаю, когда дуэлянты встречаются. Вероятность того, что они не встретятся, равна (11/12)², так что шансы на поединок равны 23/144 ≈ 1/6.

27. Решение задачи об осторожном фальшивомонетчике

(а)

(б). Пусть имеется n ящиков, каждый из которых содержит n монет. Тогда вероятность того, что извлеченная наудачу монета доброкачественна, равна 1 − 1/n, и так как всего имеется n ящиков, то

Вычислим эту вероятность для некоторых значений n.

n 1 2 3 4 5 10 20 100 1000
P(не обнаружить фальшивых монет) 0 0.250 0.296 0.316 0.328 0.349 0.358 0.366 0.3677 0.367879...=1/e

Бросаются в глаза следующие два обстоятельства. Во-первых, выписанные в таблице числа с ростом n возрастают. Во-вторых, они стремятся к некоторому значению, которое известно математикам и равно e−1 или 1/e, где e = 2,71828... — основание натуральных логарифмов.

Воспользовавшись формулой бинома Ньютона для , получим следующее выражение:

или

(1)

Если мы исследуем поведение каждого слагаемого, скажем, четвертого, то заметим, что при росте n оно стремится к −1/3!, так как

(2)

При n, стремящемся к бесконечности, все слагаемые в правой части (2), кроме 1, стремятся к нулю. Аналогично, для r-го слагаемого разложения (1) множитель, зависящий от n, стремится к единице, а все слагаемое с точностью до знака, к

Таким образом, с ростом r выражение стремится к сумме ряда

который является одним из способов вычисления e−1.

Если бы в каждом ящике было две фальшивые монеты, то искомая вероятность, равная , сходилась бы при больших n к e−2 и, точно так же, стремится к e−m. Вообще стремится к em при любом (целом или нет) значении m. Эти факты будут использованы в дальнейшем. Более строгое их обоснование можно найти в любом учебнике по дифференциальному исчислению.

28. Решение задачи о жадном фальшивомонетчике

Каждая из проверяемых монет изымается из нового ящика и с вероятностью m/n фальшива. Так как монеты извлекаются независимым образом, то искомая вероятность отвечает биномиальному распределению.

Исследуем поведение этой вероятности при возрастании n и фиксированных r и m.

Для этого запишем ее в виде

С ростом n 1/r! и mr не меняются, а

n·(n − 1)· ... ·(nr + 1)/nr стремится к 1, как указано в задаче 27, стремится к e−m и стремится к 1 (так как m и r фиксированы). Поэтому при больших n

Сумма этих вероятностей равна:

Ряд, записанный в скобках, является разложением em.

Распределение Пуассона

Распределение, задаваемое вероятностями

называется законом Пуассона и служит хорошей математической моделью для многих физических процессов.

29. Решение задачи о заплесневевшем желатине

Разобьем поверхность пластинки на n малых равных площадок. Для каждой площадки вероятность колонии равна p, а их среднее число есть np = 3. Нас интересуют лишь маленькие площадки. Когда n растет, p становится малым, так как площадь участков стремится к нулю. Вместо того, чтобы считать среднее число колоний равным 3, будем рассматривать общее среднее m = np. Может показаться, что на некоторых площадках встречаются две или больше колоний, но эти сомнения можно оставить, потому что площадки столь малы, что едва умещают одну колонию. Тогда вероятность ровно r колоний на n маленьких площадках равна

где p = m/n. Заменим p на m/n в этой формуле. Полученное выражение уже знакомо нам по задаче 28. Пусть n → ∞. Тогда мы снова приходим к распределению Пуассона

При m = 3 и r = 3 получаем значение 0.224.

То, что m действительно является средним этого распределения, проверяется непосредственно:

Чтобы получить численные результаты для больших значений m, где r = m, можно использовать таблицы[10] или формулу Стирлинга. Последняя дает

Численные примеры:
m P(m) 0,4√m
4 0.1954 0.200
9 0.1318 0.133
16 0.0992 0.100

30. Решение задачи о расчете булочника

Почему мы пользуемся предположением о распределении Пуассона? Отчасти потому, что задача допускает тогда красивое решение, а отчасти потому, что распределение действительно может быть близким к пуассоновскому, так как булочник имеет много клиентов, каждый из которых довольно редко покупает кекс. Если читателя беспокоит колебание числа покупок, связанное с разными днями недели, то будем говорить лишь о вторниках в течение лета.

Большинство обычно считает, что искомая вероятность равна 1/2.

Вероятность продать ровно r кексов есть e−20·20r/r!, как известно из задачи 28. Заменив 20 на m, мы лучше выясним структуру задачи. Сумма вероятностей закона Пуассона есть ∑em·mr/r! или

(A)

Нашей целью является выделение слагаемых, отвечающих нечетным количествам покупок. Известно, что

(B)

Сумма выражений (A) и (B) дает нам удвоенную вероятность четного числа кексов, так как члены с нечетными степенями m войдут в сумму с нулевыми коэффициентами, а члены с четными степенями — с коэффициентом 2. Следовательно, деля на 2, получим вероятность четного числа покупок (1 + e−2m)/2. При m = 20 этот результат весьма близок к 0.5, так как число e−40 мало́. С другой стороны, если булочник продает в среднем один специальный торт ко дню рождения за одну поездку, то вероятность того, что будет продано четное число таких тортов, равняется приблизительно 0.568.

31. Решение задачи о парных днях рождения

В задачах такого рода предполагается обычно, что 29 февраля не может быть днем рождения, и что всем остальным дням в году отвечает одинаковая вероятность.

Решим несколько более общую задачу. Пусть N обозначает число равновероятных дней, r — число людей. Вычислим вероятность того, что все эти люди родились в разные дни. Тем самым мы найдем и вероятность того, что хотя бы два человека родились в один и тот же день.

Для первого человека имеется N возможных дней, для второго — (N − 1), не совпадающих с днем рождения первого, для третьего — (N − 2), отличных от дней рождения первых двух и т. д., для r-го человека существует Nr + 1 возможностей. Общее число вариантов, при которых нет одинаковых дней рождения, равно

N·(N − 1)·...·(Nr + 1) (r сомножителей). (1)

Для определения интересующей нас вероятности надо найти еще общее число всевозможных расстановок дней рождения. Для каждого человека существует ровно N возможных дней, и общее число различных распределений дней рождения r людей равно

Nr. (2)

Так как, согласно предположению, все дни равновероятны, то искомая вероятность равна отношению (1) и (2). Таким образом, вероятность того, что имеются по крайней мере два одинаковых дня рождения, равна

Pr = 1 − N·(N − 1)·...·(Nr + 1)/Nr. (3)

Точное вычисление значения (3) потребовало бы при больших значениях N таких, как 365, значительного числа выкладок, чего в нашем случае можно избежать за счет использования таблицы логарифмов, представляя искомую вероятность в виде N! / (N − 2)!·Nr. Имеем

lg(365!) = 778.399975, lg(365) = 2.56229286
r = 20, lg(345!) = 727.38410,
r = 21, lg(344!) = 724.84628,
r = 22, lg(343!) = 722.30972,
r = 23, lg(342!) = 719.77442,
r = 24, lg(341!) = 717,24040,
r = 25, lg(340!) = 714.70764.

Небольшая работа с таблицами показывает, что при r = 23 вероятность по крайней мере одного совпадения дня рождений равна 0.5073, а при r = 22 эта вероятность равна 0.4757. Таким образом, r = 23 — наименьшее целое число, при котором имеет смысл заключать равноправное пари. Для большинства кажется удивительным, что это число довольно мало́, так как интуитивно ожидаемым ответом кажется 365/2. Мы обсудим это явление в следующей задаче, а пока заметим вот что:

Во-первых, следующая таблица дает значения вероятности парных дней рождения для различных значений R:

R 5 10 20 23 30 40 60
PR 0.027 0.117 0.411 0.507 0.706 0.891 0.994

Во-вторых, вспомним, что

Если x достаточно мало́, то члены порядка, большего, чем x, дают в сумму пренебрежимо малый вклад, и e−x приближенно равно 1 − x, или 1 − x можно при малых x заменить на e−x. Заметим, что

является произведением множителей вида (Nk)/N, где k много меньше N. Эти множители могут быть записаны в виде 1 − k/N, где 0 ≤ kr. Поэтому

Для исследования этой асимптотической формулы положим r = 23 и получим что-то около 0.500 вместо 0.507, или, положив r·(r − 1)/2·365 равным −lg(0.5) ≈ 0.693, найдем отсюда r.

В-третьих, предположим, что задача модифицирована таким образом: найти вероятность того, что хотя бы два дня рождения совпадают или приходятся на два дня, следующих один за другим (1 января следует за 31 декабря). Решение такой задачи предоставляется читателю.

32. Решение задачи «В поисках парных дней рождения»

Автор считает, что большинство людей имеет в виду именно эту задачу, когда им предлагают задачу 31 о парных днях рождения. Мысль о дне рождения, совпадающем с вашим, и вызывает удивление при ответе r = 23 в задаче о парных днях рождения. В настоящих условиях вам совсем не важно, совпадают ли дни рождения других людей, если только они не совпадают с вашим. Чаще всего считают, что ответ в этой задаче равен половине от 365 или 183. Из-за смешения двух проблем ответ r = 23 кажется тогда неправдоподобно маленьким.

Но и в настоящей задаче интуитивный ответ 183 оказывается неправильным. Дело в том, что выборка дней рождения производится с возвращением. Если первый из опрошенных родился 4-го июля, то ничто не мешает и последующим иметь тот же день рождения. Вероятность того, что опрошенный человек родился не в один день с вами, равна (N − 1)/N, где N = 365 — число дней в году. При опросе n людей вероятность того, что все они произошли на свет не в ваш день рождения, равна [(N − 1)/N]n, и вероятность того, что хотя бы у одного день рождения тот же самый, что и ваш, равна

(4)

Нас интересует наименьшее значение n, для которого Pn не меньше 1/2. Логарифм 364 равен 2.56110, а 1/2 равен −0.30103.

Если мы перейдем к логарифмам, то обнаружим, что искомое значение n равно 253, что довольно значительно отличается от 183.

Можно поступить и иначе, использовав опять аппроксимацию

Тогда

и

Логарифмируя, получаем n/N ≈ 0.693, n ≈ 0.693N. Для N = 365 получаем n = 253.

Эта задача легче предыдущей, и обсуждение связи между их ответами представляется поучительным.

33. Решение задачи о соотношении между разными задачами о парных днях рождения

По существу, вопрос состоит в определении числа возможных случаев в задаче о парных днях рождения. В задаче об индивидуальном дне рождения для n людей имеется n возможностей встретить человека, день рождения которого такой же, как у вас. В задаче о парных днях рождения каждый человек сравнивает свой день рождения с r − 1 днями рождения остальных людей. Число пар равно, таким образом, r·(r − 1)/2, что и является числом возможных случаев. Для того чтобы вероятности в двух задачах приблизительно равнялись, должно выполняться соотношение

(1)

Например, при r = 23 число n должно равняться 23·22/2 = 253, что согласуется с полученным ранее.

Мы уже видели, что при n значительно меньшем по сравнению с N, вероятность того, что ни один из n людей не родился с вами в один и тот же день, приближенно равна en/N. С другой стороны, в задаче о парных днях рождения было показано, что для значений r, малых по сравнению с N, вероятность отсутствия парных дней рождения приблизительно равна er·(r − 1)/2N. Для равенства этих двух вероятностей должно иметь место соотношение (1). Полученная аппроксимационная формула поясняет связь этих двух задач. Из сказанного ранее следует, что r·(r − 1)/2 имеет смысл числа возможных случаев, что также дает основание для сопоставления n и r·(r − 1)/2.

34. Решение задачи о выходных днях и днях рождения

Если на фабрике работает один человек, то предприниматель получает 364 человеко-дней, если два, то почти всегда 2·363 = 726, так что можно думать, что максимум достигается при числе рабочих, большем двух. С другой стороны, при весьма большом числе рабочих практически каждый день является выходным, и завод никогда не работает. Следовательно, действительно существует конечное число рабочих, на котором достигается максимум.

Найдем среднее число рабочих дней. Каждый день является либо рабочим либо нет. Заменим для общности 365 на N и обозначим через n число рабочих на фабрике. Тогда вероятность того, что первый день в году — рабочий, равна (1 − 1/N)n, так как в этом случае все рабочие родились в один из других N − 1 дней. Средний вклад первого дня в трудоднях равен

Это число одинаково для всех дней, так что среднее число человеко-дней, отработанных в году, при n рабочих на фабрике равно n·N·(1 − l/N)n. Для максимизации этой функции от n надо найти значение n, для которого

и

Первое неравенство означает, что

или

Nn + 1.

второе, что

Отсюда получаем nNn + 1 и, значит, или n = N, или же n = N − 1. Подставляя эти значения n в формулу для среднего числа человеко-дней, мы получаем N²·(1 − 1/N)N и (N − 1)·N·(1 − 1/N)N − 1 т. е. равные величины. Так как N-й человек не изменяет положения дел, на фабрике должно быть N − 1 рабочих. В силу соотношения (1 − 1/N)Ne−1 среднее число трудодней приблизительно равно N²·e−1. Если бы все N человек работали каждый день, то число трудодней равнялось бы N², так что e−1 равняется среднему отношению числа действительно проработанных дней к потенциально возможному N². Оно приблизительно равно 0.37. Итак, на фабрике работает 364 человека, и число рабочих дней приблизительно равно 49 (если считать, что других выходных нет). 364-й рабочий вкладывает в среднем только 0.37 дня в общее число трудодней. Рабочая сила должна быть очень дешева в этом городе!

35. Решение задачи «На краю утеса»

Перед решением задачи полезно задуматься о возможном ответе. Посмотрим, что может случиться на нескольких первых шагах. Приведенная схема иллюстрирует тот факт, что человек может упасть вниз только через нечетное число шагов. После одного шага вероятность упасть вниз равна 1/3 (рис. 6). Путь 1 → 2 → 1 → 0 добавляет еще 2/27 к вероятности падения, давая общую вероятность несчастья 11/27. После пяти шагов пути 1 → 2 → 1 → 2 → 1 → 0 и 1 → 2 → 3 → 2 → 1 → 0 вместе добавляют 8/243 к вероятности падения, давая общий результат 107/243. Этот список можно продолжить, но мы обратимся теперь к иному подходу.

Рис. 6. Схема блуждания пьяницы, показывающая вероятность нахождения на различных расстояниях от края пропасти.

Настоящая задача о блуждании весьма популярна и имеет много формулировок. Далее мы будем трактовать ее как задачу о частице, движущейся по оси.

Рассмотрим частицу, которая сначала находится в положении x = 1 на оси. Структура задачи будет яснее, если вероятность шага направо вместо 2/3 будет равна p. Частица движется из положения 1 либо в точку x = 2 с вероятностью p, либо в точку x = 0 с вероятностью 1 − p (рис. 7). Вообще, если частица находится в положении x = n, n > 0, n — целое число, то она сдвигается либо в точку x = n + 1 с вероятностью p, либо в точку x = n − 1 с вероятностью 1 − p. Если частица попадает в положение x = 0, то там она поглощается (не делает других шагов). Нас интересует значение вероятности P₁ того, что частица поглощается в точке x = 0, если она выходит из точки x = 1. Разумеется, значение P₁ зависит от p. Кажется естественным, что если p близко к 1, то вероятность P₁ мала, а если p близко к нулю, то P₁ мало отличается от 1.

Рис. 7.

Рассмотрим ситуацию после первого шага: либо частица сдвинулась налево, попала в точку x = 0 и поглотилась там (это событие имеет вероятность 1 − p), либо сдвинулась направо в точку x = 2 (это событие происходит с вероятностью p). Пусть P₂ обозначает вероятность того, что частица поглощается в начале координат x = 0, если она выходит из точки x = 2. Тогда мы имеем

P₁ = 1 − p + p·P₂, (1)

так как 1 − p есть вероятность поглощения на первом шаге и p·P₂ — вероятность поглощения на последующих шагах.

Каждый путь, ведущий к поглощению из x = 2, можно разбить на две части:

(1) Путь, идущий из точки x = 2 и достигающий положения x = 1 в первый раз (не обязательно за один шаг) и

(2) Путь, идущий из точки x = 1 в точку x = 0 (также не обязательно за один шаг). Вероятность пути из положения x = 2 в x = 1 есть P₁ поскольку структура блуждания здесь идентична структуре первоначального блуждания (см. рис. 35.1), за исключением того, что начало координат переносится на один шаг направо. Вероятность попасть из точки x = 1 в x = 0 также равна P₁ как и в исходной задаче. Величина P₂ поэтому есть P₁², так как события A (частица идет по пути от точки x = 2 к x = 1) и B (частица движется по пути от точки x = 1 до x = 0) независимы, и P(A) = P(B) = P₁.

Мы можем переписать уравнение (1) как

P₁ = 1 − p + p·P₁², (2)

Уравнение (2) — квадратное относительно P₁ и имеет два решения:

P₁ = 1; P₁ = (1 − p)/p. (3)

В таких задачах одно или оба решения могут быть подходящими, в зависимости от значений p.

Если p = 1/2, то оба решения совпадают, и P₁ = 1. Когда p = 1, P₁ = 0, так как частица всегда движется вправо. И когда p = 0, очевидно, P₁ = 1. При p < 1/2 второе решение (3) не подходит, так как тогда (1 − p)/p > 1, а по смыслу задачи P₁ ≤ 1. Поэтому при 0 ≤ p ≤ 1/2 мы имеем P₁ = 1.

Чтобы доказать, что второе решение P₁ = (1 − p)/p имеет место при p > 1/2, нам достаточно установить, что P₁ является непрерывной функцией от p (грубо говоря, что P₁ не слишком изменяется, когда p меняется мало). Мы предполагаем эту непрерывность, но не доказываем ее.

Кривая (см. рис. 8) начинается в точке P₁ = 1 при p = 1/2; она должна спуститься к P = 0 при p = 1, и ее ордината всегда должна равняться 1 или (1 − p)/p. Кривая не имеет разрывов только в том случае, когда при p > 1/2 соответствующее значение равно (1 − p)/p. Итак, при предположении непрерывности функции P₁ мы получаем P₁ = (1 − p)/p при p > 1/2. Поэтому наш пьяница с вероятностью 1/2 упадет вниз.

Рис. 8. Вероятности поглощения P.

Приведем другую интерпретацию. Рассмотрим игрока, имеющего начальный капитал в одну денежную единицу (x = 1). Он может играть неограниченно долго, причем в каждом туре игры он с какими-то вероятностями выигрывает или проигрывает эту единицу. Чтобы вероятность банкротства игрока была не более 1/2, вероятность выигрыша в отдельной партии должна быть не менее 2/3. То, что банкротство неизбежно при p = 1/2, для большинства из нас неожиданность.

Приведем еще один взгляд на задачу. Рассмотрим игрока с начальным капиталом x = 1, играющего неограниченно долго против казино с бесконечным капиталом в «безобидную игру» (p = 1/2), при которой он выигрывает или проигрывает единицу в каждом туре. Он наверное обанкротится (P₁ = 1). Чтобы он не стал банкротом с вероятностью 1/2, вероятность его выигрыша в каждой отдельной партии должна быть p = 2/3. То, что банкротство неизбежно при p = 1/2, является неожиданным для большинства из нас. Обычно считают, что если отдельные партии «безобидны» (средняя потеря равна нулю), то и вся игра безобидна. Разумеется, это представление в обычном смысле верно. Если мы представим такую игру с p = 1/2 и большим числом партий, то среднее значение денежной суммы на руках после n туров равно 1 для каждого конечного числа n. Таким образом, отсутствие «безобидности» является одним из парадоксов бесконечного.

Другой удивительный факт состоит в том, что при p = 1/2 среднее число шагов, требуемое для поглощения, бесконечно. Случай p = 1/2 является странным и глубоким.

Вас может заинтересовать применение указанного здесь метода к частице, выходящей из точки x = m, а не из точки x = 1. Обобщение приведенного выше результата, показывает, что вероятность поглощения с абсциссы x = m есть [(1 − p)/p]m или 1, в зависимости от того, будет ли p больше или меньше 1/2. Если p > 1/2 и m велико, то весьма вероятно, что частица избежит поглощения, и поэтому вероятность поглощения мала, а не равна 1.

Если частица выходит из начала координат 0 и ей разрешается делать шаги в обоих направлениях с вероятностью p = 1/2, то в другой классической задаче о блуждании ставится вопрос о том, вернется ли частица когда-либо в начало координат. Мы уже видели, что так действительно будет, ибо она заведомо вернется из положений x = 1 и x = −1. Дальнейшие сведения об этой задаче будут сообщены ниже.

36. Решение задачи о разорении игрока

Наша задача — специальный случай общей задачи о случайном блуждании с двумя поглощающими барьерами. Исторически эта проблема была поставлена как игровая, называемая задачей о разорении игрока, и многие знаменитые математики занимались вопросами, связанными с ней. Сформулируем задачу в общем виде.

Игрок M имеет m денежных единиц, игрок Nn единиц. После каждой игры один игрок выигрывает, другой проигрывает единицу. В каждой партии вероятность выигрыша игрока M равна p, а выигрыша N равна q = 1 − p. Игра продолжается до разорения одного из игроков. На рис. 36.1 указана сумма денег, которую игрок M имеет в настоящий момент. Он начинает с положения x = m. Когда x = 0, он разорен, при x = m + n банкротом является игрок N.

Рис. 36.1. Схематическое изображение задачи о разорении игрока

При такой постановке, поскольку p > 1/2, мы можем использовать результат задачи 35. Мы уже знаем, что если игрок M играет против банка с неограниченными ресурсами, то становится банкротом с вероятностью (q/p)m. По пути к банкротству он либо получает сумму m + n (n теперь конечно) либо никогда не будет иметь ее на руках. Пусть вероятность того, что он проиграет игроку N, равна Q (это событие равносильно выигрышу N у банка с неограниченным капиталом без достижения игроком M суммы m + n). Тогда

(p/q)m = Q + (1 − Q)·(q/p)m+n, (1)

поскольку Q есть доля последовательностей, для которых поглощение произойдет до достижения точки m + n, а 1 − Q — доля тех последовательностей, которые достигают положения m + n; (q/p)m+n есть доля последовательностей, поглощаемых в нуле, если игра продолжается неограниченно долго. Тогда P = 1 − Q есть вероятность того, что игрок M выиграет. Из (1) находим

P = [1 − (q/p)m] / [1 − (q/p)m+n]. (2)

В нашем случае p = 2/3, q = 1/3, m = 1, n = 2 и P = 4/7, и, значит, лучше быть вдвое более искусным в игре, чем вдвое более богатым.

Если q = p = 1/2, то P в уравнении (2) принимает неопределенную форму 0/0. Применение правила Лопиталя дает

P = m / (m + n). (3)

Таким образом, если игроки равноискусны, то шансы на выигрыш игрока M равны 1/3, а его средний выигрыш равен 1/3·2 + 2/3·(-1) = 0. Игра в этом случае безобидна, т. е. математическое ожидание выигрыша равно нулю для каждого игрока.

37. Решенuе задачu о смелой игре и осторожной игре

Смелая игра (по терминологии Л. Дубинса и Л. Сэвиджа: L. Dubins and L. Savage, How to gamble if you must, 1963), т. е. ставка 20 долларов сразу, дает игроку вероятность выигрыша равную 18/38 ≈ 0.474. Вычисление вероятности выигрыша при осторожной игре по доллару за одну партию сводится к задаче о разорении игрока с

m = 20, n = 20, p = 18/38, q = 20/38.

Подставляя эти значения в формулу для вероятности выигрыша M, получаем

P = [1 − (20/18)20] / [1 − (20/18)40] = [8.23 − 1] / [67.65 − 1] ≈ 0.108.

Итак, осторожная игра уменьшает шансы игрока на выигрыш вчетверо по сравнению сосмелой игрой.

Интуитивное объяснение этого явления состоит в том, что смелая игра есть также быстрая игра, а быстрая игра сокращает время игры против казино, которая не является безобидной. Впрочем, мы видели, что интуиция, основанная на средних, не всегда ведет к правильным выводам о вероятностях. Дубинс и Сэвидж замечают, что им неизвестно доказательство, основанное на подобных интуитивных рассуждениях. Однако в нашем специальном случае удвоения начальной суммы при игре в «красное и черное» нижеследующие пояснения Сэвиджа основываются именно на этой идее.

Подготавливая эти пояснения об игре в казино для настоящей книги, Сэвидж сознательно опустил некоторые математические тонкости, касающиеся случая равенств в неравенствах для вероятностей.

«Золотой рай»

В «Золотом раю» можно играть в любую безобидную игру, если только игрок располагает достаточным начальным капиталом. Игрок, входящий в «Золотой рай» с x долларами и желающий получить доход в y долларов, может достигнуть своей цели с вероятностью x/(x + y), поставив все свое достояние x на единственный шанс выиграть y долларов с вероятностью x/(x + y), что является, очевидно, безобидной игрой. Как известно, никакая стратегия не дает большей вероятности выигрыша, и вероятность выигрыша максимальна тогда и только тогда, когда играющий заведомо либо проигрывает x либо выигрывает y долларов.

«Меньший рай»

«Меньший рай» походит на «Золотой рай», но с той существенной разницей, что, покидая игорный зал, игрок должен уплатить налог размером t (0 < t < 1) с любой положительной суммы, которую он приобрел во время игры. Поэтому для играющего не труднее и не легче выиграть y с начальным капиталом в x долларов, чем игроку в «Золотом раю» выиграть y / (1 − t) долларов. Наибольшая вероятность, с которой он может достигнуть цели, равна поэтому

Pmax = [(1 − t) · x] / [(1 − t) · x + y]. (1)

«Потерянный рай»

Здесь крупье собирает налог размером t от положительного дохода, если он есть, после каждой сыгранной партии. В этом случае игрок, очевидно, находится не в лучших условиях, чем его собрат в «Меньшем раю». В частности, (1) есть верхняя граница для вероятности выиграть y долларов с начальным капиталом x в «Потерянном раю». Эта вероятность может быть достигнута при ставке всего капитала в одной партии, как и прежде. Однако указанная вероятность не может быть получена ни при какой стратегии, для которой вероятность выигрыша любой положительной суммы, меньшей чем y (после выплаты налогов), положительна. Чтобы убедиться в этом, заметим, что игрок в «Меньшем раю» может имитировать любую стратегию игрока из «Потерянного рая», откладывая после каждой партии ту сумму, которую отбирает крупье от игрока из «Потерянного рая». Таким образом, первый игрок может иметь больший ожидаемый доход, чем второй игрок при любой стратегии, в которой вероятность выигрыша любой положительной суммы, меньшей y, положительна.

«Красное и черное»

В «Красном и черном» игрок может поставить любую сумму в игре с вероятностью w (0 < w < 1/2) выигрыша, равного его ставке. Иначе говоря, он выигрывает то, что полагалось бы при безобидной игре с (1 − w)/w своей ставки, и затем уплачивает налог, равный t, где

t = (1 − 2w) / (1 − w).

Поэтому вероятность для игрока в «Красное и черное» выиграть y долларов с начальным достоянием в x долларов не превосходит (1), так же как и для игрока в «Потерянном раю». В терминах величины w эта верхняя грань равна

w·x / [w·x + (1 − wy]. (2)

Более того, значение (2) может быть достигнуто только в том случае, когда вероятность выиграть положительную сумму, меньшую, чем y, в отдельных играх равна нулю. Причем заведомо игрок либо проигрывает ровно x долларов, либо выигрывает ровно y. Можно показать, что эта ситуация осуществляется только тогда, когда y = x, и игрок участвует только в одной смелой игре с вероятностью выигрыша w, определяемой из (2), суммы в y долларов.

Задача об отыскании точных верхних границ и оптимальных стратегий для игрока в «Красное и черное», который хочет выиграть сумму, отличную от x, более трудна и мы не будем ее рассматривать.

38. Решение задачи о нестандартной монете

Услышав впервые эту задачу, покойный великий математик Джон фон Нейман дал ответ с точными тремя знаками за 20 секунд в присутствии публики, которой потребовалось для решения значительно больше времени.

Конечно, для того, чтобы задача имела определенный ответ, надо наложить некоторые условия, упрощающие дело. Материал, из которого изготовлена монета, сила, с которой ее подбрасывают, и свойства поверхности, на которую она падает, должны такими, чтобы задача допускала эмпирическую проверку.

Кажется естественным подобрать эти условия таким образом, чтобы монету можно было рассматривать как вписанную в сферу, центр которой совпадает с центром тяжести монеты. Сама монета при этом трактуется как прямой круговой цилиндр (рис. 10, 11).

Рис. 10.

Рис. 11.

На поверхности сферы выбирается случайная точка, и если радиус, проведенный из центра в эту точку, пересекает боковую поверхность цилиндра, то считается, что монета упала на ребро.

На практике этой ситуации отвечает клейкая поверхность, мягко упав на которую монета опускается либо на ребро либо на одно из оснований (рис. 12).

Рис. 12.

Для решения задачи нам понадобится следующий результат. Поверхность куска сферы, заключенного между двумя параллельными плоскостями, пропорциональна расстоянию между этими плоскостями, так что толщина нашей монеты должна составлять 1/3 диаметра сферы. Дадим окончательный ответ в терминах диаметра монеты (рис. 13).

Рис. 13. Чертеж сечения сферы, поясняющий соотношение между радиусом R сферы и радиусом r монеты.

Пусть R — радиус сферы, а r — радиус монеты. Согласно теореме Пифагора

Итак, высота ребра монеты составляет около 35% ее диаметра.

Замечание о принципе симметрии для случайных точек на прямой

Предположим, что несколько точек брошены случайным образом на отрезок [0, 1]. Например, пусть это точки w, x и y, как показано на рис. 14.

Рис. 14. Три точки на единичном отрезке.

Эти три точки делят наш отрезок на четыре части с длинами х, ух, wy, 1 − w. Если процедура бросания повторяется, то по-прежнему мы получаем четыре отрезка (левый, второй, третий и правый), и можно поставить вопрос о распределении длины, скажем, левого промежутка. Фиксируем некоторое число t. Какова вероятность того, что все три точки упадут справа от t? Так как бросания независимы, и вероятность того, что каждая точка упадет справа от t, равна 1 − t, то ответом на поставленный вопрос является (1 − t)³.

Итак,

P(левая точка лежит справа от t) = (1 − t)³.

Пример. Какова медиана распределения левой точки? Медианой распределения называется точка, вероятность падения слева от которой равняется 1/2.

Имеем (1 − t)³ = 1/2,

В то время как распределение длины левого промежутка находится просто, а распределение длины правого из соображений симметрии совпадает с распределением левого, задача нахождения распределения длин второго и третьего промежутков может представить известные трудности. Может быть, читатель уже догадался, что эти распределения равны распределению длины левого промежутка, но так, впрочем, думают совсем немногие. Целью следующих замечаний и является разъяснение этого факта.

Вместо того, чтобы бросать точки на единичный отрезок, будем бросать их на окружность единичной длины. При этом вместо трех точек используем четыре, причем четвертую точку обозначим через z (рис. 15).

Рис. 15. Четыре точки на единичной окружности.

Таким образом, точки x, y и w, как и раньше, размещены на единичном интервале, у которого, однако, случайные концы. В силу равноправности всех четырех точек длины дуг (z, x), (x, y), (y, w) и (w, z) имеют одно и то же распределение. Если процесс бросания производится несколько раз, и при каждом бросании вычисляется длина дуги от точки z до следующей против часовой стрелки, от этой — так же до следующей и т. д., то имеет смысл говорить о распределении длин этих дуг, причем для всех дуг это распределение одинаково.

Разрывая окружность в точке z и разворачивая ее в отрезок, видим, что бросание четырех течек на окружность, одна из которых используется как начало отсчета, эквивалентна бросанию трех точек на единичный интервал.

Мы не дадим здесь строгого доказательства, хотя читатель, быть может, и не вполне убежден предыдущими рассуждениями. Верен общий принцип симметрии:

Принцип симметрии. При бросании n точек наудачу на отрезок, распределение длин n + 1 получающихся при этом отрезков одинаково.

39. Решение задачи о неуклюжем химике

В предположении того, что трубка разбивается случайно, из принципа симметрии выводим, что распределение длины каждой части с красной меткой, средней и с синей меткой одинаково и, значит, равны и их математические ожидания. Так как сумма этих величин постоянна и равна 9 см, то средняя длина куска трубки с красной меткой равна 3 см.

40. Решение задачи о первом тузе

Естественно считать, что принцип симметрии сохраняется и для дискретных распределений. Четыре туза делят колоду на 5 частей, каждая из которых содержит от 0 до 48 карт. Если два туза лежат подряд, то будем говорить, что длина соответствующего куска колоды равна нулю. Аналогично нулевую длину имеют части колоды, которые находятся до первого туза, если он лежит сверху, и за четвертым тузом, если он является последней картой в колоде. Согласно принципу симметрии средняя длина каждой части равна 48/5 = 9.6. Последующей картой должен быть туз, который является, таким образом, в среднем 10.6 картой.

41. Обсуждение задачи о поездах

Хотя на поставленные вопросы вряд ли можно дать «правильный» ответ, все же возможно разумное объяснение этих задач. Например, согласно принципу симметрии, если на отрезок бросается одна точка, то в среднем два полученных отрезка имеют одинаковую длину, так что в пункте (а) ответ равен 119, так как длина левого промежутка равна 59, 2·59 = 118 и 118 + 1 = 119.

Аналогично в пункте (б) можно предположить, что пять наблюденных номеров разбивают весь отрезок на шесть равных частей. Так как 60 − 5 = 55, то средняя длина первых пяти отрезков равна 11, и общее число номеров может быть оценено как 60 + 11 = 71 (рис. 16). Конечно, оценка не может быть абсолютно точной при многократном употреблении.

Рис. 16.

Указанный метод заставляет думать, однако, что в среднем при многократном использовании такие оценки мало отличаются от истинного значения N при большом числе наблюдений. Если неизвестное число N подлежит оценке во многих задачах, то, следуя каждый раз приведенному методу (извлечь выборку, построить оценку), мы в среднем будем близки к истинному значению при достаточно больших объемах выборок.

С другой стороны, может быть и так, что вас не интересует приближение в среднем или недоступно большое число наблюдений, но вы хотите угадать значение N, несмотря на то, что это маловероятно. Тогда разумно оценить N как наблюденный максимум из номеров. Если вы, например, знаете номера двух локомотивов, то вероятность того, что один из двух номеров — максимально возможный, равна или 2/N.

Иногда пользуются методом доверительного оценивания, при котором в качестве оценки предлагается некоторый интервал для неизвестного параметра. Ограничимся случаем одного наблюдения. Если наудачу извлечь один из номеров 1, 2, ..., N, то вероятность появления каждого номера равна 1/N. Поэтому вероятность того, что наш номер принадлежит некоторому множеству, равна числу элементов этого множества, деленному на N. Так, если, скажем, n — это случайный номер, а N — четное число, то P(n > N/2) = 1/2, для нечетных значений N эта вероятность несколько больше. Таким образом, если n случайно, то вероятность события n > N/2 не меньше 1/2. Если мы наблюдаем значение n, а N не известно, то в качестве верхней границы для N мы можем предложить 2n. В каждом отдельном случае утверждение 2n > N верно или нет, однако, оно справедливо более, чем в половине случаев. Если желать увеличения процента правильных высказываний, то надо изменить доверительный предел.

Так, например,

и утверждение 3n ≥ N справедливо по крайней мере в 2/3 случаях. В нашей задаче, если мы хотим быть уверенными в справедливости нашего высказывания о значении числа N в 2/3 из 100% случаев, то можем сказать, что N лежит в промежутке с концами 60 и 180.

Другим часто используемым методом для оценивания является метод максимального правдоподобия, согласно которому значение N выбирается таким образом, чтобы сделать наблюденную выборку наиболее вероятной. Так, например, если N = 100, то наше наблюденное значение 60 имеет вероятность 1/100, в случае же N = 60 эта вероятность равна 1/60. Мы не можем оценить N значением, меньшим 60, так как для N = 59 или меньшем вероятность появления номера 60 равна нулю. Следовательно, если n — наблюденный номер, то оценкой максимального правдоподобия для N является само n.

В задаче не предполагалось наличие добавочной информации, такой, как «это большая железная дорога, и на ней по крайней мере 100 поездов, но, наверное, меньшее, чем 100 000», которая, конечно, может быть полезна.

42. Решение задачи о коротком куске стержня

(а). Случайность разлома стержня означает равномерную распределенность точки деления. Таким образом, вероятность того, что точка разлома находится в левой или правой половине стержня, одинакова. Если эта точка находится в левой половине, то левый кусок и является меньшим, его средняя длина равна половине от этой половины, что составляет четвертую часть длины стержня. Подобные рассуждения применимы и тогда, когда точка деления — на правой половине, так что ответ таков: одна четверть длины стержня.

(б). Можно считать, что точка перелома лежит в правой половине стержня. Тогда (1 − x)/x является отношением короткого куска к длинному при условии, что сам стержень имеет единичную длину. Так как величина x равномерно распределена на отрезке [1/2, 1], то среднее отношение равно, вместо интуитивно ожидаемого ответа 1/3,

43. Решение задачи о сломанном стержне

Можно считать, что стержень имеет единичную длину. Пусть x и y — точки перелома, причем x лежит слева от y (рис. 17).

Рис. 17. Промежуток с точками перелома x и y.

Согласно принципу симметрии каждый из трех кусков (левый, средний и правый) имеют среднюю длину 1/3, но нам надо найти, скажем, среднюю длину наименьшего куска. Если точки выбираются наугад, то обозначим через X положение первой, а через Y — положение второй точки. Тогда пара (X, Y) равномерно распределена на единичном квадрате (рис. 18), и вероятности событий вычисляются как площади соответствующих подмножеств квадрата. Так, например, вероятность того, что X < 0.2 и Y < 0.3, равна заштрихованной площади на рис. 18, что составляет 0.2·0.3 = 0.06.

Рис. 18. Единичный квадрат с равномерно распределенной величиной (X, Y).

Рис. 19. Незаштрихованная область отвечает случаю Y > X.

Предположим для удобства, что X лежит левее Y, т. е. X < Y. Тогда распределение сосредоточено на заштрихованном треугольнике на рис. 19. Вероятности по-прежнему пропорциональны площадям, но чтобы распределение было вероятностным, вся площадь треугольника должна быть умножена на 2. Мы хотим найти среднюю длину самого короткого куска. Для этого заметим, что минимальная длина равна либо X, либо YX, либо 1 − Y. Если X — наименьшее число из указанных, то

X < YX, или 2X < Y

и

X < 1 − Y, или X + Y < 1.

На рис. 20 изображена область, отвечающая этим неравенствам. Видно, что X изменяется от 0 до 1/3. Из планиметрии известно, что центр тяжести треугольника отстоит от основания на расстоянии, равном 1/3 проведенной к нему высоты. Этим основанием в нашем случае является отрезок оси Y. Так как X-я координата вершины равна 1/3, то среднее величины X, или короткого отрезка, равно 1/3·1/3 = 1/9.

Рис. 20. Треугольник, обведенный жирной линией, соответствует случаю, когда левый кусок наименьший.

Рис. 21. Область, где X отвечает наибольший кусок.

Рассмотрим теперь случай, когда X — наибольший кусок. Тогда

X > YX, или 2X > Y

и

X > 1 − Y, или X + Y > 1.

На рис. 21 изображен соответствующий четырехугольник. Для того чтобы найти координату X его центра тяжести, разобьем его на два треугольника по пунктирной линии. Затем вычислим среднее этих координат для каждого треугольника и сложим их с весами, равными площадям треугольников.

Среднее значение X для правого треугольника равно 1/2 + 1/3·1/2, для левого треугольника 1/2 − 1/3·1/6. Площади треугольников пропорциональны 1/2 и 1/6 так как у них одно и то же основание. Таким образом, среднее для величины X есть

Так как среднее значение длины самого маленького куска равно 1/9 или 2/18, а самого длинного 11/18, то для среднего куска оно оказывается равным 1 − 11/18 − 2/18 = 5/18. Этот факт нетрудно получить и непосредственным подсчетом, рассмотрев область, соответствующую неравенствам 1 − Y > X > YX.

Итак, средние длины короткого, среднего и длинного кусков относятся как 2 : 5 : 11.

Если ломать стержень на две части, то средние дайны короткого и длинного кусков относятся как

1/4 : 3/4 или 1/2 · 1/2 : 1/2 · (1/2 + 1).

Для трех кусков мы получили пропорцию

1/9 : 5/18 : 11/18,

что можно записать в виде

1/3 · 1/3 : 1/3 · (1/3 + 1/2) : 1/3 · (1/3 + 1/2 + 1).

В общем случае разламывания стержня на n кусков средние длины равны:

наименьший кусок

второй по длине кусок

третий по длине кусок

. . . . . . . . . . . . . . . . . . . . .

наибольший кусок

Автор, к сожалению, не располагает простым доказательством этого факта.

44. Решение задачи о выигрыше в небезобидную игру

Не стоит расстраиваться из-за того, что игра несправедлива, ведь в конце концов только вы можете получить приз. Пусть ваш партнер для краткости обозначен через B, вы — через A. Пусть также общее число партий равно N = 2n. Вероятность выигрыша в каждой отдельной игре равна p, а проигрыша q = 1 − p.

Первая мысль, приходящая в голову многим, состоит в том, что поскольку игра не безобидна, то с возрастанием N средняя разность (число очков A минус число очков B) становится все «больше отрицательной». Отсюда делается вывод о том, что A должен играть как можно меньше игр, т. е. две игры.

Если бы правилами допускалось нечетное число игр, то это соображение действительно привело бы к правильному результату, и A должен был бы играть всего одну игру. Для четного же числа игр накладываются два эффекта: (1) смещение в пользу В и (2) изменение среднего члена биномиального распределения (вероятности ничьей) с ростом числа сыгранных партий.

Рассмотрим на минуту справедливую игру (p = 1/2). Тогда чем больше N, тем больше вероятность победы A, так как при возрастании 2n вероятность ничьей стремится к нулю, и вероятность выигрыша A стремится к 1/2. Для N = 2, 4, 6 эти вероятности равны соответственно 1/4, 5/16, 22/64. Из соображений непрерывности следует, что при p незначительно меньшем, чем 1/2, A следует выбирать большое, но конечное число игр. Однако, если p мало, то выбор N = 2 является оптимальным для A. Оказывается, что это так в случае, когда p < 1/3.

Вероятность выигрыша в игре, состоящей из 2n партий, равна сумме вероятностей получения n + 1, n + 2, ..., 2n очков, т. е.

Если играются 2n + 2 туров, то вероятность выигрыша равна

Игра, составленная из 2n + 2 партий, может быть рассмотрена как игра из 2n туров с добавлением еще двух туров. Если только игрок A не набрал n или n + 1 очко в игре из 2n туров, то он остается выигравшим или проигравшим в игре из 2n + 2 партий в зависимости от того, выиграл он или проиграл в игре из 2n партий.

Итак, вычислим (1) вероятность получения n + 1 очка в первых 2n партиях и проигрыша в следующих двух, равную

и (2) вероятность получения n очков в первых 2n партиях и выигрыша в следующих двух, которая равняется

Если N = 2n — оптимальный выбор для A, то PN − 2PN, PNPN + 2. Из предыдущих рассуждений следует, что эти неравенства эквивалентны следующим:

(1)

После незначительных преобразований (при которых исключается тривиальный случай p = 0) неравенства (1) сводятся к следующим:

(n − 1)·qnp, nq ≥ (n + 1)·p. (2)

Отсюда выводим

Итак, если только 1/(1 − 2p) не является нечетным числом, то значение N определяется единственным образом, как ближайшее четное число, меньшее 1/(1 − 2p). Если же 1/(1 − 2p) нечетное число, то для обоих четных чисел 1/(1 − 2p) − 1 и 1/(1 − 2p) + 1 оптимальные вероятности одни и те же, т. е. если

то

P2n = P2n + 2.

Для p = 0.45 в качестве оптимального числа партий получаем 1/(1 − 0.9) = 10.

45. Решение задачи о среднем числе совпадений

Рассмотрим сначала задачу с колодой карт. Если в колоде 52 карты, то каждая карта с вероятностью 1/52 занимает место, уже занятое такой же картой. Так как общее число возможных мест для каждой карты равно 52, то среднее число совпадений равно 52·1/52 = 1. Таким образом, в среднем происходит только одно совпадение. Если бы колода состояла из n различных карт, то среднее число совпадений прежнему равнялось бы 1, так как n·(1/n) = 1. Этот вывод основывается на теореме о том, что среднее суммы есть сумма средних.

Более формально, с каждой парой карт может быть связана случайная величина Xi, которая равна 1 в случае, если карты одинаковы, и 0, если карты различны. Имеем

Наконец, общее число совпадений равно ∑Xi и в силу уже упоминавшейся теоремы

46. Решение задачи о вероятностях совпадений

Эта задача родственна задаче 28, в которой мы впервые встретились с законом Пуассона. Однако в задаче о фальшивомонетчике в силу независимости испытаний появление фальшивой монеты было равновероятно на каждом шагу, в настоящей же задаче совпадения для каждой пары не являются независимыми. Например, если n − 1 пар совпали, то необходимо совпадет и n-я пара, так что эти события действительно зависимы. Тем не менее при больших значениях n степень зависимости невелика, так что, казалось бы, вероятность r совпадений в этой задаче должна быть близка к вероятности обнаружения фальшивых монет, задаваемой распределением Пуассона. В конце мы сравним решение такой задачи с ответом, получаемым из закона Пуассона со средним 1.

При решении таких задач оказывается полезным рассмотрение частных случаев, отвечающих небольшим значениям n. При n = 1 совпадение неизбежно. При n = 2 вероятность отсутствия совпадения равна 1/2, вероятность двух совпадений также равняется 1/2. При n = 3 занумеруем карты цифрами 1, 2 и 3 и запишем в таблицу 6 возможных перестановок для верхней колоды при фиксированном порядке (1, 2 ,3) нижней.

Перестановки и совпадения, n = 3
Нижняя колода 1 2 3 Число совпадений
Перестановки верхней колоды 1 2 3 3
1 3 2 1
2 1 3 1
2 3 1 0
3 1 2 0
3 2 1 1

Отсюда получаем

Распределение числа совпадений, n = 3
Число совпадений 0 1 2 3
Вероятность 2/6 3/6 0/6 1/6

Приведем также соответствующую таблицу для n = 4. Легко заметить, что вероятность того, что произойдет n совпадений, равна 1/n!, поскольку только одной из n! перестановок отвечает n совпадений.

Число совпадений 0 1 2 3 4
n = 1, вероятность 0 1
n = 2, вероятность 1/2 0 1/2
n = 3, вероятность 2/6 3/6 0 1/6
n = 4, вероятность 9/24 8/24 6/24 0 1/24

Отметим, что математическое ожидание каждого распределения равно 1, как указано в предыдущей задаче.

Пусть P(r/n) обозначает вероятность ровно r совпадений при распределении n объектов. Эти r совпадений могут быть получены за счет совпадения r фиксированных объектов и несовпадения остальных. Так, например, вероятность того, что совпадают именно r первых объектов, равна

Число различных выборов r объектов из n равно так что

При r = n, как мы знаем, P(n/n) = 1/n!, и мы можем положить P(0/0) = 1.

Проверим справедливость соотношения (1) при n = 4, г = 2. Согласно (1)

а из нашей таблицы видно, что

P(2/4) = 6/24,

P(0/2) = 1/2

и 6/24 = 1/4, что подтверждает (1) в этом частном случае.

Мы знаем также, что сумма вероятностей по всем возможным числам совпадений при заданном значении n равна 1, т. е.

P(0/n) + P(1/n) + ... + P(n − 1/n) + P(n/n) = 1.

Используя (1), запишем это соотношение как

Так как P(n/n) = 1/n!, то отсюда можно последовательно находить значения P(0/n).

Итак, мы можем найти в принципе значение P(0/n) при любом n, но не располагаем общей формулой для вычисления P(0/n). Как и в некоторых других задачах, здесь помогает вычисление последовательных разностей. Подсчитаем P(0/n) − P(0/n − 1) для различных значений n. Имеем

P(0/1) − P(0/0) = 0 − 1 = −1 = −1/1!,

P(0/2) − P(0/1) = 1/2 − 0 = 1/2 = 1/2!,

P(0/3) − P(0/2) = 2/6 − 1/2 = −1/6 = −1/3!,

P(0/4) − P(0/3) = 9/24 − 2/6 = 1/24 = 1/4!.

Эти выкладки наводят на мысль о том, что искомые разности имеют вид (-l)r/r!, т. е.

Суммируя эти разности, получаем

Записывая P(0/0) в виде 1/0!, получаем

(3)

Осталось проверить теперь справедливость нашей догадки. Нам надо вычислить

(4)

Не следует терять хладнокровия. при виде этого зловещего выражения. Ведь сумма в (4) образована слагаемыми вида

где индекс j отвечает множителю, стоящему перед знаком суммы, а индекс i соответствует отдельным членам этой суммы. Переставим местами слагаемые так, чтобы сумма i + j была постоянной. Так, для i + j = 3 получим

Умножая на 3!, получаем более знакомое выражение

которое с помощью биномиальных коэффициентов может быть записано в виде

Но эта сумма есть разложение (x + y)³ при х = −1, y = 1 и, значит, равна нулю, так как (-1 + 1)³ = 0³ = 0. Этот факт имеет место при каждом значении i + j = r, r = 1, 2, ...., n, так что соответствующие суммы равны нулю. Лишь при r = 0 получаем единственный член (-1)0/(0!·0!) = 1. Следовательно, решение (3) удовлетворяет уравнению (2).

Ясно, что других решений у (2) нет. Это может быть доказано методом индукции, так как P(0/n) выражается через P(0/1), P(0/2), ..., P(0/n − 1).

Из (1) и (3), наконец, выводим

Если nr велико, то выражение в скобках близко к e−1 и

если только nr достаточно велико. Итак, действительно, вероятности r совпадений в нашей задаче близки к пуассоновским со средним 1. Однако для этой близости необходимо, чтобы разность nr была велика, а не только само n, как казалось в начале.

Вероятность того, что нет ни одного совпадения, при больших n стремится к e−1 ≈ 0.368.

47. Решение задачи о выборе наибольшего приданого

Любопытно узнать — на много ли шансы мудреца на успех больше 1/100? Многие предлагают следующую стратегию: пропустить первую половину билетов и затем выбрать первую сумму, превосходящую все предыдущие, если таковая найдется. Это достаточно разумно, но такая стратегия не является оптимальной. Очень немногие представляют себе порядок величины вероятности выигрыша.

Мы начнем с рассмотрения нескольких примеров. Поскольку мы ничего не знаем о суммах, проставленных на билетах, то можем рассматривать лишь номера билетов при их упорядочении согласно величинам сумм, записанных на них. Если, например, у нас имеется три билета с номерами 1, 2, 3, то билету 3 отвечает наибольшее приданое. Для одного или двух билетов задача тривиальна: мудрец делает правильный выбор при одном билете, и его шансы на выигрыш равны 1/2 при двух билетах.

При трех билетах имеем шесть возможных способов вытаскивания:

123 231*

132* 312

213* 321

Одна из стратегий — пропустить первый билет и затем выбрать первый номер, его превосходящий, если такой найдется. Эта стратегия выигрывает в трех случаях, отмеченных звездочкой, т. е. в половине всех возможных случаев, что значительно улучшает просто случайную догадку, например, выбор первого билета.

Допустим теперь, что у нас есть четыре билета. Их возможные перестановки есть

1234 2134 3124*+ 4123

1243+ 2143*+ 3142*+ 4132

1324+ 2314+ 3214*+ 4213

1342+ 2341+ 3241*+ 4231

1423* 2413* 3412* 4312

1432* 2431* 3421* 4321

Кажется разумным пропустить первый билет и остановиться на следующем наибольшем номере, если он есть. Назовем этот план стратегия 1. Звездочки в нашем списке указывают на случай выигрыша этой стратегии. Вероятность правильного решения равна здесь 11/24, что гораздо лучше, чем случайное решение с вероятностью выигрыша 1/4.

Стратегия 2 пропускает первые два номера и затем выбирает первый номер, их превосходящий. 10 перестановок, в которых эта стратегия дает выигрыш, отмечены крестиком. Видно, что стратегия 1 выигрывает чаще.

Если продолжать изучение всех возможных случаев их перечислением, то задача приобретает зловещий вид, так как уже для восьми билетов число перестановок есть 40320. Далее, могут существовать хорошие стратегии, которые мы упустим из виду, хотя это кажется невероятным. Будем надеяться, что математика сможет нам помочь.

Следует подчеркнуть, что мудрец ничего не знает о распределении номеров. Чтобы удостовериться в этом, король может сам вытаскивать билеты и сообщать мудрецу их номера среди уже появившихся. Только билет с наибольшим приданым среди вытянутых заслуживает внимания; назовем такое максимальным.

Покажем теперь, что оптимальная стратегия — пропустить s − 1 билетов и выбрать первый максимальный номер после них. Мы выберем максимальное приданое на i-м шагу, если вероятность того, что оно наибольшее среди всех имеющихся, превосходит вероятность правильного решения при оптимальной стратегии и более позднем вытягивании. Формально: остановимся на максимальном номере при i-м вытягивании, если

Р (выиграть при i-м вытягивании) > Р (выиграть при оптимальной стратегии, начиная с i + 1 вытягивания). (1)

Покажем, что вероятность в правой части (1) убывает, когда i возрастает, а вероятность в левой части (1) возрастает с возрастанием i, и потому существует выбор шага i, после которого предпочтительнее удержать максимальное приданое, нежели продолжать испытания. Вычисляя затем вероятность выигрыша для такой стратегии, найдем оптимальный выбор значения s.

После нескольких первых ходов в этой игре мы можем еще прибегнуть ко всем стратегиям, определяемым последующими вытаскиваниями, так как мы всегда можем пропустить часть билетов, пока не достигнем нужного нам числа билетов. Следовательно, вероятность в правой части неравенства (1) не возрастает с ростом i. При i = 0 это искомая оптимальная вероятность, а при i = n − 1 эта вероятность равна 1/n как вероятность выигрыша при выборе на последнем шагу.

Вероятность того, что на i-м шагу максимальное приданое больше всех имеющихся, равна вероятности того, что наилучший номер находится на одном из первых i билетов, а именно, равна i/n, что является строго возрастающей от 1/n до 1 функцией от i. Поэтому значение i/n в какой-то точке превосходит вероятность выигрыша при продолжении испытаний. Таким образом, оптимальная стратегия может быть задана следующим правилом: пропустить s − 1 первых номеров и выбрать затем первого лидера, т. е. первый номер, который больше всех предыдущих. Сосчитаем вероятность выигрыша для такой стратегии. Вероятность правильного решения есть вероятность появления ровно одного лидера между s-м шагом и n-м. Вероятность того, что наилучший билет появился на k-м шагу, равна 1/n. Вероятность того, что максимум первых k − 1 номеров появился среди первых s − 1 номеров, есть (s − 1)/(k − 1). Произведение (s − 1)/[n·(k − 1)] дает вероятность того, что мы выиграем при выборе k, skn. Суммируя эти числа, получим вероятность π(s, n) получения наилучшего приданого при оптимальной стратегии

(2)

Так как первое вытаскивание всегда дает максимальный номер, то π(1, n) = 1/n. Заметим, что при n = 4, s = 2 имеем π(1, n) = 11/24, как и в нашем примере.

Оптимальное значение s, скажем, s*, есть минимальное s, для которого имеет место неравенство (1), т. е. это наименьшее s, для которого

(3)

или, что равносильно, такое s, для которого

(4)

Оптимальное значение s и вероятности выигрыша для задачи о приданных
n s π(s, n) n s π(s, n)
1 1 1.000 10 4 0.399
2 1 0.500 20 8 0.384
3 2 0.500 50 19 0.374
4 2 0.458 100 38 0.371
5 3 0.433 n/e 1/e ≈ 0.368

Эта таблица дает оптимальные значения s и соответствующие им вероятности правильного решения для небольших значений n. Для n = 100 следует пропустить 37 приданных и выбрать после этого первое максимальное.

Большие значения n

Для больших значений n мы можем аппроксимировать сумму выражением ln(n) + C, где С — постоянная Эйлера. Используя это приближение в формуле (2) для больших s и n, получаем

(5)

Аналогично приближения для правой и левой частей неравенства (4) показывают, что ln(n/s) ≈ 1, и, значит, sn/e. Подставляя эти результаты в (5), находим

Подводя итог, видим, что для больших значений n оптимальная стратегия пропускает приблизительно 1/e часть билетов и останавливается после этого на первом максимальном приданом, причем вероятность правильного решения равна приближенно 1/e.

Представляется замечательным, что в этой игре, которая на первый взгляд дает вероятность 1/n выигрыша, существует простая стратегия с вероятностью правильного решения больше чем 1/3 даже для больших значений n.

48. Решение задачи о выборе наибольшего случайного числа

Довольно понятно, что надо выбрать первое же число, если оно достаточно велико, например, равно 0.999, потому что вероятность получить не меньшее же число позднее, равна только

1 − (0.999)99 ≈ 0.1.

Как и в предыдущей задаче, мы должны выбирать между очередным максимальным появившимся номером и шансом на то, что одно из последующих чисел будет больше этого номера, причем мы его выберем. Рассмотрим процедуру решения с конца. Если мы не сделали выбор до последнего шага, то останавливаемся на последнем числе и выигрываем или проигрываем. Если выбор не произведен до предпоследнего вытягивания, и появилось максимальное число (самое большое до сих пор), мы выбираем его, если оно больше 1/2, отказываемся от него, если оно меньше 1/2, и поступаем произвольным образом в случае 1/2. Если это число меньше 1/2, то шанс на выигрыш больше при продолжении испытаний.

Если третье с конца число x максимально, то вероятности появления 0, 1 или 2 больших чисел после этого равны x², 2x∙(1 − x) и (1 − x)² соответственно. Если мы пропустим x и выберем следующее большее, чем x, число, то вероятность выигрыша окажется равной

2x∙(1 − x) + 1/2∙(1 − x)²,

так как если дальше будет 0 больших чисел, мы не выиграем, если 1, то выиграем наверняка, и если два числа, больших x, то мы выберем наибольшее с вероятностью 1/2. Если мы пропускаем какое-то число при определенном вытаскивании, то при последующих вытягиваниях это положение может измениться, так как нам, возможно, придется остановиться на этом числе, ввиду уменьшения шансов на появление большего. Следовательно, если имеются два числа, больших «порогового» уровня x в нашей последовательности, то мы заведомо выберем первое. Оно лишь с вероятностью 1/2 наибольшее из этих двух чисел. Таким образом, если на некотором шагу мы отказались от «порогового» числа, то можно быть уверенным в том, что оптимальная стратегия выбирает первое число, значение которого превосходит данный «пороговый» уровень.

Определим это «пороговое» значение x для третьего с конца шага. Это число удовлетворяет уравнению

x² = 2x∙(1 − x) + 1/2∙(1 − x)².

Здесь x² есть вероятность того, что мы выиграем, остановившись на числе x, а правая часть есть вероятность выиграть, если мы отказались от x. «Пороговый» уровень, как нетрудно проверить, равен

Таким образом, мы выбираем максимальное число третье с конца, если его значение превосходит 0.6899.

Вообще, если остается r билетов и появилось максимальное число, то мы выберем его, если оно превосходит «пороговое» значение x, вычисляемое из уравнения

(1)

Для нахождения x при небольших значениях r это уравнение можно решать численно, используя, например, таблицы вероятностей биномиального закона. В нижеследующей таблице «пороговых» уровней приведены некоторые из них.

Чтобы найти приближенное решение, заметим, что 1 − x уменьшается по мере возрастания r, и главный вклад в правую часть уравнения (1) дается первым членом. Таким образом,

xrr∙xr − 1∙(1 − x), или xr/(r + 1).

С другой стороны, деля обе части уравнения (1) на xr и полагая z = (1 − x)/x, получаем

(2)

откуда определяется z.

Наконец, так как приближенно z = 1/r, положим

где α(r) — функция, близкая к постоянной. Так,

α(1) = 1

α(2) = 0.8990,

α(3) = 0.8668,

α(4) = 0.8509,

α(5) = 0.8415.

Полагая в (2) z = α(r)/r и устремляя r к бесконечности, получаем

(3)

Здесь α — предельное значение α(r), α = 0.8043.Хотя существуют и лучшие приближения для α(r), заменим α(r) на α. Тогда

Эта формула для x дает результаты, приведенные в последнем столбце таблицы.

Таблица «пороговых» уровней и их приближений
Число оставшихся испытаний Решение уравнения (1) r/(r + a) Число оставшихся испытаний Решение уравнения (1) r/(r + a)
1 0.5000 0.5542 9 0.9160 0.9180
2 0.6899 0.7132 10 0.9240 0.9256
3 0.7758 0.7886 11 0.9305 0.9319
4 0.8246 0.8326 12 0.9361 0.9372
5 0.9856 0.8614 13 0.9408 0.9417
6 0.8778 0.8818 14 0.9448 0.9457
7 0.8939 0.8969 15 0.9484 0.9491
8 0.9063 0.9086

Поскольку в данной игре больше информации, чем в игре из предыдущей задачи, то шансы на выигрыш также больше. Если число билетов равно 2, то игроку следует выбрать первое число, если оно больше 1/2, а в противном случае избрать второе. Вероятность правильного решения в этом случае равна 3/4. Увеличение числа билетов от 1 до 2 значительно уменьшило вероятность выигрыша. Некоторые геометрические соображения, которые мы не будем здесь приводить, показывают, что для n = 3 вероятность правильного выбора равна приблизительно 0.684. Для больших n эта вероятность равняется приближенно 0.580.

49. Решение задачи об удвоении точности

Да. Пусть A — длина длинного стержня, а B — длина короткого. Можно положить эти стержни рядом и измерить разность длин AB, а затем приложить их один к другому и измерить сумму длин A + B. Пусть D и S обозначают наблюденные длины AB и A + B соответственно. Тогда оценка для A есть 1/2(S + D) и оценка для B есть 1/2(SD). Далее, D = AB + d, S = A + B + s, где d и s — случайные ошибки. Следовательно,

В среднем ошибка 1/2(d + s) будет нулевой, поскольку d и s имеют средние нуль. Дисперсия оценки A есть дисперсия

Это значение совпадает со значением для дисперсии среднего двух независимых наблюдении. Таким образом, оба наблюдения внесли полный вклад в измерение A. Точно так же дисперсия оценки B равняется σ²/4. Следовательно, делая два измерения — одно для разности, другое для суммы — мы получаем оценки, точность которых равна точности при четырех рениях, по два на каждый стержень в отдельности.

Для получения столь хороших результатов мы должны как можно точнее соединить концы стержней. Если этого сделать нельзя, то можно считать, что в результаты измерений входит ошибка, связанная с неидеальным совпадением концов стержня. Если эта случайная ошибка имеет штандарт σ√2, то одному измерению суммы или разности отвечает штандарт σ√3/√2, и дисперсия нашей оценки A будет равна

При этих предположениях наша точность будет точно такой же, как и точность при 4/3 независимых измерениях вместо 2, но все же больше точности одного прямого измерения.

Мы можем обосновать предположение о том, что ошибка от неточного совпадения концов имеет штандарт σ/√2, следующим образом. Представим себе s (или d) как сумму двух независимых ошибок измерения, каждую с дисперсией σ²/2. Тогда сумма слагаемых ошибок имеет дисперсию, которую мы считали

равной σ². Если мы припишем дисперсию σ²/2 и третьему слагаемому, то такая модель будет согласовываться с исходной.

50. Решение задачи о квадратных уравнениях со случайными коэффициентами

Для того чтобы вопрос задачи имел смысл, предположим, что точка (b, c) равномерно распределена на квадрате с центром в начале координат и стороной 2B (рис. 22). Решим задачу при фиксированном B, а затем устремим B к бесконечности, так что b и c могут принимать любые значения.

Рис. 22. Серая область отвечает случаю вещественных корней.

Для того чтобы уравнение имело вещественные корни, необходимо и достаточно, чтобы

b² − c ≥ 0.

На приведенном рисунке изображена парабола b² = c и показана область, где наше уравнение имеет вещественные корни для B = 4.

Нетрудно подсчитать, что площадь незаштрихованной области равна 4/3∙B3/2 (при B ≥ 1), а площадь всего квадрата, конечно, равна 4B². Следовательно, вероятность того, что корни комплексные, равна 1/3∙√B. При B = 4 ответ равен 1/6. С ростом B 1/√B стремится к нулю, так что вероятность того, что корни вещественные, стремится к 1.

Следует заметить, что эта задача отличается от такой же задачи, связанной с уравнением ax² + 2bx + c = 0. Конечно, можно разделить на a, но если a, b и c были независимы и равномерно распределены в некотором кубе, то b/a и c/a уже зависимы и распределены неравномерно.

51. Решение вадачи о двумерном случайном блуждании

В одномерном случайном блуждании (см. задачу 35 «На краю утеса», последняя часть решения) мы нашли, что вероятность возвращения частицы в начало есть l, если вероятности шагов налево и направо одинаковы. Но положение дел все же весьма деликатно сбалансировано. Если бы одна из вероятностей отличалась от 1/2, то частица удалилась бы в бесконечность. В случае двух измерений можно предположить, что у частицы больше возможностей для ухода в бесконечность. Выясним, так ли это. Мы постараемся найти среднее число возвращений частицы в начало и отсюда определить значение вероятности возвращения частицы. Прежде всего, сколько раз частица вернется в начало? Если P есть вероятность возвращения, то 1 − P = Q есть вероятность того, что возвращения не будет. Тогда вероятность ровно x возвращений есть PxQ, так как после каждого возвращения частицу можно рассматривать как снова выходящую из начала. Если бы P было известно, то среднее число возвращений в начало координат можно было бы найти, суммируя геометрический ряд вида

Из задачи 4 об испытаниях до первого успеха видно, что среднее число возвращений есть величина, обратная к вероятности успеха. В упомянутой задаче успех заканчивал серию испытаний, в нашей же задаче серию заканчивает невозвращение в начало, так что среднее число испытаний до первого успеха равно 1/Q. Следовательно, среднее число успехов равно 1/Q − 1. Если Q = l, то среднее число успехов равняется 0, и с вероятностью 1 частица будет потеряна и никогда не вернется. С другой стороны, чем меньше Q, тем больше среднее число возвращений. Действительно, каждому значению Q отвечает среднее число возвращений и для каждого среднего числа найдется соответствующее Q. Если среднее число возвращений перед окончательным уходом бесконечно (неограниченно), то Q должно быть равным нулю, а P равным 1. Более формально, P → 1 при µ → ∞. Теперь видно, что для решения задачи о двумерном блуждании мы должны подсчитать значение µ.

Выходя из начала, частица может попасть в него обратно лишь после четного числа шагов. Более того, ее путь может быть представлен как «произведение» двух независимых одномерных случайных блужданий, каждое из которых начинается в начале координат, и одно происходит в вертикальном направлении, а другое — в горизонтальном направлении. После двух шагов горизонтальная компонента x имеет распределение

x -2 0 2
P(x) 1/4 2/4 1/4

Вертикальная компонента после двух шагов распределена точно так же, и вероятности их совместного распределения в девяти точках выглядят следующим образом:

Распределение X
x -2 0 2
P(x) 1/4 2/4 1/4
Распределение Y
y P(y) P(x, y)
2 1/4 1/16 2/16 1/16
0 2/4 2/16 4/16 2/16
-2 1/4 1/16 2/16 1/16
Совместное распределение X и Y после двух шагов

Основной факт, на который мы хотим обратить внимание, состоит в том, что вероятность возвращения в начало есть 4/16, и это число ввиду независимости компонент блуждания есть произведение P(X = 0) на P(Y = 0). Это допускает следующую интерпретацию. После двух шагов 25 % частиц в среднем вернется в начало. Вклад в среднее число возвращений в начало координат будет тогда равен 4/16·1 + 12/16·0 = 4/16. Вычислим вероятность того, что частица попадет в начало после 2, 4, 6, ... шагов, и, сложив все эти значения, найдем математическое ожидание числа возвращений частицы в начало.

После 2n шагов, n = 1, 2, ..., вероятность того, что частица вернулась в начало координат, равняется

так как для осуществления этого события мы должны иметь равные количества шагов как по вертикали, так и по горизонтали. Строго говоря, надо было бы поставить индексы у X и Y и писать X2n и т.д., но это выглядит неприятно и отпугивающе. Просуммируем теперь приближенные выражения для этих вероятностей и найдем математическое ожидание числа возвращений. Для больших значений n можно применить формулу Стирлинга, приведенную в задаче 18, и получить

Тогда для больших n имеем

Эти вероятности надо просуммировать по n. Из задачи 14 известно, что и последнее выражение неограниченно растет с возрастанием N. Найдем вероятность того, что частица вернется в начало после числа шагов, равного 2, 4, 6, 8, , .., 2n. Каждая из этих вероятностей есть также среднее значение числа случаев, когда частица попадает в начало после ровно 2n шагов. Чтобы получить общее математическое ожидание числа возвращений частицы в начало, просуммируем эти значения, пользуясь тем фактом, что сумма средних есть среднее суммы. Видим, что среднее число возвращений в начало бесконечно, и вероятность возвращения в начало P = 1. Таким образом, частица не только вернется, но будет возвращаться бесконечное число раз. Более точно, надо сказать, что почти каждая частица возвращается бесконечно часто, так как существуют пути такие, например как постоянное направление на северо-восток, которые позволяют некоторым частицам уходить в бесконечность. Но доля таких частиц равна нулю.

52. Решение вадачи о трехмерном случайном блуждании

Поскольку мы знаем, что в случае одного и двух измерений частица возвращается в начало с вероятностью 1, то не будет ли естественно предположить, что она вернется туда заведомо при любом числе измерений? Казалось бы да, но этот ответ не верен.

В нашем случае положение частицы задается тремя координатами, и вероятность того, что все три координаты равны 0 после 2n шагов, есть

P(частица в начале) = P(X=0)·P(Y=0)·P(Z=0) = .

Применим снова формулу Стирлинга. Мы видим, что на 2n-м шаге

P(частица в начале) = 1/(πn)3/2.

Покажем, что сумма ∑1/n3/2 ограничена. Заменим для этого 1/n3/2 площадью прямоугольника с основанием между точками n и n+1 и высотой 1/n3/2 (рис. 23).

Рис. 23. Доказательство сходимости ряда ∑1/n3/2

Проведем кривую f(n) = 1/(n − 1)3/2 через вершины правых углов прямоугольников.

Площадь под кривой превосходит площадь соответствующих прямоугольников и

При N → ∞ это выражение стремится к 2(n − 1)1/2 — конечному пределу. Это показывает, что и предел суммы средних конечен.

Мы можем оценить это число, сложив несколько первых членов ряда и приблизив «остаток» суммы соответствующим интегралом, что дает приблизительно 0.315. После 10 или, скажем, 20 членов формула Стирлинга очень точна, и остаток, оцениваемый интегралом, весьма мал. Автор при расчете использовал 18 слагаемых. Число 0.315 есть среднее число возвращений частицы в начало координат. Следовательно, 1/Q = 1 + 0.315, и мы получаем Q = 1/1.315 ≈ 0.761.

Поэтому вероятность P того, что частица вернется в начало координат, приблизительно равна 0.239.

Для читателей, знакомых с результатами о случайных блужданиях, где частица сдвигается в центры граней окружающего куба, а не в его вершины, известно, что доля возвращающихся частиц равна приближенно 0.35[11], так что для восьми равновероятных шагов шансы на возвращение значительно меньше, чем для шести.

Та же техника в случае 4-мерного блуждания, когда для определения вектора, на который сдвигается частица, бросают четыре монеты, показывает, что вероятность возвращения снижается до 0.105.

53. Решение задачи об игле Бюффона

Это, пожалуй, наиболее известная задача, связанная с геометрическими вероятностями. На рис. 24 показаны положения иглы, при которых она касается одной из прямых. Из соображений симметрии понятно, что достаточно рассмотреть лишь промежуток между какими-нибудь двумя прямыми.

Рис. 24. Иглы, обозначенные пунктиром, пересекают одну из прямых, а проведенные сплошной линией — касаются одной из прямых.

Положение иглы вдоль вертикали не играет здесь никакой роли, так как ее сдвиг вверх или вниз не влияет на пересечение соответствующей прямой. Ясно также, что положение иглы определяется углом между направлением иглы и прямой и расстоянием от центра иглы до ближайшей прямой. Центр P в предположении его равномерного распределения может занять любое положение между прямыми с одинаковой вероятностью, и при фиксированном значении угла θ вероятность того, что игла пересечет одну из прямых, равна 2x/2a, так как для пересечения необходимо, чтобы центр иглы упал на расстоянии, меньшем, чем x, от какой-нибудь из прямых (см. рисунок). Мы можем считать, что угол θ равномерно распределен на отрезке от 0 до π/2 (или от 0° до 90°). Действительно, если игла пересекает прямую при угле θ, то это положение вещей сохранится и при угле π − θ (или 180° − θ). Итак, нам надо найти среднее значение величины x/a или, так как x = l∙cos θ, среднее величины (l/a)∙cos θ. Это математическое ожидание вычисляется интегрированием

Число π/2 в знаменателе левой части предыдущего равенства является нормирующим множителем для распределения угла θ, 0 < θ < π/2. Так как длина иглы равна 2l, то

P(игла пересечет прямую) = 2×(длина иглы)/(длина окружности радиуса α).

Чем объяснить известную популярность этой задачи? Автор считает, что это связано с возможностью экспериментального определения числа π. Плоскость с параллельными прямыми может быть реализована как разграфленная бумага. Если расстояние между прямыми равно длине иглы, то число π может быть оценено как 2/(относительная частота пересечений). Большой точности при этом способе определения π достичь трудно, оценка всегда является рациональным числом, но все же сама возможность определения такой мировой постоянной, как π, опытным путем представляется весьма интересной. Более удобный метод вычисления числа π будет предложен в задаче 55.

Любопытные задачи на подсчет геометрических вероятностей имеются в книге Кендалл М., Моран П., Геометрическая вероятность, «Наука», 1972 г.

54. Решение задачи об игле Бюффона с вертикальными и горизонтальными прямыми

Среднее число пересечений вертикальных прямых равно вероятности пересечения одной такой прямой.

Из предыдущей задачи (a = 1/2) известно, что эта вероятность равна 4l/π. Среднее число пересечений вертикальных прямых также равно 4l/π, что можно заметить, поворачивая нашу решетку на 90°. Среднее суммы равно сумме средних, и ответ равен 8l/π.

Если игла единичной длины, то среднее число пересечений равно 4/π ≈ 1.27.

До этого предполагалось, что игла короче, чем расстояние между прямыми. В следующей задаче это условие не выполнено.

55. Решение задачи о длинной игле

Разделим мысленно иглу на n кусков одинаковой и меньшей единицы длины. При бросании каждого из этих кусков среднее число его пересечений было найдено в предыдущей задаче. Таким образом, согласно уже упоминавшейся теореме о среднем суммы, среднее число пересечений равно 4∙(исходная длина)/π. Тот факт, что игла подбрасывается вся целиком, а не кусочками, не имеет здесь значения.

Для определения числа π эксперимент, отвечающий настоящей задаче, более удобен чем первоначальный, предложенный Бюффоном. (Почему бы не взять лист клетчатой бумаги и не провести его?) Автор провел такой опыт с зубной щеткой и графленой бумагой. Длина щетки была равной 5.2 дюйма, а клетки 1 дюйм. При десяти бросаниях автор получил 8, 6, 7, 6, 5, 6, 7, 5, 5, 7 пересечений, что в сумме дает 62.

Итак, оценкой числа π в этом случае является 4∙5.2/(62/10) ≈ 3.35 вместо 3.14. При другом опыте, состоящем также из 10 подбрасываний, было получено 67 пересечений, что дает оценку 3.10.

56. Обсуждение задачи о двух урнах

Е. Молина предложил эту задачу, чтобы дать формулировку знаменитой проблемы Ферма на вероятностном языке.

Пусть z обозначает число белых шаров в первой урне, x — число белых шаров и y — число черных шаров во второй урне. Тогда задача состоит в том, чтобы найти целые числа n, x, y и z такие, что

или

zn = xn + yn.

Хотя для многих значений n известно, что это уравнение не имеет корней, но не установлено, так ли это при всех n ≥ 3. Доказано, однако, что целочисленных решений нет при n < 2000.

57. Обсуждение задачи о простых делителях

Из таблиц или из непосредственного расчета нетрудно выписать распределения числа простых делителей для небольших значений N.

В таблице 1 приведены результаты для N = 100 и N = 1000 вместе со средними и дисперсиями s².

Таблица 1. Распределение числа простых делителей с учетом их кратностей для N = 100 и N = 1000 вместе со средними x̅ и дисперсиями s² (x = число простых делителей)
N = 100 N = 1000
x f fx fx² x f
1 26 26 26 1 169
2 34 68 136 2 299
3 22 66 198 3 247
4 12 48 192 4 149
5 4 20 100 5 76
6 2 12 72 6 37
100 240 724 7 14
= 2.40, s² = ∑f∙(x)2/N = ∑fx²/N² = 1.48. 8 7
9 2
1000
= 2.88, s² = 2.22

Из этой таблицы, например, видно, что среди первых 100 натуральных чисел ровно 26 простых, у 34 чисел два простых делителя и только у двух шесть простых делителей.

Распределение числа делителей при N = 100 напоминает выборку из закона Пуассона. Для пуассоновских распределений среднее равно дисперсии. Из таблицы видно, что для N = 100 среднее несколько больше дисперсии. Если рассмотреть величину x − 1 вместо x, то новое среднее будет равно 1.40, а дисперсия, равная 1.48, не изменится. Полезно сравнить полученные результаты с табличными вероятностями для закона Пуассона. (Сумма элементов последней строки первой половины табл. 2 не равна 100 из-за округления значений.)

Таблица 2. Частоты простых делителей x и соответствующие величины для распределения Пуассона со средним m
N = 100
x − 1 0 1 2 3 4 ≤ 5
Наблюденные частоты 26 34 22 12 4 2
Пуассоновские частоты для m = 1.4 24.7 34.5 24.2 11.3 3.9
N = 1000
x − 1 0 1 2 3 4 5 6 7 ≤ 8
Наблюденные частоты 169 299 247 149 76 37 14 7 2
Пуассоновские частоты для m = 1.9 150 284 270 171 81 31 10 3 1
Пуассоновские частоты для m = 1.8 165 298 268 161 72 26 8 2 1

Видно, что при N = 100 совпадение лучше, нежели при N = 1000. Для N = 1000 более точная аппроксимация при небольших значениях x − 1 может быть получена за счет выбора меньшего математического ожидания пуассоновского распределения.

Таблица 2 подтверждает предположение о пуассоновости распределения числа простых делителей, однако картина слишком сложна, чтобы можно было угадать вид параметра этого закона для больших N.

Мы знаем, что вероятность отсутствия простых делителей, т. е. того, что само число просто, равна приближенно 1/ln(N). Для закона Пуассона вероятность появления 0 равна e−m, где m — математическое ожидание этого распределения (см. задачу 29). Отсюда выводим:

и

m = −ln(ln(N)),

или

m = ln(ln(N)).

Любопытно сравнить эту формулу с полученными ранее результатами.

Имеем

ln(ln(100)) = 1.53,

что надо сравнить со средним 1.4 при N = 100. Для N = 1000 среднее равнялось 1.88, а

ln(ln(1000)) = 1.93.

Из этого сравнения кажется весьма правдоподобным, что распределение числа простых делителей, уменьшенного на 1, приближенно подчиняется закону Пуассона со средним m = ln(ln(N)).

Для доказательства этого факта требуются тонкие и глубокие современные математические методы.

В табл. 3 сопоставлены значения ln(ln(N)) и числа простых делителей для некоторых N, вычисленные на ЭЦВМ.

Таблица 3. Среднее и дисперсии числа простых делителей (минус 1) и ln(ln(N))
N 100 1 000 10 000 100 000 1 000 000
x − 1 1.40 1.88 2.20 2.44 2.63
ln(ln(N)) 1.53 1.93 2.22 2.44 2.63
s² 1.48 2.22 2.70 3.00 3.23

Приведенная таблица, возможно, несколько вводит в заблуждение. Не исключено, что с ростом N наблюденные значения будут отклоняться от ln(ln(N)), так при N = 106 среднее равно 2.627, а согласно формуле 2.626. С ростом N разность между x и s² возрастает, но все с меньшей скоростью.

Загрузка...