Например, в резюме Шестого оценочного доклада МГЭИК за 2021 год для политиков , посвященном физическим научным основам изменения климата 10 , содержатся утверждения:

только с прямой неопределенностью; например, "вероятный диапазон общего антропогенного повышения глобальной температуры поверхности с 1850-1900 до 2010-2019 гг. составляет от 0,8°C до 1,3°C, а наилучшая оценка - 1,07°C". МГЭИК утверждает, что в вероятностных заявлениях нет необходимости упоминать высокую или очень высокую степень уверенности, поэтому предполагается, что высокий уровень уверенности подразумевается.

с прямой и косвенной неопределенностью, например, "Среднемировые осадки на суше, скорее всего, увеличились с 1950 года, причем темпы их увеличения ускорились с 1980-х годов (средняя степень достоверности)".

с косвенной неопределенностью, например, "В 2011-2020 годах среднегодовая площадь арктического морского льда достигла самого низкого уровня, по крайней мере, с 1850 года (высокая степень достоверности)" и "Существует низкая степень достоверности в прогнозируемом сокращении антарктического морского льда".

Во втором примере мера уверенности используется в качестве дополнения к оценке вероятности, а в третьем пункте уверенность используется в качестве замены прямого термина "вероятность", когда авторы, предположительно, не сочли возможным оценить вероятность. Это вызвало обеспокоенность по поводу того, используются ли эти термины четко и последовательно во всех публикациях МГЭИК. 11

В медицинском мире также возникла необходимость в использовании шкалы GRADE - доказательств очень низкого, низкого, умеренного и высокого качества. Например, в обзоре 2010 года оценивается, что лучевая терапия после операции по поводу рака шейки матки снижает риск прогрессирования заболевания на 42 % (95 % доверительный интервал от 9 до 63 %), в основном на основании одного хорошо проведенного рандомизированного исследования с участием всего около 280 человек - по шкале GRADE качество этих доказательств было умеренным. Существует формальный процесс определения соответствующего уровня GRADE, учитывающий риск предвзятости, неточности, противоречивости, косвенности и предвзятости при публикации, хотя присвоение уровня все же требует значительных суждений. Система GRADE используется более чем сотней организаций по всему миру. 12, 13

Раньше шкала оценки определялась тем, насколько вероятно, что дальнейшие исследования изменят результат, но в 2011 году руководство изменило 14 , и теперь GRADE называется шкалой уверенности в доказательности, а уровни определяются следующим образом

Очень низкий: Истинный эффект, вероятно, заметно отличается от расчетного.

Низкий: истинный эффект может заметно отличаться от расчетного.

Умеренный: Авторы считают, что истинный эффект, вероятно, близок к расчетному.

Высокий: авторы уверены, что истинный эффект схож с расчетным.

Таким образом, хотя GRADE построена как шкала качества доказательств, теперь она интерпретируется как прямая неопределенность - замещающая модельную неопределенность вокруг оцененного эффекта, а не дополняющая ее . Это похоже на эффект добавления субъективной неопределенности типа B, но без количественной оценки эффекта.

Еще одна спорная область науки возникла во время пандемии Ковид-19, где активно обсуждались и продолжают обсуждаться потенциальная польза и вред изоляции, масок, вакцин и так далее. Научно-консультативная группа Великобритании по чрезвычайным ситуациям (SAGE) часто собиралась на протяжении всей пандемии (я присутствовал на одном из их заседаний), и их суждения об эффективности различных мер по снижению распространения вируса обычно сопровождались кратким описанием степени уверенности по шкале: низкая, низкая-умеренная, умеренная, умеренная-высокая, высокая - та же шкала, которую мы приняли для анализа инфицированной крови. Например, в сентябре 2020 года они пришли к выводу, что ограничения на проведение собраний на открытом воздухе, включая запрет на проведение крупных мероприятий, окажут низкое влияние на передачу вируса Ковид с высокой степенью достоверности, в то время как закрытие всех школ будет связано с уменьшением R на 0,2-0,5, но с низкой степенью достоверности. 15

К сожалению, даже когда ученые признают, что сомневаются в своих знаниях, это часто не получает широкого распространения или понимания. Политики, принимающие решения, склонны действовать как , если доказательства, лежащие в основе их решений, неопровержимы. Чтобы противостоять этому, некоторые организации делают неопределенность заметной чертой своей деятельности. Например, Британский фонд поддержки образования предоставляет рекомендации по политике улучшения образования, а в их наборе инструментов для преподавания и обучения 16 их суждения отображаются, как в гостиничном рейтинге: от одного до пяти маленьких "висячих замков" , обозначающих уверенность в выводах. А Статистическое управление Великобритании использует ярлык "Официальная статистика в разработке" для тех, которые еще нельзя считать "официальной статистикой", и которые могут быть подвержены "широкой степени неопределенности в новых оценках или увеличению неопределенности в существующих статистических данных". 17

Уроки, извлеченные из всех этих примеров, обобщены на рисунке 9.1 , где показаны прямые и косвенные пути выражения неопределенности в отношении утверждения о факте, оценке, тенденции или причинно-следственной связи.

Основания для утверждения могут вызывать множество опасений - данные могут быть низкого качества и иметь потенциальную погрешность, эксперты могут не соглашаться друг с другом, и, что особенно важно, могут существовать важные информационные пробелы. Часто, к сожалению, отсутствует ясность в том, как следует использовать эти шкалы . Хотя объектом "уверенности" обычно называют весь аналитический процесс, мы видели, что эти термины часто применяются к самому утверждению, по-видимому, как нечисловая степень уверенности, используемая в качестве замены вероятности, а не как заявление об оцененной вероятности.

Шкалы, которые мы рассмотрели в этой главе, популярны потому, что аналитики часто, что очень разумно, не хотят полностью посвящать себя численным выводам, основанным только на моделях. Все наши примеры касались недостатка научных знаний - чистой эпистемической неопределенности, - когда мы, как правило, можем указать, чего мы не знаем. Выражаясь вечной фразой Дональда Рамсфельда, упомянутой во Введении, мы имеем дело с "известными неизвестными".

Рисунок 9.1


Прямые и косвенные пути к неопределенности в отношении утверждения о факте, оценки, тенденции или причинно-следственной связи. Прямая неопределенность возникает в результате статистического моделирования или экспертной оценки. Косвенная неопределенность возникает из-за опасений по поводу качества и силы доказательств, а также всего аналитического процесса, и резюме может быть применено как к количественному выражению неопределенности, так и к самому утверждению (пунктирные стрелки).

OceanofPDF.com

Однако иногда мы не можем концептуально представить себе все возможности. Как мы увидим в главе 13, с такой "глубокой неопределенностью" можно столкнуться при попытке сделать долгосрочные прогнозы, но она может возникнуть и при недостатке знаний - эпистемическая неопределенность в отношении того, какой тип инопланетных форм жизни может существовать, не имеет четко определенного списка вариантов.

Иногда мы можем просто признать, что не знаем.

Резюме

Даже приложив все усилия для количественного моделирования и оценки, многие исследователи и организации чувствуют необходимость в дополнительных шкалах "уверенности".

Эти шкалы возникают в результате "косвенного" пути к неопределенности в отношении утверждения, которая может отражать качество имеющихся доказательств, степень согласия экспертов и признанные пробелы в информации.

Качественные шкалы "уверенности" используются как в качестве дополнения к численной оценке неопределенности, так и в качестве замены, когда люди не желают количественно оценивать свою неопределенность.

Несмотря на широкое распространение таких шкал, часто не хватает ясности относительно их точного значения.

Даже эти шкалы окажутся неадекватными в ситуациях, когда мы не можем даже перечислить возможные варианты.

ГЛАВА 10. Что или кто виноват?

Причинность, климат и преступность

Вы заходите в комнату, щелкаете единственным выключателем, и свет загорается. Это простейший тип причинности - базовый физический механизм определяет, что свет включается тогда и только тогда, когда вы щелкаете выключателем. Конечно, все может быстро усложниться - выключателей может быть несколько, схема может быть неисправна, лампочка может перегореть, - но должно быть возможно оценить происходящее с помощью наблюдения и логики.

В этой главе мы рассмотрим две более сложные ситуации. Первая касается общей причинно-следственной связи - имеет ли некоторое действие или воздействие A тенденцию вызывать результат B в повторяющихся ситуациях, в смысле повышения оценочной вероятности наступления B. Типичные примеры: повышают ли определенные продукты питания риск развития рака, или вакцины являются основной причиной вреда. По сути, это изучение неопределенности в отношении "следствий причин", по сути, ответы на вопросы "что-если?".

Затем мы рассматриваем конкретную причинно-следственную связь, которая рассматривает отдельное событие и спрашивает, привело ли предыдущее действие или воздействие к этому событию, или в какой степени. Теперь мы рассматриваем "причины следствий", также известные как атрибуция, по сути, отвечая на вопросы "почему?". Мы, люди, быстро объясняем, почему что-то произошло, будь то дорожная авария, сердечный приступ, разрыв отношений или неожиданный результат референдума. Каждый может громко провозгласить свою теорию, несмотря на "скрытую половину" Майкла Бластленда, означающую, что обычно не существует простого объяснения событий. Существует популярное заблуждение, известное на латыни как post hoc ergo propter hoc: после наблюдения за тем, что B последовало за A, сделать вывод, что A на самом деле стало причиной того, что B произошло. Классический пример - когда футбольная команда терпит ряд поражений, увольняет менеджера, выигрывает следующий матч, а потом люди утверждают, что увольнение изменило судьбу команды. Но мы уже видели, что в футболе очень много удачи , и, возможно, этот период невезения подошел к концу. fn1

В соответствии с остальной частью книги, мы будем избегать подобных личных интуиций и вместо этого сосредоточимся на вопросах, где аналитический подход к атрибуции является разумным, например, на судебных делах, в которых люди утверждают, что пострадали от воздействия определенных химических веществ, на недавних спорах о том, было ли антропогенное изменение климата причиной эпизода экстремальной погоды, или даже на судебных расследованиях того, был ли человек виновен в преступлении.

В утверждениях как об общей, так и о специфической причинно-следственной связи преобладает неопределенность. Это может быть просто словесная оговорка, как, например, "жестокие видеоигры могут увеличить риск агрессии", 1 но здесь мы рассматриваем попытки более строгого выражения неопределенности, либо численно, либо, по крайней мере, на формальной шкале. Обсуждение неизбежно станет немного техническим, хотя, надеюсь, эти идеи помогут разрешить противоречивые претензии по некоторым глубоко спорным вопросам.

Общая причинность

В главе 8 мы уже видели, как рандомизация позволяет оценить причинно-следственные связи: сравнивая результаты в группах людей, которым случайным образом назначили прием дексаметазона или контроль, мы можем быть уверены, вплоть до игры случая, что любые различия будут обусловлены назначенным лечением. Мы не просто наблюдаем, что вероятность хорошего выздоровления выше в группе, получающей препарат, мы активно вмешались, чтобы создать группы, которые будут соответствовать друг другу, даже с учетом факторов, о которых мы не подозреваем, что они могут повлиять на исход.

Но СМИ любят заголовки типа "Может ли кошка вызвать у вас рак?", 2 , и они, конечно, не основаны на рандомизированных исследованиях. Так насколько мы можем быть уверены в причинно-следственной связи, если не было проведено ни одного эксперимента? Следующий пример показывает, что нужно быть очень осторожным, делая подобные заявления.

Вредна ли гормонозаместительная терапия (ГЗТ) для женщин?

Гормонозаместительная терапия (ГЗТ) обычно назначается для облегчения серьезных симптомов, с которыми сталкиваются женщины , переживающие менопаузу. Однако многие обсервационные исследования, в которых за большим количеством людей следили в течение длительного времени, показали, что гормонозаместительная терапия (ГЗТ) также связана с улучшением сердечно-сосудистых показателей. Это всего лишь "корреляции", но часто используются формулировки причинно-следственных связей, например, в часто цитируемом обзоре 1992 года говорится, что имеются обширные и последовательные доказательства того, что использование HRT "снижает риск" развития ишемической болезни сердца примерно на 35%. 3

Но так ли это на самом деле, или женщины, принимающие HRT, которые, как правило, моложе и находятся в менопаузе или вскоре после нее, в любом случае подвержены меньшему риску? Когда в 2002 году были опубликованы результаты крупного рандомизированного исследования Women's Health Initiative, они показали, что HRT увеличивает годовой риск ишемической болезни сердца на 18 % (95% интервал: 5 % снижение - 45 % увеличение), а также повышает риск инвазивного рака молочной железы, инсульта и легочной эмболии. 4 Это вызвало, мягко говоря, всеобщее недоумение и существенное снижение количества назначений HRT.

Однако дальнейший анализ в значительной степени разрешил кажущееся противоречие, поскольку в обсервационных и рандомизированных исследованиях рассматривались разные группы. Теперь исследователи уверены том, что, если начать лечение у большинства женщин в возрасте до шестидесяти лет или в период менопаузы, ограниченный период HRT значительно снижает смертность и сердечно-сосудистые заболевания, 5 и для этих женщин польза может перевесить риск. Все дело в выборе времени.

Пример HRT показывает, насколько осторожно и сложно нужно подходить к оценке причинно-следственной связи, особенно в отсутствие рандомизированных исследований. Классическим примером являются долгие годы, потребовавшиеся для того, чтобы связь между курением и раком легких была наконец установлена как причинно-следственная, на основании многочисленных исследований и несмотря на усилия табачной промышленности поставить под сомнение научные данные.

Как только мы можем предположить наличие причинно-следственной связи, мы можем попытаться ответить на такие вопросы, как, например, какой доли (и с какой неопределенностью) случаев рака легких можно было бы избежать, если бы люди не курили? Например, в исследовании, проведенном среди норвежских женщин, 6 курящих в настоящее время, относительный риск развития рака легких был в четырнадцать раз выше, чем у никогда не куривших (95%-ный интервал от 10 до 19). Это означает, что из каждых четырнадцати курильщиков, заболевших раком легких, один заболел бы в любом случае, а тринадцать (93 % от общего числа) заболели из-за курения. Это называется приписываемой долей или избыточной долей, и в данном исследовании она будет иметь 95%-ный интервал от 90 до 95%. В условных обозначениях, если RR - это относительный риск, то приписываемая или избыточная фракция - это AF = (RR - 1)⁄ R = 1 - 1⁄ RR, который в данном исследовании составил 1 - 1⁄ 14 = 0,93.

Но мы хотели получить представление о доле всех случаев рака легких, вызванных курением, которая известна как доля, приходящаяся на население. Для этого нам нужно знать долю женщин, которые когда-либо курили, которая в период проведения исследования составляла около 30 %. Исходя из этого, можно предположить, что доля, приходящаяся на популяцию, составляет 80 % (с 95 %-ным интервалом от 73 % до 84 %). fn2 Это означает, что в принципе около 80 % случаев рака легких у женщин (а также многих других опасных для жизни состояний) можно было бы избежать, если бы люди не курили.

Такие показатели, как , демонстрируют потенциальную пользу от изменения поведения и тем самым уменьшают воздействие "следствий причин". Но, как мы увидим далее, приписываемая доля может также служить основой для отнесения "причин к следствиям" и использоваться в судебных решениях по искам о компенсации.

Если причинно-следственная связь между курением и раком легких установлена без всяких сомнений, то с другими причинами рака все не так однозначно. Международное агентство по изучению рака (МАИР) осуществляет долгосрочную программу по изучению того, является ли большое количество химических веществ и других факторов воздействия канцерогенными (то есть способными вызывать рак у человека), и после обширных исследований относит каждое из них к одной из четырех категорий:

Группа 1: канцерогенные для человека. Примеры: плутоний, ионизирующее излучение , работа пожарным, курение, алкоголь, переработанное мясо.

Группа 2A: вероятно, канцерогенно для человека. Например, работа парикмахером или барбером (из-за воздействия некоторых химических веществ), работа в ночную смену, очень горячие напитки, красное мясо.

Группа 2B: возможно, канцерогенно для человека. Например, алоэ вера, работа в химчистке.

Группа 3: не поддается классификации на предмет канцерогенности для человека. Например, угольная пыль, кофе, силиконовые грудные имплантаты.

Существует много недоразумений, связанных с этими классификациями. И переработанное мясо, и курение относятся к группе 1, но это не значит, что они одинаково опасны, несмотря на грубо вводящие в заблуждение заголовки типа "Бекон, ветчина и сосиски имеют такой же риск развития рака, как и сигареты, предупреждают эксперты". 7 Это потому, что классификация МАИР касается опасности , а не риска, где, как мы видели в главе 1, опасность - это потенциал, при возможно очень экстремальных обстоятельствах, причинить вред, тогда как в данном контексте риск означает реальную вероятность вреда, учитывая обычный образ нашей жизни. Поэтому, когда IARC отнесла переработанное мясо к группе 1 как "канцерогенное для человека", наряду с курением, ионизирующим излучением и плутонием, они, конечно, не подразумевали, что риск одинаков.

МАИР старается лучше объяснять, что означает ее классификация, но это не мешает неверно понимать ее суждения. Например, ...

Может ли аспартам, входящий в состав таких напитков, как диетическая кола, вызвать у вас рак?

Аспартам - низкокалорийный искусственный подсластитель, который уже несколько десятилетий используется в огромном количестве пищевых продуктов, в частности, в диетических напитках. В 2023 году на основании широкого спектра доказательств МАИР отнес аспартам к группе 2B, возможно, канцерогенной для человека, что, согласно опубликованному алгоритму 8 , означает, что установлен хотя бы один из следующих критериев:

Ограниченные доказательства канцерогенности для человека

Достаточные доказательства канцерогенности у экспериментальных животных

Убедительные доказательства того, что вещество обладает ключевыми характеристиками канцерогенов.

К сожалению, за две недели до официального заявления МАИР произошла утечка информации в СМИ, в результате чего появились заголовки типа "Подсластитель аспартам будет объявлен возможным риском развития рака", 9 , в которых была допущена именно та ошибка, которая была допущена в отношении бекона. Это было особенно иронично, поскольку объявление о классификации МАИР было сделано одновременно с заявлением Объединенного экспертного комитета по пищевым добавкам (JECFA) ВОЗ по продовольствию и сельскому хозяйству Organization о реальном риске, который не обнаружил "убедительных доказательств того, что аспартам оказывает неблагоприятное воздействие на организм человека или экспериментальных животных".

Эти два заявления могут показаться противоречивыми, но вполне возможно, что аспартам может быть канцерогеном при употреблении в достаточных количествах и при этом не представляет ощутимого риска в том количестве, которое потребляют люди. Рекомендации ВОЗ остаются неизменными уже сорок лет: в среднем люди могут употреблять до четырнадцати банок диетического напитка в день (около половины ведра). Таким образом, отвечая на вопрос, заданный в начале этого раздела, можно сказать, что вы не заболеете раком от диетических напитков - хотя, несомненно, по этому поводу будут судебные разбирательства.

В классификации МАИР используются такие термины, как "вероятно", , но, как ни странно, это не является прямым выражением вероятности канцерогенности. Это качественная оценка силы доказательств канцерогенности, и поэтому это скорее выражение "косвенной неопределенности", как обсуждалось в главе 9. Агентство по охране окружающей среды США (EPA) подтверждает этот подход, говоря: "Большинство причинно-следственных выводов основываются на силе доказательств, так что нет ни одного источника неопределенности, характеризующего неопределенность относительно заключения. Поэтому неопределенность большинства причинно-следственных анализов должна быть охарактеризована качественно".

В отличие от этого, сейчас мы увидим, что исследователи изменения климата несколько смелее и готовы придать вероятности своим причинно-следственным утверждениям.

Изменение климата может стать еще более спорной областью науки и причинности, чем причины возникновения рака. На протяжении лет все более поляризованный конфликт между учеными, которые утверждают, что последние изменения климата в основном вызваны деятельностью человека, и теми, кто утверждает, что многое является просто естественной вариацией. Поэтому Межправительственная группа экспертов по изменению климата (МГЭИК) разработала способ выражения степени уверенности в своих утверждениях о причинно-следственных связях, и в своем докладе за 2021 год 11 использует такие фразы, как

Неоспоримо, что под влиянием человека потеплели атмосфера, океан и суша".

Влияние человека, скорее всего, является основной причиной глобального отступления ледников с 1990-х годов и сокращения площади арктического морского льда в период с 1979-1988 по 2010-2019 годы".

Вполне вероятно, что антропогенное воздействие способствовало наблюдаемым изменениям количества осадков с середины XX века".

Как мы уже видели в главе 2, эти "прямые" выражения неопределенности можно перевести в цифры: "очень вероятно" - 90-100%, а "вероятно" - более 66%. Неоднозначное" - это зашкаливающее значение, которое, предположительно, следует интерпретировать как "определенное".

Это экспертные оценки, основанные на многочисленных фактах. Один из основных вкладов основан на сравнении двух математических моделей климата: одна прогнозирует, что должно было произойти с 1850 года до наших дней, включая влияние человека, а другая прогнозирует, что могло бы произойти, если бы мы не развивали нашу промышленность и действовали только естественные процессы. Это называется контрфактическим прогнозом, поскольку он прямо направлен на оценку потенциального влияния истории, развивавшейся не так, как она развивалась на самом деле.

На рисунке 10.1 показано такое сравнение для глобальной приземной годовой температуры между 1850 и 2020 годами. Даже с учетом неопределенности в прогнозах моделей первая модель, построенная под влиянием человека, хорошо согласуется с данными наблюдений (черная линия), в то время как второй "естественный" прогноз не имеет ничего общего с фактическими данными. Эти смоделированные прогнозы известны как "отпечатки пальцев".

МГЭИК также включает более формальный регрессионный анализ, чтобы увидеть, насколько хорошо две модели вместе соответствуют данным - если коэффициент для "антропогенного" отпечатка близок к 1, а коэффициент для "естественного" отпечатка близок к 0, то можно сделать вывод, что антропогенное потепление примерно равно наблюдаемому потеплению. Таким образом, исследователи климата проводят классический статистический анализ, результаты которого представлены в виде оценок и доверительных интервалов, и используют его в качестве первичной основы для консенсусного вероятностного суждения о лежащей в основе причинности, что, по сути, является байесовской идеей. И их вывод был "однозначным".

В этом анализе рассматривались возможные причины изменения климата всей планеты, но вполне естественно, что на сайте можно задать вопрос о том, можно ли отнести к антропогенному изменению климата конкретные погодные явления, такие как сильные дожди, засухи, аномальная жара и т. д. Это также может стать все более важным в судебных делах об ответственности за ущерб от экстремальных погодных условий.

Следующий, довольно приходской, вопрос представляет определенный личный интерес.

Рисунок 10.1


Наблюдаемое изменение среднегодовой глобальной температуры поверхности 1850-2020 гг. (черная линия) в сравнении с моделированием на основе антропогенных и природных факторов (пунктирная линия показывает оценку, а светло-серая полоса - неопределенность) и только природных факторов (бледная линия и темно-серая полоса). 12 Моделирование с учетом антропогенного влияния совпадает с наблюдаемыми данными.

Какое влияние оказало антропогенное изменение климата на рекордно высокие температуры в Великобритании в сентябре 2023 года?

Должен признаться, что сентябрь 2023 года показался мне просто великолепным: я провел много теплых вечеров на улице и совершал долгие велосипедные прогулки по сельской местности. Но пока я самодовольно наслаждался собой, возможно, мне следовало бы задуматься о причинах почти беспрецедентной средней температуры сентября в Великобритании - 15,2 °C.

Метеорологическое управление Великобритании (Met Office) в настоящее время проводит быстрые исследования атрибуции для таких событий, как рекордные температуры в сентябре 2023 года. 13 Они аналогичны описанной выше оценке климатической причинности: модель естественной изменчивости (NAT) дает распределение вероятности того, что можно было бы ожидать в сентябре, если бы не было влияния человека, а имитации моделей, которые допускают влияние человека (HUM), дают сопоставимое распределение вероятности. Это дает оценку вероятности наблюдения такой экстремальной температуры без и с антропогенным воздействием, что по сути является P-значениями для "конкурирующих" гипотез, обозначенных PNAT и PHUM.

На рис. 10.2 показаны распределения вероятностей при естественном и антропогенном воздействии, каждое из которых получено в результате многократного прогона моделей, а затем сглажено. Хвостовая область PHUM для распределения HUM оценивается в 2,7 % (90 %-ный интервал неопределенности от 2,4 % до 3,1 %), что означает, что, по оценкам Met Office, вероятность наблюдения таких экстремальных температур составляет всего 1 к 40, даже с учетом антропогенного изменения климата - эта небольшая вероятность отражает общую закономерность, согласно которой современные климатические модели недопрогнозируют экстремальные погодные явления. 14. Но для "естественной" модели вероятность PNAT наблюдать такой экстремальный результат оценивается в 0,023% (90-процентный интервал от 0,018% до 0,030%), примерно 1 к 4 000. Met Office предупреждает, что эти оценки основаны на многочисленных допущениях и не должны восприниматься слишком буквально, и отказывается рассчитывать относительный риск такого экстремального события, связанного с влиянием человека . Если бы Метеорологическое управление было менее осторожным, оно могло бы сделать вывод, что относительный риск PHUM/PNAT составляет около 100, что означает, что влияние человека делает такое экстремальное событие более вероятным примерно в 100 раз.

Рисунок 10.2


Распределения вероятностей для средней дневной температуры в Великобритании в сентябре 2023 года, полученные на основе моделей, предполагающих только естественную изменчивость (NAT - темная линия) и влияние человека (HUM - бледная линия). Наблюдаемая средняя температура 2023 года показана сплошной черной линией и является неправдоподобно высокой в условиях естественной изменчивости.

Из рисунка 10.2 можно извлечь еще один важный урок. График демонстрирует , что, казалось бы, совсем небольшое повышение средней температуры, примерно с 12 до 14 °C, которое мы, скорее всего, не почувствовали бы, если бы оно произошло в течение часа, приводит к непропорционально большим изменениям в "хвостовых областях" и тем самым значительно повышает риск экстремальных событий. Этот простой график наглядно показывает, почему попытка удержать глобальное потепление ниже 2°C является такой важной задачей.

Исследования атрибуции стали более распространенными и часто проводятся вскоре после или даже во время изучаемого события. Это может привести к проблемам. В 2018 году, когда ураган "Флоренс" приближался к побережью США, исследователи заявили, что из-за изменения климата количество осадков над Каролинами увеличится более чем на 50 %, а сам ураган будет примерно на 80 км сильнее. Это сопровождалось заголовками типа "Как глобальное потепление разжигает чудовищные штормы, такие как ураган Флоренс". 15 Но два года спустя те же исследователи признали, что, согласно пересмотренному анализу, изменение климата привело к изменению количества осадков на ±5 %, а ураган стал шире всего на 9 км. 16 Это опровержение их предыдущих утверждений не получило широкой огласки, но продемонстрировало, что подобные исследования атрибуции должны проводиться очень осторожно, с учетом неопределенности как естественной изменчивости климата, так и результатов климатических моделей.

В отличие от осторожности, выраженной Метеорологическим управлением Великобритании, во многих исследованиях, посвященных атрибуции, оцениваются относительные риски, связанные с изменением климата под влиянием человека; например, относительный риск около RR = 3,5 был оценен для рекордных майских температур в Южной Корее в 2017 году, 17 , то есть вероятность возникновения таких экстремальных температур в 3,5 раза выше при предположении о влиянии человека на климат, чем при предположении о наличии только естественного климата. Ранее мы видели, что при оценке причин рака мы можем рассчитать приписываемую долю, как долю случаев, которых можно было бы избежать, если бы они не подвергались определенному воздействию, например, курению, где приписываемая доля определяется как 1 - 1⁄ RR. В климатическом контексте это известно как доля приписываемого риска (FAR), и FAR события в Южной Корее 2017 года оценивается как 1 - 1⁄ 3,5 = 0,72. В настоящее время в исследованиях по атрибуции погодных явлений избегают называть это "вероятностью причинно-следственной связи", хотя будет интересно посмотреть, начнет ли это фигурировать в будущих судебных процессах, связанных с изменением климата .

Некоторые климатологи взяли методы исследования атрибуции для конкретных событий и, рассматривая все современное развитие климата как единое "событие", применили их к изменению климата в целом. 18 Это привело к оценке общей "вероятности причинности" влияния человека на изменение температуры в 0,9999 - альтернативная количественная основа для суждения МГЭИК 2021 года о том, что это "однозначно".

Тем не менее, несмотря на возможную привлекательность оценки вероятности причинно-следственной связи, любая оценка, полученная в результате исследования атрибуции, должна опираться на широкий спектр предположений - более того, можно было бы приветствовать некоторую меру доверия к анализу. И это для четко определенных погодных явлений, с разумным пониманием лежащих в их основе физических процессов . Когда мы переходим к еще более сложным областям, например, к судебным делам, в которых утверждается, что компании социальных сетей несут ответственность за нанесение вреда психическому здоровью конкретных людей, любые попытки количественно оценить неопределенность причинно-следственных связей будут еще более затруднительными. Но, как мы сейчас увидим, существует юридический прецедент расчета "вероятности причинности" непосредственно на основе научных доказательств.

Мы все заинтересованы в том, чтобы объяснять возможные причины плохого самочувствия. Почему у меня болит голова? Кто заразил меня вирусом SARS-CoV-2? Вызвала ли вакцина болезнь моего ребенка? Как правило, у нас есть только подозрения, но некоторые ситуации требуют более формальных методов. Например, при оценке того, привело ли лекарство к нежелательному явлению, часто используется алгоритм 19 для классификации реакций на определенную, вероятную, возможную или сомнительную причинность, хотя, как и классификация IARC для канцерогенности, она выражает не вероятность, а скорее неформальную силу доказательств причинности.

Конечно, оценка причинно-следственной связи действительно достигает центра в случае судебного иска о возмещении ущерба, когда необходимо принять решение, потенциально меняющее жизнь.

Как суд принимает решение о том, был ли нанесен вред человеку его рабочей средой?

Джон Куксон почти тридцать лет проработал в фармацевтической корпорации, позже ставшей известной как Novartis, включая период работы на производстве красителей в Гримсби на восточном побережье Англии. После выхода на пенсию у него развился рак мочевого пузыря, и в 2001 году он подал в суд на своего предыдущего работодателя, утверждая, что подвергся воздействию "ароматических аминов", задействованных в производстве красителей. Все стороны согласились с тем, что эти вещества связаны с повышенным риском развития рака. Суду необходимо было решить, был ли его рак вызван воздействием на рабочем месте, и если да, то с какой вероятностью.

Невозможно биологически определить, откуда у него взялся рак. И мы не можем заново запустить историю и наблюдать контрфактический мир, в котором мистер Куксон никогда не подходил бы к красителям , и посмотреть, развился ли бы у него рак в любом случае. Поэтому, чтобы получить разумную вероятность того, что воздействие вызвало его индивидуальный рак, мы должны использовать эпидемиологические данные, полученные в популяциях. По сути, идеи общей причинности (следствия причин) используются для приписывания ответственности в конкретном случае (причины следствий).

Мы уже встречали понятие "приписываемая доля" или "избыточная доля, связанная с воздействием". Например, 93 % случаев рака легких у курящих норвежских женщин были связаны с их курением. Простой, но важный шаг - перейти от этого утверждения о популяциях к утверждению, что если у конкретного курильщика развивается рак легких, то вероятность того, что рак легких был вызван его курением, составляет 93 %. Если мы готовы сделать этот прыжок, то это дает возможность оценить вероятность причинно-следственной связи у отдельного человека - просто используйте долю, приписываемую популяции. В общем случае она не будет равна 1, поскольку не каждый случай заболевания был вызван воздействием. Юридический вопрос заключается в том, достаточно ли велика конкретная вероятность причинной связи, чтобы оправдать компенсацию.

В то время как для вынесения приговора по уголовному делу требуются доказательства "вне разумных сомнений", которые юристы неохотно оценивают, гражданские дела решаются на основании "перевеса доказательств" (США) или "баланса вероятностей" (Великобритания). Это часто интерпретируется как означающее вероятность более 50 %, и поэтому вероятность причинения вреда более 1⁄ 2 должна выиграть дело в пользу истца, заявляющего о причинении вреда.

Существует удивительно простой способ определить, превышает ли наша вероятность причинно-следственной связи 50%; проверьте, превышает ли относительный риск 2. fn3 Рассуждения выглядят следующим образом: если воздействие более чем в два раза увеличивает риск неблагоприятного события, то более половины случаев можно отнести на счет воздействия, а значит, в каждом конкретном случае наша вероятность причинно-следственной связи превышает 50%.

Дело мистера Куксона усложнялось тем, что он много лет умеренно курил, хотя бросил почти за пятнадцать лет до того, как у него диагностировали рак. 20 Было признано, что и профессиональное воздействие различных канцерогенов, и сигаретный дым способны вызвать рак мочевого пузыря, но команда юристов Куксона утверждала, что относительный риск, связанный с химическими веществами, превышает 2, а выше риска от курения, и судья в апелляции 2007 года заключил: "С точки зрения риска, если профессиональное воздействие более чем вдвое превышает риск от курения, то по логике вещей должно быть вероятно, что болезнь была вызвана первым". Джон Куксон получил свою компенсацию.

Правило "удвоения риска" закреплено в законодательстве США: в Законе о компенсации работникам энергетической отрасли за профессиональные заболевания Program Act of 2000 21 говорится, что если у работника развивается рак после воздействия радиации на работе, то компенсация выплачивается, если оцениваемая вероятность причинной связи превышает 50%, и это определяется относительным риском, превышающим 2. Как мы видели в примере с курением, ограниченность эпидемиологических данных означает, что существует неопределенность в отношении относительного риска, которая переходит в неопределенность в отношении вероятности причинно-следственной связи. Возможно, удивительно, что в законе США говорится, что верхняя граница 98%-ного доверительного интервала для вероятности причинной связи определяет, достигнут ли порог в 50% - это означает, что компенсация выплачивается, если нет высокой уверенности в том, что вероятность причинной связи меньше 50%.

В некоторых обстоятельствах относительный риск меньше 2 может означать, что вероятность причинно-следственной связи превышает 50%. Если облучение ускоряет развитие заболевания, так что у некоторых больных болезнь развилась бы в любом случае, если бы они не подверглись воздействию, то это не будет отражено в эпидемиологическом относительном риске. 22 Это означает, что приписываемая доля является лишь нижней границей вероятности причинности, где "причинность" теперь включает вред от того, что болезнь возникла раньше, чем в противном случае. Поэтому требование относительного риска больше 2 может быть слишком строгим.

Все это предполагает, что относительный риск, относящийся к конкретному случаю, может быть точно оценен. Американское справочное руководство по научным доказательствам 23 для судов с должной осторожностью относится к использованию правила "удвоения риска", предупреждая о необходимости наличия веских доказательств для оценки относительного риска, о том, что истец должен быть похож на участников исследования и что воздействие не ускоряет развитие болезни и действует независимо от других возможных причин.

Совершено преступление, кто-то обвиняется, и дело рассматривается в уголовном суде. Хотя это и не стандартная интерпретация, по сути, это исследование атрибуции, когда две гипотезы, виновный или невиновный, сравниваются на основе доказательств, в основном судебно-медицинских. При оценке "виновности" экстремальных погодных явлений исследователи оценивают вероятности того, что наблюдалось при двух гипотезах о климате, природном или антропогенном, и могут рассчитать их соотношение. Аналогично, "доказательная ценность" судебно-медицинских доказательств лучше всего определяется соотношением вероятностей.

Возвращаясь к главе 7 , вспомним, что коэффициент вероятности выражает, насколько больше вероятность наступления события B в случае, если A будет истинным, по сравнению с тем, если A будет ложным, и поэтому он, по сути, суммирует информацию, которую B предоставляет об A. В уголовном праве коэффициент вероятности принимает вид

например, обвинение может утверждать о присутствии подозреваемого на месте преступления, а защита - о том, что подозреваемый не присутствовал.

Предположим, что улика состоит из профиля ДНК, найденного на месте преступления, который точно соответствует подозреваемому. Обвинение утверждает, что ДНК принадлежит подозреваемому, поэтому Pr(Evidence| Prosecution proposition) = 1, и отношение правдоподобия равно

Вероятность того, что определенный профиль ДНК принадлежит неизвестному человеку, называется "вероятностью случайного совпадения" и оценивается с помощью различных предположений о частоте встречаемости определенных элементов профиля в популяции, хотя точные значения могут быть оспорены из-за сложностей с образцом ДНК. Типичные коэффициенты вероятности совпадения по ДНК исчисляются миллионами или даже, при полном профиле, миллиардами. 24

В таблице 10.1 показан рекомендуемый способ представления коэффициентов вероятности в суде 25 в Великобритании, аналогичный переводу слов и цифр, описанному в главе 2. Например, в анализе, приведенном в главе 7, полиция Метрополитен , по сути, исходила из того, что положительная идентификация по распознаванию лица в реальном времени имеет коэффициент вероятности около 700, что означает "умеренно сильную поддержку" для включения человека в список лиц, подлежащих наблюдению.


Значение отношения правдоподобия

Вербальный эквивалент


1-10

Слабая поддержка


10-100

Умеренная


100-1,000

Умеренно сильная


1,000-10,000

Сильная


10,000-1,000,000

Очень


1 000 000 и выше

Чрезвычайно прочный


Таблица 10.1


Рекомендуемые вербальные интерпретации коэффициентов вероятности в судопроизводстве в Великобритании.

В Великобритании существует "ограничение": максимальный коэффициент вероятности, о котором можно сообщить, составляет 1 миллиард (1 000 000 000 000). 26.

Возвращаясь к примеру распознавания лиц в реальном времени, приведенному в главе 7, вспомним, что, хотя система, как утверждается на сайте , имеет коэффициент ложных срабатываний 1 к 1000, при правдоподобных обстоятельствах 59 % людей, обнаруженных системой, окажутся ложноположительными идентификаторами. Очевидно, что существует обеспокоенность по поводу потенциальной путаницы между

Вероятность того, что вас вычислит система, если вы не находитесь в списке наблюдения = 1 из 1000 = 0,1%.

с "обратной" вероятностью

Вероятность того, что вы не попадете в список наблюдателей, с учетом того, что вас выберет система = 10⁄ 17 = 59%.

Путаница между этими двумя условными вероятностями даже имеет название: заблуждение прокурора. Оно возникает из-за распространенной судебной ошибки. После того как ДНК, найденная на месте преступления, совпадает с ДНК подозреваемого, разумное заявление о вероятности случайного совпадения может быть следующим

Если подозреваемого не было на месте преступления и кто-то другой оставил ДНК на сайте , вероятность совпадения с ним составляет всего один шанс из миллиона.

но вместо этого вероятность случайного совпадения может быть ошибочно истолкована как означающая

При такой степени совпадения ДНК вероятность того, что подозреваемый не окажется на месте преступления, составляет всего один шанс из миллиона.

Это также можно представить как путаницу отношения правдоподобия (1 000 000) с апостериорной вероятностью того, что обвинение верно. Написанная так прямо, такая ошибка может вызвать удивление - это все равно что спутать "большинство пап - католики" с "большинство католиков - папы". Но, как мы увидим далее, подобные недоразумения не только случаются, но и могут иметь трагические последствия.

Не только прокуроры заблуждаются. Предположим, кто-то подозревается в том, что оставил ДНК на месте преступления, и вероятность случайного совпадения составляет 1 к 5 миллионам. Это дает коэффициент вероятности 5 миллионов, или "чрезвычайно сильное доказательство" в пользу аргументов обвинения. Но защита указывает на то, что в Великобритании проживает еще 60 миллионов человек, и, следовательно, около 12 человек совпадают с ДНК подозреваемого. Таким образом, вероятность того, что подозреваемый был на месте преступления, составляет лишь 1 к 13. Это иногда называют "заблуждением защиты ", поскольку оно предполагает, что все жители Великобритании в равной степени могли быть на месте преступления.

Это разновидность байесовского аргумента, в котором подозреваемому дается первоначальная предварительная вероятность оказаться на месте преступления в размере 1 к 60 миллионам, которая затем умножается на отношение правдоподобия в 5 миллионов, чтобы получить апостериорную вероятность в размере 1 к 12. Таким образом, это "заблуждение" только в том смысле, что предварительная вероятность должна основываться на количестве людей, которые потенциально могли быть на месте преступления, и она не учитывает другие подтверждающие улики.

Печальное дело Салли Кларк обсуждалось много раз, но многое в нем осталось без внимания. Она была адвокатом, у которой с разницей в год внезапно и неожиданно умерли двое младенцев в возрасте семи недель и одиннадцати недель. Затем ее признали виновной в их убийстве и в 1999 году приговорили к пожизненному заключению. На суде профессор сэр Рой Мидоу, педиатр в отставке и эксперт по синдрому внезапной детской смерти (СВДС), утверждал, что вероятность смерти ребенка в такой семье от СВДС составляет примерно 1 к 8543, а вероятность смерти двух младенцев от СВДС в одной семье - 1⁄ 8543 1 × ⁄ 8543 или примерно 1 на 73 миллиона, что означает, что в Англии и Уэльсе такое случается примерно раз в сто лет. Он описал эти шансы, как если бы вы поставили на длинноногую лошадь с коэффициентом 80 к 1 на Grand National и она выиграла бы четыре года подряд, и что такое событие "очень, очень, очень маловероятно". 27

С этим рассуждением связаны две проблемы. Во-первых, умножение вероятностей справедливо только в том случае, если события независимы, а известно, что смерти от СПИДа имеют тенденцию группироваться в семьях, возможно, благодаря генетическим связям. Таким образом, вероятность 1 к 73 миллионам слишком мала.

Но это не самый важный вопрос. Как отметил статистик Филипп Давид, 28 "если фоновые данные о двойных смертях от СПИДа (или других естественных причин) релевантны, то, конечно, также должны быть фоновые данные о двойных смертях от убийства ". По сути, хотя Мидоу был прав в том, что две смерти от СПИДа - крайне редкое явление, также "очень, очень, очень маловероятно", что мать убьет двух своих маленьких детей. Опять же, это скорее байесовский аргумент, поскольку мы принимаем во внимание очень низкую предварительную вероятность того, что кто-то совершит такое преступление.

Дело было впервые обжаловано в 2000 году, но показания экспертов-статистиков, таких как профессор Давид, были отклонены на том основании, что "это вряд ли ракетостроение, не так ли?" 29 Наконец, во время второй апелляции в 2003 году были представлены новые доказательства бактериальной инфекции у одного из ее сыновей, которые ранее не были представлены, и Кларк была освобождена. 30 В судебном решении патологоанатом подвергся резкой критике, , но также было сказано, что показания Мидоу не должны были быть представлены присяжным в том виде, в котором они были представлены, и что "наглядное упоминание профессором Мидоу шансов на победу в Grand National из года в год, возможно, оказало значительное влияние на их мышление". Несмотря на то что новые данные о патологии привели к тому, что апелляция Кларка была удовлетворена, судьи пришли к выводу, что они "с большой долей вероятности сочли бы, что статистические данные представляют собой достаточно четкую основу, на которой апелляция должна была быть разрешена". Успешная апелляция привела к пересмотру других дел, по которым Медоу давала показания, и впоследствии с трех женщин были сняты обвинения в убийстве своих детей. К сожалению, Кларк, которая провела четыре года в тюрьме, прежде чем была оправдана, умерла от острого алкогольного отравления в 2007 году.

Случай австралийки Кэтрин Фолбигг, если это возможно, еще более трагичен. Все ее четверо детей умерли в младенчестве - в 1989, 1991, 1993 и 1999 годах. Хотя прямых доказательств того, что она причинила вред детям, не было, в 2003 году ее признали виновной в удушении детей и приговорили к сорока годам лишения свободы, в основном на основании предполагаемой невероятности того, что все дети умерли от естественных причин. В подтверждение того, что смерти не были случайными, приводились слова Роя Мидоу. После долгой кампании она была наконец освобождена в 2023 году благодаря новым доказательствам того, что ее дети несли очень редкие генные мутации, которые предрасполагали к внезапной сердечной смерти. Она провела в тюрьме двадцать лет.

Как мы видели в главе 4, посвященной совпадениям, суды должны быть очень осторожны, прежде чем прийти к выводу, что события настолько маловероятны, что "не могут быть просто случайностью". Во-первых, потому что при достаточном количестве возможностей даже редкие на первый взгляд вещи будут происходить. Во-вторых, потому что за событиями могут стоять общие факторы, которые резко повышают вероятность их совместного возникновения. И наконец, потому что нам также необходимо учитывать редкость альтернативных, криминальных объяснений.

Все это можно прояснить с помощью формального анализа коэффициентов вероятности и байесовского мышления. Но хотя в Великобритании соотношения вероятностей, основанные на доказательствах, разрешены в судопроизводстве, Апелляционный суд Англии и Уэльса постановил, что теорема Байеса не должна формально использоваться в суде для объединения и взвешивания доказательств. 31 Это, очевидно, лучше всего делать присяжным, используя их человеческое суждение.

После рассмотрения причин возникновения рака, атрибуции изменения климата и экстремальных погодных явлений, гражданских судебных дел о возмещении ущерба и уголовных дел, основанных на судебной экспертизе, настало время поразмышлять о том, что все они говорят нам о неопределенности и причинности.

Первый урок заключается в том, что оценить причинно-следственную связь очень сложно. Существует много неопределенности, и выразить ее в терминах вероятности не так-то просто. Во-вторых, в некоторых обстоятельствах можно прийти к вероятности причинности, но нужно различать два разных типа вопросов. Во многих обстоятельствах мы не можем напрямую наблюдать причинно-следственную связь, будь то между деятельностью человека и экстремальными погодными условиями или между воздействием химических веществ и заболеванием раком. Мы не можем абсолютно точно доказать цепочку причинно-следственных связей, поэтому приходится иметь дело с ассоциациями и делать выводы о причинности. В отличие от этого, в уголовных делах мы напрямую рассматриваем причинно-следственные гипотезы о том, почему произошли события, которые в принципе можно было бы решить с уверенностью, если бы у нас были нужные доказательства. Это означает, что теоретически можно рассчитать "вероятность вины" (хотя в британском суде это было бы недопустимо).

Наконец, часто возникает путаница между вероятностью и силой доказательства. Знаменитый юридический вопрос, впервые заданный в 1971 году, 32 может прояснить эту проблему:

Истца по неосторожности сбивает синий автобус. Единственный вопрос заключается в том, управлял ли автобусом ответчик, который обслуживает 80 % всех синих автобусов в городе. Если это единственное доказательство в суде, достаточно ли его для того, чтобы доказать правоту истца в соответствии с гражданским стандартом доказывания?

В ходе недавнего неофициального опроса юристов на конференции 33 около двух третей сказали, что этого достаточно для того, чтобы на основании баланса вероятностей сделать вывод об ответственности автобусов ответчика, в то время как другая треть не согласилась, предположительно считая, что, хотя вероятность превышала 50%, были представлены лишь косвенные доказательства. fn4 С точки зрения Байеса, мы бы сказали, что имеем 80% в качестве предварительной вероятности, но без доказательств, специфических для данного случая.

В 1921 году Джон Мейнард Кейнс написал в своем "Трактате о вероятности":

По мере увеличения имеющихся в нашем распоряжении соответствующих доказательств величина вероятности аргумента может либо уменьшаться, либо увеличиваться, в зависимости от того, насколько новые знания усиливают неблагоприятные или благоприятные доказательства; но в любом случае что-то, похоже, увеличилось - у нас появилась более существенная основа , на которую можно опереться в своем заключении. 34

Это отражает наше обсуждение в главе 9, где прямая неопределенность, предпочтительно выраженная в терминах вероятности, четко отличается от косвенной неопределенности, которая касается силы и релевантности доказательств. В частности, мы определили, что люди с наибольшей неохотой принимают решения, основанные на текущих вероятностях, если существуют серьезные информационные пробелы, когда потенциально доступные доказательства могут кардинально изменить их текущие убеждения. Судья Верховного суда Великобритании лорд Леггатт высказал ту же мысль в отношении примера с автобусом, сказав: "Во-первых, отсутствует слишком много релевантной информации, а во-вторых, имеющаяся информация недостаточно конкретна". 35

В целом юридическая система считает, что использовать статистические и эпидемиологические доказательства в своих решениях, мягко говоря, затруднительно. 36 Возможно, более четкое разграничение вероятности и силы доказательств помогло бы в этой и многих других областях.

Резюме

Неопределенность в отношении общей причинности - следствий причин - обычно выражается в виде качественного суждения.

В этом контексте такие термины, как "вероятная причина", основаны на силе доказательств и не могут быть истолкованы вероятностно.

Неопределенность в отношении атрибуции, причин конкретных событий, в некоторых обстоятельствах может быть выражена количественно в виде "вероятности причинности".

Атрибуция климата исследования оценивают относительный риск экстремальных погодных явлений, связанных с влиянием человека на климат, хотя в этих оценках существует значительная неопределенность.

В гражданских делах правило "удвоения риска" иногда используется в качестве основания для утверждения, что вероятность причинно-следственной связи превышает 50 %, хотя это может быть слишком строгим.

В уголовных делах ценность судебно-медицинских доказательств лучше всего выражается в коэффициенте вероятности, сравнивающем гипотезы обвинения и защиты.

Все эти области выиграют от более четкого разграничения между вероятностью и силой и значимостью доказательств.

ГЛАВА 11

.

Предсказание будущего

Мы не знаем, что произойдет в будущем, и, если только мы не наделены какими-то магическими способностями, мы не можем этого знать. Неуверенность в будущем, таким образом, в корне отличается от эпистемической неуверенности предыдущих глав, где наше текущее незнание, по крайней мере в принципе, может быть устранено за счет большего количества знаний. Когда же дело доходит до гадания о том, что произойдет, нам остается только ждать и смотреть, что получится.

Эта базовая неопределенность не мешала людям искать ответы на безответный вопрос - что со мной произойдет? Гадалки и оракулы процветали на протяжении всей истории человечества, и многие из них использовали случайность в качестве средства для своих пророчеств. Цель такой клеромантии - отразить закономерности будущего с помощью , например, расклада стеблей тысячелистника по И-Цзину, выбора карт Таро или форм чайных листьев, как, например, в классе профессора Трелони в фильме "Гарри Поттер и узник Азкабана". 1. Конечно, как заметил статистик Дэвид Хэнд, важно, чтобы прорицатель использовал непонятный язык и делал свои предсказания настолько многочисленными и неоднозначными, насколько это возможно. 2

Научная революция, напротив, открыла новую, более строгую эру. Ученые впервые смогли делать весьма конкретные предсказания, используя прозрачные методы, основанные на математических уравнениях, представляющих физические законы. Например, используя модель Ньютона для планетарного движения, Эдмонд Галлей рассчитал орбиты двадцати четырех исторических комет, но заметил , что три из них казались удивительно похожими. Предположив, что все они - одна и та же комета, движущаяся по эллиптической орбите, он в 1705 году предсказал ее следующее появление в 1758 году. К сожалению, он умер в 1742 году, так и не успев стать свидетелем возвращения кометы по расписанию, но, как мы вскоре увидим, не успев внести фундаментальный вклад в предсказание продолжительности жизни людей.

Исаак Ньютон может показаться воплощением научной рациональности, но на самом деле он был одержим алхимией (чуть не погиб при взрыве в своей лаборатории в Тринити-колледже в Кембридже) и толкованием чисел в Библии. Он был "арианином" - тем, кто не верил в божественность Христа, - и считал, что церковь испорчена. Ему приходилось держать эти еретические убеждения в тайне, но в частном порядке он использовал библейские ссылки , чтобы определить, когда наступит конец света, и Христос придет снова, чтобы сформировать новое глобальное царство мира. 3 Он пришел к выводу, что это произойдет около 2060 года, fn1 по совпадению как раз перед следующим появлением кометы Галлея в 2061 году.

Законы Ньютона - это примеры детерминированных физических принципов, которые до сих пор служат основой для предсказаний во многих сферах человеческой деятельности, будь то движение планет , погода, климат, посадка космического корабля на астероид или попадание ракеты в цель. Но даже самая простая подброшенная монетка не поддается детерминированному предсказанию (если только вы не Перси Диаконис), и поэтому мы должны признать неопределенность, которая в некоторых обстоятельствах может быть выражена в виде вероятности . Хотя в соревнованиях по прогнозированию, которые мы рассматривали в главе 2, могут использоваться субъективные суждения людей, мы обычно обращаемся к статистическим моделям, основанным на данных, для получения численных оценок неопределенности будущего.

Примеры в этой главе приводятся в порядке убывания того, насколько далеко вперед мы хотим предсказать; есть большая разница между предсказанием погоды и предсказанием климата, результатов футбола и возможных спортивных рекордов, выживу ли я в следующем году и как долго люди будут жить в будущем, инфляции в следующем году и инфляции через сорок лет, не говоря уже о будущем человечества. Краткосрочные прогнозы, как правило, можно делать с большей уверенностью, поскольку ситуацию можно считать стабильной, в то время как в долгосрочных прогнозах должна все больше преобладать глубокая неопределенность в отношении того, как будет развиваться мир. Но, как всегда, любой анализ в значительной степени зависит от предположений - даже в чрезвычайно краткосрочной перспективе вы не сможете правильно оценить вероятность того, что при подбрасывании монеты выпадет решка, если кто-то передал вам двухкопеечную монету.

Прогнозирование результатов футбольных матчей на следующей неделе fn2

На дворе было 22 мая 2009 года, в английской Премьер-лиге оставался один матч, "Вест Бромвич Альбион" находился на дне лиги с 31 очком, а "Манчестер Юнайтед" - на вершине с 87. Радиопрограмма BBC "Больше или меньше" попросила меня сделать несколько прогнозов на финальные матчи, и я использовал базовую статистическую модель, чтобы оценить шансы на тот или иной результат для всех матчей, которые будут сыграны в выходные - сейчас гораздо более сложный анализ используется как спортивными букмекерскими компаниями, так и игроками.

В таблице 11.1 показаны результаты матчей "Уиган" - "Портсмут", тогда занимали 12 и 14 места в лиге из двадцати команд. У "Уигана" было 42 очка, и он забил 33 гола. Среднее количество забитых голов до этого момента составляло 46, поэтому мы можем оценить "силу атаки" Уигана как 33⁄ 46 = 0,72, то есть они забили только 72% от среднего количества голов. Аналогично, "Портсмут" пропустил 56 голов по сравнению со средним показателем 46 (количество пропущенных голов должно соответствовать количеству забитых), что позволяет оценить "слабость обороны" как 56⁄ 46 = 1,22, то есть "Портсмут" пропустил на 22 % больше голов, чем в среднем.

Все вместе это позволяет нам определить, сколько голов, по нашим прогнозам, забьет команда "Уиган", играющая на своем поле. Мы исходим из базового ожидания 1,40 - среднего количества голов, забитых домашней командой. Затем мы корректируем на силу атаки "Уигана" , равную 0,72, и слабость обороны "Портсмута", равную 1,22, чтобы получить 1,40 × 0,72 × 1,22 = 1,22 гола.

Аналогично, "Портсмут" начинает с базового значения 1,08 - среднего количества голов, забитых командой на выезде, которое корректируется на силу атаки 0,83 и слабость обороны "Уигана" 0,98, чтобы получить 1,08 × 0,83 × 0,98 = 0,87 гола. Но, как и в случае с 2,4 детьми, никто не забьет 0,87 гола - это лишь ожидаемое значение, теоретическое среднее, если матч будет сыгран снова и снова (не дай Бог). Чтобы получить вероятность каждого конкретного количества голов, разумно предположить распределение Пуассона, возникающее естественным образом из-за большого количества возможных маловероятных возможностей для взятия ворот. Это дает распределения вероятностей, показанные в табл. 11.1; например, мы оцениваем 37%-ную вероятность того, что "Портсмут" забьет именно 1 гол.

Чтобы оценить вероятность фактического результата всей игры, мы можем предположить, что голы, забитые каждой командой, независимы, в том смысле, что если бы мы знали, сколько забил Уиган , это не дало бы нам никакой дополнительной информации о результатах Портсмута. Это сильное предположение, но оно означает, что для примера мы можем найти вероятность результата 1:0, который является наиболее вероятным, умножив 36 % на 42 %, чтобы получить 15 % - так что даже наиболее вероятный результат все равно не очень вероятен.

На самом деле, между результатами команд существует определенная корреляция, то есть матчи имеют тенденцию быть либо высоко-, либо низкозабивными. Специальное программное обеспечение, позволяющее учитывать такие корреляции, дало оценку вероятностей для каждой комбинации голов и привело к оценкам домашней победы/ничьей/голевой победы, приведенным в табл. 11.2.

Таблица 11.1


Модель для прогнозирования результата матча премьер-лиги Уиган - Портсмут 24 мая 2009 года. Вероятности забития каждого количества голов получены из распределений Пуассона со средними значениями 1,22 и 0,87.

Таблица 11.2


Оцененные вероятности победы/ничьей/выигрыша дома для всех матчей Премьер-лиги, сыгранных в воскресенье, 24 мая 2009 года. Фактический результат выделен жирным шрифтом с указанием пенальти, назначенного Бриером.

Наиболее вероятные комбинации голов были озвучены Джеймсом Александром Гордоном (который раньше зачитывал реальные результаты на BBC) в программе "Больше или меньше" 22 мая 2009 года 4 и, нашему удивлению, были представлены как точные прогнозы без каких-либо уточняющих вероятностей. 5 Мы провели выходные в нервном ожидании.

Когда 24 мая пришли реальные результаты, в таблице 11.2 показано, что мы получили 9⁄ 10 "правильных" прогнозов в отношении наиболее вероятной победы дома/ничьей/выигрыша в гостях, а также два точных результата, включая победу "Уигана" над "Портсмутом" со счетом 1:0! Это не может не радовать, особенно , поскольку Марк Лоуренсон, официальный футбольный эксперт BBC, получил только семь правильных результатов и только один точный счет. 6

Все это очень хорошо, но мы знаем, что так оценивать вероятностные прогнозы нельзя. Для нашей викторины в главе 2 мы адаптировали правило подсчета баллов Brier, разработанное в области прогнозирования погоды, чтобы оценить, насколько точными были наши вероятности. Штрафной балл Брайера используется в его исходной форме в табл. 11.2, где высокие баллы соответствуют плохим прогнозам: балл Брайера 0 соответствует идеальному прогнозу, а балл 2 - бесполезному прогнозу, который ставит 100%-ную вероятность на исход, который не произошел. fn3 Средний штрафной балл Брайера составил 0,34. 7

Полезно иметь, с чем сравнить этот результат, например, с прогнозом, в котором не использовались никакие знания об отдельных командах - по сути, с прогнозом "без мастерства". В качестве прогноза по умолчанию для всех матчей можно было бы использовать вероятности 0,45, 0,26 и 0,29, поскольку это пропорции домашних побед, ничьих и выездных побед в течение всего сезона. Это дало бы пенальти в Брайере 0,59, что гораздо хуже, чем средний показатель 0,34, которого мы достигли, и поэтому наша модель позволила нам уменьшить пенальти на 0,59 - 0,34 = 0,25 по сравнению с прогнозом "без навыков". Процентное снижение составляет 0,25⁄ 0,59 = 43%, и это известно как Brier Skill Score (BSS), где оценка мастерства в 0% означает прогнозы, которые по сути не лучше случайных, а оценка мастерства в 100% означает идеальные прогнозы.

Оказалось также, что наш штраф в Брайере был несколько меньше, чем мы могли бы предположить , если бы вероятности в таблице 11.2 были "истинными" шансами каждого результата, и это подтвердило наше впечатление, что нам очень повезло. Как и некоторым людям, которые, вопреки нашим рекомендациям, сделали ставки на наш выбор.

К сожалению, удача нам не сопутствовала. На следующий год я попробовал повторить упражнение и сделал это неудачно. Мне следовало остановиться, пока я был впереди.

Прогнозирование погоды на следующую неделю

15 октября 1987 года уважаемый синоптик Би-би-си Майкл Фиш сказал во время эфира: "Женщина позвонила на Би-би-си и сказала, что слышала, что надвигается ураган. Если вы смотрите, не волнуйтесь, его нет". К несчастью для его репутации, на пути действительно был ураган, который за эту ночь убил 22 человека, повалил 15 миллионов деревьев, и нанес ущерб более чем на 2 миллиарда фунтов стерлингов.

Погода - классический пример хаотической системы, где сложные нелинейные процессы могут приводить к чрезвычайной чувствительности к начальным условиям. Прогнозы традиционно основывались человеческих суждениях, полученных из наблюдений на сети метеостанций, но к 1950-м годам компьютеры позволили делать численные прогнозы на основе моделей, представляющих движения атмосферы в виде математических уравнений, работающих на сетке. Это позволило получить единый детерминированный прогноз того типа, который был доступен Майклу Фишу в 1987 году, без какой-либо меры неопределенности.

Подстегнутые неудачей Великого шторма 1987 года, Тим Палмер и его команда из Европейского центра прогнозов погоды средней дальности (ECMWF) начали адаптировать подход Монте-Карло к этим моделям большой погоды. Запустив модель с пятьюдесятью различными наборами начальных условий, можно было изучить по сути пятьдесят различных "возможных вариантов будущего" - этот набор прогнозов известен как ансамбль. Когда они ретроспективно изучили данные за октябрь 1987 года и запустили модель с пятьюдесятью различными возмущениями начальных условий для полудня 13 октября, они обнаружили, что шестьдесят шесть часов спустя (в начале 16-го) многие из пятидесяти членов ансамбля показали существенную депрессию над югом Великобритании, причем более 30 % показали ураганные ветры в какой-то момент. 8 Майкл Фиш не был бы так уверен, если бы имел доступ к этой информации.

Ансамбли, по-видимому, являются естественным средством оценки неопределенности - если 20 из 50 членов ансамбля показывают дождь в определенное время и в определенном месте, то объявляют о 40-процентной вероятности дождя. Но, возвращаясь к постоянной теме этой книги, оценка вероятности должна быть хорошо откалибрована, так что в тех случаях, когда прогноз погоды объявляет о 40 % вероятности дождя, дождь должен идти примерно в 40 % случаев. Палмер описывает чрезвычайную сложность получения калиброванных вероятностей из ансамбля, поскольку простое случайное возмущение начальных условий не позволяет полностью изучить возможности, поскольку ансамбль будет слишком плотно сгруппирован, а утверждения будут слишком уверенными. Вместо этого возмущения должны быть намеренно сфокусированы на направлениях, в которых атмосфера наименее стабильна.

Ансамбли начали использоваться ECMWF в 1992 году и теперь стали стандартным способом составления вероятностных прогнозов . Когда речь заходит об оценке их качества, естественно вернуться к работе Глена Брайера над правилами подсчета очков, разработанными, когда вероятности были лишь субъективными суждениями. Как и в случае с нашими футбольными прогнозами, "мастерство" системы прогнозирования измеряется улучшением показателей пенальти по сравнению с базовым прогнозистом, не имеющим навыков. В футболе мы использовали средние долгосрочные пропорции каждого типа результата в качестве базовой линии, в то время как в прогнозировании погоды используются прогнозы, которые мы могли бы сделать на основе долгосрочных климатических условий, например, в какой пропорции мы ожидаем дождливых дней в это время года.

ECMWF сообщает, что их текущий показатель Brier Skill Score для прогнозирования осадков в Европе - % улучшения по сравнению с простым прогнозированием на основе климатических данных - составляет около 40% для двух дней вперед и 20% для семи дней вперед. 9 Это может звучать не очень хорошо, но этот показатель постоянно улучшается, поскольку компьютерные мощности позволяют более тонкую детализацию, и было бы неразумно ожидать почти идеального прогнозирования, необходимого для получения показателя мастерства, близкого к 100%.

Тем не менее, существует конкуренция со стороны принципиально иного подхода к моделированию, основанного на глубоком обучении, которое часто обозначается как искусственный интеллект (AI). При этом не делается попыток представить уравнениями физические процессы, лежащие в основе моделирования, а вместо этого строится сложная многослойная сеть, связывающая ряд погодных переменных. Например, версия GraphCast 2023 10 использует тридцать девять лет исторических данных для обучения сети с 37 миллионами параметров (небольшой по современным стандартам машинного обучения). Прогнозы, основанные, по сути, на черном ящике статистических ассоциаций, а не на причинно-следственной модели, как утверждается, имеют значительно более высокую квалификацию, чем стандартные системы при составлении детерминированных прогнозов. Версия GraphCast 2023 года не обрабатывает неопределенность, хотя исследователи утверждают, что это важный следующий шаг.

Со времен злополучного выступления Майкла Фиша все давно изменилось.

Предсказание Ковида на недели и месяцы вперед

Во время пандемии мы все познакомились с изображениями прогнозов (заметьте, не "предсказаний") числа случаев заболевания Ковид-19, госпитализаций и смертей в будущем. Как и при оценке R (глава 8), многочисленные команды строили модели, используя различные подходы, от подгонки кривых до сложных детерминированных моделей для всего населения. Часто прогнозы были представлены на сайте с (как правило, очень широкими) полосами неопределенности, хотя они обычно игнорировались комментаторами в СМИ.

В отличие от прогнозирования погоды, модели пандемии не особенно чувствительны к начальным условиям, но они чрезвычайно чувствительны к выбору структуры модели, как мы уже видели при оценке R, а также ко всем предположениям, которые необходимо сделать относительно характеристик последнего варианта вируса, эффективности вакцин и нелекарственных мер, таких как социальное дистанцирование. Еще более фундаментальное отличие заключается в том, что, опять же в отличие от погоды, на развитие пандемии сильно влияет поведение людей, а на это поведение могут повлиять обнародованные прогнозы, создавая петлю обратной связи. Таким образом, прогнозы чрезвычайно чувствительны к тому фактору, о котором известно меньше всего, - поведению людей в будущем. Эта чувствительность сделала необходимым, чтобы прогнозы были представлены как возможные сценарии, а не как предсказания или прогнозы, хотя именно так они часто интерпретируются.

Возможность недоразумений усугублялась еще и тем, что разработчики моделей в Великобритании, как правило, отвечали на запросы правительства о прогнозах с учетом определенных предпосылок, включая так называемые разумные сценарии планирования на худший случай (RWCS). Они обязательно пессимистичны, поэтому неудивительно, что события часто оказывались несколько лучше прогнозов. Это вызвало дополнительный скептицизм.

Проблема в том, что если разработчики моделей действительно учитывают все неопределенности параметров, в частности изменения в поведении людей, и допускают различные варианты моделей, то результирующие интервалы неопределенности для чего-то большего, чем несколько дней или недель, будут очень широкими, охватывая, по сути, все возможности. И тогда политики могут спросить - а что в этом хорошего? На что разработчики моделей могут ответить: перед нами поставлена невыполнимая задача - мы не можем с уверенностью сказать , что произойдет в долгосрочном будущем.

Иногда аналитикам лучше отказаться от попыток ответить на вопрос, на который нет ответа, и просто сказать: "Это зависит от ситуации".

Прогнозирование экономики на несколько лет вперед

В мае 2018 года Банк Англии опубликовал свой ежеквартальный отчет об инфляции, в котором содержались прогнозы годового изменения ВВП на ближайшие три года, представленные на рис. 11.1(a). 11

На сайте все оказалось совсем не так, как прогнозировалось. На рисунке 11.1(b) показано, что после пандемии Ковид-19 в первом квартале 2020 года ВВП временно резко упал, причем годовое сокращение составило 25 %, что значительно отличается от масштаба графика, построенного в мае 2018 года. На первый взгляд, это огромный провал прогнозов, показанных на рис. 11.1(а), так стоит ли считать Банк Англии "ошибающимся"? Все зависит от того, как они выражают неопределенность.

Комитет по денежно-кредитной политике (MPC) Банка использует веерные диаграммы (с некоторыми изменениями) с 1990-х годов, призванные подчеркнуть не только неопределенность будущего, но и настоящего и прошлого. На рис. 11.1(a) и (b) показаны текущие оценки роста в прошлом, сделанные Управлением национальной статистики (ONS), а значительная неопределенность отражает возможные пересмотры по мере поступления новых данных. Что касается будущего, то MPC заявляет, что "если бы экономические обстоятельства, идентичные сегодняшним, преобладали в 100 случаях, то, по наилучшему коллективному мнению MPC, зрелая оценка роста ВВП находилась бы в пределах темной центральной полосы только в 30 из этих случаев". Таким образом, в интерпретации MPC вероятность - это, по сути, ожидаемая частота возможных вариантов развития событий - как если бы мир был воспроизведен сто раз. Как мы видели в главе 3, это хорошо согласуется с пониманием Алана Тьюринга, Ричарда Фейнмана и других.

В основе "веера" лежит статистическая модель с явными предположениями о стабильности покупок активов банком, а затем корректируется на будущую неопределенность в соответствии с субъективным мнением MPC, которое основывается на размере исторических ошибок прогнозирования и суждениях о будущих рисках. Затем к центральным 90% их распределения подгоняется плавная кривая. 12 У полученных графиков есть две примечательные особенности:

Рисунок 11.1


(a) "Веерная диаграмма" Банка Англии, показывающая прогнозы будущего роста и оценки прошлого роста, опубликованная в мае 2018 года. Полосы показывают центральные интервалы вероятности 30%, 60% и 90%. (b) Веерная диаграмма от августа 2021 года, показывающая, что произошло после 2018 года. Обратите внимание на изменение вертикального масштаба.

OceanofPDF.com

MPC не дает центральной оценки будущего, предположительно, чтобы избежать излишнего внимания комментаторов к .

Хвосты распределения вероятностей не моделируются, MPC говорит: "А в остальных 10 случаях из 100 рост ВВП может оказаться за пределами зеленой зоны веерной диаграммы (серая зона)".

По сути, MPC дает 10 % вероятности того, что произойдет "что-то еще", а это значит, что его нельзя обвинить в "ошибке", когда он не смог предсказать экстремальные последствия финансового краха 2008 года или пандемии Ковида в 2020 году.

Прогнозы представляют собой сочетание моделирования на основе предположений и субъективной оценки - неопределенности типа А и типа В, если говорить языком метрологии, - оставляя при этом место для немоделируемых неизвестных. Они являются мощным инструментом коммуникации, хотя не все могут осознавать, что они оставляют открытой возможность масштабного кризиса . Веерные диаграммы также используются Европейским центральным банком, но они никогда не были популярны в средствах массовой информации и вышли из употребления в других центральных банках. fn4

Предсказание времени нашей жизни

Возможно, Галлей и имеет свою комету, но не поэтому он является героем для статистиков. В 1693 году он опубликовал в журнале Transactions of the Royal Society в Лондоне работу, в которой проанализировал данные о возрасте, в котором умерли человек в городе Бреслау (ныне Вроцлав в Польше) в период с 1687 по 1691 год. Идея "климактерического" возраста, в котором люди подвергаются особому риску смерти, существовала уже несколько веков - шестьдесят три года считались "большим климаксом", а значит, особенно опасными. Но никто не изучал данные, пока пастор Нейман из Бреслау не распространил свои записи по всей Европе. Рассматривая число умирающих в каждом возрасте, Галлей не только положил конец идее климактерических лет, но и, что очень важно, оценил долю умирающих в каждом возрасте среди тех, кто дожил до этого времени - это стало известно как сила смертности, хотя сейчас мы бы назвали это опасностью. fn5 Таким образом, он создал первую правильную таблицу жизни, показывающую предполагаемую вероятность дожить до каждого возраста - она доходила до восьмидесяти четырех, возраста, который, по его мнению, имел 2 % шансов на достижение.

Недавним нововведением конца 1600-х годов стала продажа аннуитетов в качестве способа сбора денег для правительства. , когда за один платеж клиента правительство гарантировало выплачивать ему фиксированную сумму каждый год до конца его жизни. Стандартом было взимание семикратной суммы ежегодного платежа, так что , например, если кто-то хотел получать 100 фунтов стерлингов в год до конца жизни, он должен был заплатить правительству 700 фунтов. Но это была ставка независимо от возраста клиента! Таким образом, аннуитеты могли принести огромные убытки, если бы их покупали более молодые и здоровые люди. Это был небольшой, но блестящий шаг Галлея - использовать свою таблицу продолжительности жизни для установления минимальной цены аннуитета, которая должна приносить прибыль государству. В работе Галлея, опубликованной в 1693 году, было показано, что покупатель в возрасте двадцати лет должен платить в 12,8 раза больше годового платежа, в возрасте пятидесяти лет - в 10,9 раза, а стандартная ставка "7 раз" должна предлагаться только людям старше шестидесяти пяти лет. Затем, начав заниматься аннуитетами (и страхованием жизни), Галлей вернулся к своей общей научной работе, разобрался со своей кометой и в качестве последнего достижения умер в возрасте восьмидесяти шести лет, на два года позже окончания срока своей жизни.

На рис. 11.2 представлена некоторая информация из текущих таблиц продолжительности жизни для Великобритании, в частности расчетные коэффициенты опасности (доля выживших, которые умирают в каждом году возраста) и соответствующее распределение возрастов смерти, которое представляет собой долю родившихся, которые, как ожидается, умрут в каждом году возраста, предполагая, что текущие опасности действуют в течение всей их жизни.

На рис. 11.2 (a) показано, что опасность резко возрастает с возрастом, хотя "всплеск" сразу после рождения на этой шкале незаметен. Ежегодный риск смерти у мужчин постоянно выше, чем у женщин, и примерно на 50 % выше в возрасте от сорока до восьмидесяти лет, что означает, что в каждом возрасте на каждые две женские смерти приходится три мужские.

Более глубокое понимание можно получить , представив эти данные в логарифмической шкале , как на рис. 11.2 (b). Эта шкала показывает относительно высокую смертность в первые годы жизни, как правило, из-за врожденных заболеваний или проблем при рождении, при этом ежегодный риск снижается до минимума в течение нескольких лет - поскольку ежегодно умирает лишь 1 из 15 000 девятилетних детей, это, возможно, самая безопасная группа людей всей истории человечества. После этого риск неумолимо растет - необдуманное поведение приводит к печальному росту, особенно у мужчин, в конце подросткового и начале двадцатого годов, а затем линии становятся довольно прямыми. Это закон Гомперца, впервые замеченный Бенджамином Гомперцем в 1825 году, fn6 и означающий, что среднегодовой риск смерти увеличивается с одинаковой скоростью - примерно на 9 % в год, то есть примерно удваивается на каждые восемь лет увеличения возраста.

Рисунок 11.2


Коэффициенты опасности (годовая вероятность смерти с учетом выживаемости на данный момент) в (а) линейной и (б) логарифмической шкале; (в) распределение возраста на момент смерти при условии сохранения текущих коэффициентов опасности на протяжении всей жизни. Таблицы продолжительности жизни в Великобритании, 2018-20 гг. для мужчин и женщин.

На рис. 11.2(c) показано распределение вероятностей возраста смерти, ожидаемого для человека, живущего с текущими средними опасностями. Среднее значение этих распределений - это ожидаемая продолжительность жизни при рождении, которая в настоящее время составляет восемьдесят три года для женщин и семьдесят девять лет для мужчин, в то время как мода распределений показывает наиболее распространенный возраст, в котором люди должны умереть, который составляет восемьдесят девять лет для женщин и восемьдесят шесть лет для мужчин - перекос распределения создает эту существенную разницу между средним значением и наиболее распространенным возрастом смерти.

Но где каждый из нас окажется на этой кривой?

Как долго вы (или я) собираетесь жить?

Ответ на этот вопрос может заинтересовать не только вас - именно его задают актуарии, когда определяют цены на аннуитеты и страхование жизни, опираясь на работу Галлея более чем 300-летней давности. Мы могли бы использовать данные таблицы жизни, чтобы составить распределение для возраста смерти среди людей, достигших вашего возраста. Но это предполагает, что эти риски применимы к вам, и что они будут продолжать применяться к вам в будущем. Оба предположения, как правило, неуместны.

Во-первых, опубликованные данные о рисках показывают, что среди всех людей, достигших каждого дня рождения, наблюдается доля тех, кто умирает в последующий год. Это описание популяции, и его можно рассматривать как среднестатистических рисков в каждом возрасте. Но большая часть риска смертности в популяции приходится на тех, кто уже болен, поэтому распределение риска в каждом возрасте будет сильно перекошено, а среднее арифметическое будет повышаться небольшой группой людей с очень высоким риском. Это означает, что риск "среднего человека" - медиана - значительно ниже, чем опубликованная опасность. Это может показаться парадоксальным, но у большинства людей риск ниже среднего.

Какой же будет ваша индивидуальная таблица жизни? Мы можем рассматривать опубликованные таблицы как базовые, в которых опасность может быть скорректирована в большую или меньшую сторону в соответствии с вашими индивидуальными факторами риска. Это известно как модель пропорционального риска. Например, у человека, выкуривающего двадцать сигарет в день, ежегодный риск смерти примерно в два раза выше, чем у некурящего, и это приводит к сокращению продолжительности жизни примерно на восемь-десять лет. На самом деле, приблизительное правило гласит, что то, что связано с увеличением риска на 10 % в год, например, сидячий образ жизни, эквивалентный просмотру двух часов телевизора в день, 13 сокращает продолжительность вашей жизни примерно на один год - мы будем использовать это позже, когда будем рассматривать коммуникацию хронических рисков в главе 14.

Все чаще звучат заявления о персонализированной оценке риска на основе генетики, обобщенной в так называемых полигенных баллах риска, но их значение может быть преувеличено, поскольку в целом они мало что добавляют к тому, что можно получить из базовой информации о возрасте, поле, образе жизни и семейной истории. 14 Например, в 2019 году тогдашний министр здравоохранения Англии Мэтт Хэнкок был "удивлен и обеспокоен" тем, что, согласно генетическому профилю, риск развития рака простаты у него к семидесяти пяти годам составил 15 %, и сказал: "По правде говоря, этот тест, возможно, спас мне жизнь". Но впоследствии это было широко высмеяно, 15 поскольку, по данным Cancer Research UK, рак простаты в любом случае будет диагностирован у каждого шестого британского мужчины в течение жизни. Возможно, персонализированные прогнозы для тех, у кого уже есть заболевание, имеют большую ценность . После того как в 2016 году у меня диагностировали рак простаты, мне с трудом удалось найти достоверную информацию о выживаемости таких людей, как я, хотя недавний алгоритм 16 оценивает 10-летнюю выживаемость до 2026 года примерно в 77 % (чего я, надеюсь, смогу достичь). fn7

Когда мы подаем заявление на страхование жизни и отмечаем галочками возраст, курение, семейную историю болезней и так далее, алгоритм страховой компании вносит эти поправки в вашу персональную таблицу жизни. Но каким бы тонким ни был анализ, он никогда не сможет дать реальную количественную оценку вашего риска (которого на самом деле не существует) - только то, что мы могли бы ожидать от группы людей, которые поставили те же галочки, что и вы.

Еще одна проблема с использованием таблиц жизни в качестве прогнозов заключается в том, что дают так называемую ожидаемую продолжительность жизни за период, которая основана на предположении, что текущие показатели опасности останутся такими же в будущем. Но если мы хотим оценить, как долго будет жить новорожденный, нам нужна когортная продолжительность жизни, которая учитывает прогнозы относительно развития опасных факторов.

В таблице 11.3 показано, что девочки, родившиеся в Англии и Уэльсе в 2020 году, в настоящее время в среднем ожидают, что они доживут до 90,3 года, а 19 % - до 100 лет, в то время как следующее поколение девочек, родившихся в 2045 году, по оценкам когорты, будет жить почти 93 года, а более чем каждая четвертая доживет до своего сотого дня рождения в 2145 году. Будем надеяться, что о каждой из них будет кому позаботиться.

Все эти оценки подвержены значительным колебаниям и неопределенности. Средняя продолжительность жизни в районах Великобритании с самым высоким уровнем депривации, таких как город Глазго, примерно на десять лет ниже, чем в более богатых районах, таких как Южный Кембриджшир. И даже до Ковида средняя продолжительность жизни сокращалась почти в 20 % населенных пунктов для женщин и примерно в 11 % населенных пунктов для мужчин. 17. Конечно, существует значительная неопределенность относительно того, что принесет будущее, поскольку на показатели смертности могут повлиять изменения климата, пандемии, конфликты и т. д. fn8 Модель UK Continuous Mortality Investiga tions, используемая страховой и пенсионной индустрией, позволяет пользователям делать свои собственные предположения, хотя их иллюстративные примеры предполагают постоянное ежегодное снижение уровня смертности на 1,5%, 19 что примерно соответствует дополнительным двум месяцам продолжительности жизни каждый год.


Период жизни - ожидаемая продолжительность жизни, предполагающая, что опасные факторы в год рождения сохраняются на протяжении всей жизни.

Когортная ожидаемая продолжительность жизни - с учетом изменений в опасных факторах

% достигает 100


Женщины, родившиеся в 2020 году

82.6

90.3

19%


Женщины, родившиеся в 2045 году

85.5

92.7

27%



Мужчины, родившиеся в 2020 году

78.6

87.5

14%


Родится в 2045 году

82.4

90.2


Таблица 11.3


Предполагаемая ожидаемая продолжительность жизни для периодов и когорт при рождении в 2020 и 2045 годах, Англия и Уэльс, с предполагаемым процентом тех, кто достигнет 100 лет. Управление национальной статистики Великобритании (ONS). 18

Как долго мы собираемся жить? В качестве примера я могу привести себя. На момент написания этой статьи мне семьдесят, и, согласно последним таблицам продолжительности жизни в Англии, ожидаемая продолжительность жизни мужчины этого возраста составляет еще пятнадцать лет, в результате чего я доживу до восьмидесяти пяти лет, с 26 % вероятностью до девяноста и 1 % - до сотого дня рождения. Но это только базовые показатели - я достаточно хорошо развит для своего возраста, не курю и не страдаю избыточным весом, но, с другой стороны, у меня все еще есть рак простаты. Давайте будем очень оптимистичными и предположим, что эти факторы нивелируются и опубликованные цифры относятся ко мне. Если мы предположим, что уровень смертности будет продолжать снижаться на актуарном уровне 1,5 % в год, , то ожидаемая продолжительность жизни моей когорты составит еще семнадцать лет, с вероятностью 34 % дожить до девяноста лет и 5 % - до ста.

На данный момент мне кажется, что девяноста более чем достаточно, но, конечно, я могу считать иначе, если доберусь до места.

Прогнозирование климата на годы вперед

Достигнет ли глобальное потепление катастрофических масштабов в этом столетии?

Сейчас мы подошли к тому периоду будущего, который некоторые из нас уже не переживут. Будущее климата стало главной общественной проблемой, а предсказания того, что может произойти при различных вариантах политики, не только приобрели политическую значимость, но и оказали глубокое влияние на жизнь многих заинтересованных людей. Однако это будущее по своей сути неопределенно.

Климатические модели можно рассматривать как обобщение моделей для краткосрочного прогнозирования погоды, поскольку они основаны на математических представлениях того, как будут развиваться те или иные аспекты мира в соответствии с физическими законами. Они учитывают не только движение атмосферы, но и динамику океанов, температуру суши, лед на суше и на море. Эти чрезвычайно сложные модели обязательно имеют гораздо более грубое представление, чем модели погоды , как во времени, так и в пространстве, так что они могут проследить изменения за столетие или более за практический промежуток времени. Они также отличаются тем, что не так чувствительны к начальным условиям, но будут чувствительны к "форсингам" (внешним воздействиям, таким как выбросы углерода) и предположениям о том, как будет реагировать климат. Как и в случае с погодной моделью, можно создавать ансамбли, представляющие возможные варианты развития событий, хотя различные члены ансамбля возникают в результате возмущений важных параметров модели, а не начальных условий.

В Шестом докладе об оценке (AR6) Межправительственной группы экспертов по изменению климата (МГЭИК) за 2019 год определены три основных источника неопределенности в отношении будущего климата: 20

Естественные и неизбежные колебания климата. Ее можно аппроксимировать с помощью ансамблей, но по сути она является неустранимой.

Политика и действия, предпринимаемые обществом. Для этого моделируются последствия различных сценариев, от агрессивной политики, которая приведет к нулевым выбросам углерода к середине этого века, до сценария "бизнес как обычно", при котором выбросы продолжают расти.

Как климат реагирует на действия общества. Это самая сложная часть, поскольку она включает в себя множество предположений о чувствительности климата к изменению выбросов и, в частности, о любых обратных связях в системе. Это часто называют "неопределенностью модели", хотя я уже говорил, что это неподходящий термин, поскольку ни одна модель никогда не может быть правильной. Лучше назвать это "нерешительностью модели".

Важнейший третий источник исследуется на сайте , где рассматриваются результаты более чем тридцати различных моделей, построенных командами по всему миру. Многие из этих моделей могут исходить из общего источника и иметь общие предубеждения, но в целом не существует надежного и прочного метода взвешивания моделей, поэтому по умолчанию используется один прогноз из каждой модели и изучаются различия между ними. Это известно как "ансамбль возможностей".

Как всегда, эти модели являются несовершенными, возможно, очень несовершенными, отображениями реальности. Поэтому для многих прогнозов МГЭИК использует прагматичный подход, изменяя интерпретацию рассчитанных интервалов неопределенности; кажущийся "очень вероятным" 90%-ный интервал (от 5% до 95%), полученный на основе разброса мультимодельного ансамбля, вместо этого рассматривается как "вероятный" 66%-ный интервал (от 17% до 83%) - это можно рассматривать как еще один пример добавления дополнительной субъективной неопределенности "типа B", чтобы учесть немоделируемые факторы.

Исключение составляет такая важная метрика, как глобальная температура приземного слоя воздуха (GSAT), где вместо довольно произвольной корректировки дополнительная неопределенность оценивается численно с использованием широкого спектра источников, включая качество соглашений с историческими наблюдениями. Некоторые этих расширенных интервалов показаны на рисунке 11.3 для различных сценариев.

Уровень глобального потепления выше 20C по сравнению с уровнями 1850-1900 годов был установлен Парижским климатическим соглашением в 2015 году в качестве предела, позволяющего избежать катастрофических последствий. Рисунок 11.3 показывает, что даже при сценарии умеренных выбросов SSP1-2.6, при котором чистый ноль будет достигнут примерно к 2050 году, этот порог все равно будет преодолен к концу века, хотя и со значительной неопределенностью. Однако при сценарии высоких выбросов (SSP3-7.0) этот порог с большой вероятностью будет превышен к 2040-м годам.

Климатические модели проделали огромную работу, и их результаты могут оказать серьезное влияние на общественные проблемы и политические решения. Но любые заявления должны сопровождаться как численными оценками неопределенности, так и должным смирением отношении моделей, даже если скептики пытаются воспользоваться этой неопределенностью для критики климатологии. По словам специалиста по климатическим моделям Дэвида Стейнфорта, "даже если модели могут воспроизвести историю климата, не стоит ожидать, что они достоверно расскажут нам о новом странном будущем, с которым мы сталкиваемся". 21 Далее Стейнфорт утверждает, что создание больших и более сложных моделей не обязательно приведет к более глубокому пониманию, и может ввести нас в заблуждение, заставив думать, что мы можем предсказать, что произойдет, поэтому "вместо того, чтобы пытаться сделать наши ответные меры в соответствии с климатом будущего, мы должны искать устойчивые и гибкие решения, средства, которые будут надежны в широком диапазоне возможных климатических исходов". Мы вернемся к этой точке зрения, когда перейдем к глубокой неопределенности в главе 13.

Рисунок 11.3


Расчетное повышение средней глобальной приземной температуры воздуха к 2081-2100 гг. по сравнению с 1995-2014 гг. и 1850-1900 гг. при различных сценариях выбросов. Заштрихованные полосы показывают рассчитанные "очень вероятные" диапазоны 5-95% для сценариев SSP1-2.6 (нижняя полоса - сценарий умеренных выбросов, достигающих чистого нуля во второй половине века) и SSP3-7.0 (верхняя полоса - сценарий высоких выбросов). Цифры рядом с обозначениями сценариев указывают на количество моделей, использованных в прогнозах. Оценки МГЭИК в 2019 году.

Мы рассмотрели широкий спектр областей, в которых предсказания используются регулярно, и настало время подвести итоги.

В то время как простые методы могут быть пригодны для краткосрочных прогнозов в контролируемых ситуациях, выросла целая индустрия, создающая все более сложные модели будущего. Многие из них используются для того, чтобы заработать деньги: компании, занимающиеся спортивными ставками, предсказывают результаты, используя как прошлые результаты, так и наблюдения за игрой; хедж-фонды строят сложные модели для изменчивости финансовых рынков, надеясь получить прибыль как от роста, так и от падения стоимости; а "предиктивная аналитика" используется для оптимизации бизнес-решений. Модели по-разному справляются с неопределенностью - некоторые из них полностью стохастические, например, модели финансовых временных рядов, а другие в основе своей детерминированы и имеют "прикрученную" неопределенность, например, модели погоды и некоторых пандемий.

Примеры, приведенные в этой главе, показывают, что неопределенность в моделях прогнозирования возникает из четырех основных источников:

Неизбежная алеаторная изменчивость, или случайность, которую невозможно уменьшить. Иногда это называют "случайной ошибкой".

Эпистемическая неопределенность в отношении параметров модели, как в настоящее время, так и в отношении того, могут ли они измениться в будущем.

Неопределенность, возникающая при выборе структуры модели - как уже говорилось, это не совсем неопределенность модели, поскольку не существует "истинной" модели, которую можно было бы когда-либо определить.

Систематическое расхождение любой модели с истиной, помимо неизбежной случайной ошибки. Ее можно уменьшить, построив более совершенную модель, но никогда нельзя устранить.

Мы видели, что когда будущее в решающей степени зависит от поведения людей, то мы должны чувствовать себя гораздо менее уверенно как в структуре модели, так и в соответствующих предположениях о параметрах. Кроме того, предположения, которые сейчас являются разумными в отношении параметров и структуры модели, в будущем могут перестать соответствовать действительности. Долгосрочные прогнозы Covid-19 в значительной степени зависят от сроков появления эффективной вакцины, а финансовые модели, возможно, хорошо работали в стабильный период, когда события коррелировали лишь слабо, но катастрофически провалились, когда надвигающийся финансовый кризис привел к массовому групповому поведению.

Как только мы признаем хрупкость конкретной модели, мы, возможно, не захотим с уверенностью выводить вероятности будущих событий. Поэтому нам остаются подходы, описанные ранее: выражение оговорок, проведение анализа чувствительности, привлечение нескольких команд, использование рейтингов доверия и, если необходимо, признание глубокой неопределенности. Также имеет смысл рассмотреть совокупность подходов, возможно, включая рынки предсказаний, субъективные суждения экспертов или даже суперпрогнозистов. 22

Прежде всего, с должным смирением относитесь к любым заявлениям и скептически относитесь к тем, кто утверждает, что их анализ подскажет вам, что произойдет.

Резюме

В хорошо контролируемых условиях простые статистические модели могут обеспечить надежные вероятности будущих событий.

По мере того как мы заглядываем все дальше в будущее, предположения о структуре и стабильности моделей становятся все более важными.

Неопределенность может быть добавлена к сложным детерминированным моделям путем запуска ансамблей, либо из различных начальных состояний, либо с возмущенными параметрами.

Даже если приложить все усилия, модели будут неадекватно отображать реальность.

Смирение необходимо, особенно когда будущее сильно зависит от поведения людей или других непостижимых факторов.

Для того чтобы разобраться в этом вопросе, можно использовать различные методы прогнозирования.

ГЛАВА 12

.

Риск, неудачи и катастрофы

Начнем с леденящего душу примера того, что может произойти в буквальном смысле слова в "идеальный шторм".

Почему затонуло судно MV Derbyshire?

MV Derbyshire был огромным балкером весом более 90 000 тонн, вдвое больше "Титаника", и 9 сентября 1980 года, во время тайфуна "Орхидея" у берегов Японии, он просто исчез. Не было получено никаких сигналов, не было найдено никаких спасательных шлюпок, и сорок четыре человека погибли на этом крупнейшем британском судне, когда-либо пропадавшем в море. Судно было современным, построенным по современным стандартам, и причина его гибели оставалась загадкой в течение двух десятилетий.

В 1994 году в результате поисковых работ было обнаружено затонувшее судно, которое находилось на глубине 4 км и было разбросано более чем на километр. Фотографические свидетельства показали, что люк, закрывающий грузовой отсек в передней части корабля, потерпел катастрофическое обрушение , и тогда встал вопрос о том, как достаточное давление попало на передний люк, чтобы вызвать его разрушение.

Для решения этой загадки потребовалась теория, зародившаяся более ста лет назад, когда исследователи британской хлопчатобумажной промышленности поняли, что риск разрыва нити зависит от прочности самых слабых волокон. Это означало, что статистики должны были не рассматривать среднюю прочность, а понять, насколько изменчива минимальная прочность набора волокон в нити. Это требует особой осторожности. Стандартное статистическое моделирование, как правило, направлено на объяснение или предсказание обычных явлений и поэтому фокусируется на типичных наблюдениях. Но, как мы видели в исследованиях по атрибуции климата, когда нас интересуют экстремальные значения, форма хвостов распределения вероятностей становится решающей. Так родилась теория экстремальных значений.

В своем вкладе в расследование гибели MV Derbyshire статистики Джанет Хеффернан и Джонатан Таун использовали теорию экстремальных значений для моделирования потенциального давления волн, используя данные экспериментов с масштабной моделью судна и оценки размера волн во время тайфуна. В частности, они предположили, что волны следуют тому, что на сайте известно как обобщенное распределение Парето, которое, как мы увидим ниже, допускает ранее невиданные экстремальные события. Они пришли к выводу, что если корабль получил некоторые повреждения в начале тайфуна, то весьма вероятно, что в какой-то момент произошел удар, достаточный для обрушения переднего люка. 1 "Шальная" волна высотой более 20 м могла ударить по кораблю и обрушить передний люк, после чего быстро обрушились остальные люки, и корабль затонул в считанные секунды. Корабль, по сути, взорвался, а затем, когда он затонул, взорвался из-за сжатого воздуха между корпусами, разбросав обломки по большой площади. Не было времени даже подать сигнал бедствия.

Спустя двадцать лет семьи погибших наконец узнали, что произошло.

Печальную историю MV Derbyshire можно было бы рассказать в главе 10, поскольку она посвящена попыткам приписать причины прошлым событиям. Но это подходящее вступление к обсуждению экстремальных ситуаций; землетрясения, наводнения, извержения вулканов, террористические акты и крупные финансовые кризисы - все это события с низкой вероятностью и высоким воздействием на общество, причем такого типа, который, возможно, никогда не происходил раньше.

На сайте можно найти множество потенциальных угроз, как для общества, так и для нас самих. Нас могут волновать экологические риски, связанные с изменением климата или экстремальными погодными явлениями, финансовые риски, связанные со стоимостью жизни и пенсиями, риски для здоровья, такие как рак или Covid-19, риски, связанные с современными технологиями, такими как ИИ, риски безопасности, связанные со злонамеренными актами насилия или преступлениями, и так далее, и так далее, вплоть до экзистенциальных угроз всему человечеству.

Все это может показаться немного чрезмерным, и неудивительно, что о том, как справиться с неопределенностью, связанной со всеми этими рисками, написано огромное количество книг, иллюстрирующих совершенно разные взгляды на предмет риска. Подходы подразделяются на несколько широких категорий, включая

Технический: Количественный анализ риска (QRA) пытается математически смоделировать вероятность и последствия событий, чтобы обеспечить числовой вклад в принятие решений.

Экономический: Согласно основным экономическим постулатам рациональности, с рисками можно справиться с помощью теории принятия решений в условиях неопределенности, к которой мы перейдем в главе 15. Однако она предполагает полностью определенную проблему, и даже это может быть поставлено под сомнение.

Психологический: в главе 1 мы уже видели, как восприятие рисков может зависеть от таких факторов, как знакомство, страх и т. д., а не от "реальной" вероятности причинения вреда, и мы знаем из собственного опыта, что ощущения угроз сложны и сильно варьируются.

Культурный: Группы людей могут иметь совершенно разные взгляды на то, как следует относиться к рискам в обществе. Во время пандемии Ковид-19 мы наблюдали крайности во мнениях: от "либертарианской" точки зрения , что индивидуальное поведение не должно предписываться государством, до более "иерархической" точки зрения, которая поощряла сильное вмешательство ради общего блага. Риск становится политическим.

Социология: В 1990-е годы после аварии на Чернобыльской АЭС возникла идея, что чисто технократический подход к оценке и управлению рисками неадекватен, поскольку в нем доминируют профессионалы с ограниченным кругозором и навязывают свое собственное мировоззрение . С тех пор все чаще признается социальный контекст риска, будь то расширение участия, учет справедливости и беспристрастности или признание взаимосвязи между глобальными угрозами.

Моя профессиональная подготовка как статистика означает, что я сосредоточен на более технических подходах к количественной оценке и информированию о рисках, но я признаю, что это необходимо с учетом знаний из области психологии и социологии. Они могут помочь понять, почему некоторые угрозы привлекают особое внимание и почему люди могут скептически относиться к математическому "рациональному" подходу к вещам, которые могут внушать страх и отвращение. Однако неизбежно, что обсуждение экстремальных событий может стать довольно техническим.

В главе 2 мы видели, что суперпрогнозисты могут хорошо оценивать вероятности для правдоподобного будущего, но когда речь идет о крошечных вероятностях экстремальных событий, мы можем ожидать, что чисто субъективная оценка будет плохой. Поэтому часто используют статистические модели, чтобы попытаться количественно оценить как низкие вероятности, так и высокие последствия, хотя эти модели могут иметь все те ограничения, о которых мы говорили ранее. В начале финансового кризиса в 2007 году газета Financial Times сообщила, что Дэвид Виниар из Goldman Sachs сказал: "Мы наблюдали события с 25-стандартным отклонением несколько дней подряд", что, если исходить из нормального распределения, является событием с вероятностью примерно один к 10135 (это 135 нулей). Для сравнения, шанс выиграть джекпот в текущей лотерее Великобритании 6/59 составляет примерно 1 к 45 миллионам, , так что событие с вероятностью один к 10135 равносильно выигрышу джекпота семнадцать раз подряд. Это убедительно свидетельствует о том, что финансовые модели были неадекватны в своем моделировании экстремальных ситуаций.

Оценка вероятности экстремальных событий в значительной степени зависит от формы хвостов распределения, и оказалось, что финансовые модели в основном предполагают нормальное распределение вероятностей, которое имеет очень "тонкие" хвосты. Но мы видели, что статистики используют широкий спектр распределений с "более толстыми" хвостами, чем у нормальной кривой, например обобщенную модель Парето, использованную для волн, обрушившихся на MV Derbyshire, хвост которой имеет форму закона мощности с параметром формы a, что означает, что распределение вероятностей уменьшается пропорционально 1/xa+1, где меньшее a соответствует более толстому хвосту. fn1

Хвосты закона мощности возникают во многих ситуациях, когда существенная вариация включает несколько очень больших случаев, таких как размер городов, количество сотрудников в фирме, доходность фондового рынка (с формой a около 3), в то время как распределение количества сексуальных партнеров в предыдущем году имеет форму около 2,5, что указывает на длинный хвост активности. 2 Еще в 1896 году Вильфредо Парето утверждал , что распределение богатства следует закону мощности, после того как заметил, что 80 % земли в Италии принадлежало 20 % людей (a около 1,2), а экономист Ксавье Габэ сообщает, что текущие параметры формы составляют около 1,5 для богатства и от 1,5 до 3 для дохода. Анализ более 13 000 террористических инцидентов в период с 1968 по 2007 год показал, что число жертв следует закону мощности с ≈ 2,4 (95% интервал от 2,3 до 2,5), 3 с очень длинным хвостом, отражающим случайные массовые смертельные случаи, такие как после теракта 11 сентября в Нью-Йорке. Это означает, что нападение, подобное 11 сентября, в результате которого погибло более 2 700 человек, не будет особым выбросом, а вероятность его возникновения в этот период оценивается в диапазоне от 11 до 35 %. Однако на оценку формы кривой терроризма, предположительно, повлияло событие 11 сентября, поэтому в данном расчете присутствует определенная круговая порука.

В предыдущей главе мы видели, что в мае 2018 года Банк Англии прогнозировал, что рост экономики в первом квартале 2020 года составит от 1 до 2 % в год, хотя нижний конец "веера" показывал, что они приписывают 0,05 вероятности падения более чем на 1 %. Фактическое падение в годовом исчислении составило 25 %. fn2

Мы подчеркнули, что Банк Англии явно избегает моделирования крайних точек своего распределения, но полезно посмотреть на последствия, если бы они сделали конкретные предположения о форме хвоста. На рис. 12.1 показаны четыре возможных варианта обобщенных распределений Парето с параметрами формы a = 1, 2 и 3 в сравнении с нормальным распределением.

На рис. 12.1 (a) показаны распределения изменения ВВП при падении более чем на 1%. Площадь под каждой из кривых равна 0,05, и невооруженным глазом видно, что они не особенно отличаются друг от друга. Однако если мы посмотрим на "вероятности превышения" на рис. 12.1(b), то увидим несколько иную картину - это вероятности того, что падение будет больше, чем значение на оси x. fn3 Каждая из них начинается 0,05, поскольку все кривые моделируют самые крайние 5% распределения. Но затем нормальное распределение быстро падает, исключая, по сути, экстремальные падения. В то время как распределения Парето с более толстым хвостом сохраняют разумную вероятность действительно экстремального события, причем кривая с параметром формы 1 дает 0,006 вероятности для падений, даже больших, чем наблюдаемое падение на 25 %. Еще одна интересная особенность распределения Парето заключается в том, что, если известно, что значение превысило определенный порог "провала" , его условное распределение все равно является распределением Парето с той же формой - если мы обусловливаем падение более чем на 1%, кривая с параметром формы 1 будет давать 0,12 вероятности, что падение будет больше, чем наблюдаемые 25% - другими словами, если мы собираемся столкнуться с экстремальным событием , опыт Covid не был особенно удивительным.

Загрузка...