Искажения: введение

Роб Бенсинджер


Это не тайна. Но почему-то это редко всплывает в разговорах и очень немногие спрашивают, что же нам с этим делать. Это шаблон, спрятанный за всеми нашими победами и поражениями, невидимый нашему глазу. Что же это?

Представьте себе урну с 70 белыми и 30 красными шарами; вы вытаскиваете 10 наугад. Возможно, 3 из них будут красными, и вы верно угадаете, сколько всего красных шаров в урне. Или, возможно, у вас будет 4 красных шара, а может быть, другое число. И тогда вы получите неверное общее число.

Эта случайная ошибка — цена за неполное знание, и это в целом неплохо, как и любая ошибка. В среднем наши оценки будут верны, и чем больше мы узнаём — тем меньше мы делаем ошибок.

Но предположим, что белые шары тяжелее и опускаются на дно урны. Тогда ваша выборка может быть нерепрезентативной постоянно.

Такие ошибки называются систематическими. Когда ваш метод познания мира искажён, изучение мира может вводить вас в заблуждение. Накопленные данные могут даже искажать предсказания. Для человека, привыкшего высоко ценить знания и способы их получения, это пугающая перспектива. Если мы хотим быть уверены, что познание помогает, а не делает всё только хуже, нужно узнавать об искажениях в наших данных и исправлять их.

Идея когнитивного искажения в психологии работает похожим образом. Когнитивное искажение — систематическая ошибка нашего мышления (в противоположность случайной ошибке, вызванной простым невежеством). Статистическая погрешность искажает выборку так, что она менее точно отражает положение дел. Когнитивные искажения же портят не выборку, а наши убеждения, и убеждения менее точно отражают факты; такие искажения вмешиваются в процесс принятия решений, и мы достигаем наших целей с меньшей надёжностью.

Возможно, вы оптимист, а красные шары можно использовать как лекарство от редкой тропической болезни, которую подхватил ваш брат. Тогда вы переоцените количество красных шаров в урне, потому что вам хочется, чтобы их было больше. И здесь искажена не выборка, а вы сами.

Тем не менее нужно быть осторожным, говоря про искажения в людях. Обычно мы имеем в виду, что люди нечестны или предвзяты. Но когнитивные искажения — это совершенно другое. Они — неотъемлемая часть человеческого мышления, а не дефект, который можно списать на воспитание или гнилой характер1.

Когнитивное искажение — это проторенная дорожка для ваших внутренних шаблонов мысли, по которой нельзя прийти к истине (или другой потенциально достижимой цели — например, счастью). Как и статистические погрешности, когнитивные искажения могут искривлять наше видение реальности, в большинстве случаев их нельзя исправить, просто собрав побольше данных, и их эффекты со временем суммируются. Но когда неточный инструмент, который нужно откалибровать, это вы сами — избавиться от искажений будет уникальным вызовом.

И тут возникает вполне очевидный вопрос. Если нельзя доверять своему мозгу, то как вообще чему-то можно доверять?

Хорошо бы иметь конкретное название для преодоления когнитивных искажений и вообще ошибок, которыми наши сознания могут себе навредить.

Мы могли бы назвать этот проект как угодно. Я считаю, что на данный момент название «рациональность» прекрасно подходит.

Рациональные чувства

Голливуд считает, что быть «рациональным» — значит суровым и гиперинтеллектуальным. Вспомните Спока из «Звёздного пути» — он «рационально» подавляет эмоции, «рационально» отказывается полагаться на интуицию, но его может легко сбить с толку «иррациональный» оппонент2.

Есть и другое определение «рациональности», которое используют математики, психологи и социологи. Грубо говоря, идея в том, чтобы действовать наилучшим возможным образом. Рациональный человек, даже если он не знаком с темой, формирует максимально близкие к реальности убеждения на основе имеющихся у него свидетельств. Неважно, насколько плохо идут дела у рационального человека — он делает наилучший возможный выбор и таким образом повышает свои шансы на успех.

Реальная рациональность состоит не в том, чтобы игнорировать интуицию и эмоции. Для рационального человека быть рациональным зачастую означает лучше осознать свои чувства и учитывать их при принятии решений.

Рациональность — это и знание о том, когда не нужно слишком долго размышлять. В экспериментах, где нужно было выбрать постер на стену или предсказать исход баскетбольного матча, испытуемые показывали худший результат, если старательно обдумывали своё решение. 3, 4 Есть задачи, решать которые лучше вдумчиво, и есть другие задачи, где лучше принять решение быстро. Психологи, работающие над теорией двух процессов, выделяют процесс «Система 1» (быстрое, неявное, ассоциативное, автоматическое суждение) и процесс «Система 2» (медленное, явное, интеллектуальное, подконтрольное суждение)5. Стереотипный рационалист целиком полагается на Систему 2, игнорируя чувства и импульсы. Если посмотреть не на стереотип, а на того, кто действительно рационален, кто достигает своих целей, кто действительно смягчает урон от когнитивных искажений, можно обнаружить, что он сильно полагается на привычки и интуицию Системы 1, в ситуациях, где на них можно положиться.

К сожалению, Система 1 является плохим помощником, когда надо определить «стоит ли сейчас доверять Системе 1?». Наша нетренированная интуиция не подскажет нам когда мы должны перестать полагаться на нее. Предвзятость и непредвзятость ощущаются одинаково6. С другой стороны, поведенческий экономист Дэн Ариели отмечает: мы предсказуемо иррациональны. Мы запарываемся одними и теми же способами, снова и снова, систематически.

Если мы не можем использовать инстинкт, чтобы понять, когда поддаемся когнитивному искажению, то можно использовать науки о разуме.

Многоликие Ошибки

В процессе эволюции наши мозги для решения задач научились применять когнитивные эвристики — грубые методы, которые позволяют получить ответ быстро. В большинстве случаев этот ответ оказывается правильным, но иногда — нет. Когнитивные искажения возникают в тех случаях, когда эти эвристики достаточно последовательно порождают ярко-выраженные ошибки.

Эвристика репрезентативности, например, является нашей склонностью оценивать феномен, основываясь на том, насколько он характерен по отношению к разным категориям. Это может вести к таким ошибкам, как конъюнктивное заблуждение. Тверский и Канеман обнаружили, что субъекты эксперимента считали менее вероятным, что сильный игрок в теннис «проиграет в первом сете», чем «проиграет в первом сете, но выиграет матч»7. То, что сильный игрок сможет отыграться, кажется более характерным, так что мы переоцениваем вероятность такого сложного-но-так-разумно-звучащего рассказа, по сравнению с вероятностью действительно простого сценария.

Также эвристика репрезентативности может быть частью нечувствительности к априорной вероятности, когда мы основываем наше суждение на том, насколько «нормальна» комбинация атрибутов, пренебрегая тем, насколько распространены атрибуты в популяции в целом8. Стив более вероятно является застенчивым библиотекарем, или застенчивым продавцом? Большинство людей будет думать над этим, анализируя насколько «застенчивость» сочетается с стереотипами этих профессий. Они терпят неудачу в том, чтобы учесть насколько больше продавцов в сравнении с библиотекарями в Соединенных Штатах9.

Среди других примеров искажений есть: игнорирование срока действия (оценка опыта без учета того, как долго он будет переживаться), заблуждение невозвратных затрат (чувство необходимости продолжать заниматься тем, на что уже потрачены силы и время, тогда как следует сжечь мосты и двигаться дальше), и ошибка подтверждения (придавать больше значения подтверждающим наши убеждения свидетельствам)10. Игнорирование вероятности — еще один пример когнитивного искажения. В течение месяцев и лет после атаки 11 сентября, множество людей предпочитали вождение на дальние расстояния полетам. Захват был маловероятен, но теперь чувствовалось, что он был одним из вариантов; всего лишь возможность захвата самолета сильно влияла на решения. Полагаясь на черно-белое мышление (машины и самолеты либо «безопасны» либо «опасны», и точка), люди подвергали себя еще большей опасности. В то время как им следовало взвешивать вероятности умереть в автомобильной аварии против смерти во время перелета через страну — первое гораздо более вероятно; они, вместо этого, полагались на общее чувство беспокойства и тревоги (аффективная эвристика).


Такой же поведенческий шаблон можно наблюдать и у детей, которые, слушая аргументы за и против ремней безопасности, мечутся между мыслями «ремень это хорошо» и «ремень это плохо», вместо взвешивания за и против11. Еще несколько примеров искажений: правило кульминации\завершения (оценка воспоминаний на основе самых интенсивных моментов и того, как они завершились); якорение (принятие решения, основываясь на недавно полученной информации, даже если она не относится к делу)12 и само-якорение (использование самого себя в качестве модели определения вероятных черт, не оценивая внимательно насколько вы атипичны)13; искажение «статус кво» (чрезмерная переоценка пользы нормального и ожидаемого, по сравнению с новым и другим)14.

Знание об искажениях редко может защитить от них. В ходе исследований слепоты по отношению к искажениям, субъекты эксперимента предсказали, что если они будут знать, что оцениваемая картина принадлежит кисти известного художника, им будет сложней нейтрально оценить качества этой картины. И, действительно, субъекты, которым сообщили имя автора картины и попросили оценить ее качество продемонстрировали действие искажения, которого они предсказали, относительно контрольной группы. Когда их опрашивали после, эти же субъекты заявляли, что их оценка картины была объективной и нетронутой искажением — и так во всех группах! 15. По аналогии, Пронин пишет на тему искажения гендерной слепоты:


В одном из исследований, участники оценивали мужские и женские кандидатуры на пост шефа полиции, и потом сравнивали пользу «знание жизни на улице» против «формального обучения». В результате, участники предпочитали то образование, которое получили мужские кандидаты (т.е. если им было сказано, что он «знает жизнь на улице», то это считали более важным). Участники были слепы по отношению искажению гендерного восприятия; действительно, чем объективней они себя считали, тем больше признаков искажения демонстрировали16. Даже если мы знаем об искажениях, замечает Пронин, мы остаемся «наивными реалистами», когда речь идет о наших собственных убеждениях. Мы быстро откатываемся на позицию оценки наших убеждений, как свободных от искажений представлений о реальности, такой, какая она на самом деле есть17.

Особенно отвратительна мысль о том, что именно наши убеждения ошибочны. Даже если мы корректно определим ошибки других, для своих у нас есть особое слепое пятно. Как показал опрос, проводившийся в аэропорту среди 76 ожидающих, люди оценивали себя, в среднем, как менее подверженных когнитивным искажениям, чем типичная персона в аэропорту. В частности, люди думали о себе, как о необычайно объективных, когда речь заходила об общественно порицаемых искажениях или искажениях с мало заметными в ближайшем времени последствиями 18. Другое исследование показало, что сильные чувства по отношению к проблеме воспринимались людьми как усиливающие понимание и объективность, если эти чувства испытывали опрашиваемые, если же речь заходила о других, то их, по мнению опрашиваемых, такие чувства делали менее объективными и более предвзятыми. Нам не удается заметить «ошибочно-чувствующиеся мысли», когда мы занимаемся самоанализом, так что мы полагаем себя более объективными, чем все остальные19.

Изучение искажений может сделать вас более уязвимыми для сверхуверенности и ошибки подтверждения, по мере того, как вы будете видеть влияние искажений у окружающих, но не у вас. И слепое пятно, в отличии от остальных искажений, особенно серьезно проявляется среди интеллектуальных, вдумчивых, непредубежденных20, 21.

И это причина для беспокойства.

И все же… Кажется, мы способны быть лучше. Известно, что мы способны снизить влияние нечувствительности к априорной вероятности, думая о вероятностях, как о частоте событий. Мы можем минимизировать игнорирование срока действия, уделяя внимание сроку действия и изображая его графически22. Люди различаются в том, как сильно у них проявляются различные искажения, так что должны существовать способы повлиять на наши заблуждения.

Однако, если мы хотим стать лучше, недостаточно просто создать список когнитивных искажений. Подход к устранению искажений в «Рациональности: от ИИ до Зомби» предполагает системное понимание того, как работает правильное мышление и как мозг отстает от него. В определенных границах, эта книга делает свою работу, ее подход может быть сравнен с тем, что описан у Серфаса, который заметил, что «годы работы в финансовом секторе» не влияют на уязвимость к заблуждению невозвратных затрат, тогда как «посещение некоторого количества курсов по бухгалтерскому учету» влияет.

Следовательно, следует различать опыт и компетентность, которая означает «развитие схематических принципов, включающих концептуальное понимание проблем», что, в свою очередь, позволяет лицу, принимающему решения, распознать конкретное искажение. Однако, использование контрмер компетентности требует большего, чем знание контекста проблемы и того, что вы являетесь экспертом в своем деле. Это требует полного понимания скрытой подоплеки конкретного искажения, способности заметить его, наличия соответствующих инструментов для нейтрализации искажения23.

Цель этой книги — заложить фундамент для создания рациональной компетентности. Что означает глубокое понимание структуры широкой проблемы: человеческие ошибки, самообман, и тысяча способов, как утонченная мысль может победить себя.

Слово об этом тексте

«Рациональность: от ИИ до Зомби» родилась в качестве серии эссе Элиезера Юдковского, опубликованных между 2006 и 2009 на экономическом блоге «Overcoming Bias» и побочном блоге «Less Wrong». Я работал с Юдковским вот уже год в Machine Intelligence Research Institute(MIRI), некоммерческой организации, основанной им в 2000 для исследования теоретических требований к созданию умней-чем-человеческого интеллекта (ИИ).

Читая его посты, я заинтересовался его работой. Он впечатлил меня способностью кратко передать идеи, выработка которых у меня занимала годы изучения аналитической философии. Ища пути соединить дух науки и скептицизма со строгим и системным подходом к исследованиям, Юдковский старается не только опровергнуть, но и понять ложные шаги и слепые пятна плохой философии (плохой недо-философии). Помогая собрать его эссе в книгу, я надеюсь облегчить погружение в них и понимание их как целого.

Получившийся в результате рациональный букварь полон личных деталей — Юдковский использует свой опыт общения со своей матерью, ортодоксальной иудейкой (психиатром) и отцом (физиком), разговорах в чате и рассылках. Читатели, знакомые с Юдковским по «Гарри Поттеру и Методам Рационального Мышления», его научно-ориентированной интерпретацией Гарри Поттера Дж. К. Роулинг, узнают элементы непочтительного иконоборчества, и основные концепты.

С точки зрения стилистики, эссе в этой книге представляют гамму от «жизнерадостный учебник» до «сборник вдумчивых виньеток» и «буйного манифеста», контент, соответственно, тоже отличается от эссе к эссе. В книге собраны сотни статей Юдковского в двадцать шесть «цепочек», как бы глав, связанных по смыслу постов. Цепочки же сгруппированы в шесть книг, раскрывающих темы:

Книга 1 - Карта и территория. Что такое убеждение и почему одни убеждения работают лучше других? Эти четыре цепочки объясняют Байесовские понятия рациональности, убеждений и свидетельств. Основная тема: штуки, которые мы называем «объяснениями» и «теориями», не всегда функционируют как карты для навигации по миру. В результате есть риск перепутать наши ментальные карты с другими инструментами.

Книга 2 - Как Действительно Изменить Свое Мнение. Штука, называемая «правдой», похоже полезная. Так почему же мы спешим с выводами, наступаем на те же грабли, повторяя те же ошибки? Почему мы так плохо умеем вырабатывать точные убеждения и как делать это лучше? В этих семи цепочках обсуждаются мотивированные рассуждения и ошибка подтверждения, особый фокус на образцах самообмана, которые трудно заметить, и ловушке «использования аргументов как солдат».

Книга 3 - Машина В Призраке. Почему мы не эволюционировали более рациональными? Даже при условии ограниченных ресурсов, похоже, мы могли бы получать больше эпистемической отдачи от наших свидетельств. Чтобы получить более реалистичную картину того, почему и как наш разум исполняет свои биологические функции, нам нужно залезть под капот и внимательно посмотреть как работает эволюция и наш мозг. Эти три цепочки иллюстрируют, как даже философы и ученые могут заблуждаться, если полагаются на интуитивное, не-техническое понимание эволюционных и психологический идей. Обозначив наши разумы внутри огромной целеполагающей системы, мы можем идентифицировать некоторые основы человеческого рассуждения и понять как эта система может «потерять цель».

Книга 4 - Всего Лишь Реальность. В каком мире мы живем? Каково наше место в нем? Основываясь на примерах работы эволюционных и когнитивных моделей из предыдущих цепочек, в этих шести цепочках мы исследуем природу ума и физического закона. В дополнение к применению и обобщению прошлых уроков о научных тайнах и скупости, эссе этой части поднимают новые вопросы о роли науки в рациональности отдельного индивида.

Книга 5 - Всего Лишь Доброта. Как что-то становится ценным — морально, эстетически или пруденциально? Эти три цепочки задаются вопросами о том, как мы можем оправдать, пересмотреть и принять наши ценности и желания. Цель — понять наши цели, не повредив их достижению. Самая сложная проблема: как понять, когда стоит доверять запутанному, сложному, работающему от случая к случаю импульсивному пониманию «хорошо» и «плохо», а когда заменить его на простые, не ведающие исключений, принципы.

Книга 6 - Становясь Сильней. Как люди и сообщества могут применить все это на практике? Эти три цепочки начинаются с автобиографической истории о самых серьезных философских промахах Юдковского, сочетающейся с советами о том, как другие люди могут избежать подобных. Книга заканчивается рекомендацией по разработке курса обучения прикладной рациональности, основанной (основана рациональность, а не рекомендация (прим. перев.)) на фактических данных. И по формированию групп и институтов для поддержки заинтересованных студентов, педагогов, исследователей и друзей.

Еще цепочки дополнены «интерлюдиями», эссе с личного сайта Юдковского (http://www.yudkowsky.net). Они связаны с разными цепочками, например, «Двенадцать добродетелей рациональности» лирически суммируют множество уроков «Рациональности: от ИИ до Зомби», и часто цитируются в эссе.

Кликнув на звездочку в конце каждого эссе, вы попадете на оригинальную версию с сайта Less Wrong (так можно оставить комментарий) или с сайта Юдковского. Также вы можете обнаружить словарь терминов на http://wiki.lesswrong.com/wiki/RAZ_Glossary.

Карта и территория

Первая книга начинается с цепочки о когнитивных искажениях: «Предсказуемо неправы». Книга не ограничена этой темой: плохие привычки и плохие идеи тоже имеют значение, даже если они становятся следствием содержания нашего разума, а не его структуры. Таким образом, эволюционировавшие и изобретенные будут показаны в цепочках, начиная с дискуссии в «Ложных Убеждениях» о том, как ожидания расходятся с декларированными убеждениями.

Оценка иррациональности была бы неполной без теории, описывающей рациональность, или если «теория» будет состоять из смутных трюизмов, без точного объяснительного механизма. Цепочка «Замечая замешательство» раскрывает вопрос: почему полезно основывать поведение на «рациональных» ожиданиях и как это ощущается изнутри.

Дальше, «Загадочные ответы» ставит вопрос: способна ли наука решить эти проблемы для нас. Ученые основывают свои модели на повторяемых экспериментах, а не на спекуляциях и слухах. Наука также имеет великолепную репутацию в сравнении с историями, религией и… Да в сравнении с чем угодно имеет. Стоит ли волноваться по поводу «ложных» убеждений, ошибки подтверждения, ошибки знания задним числом и им подобных, если мы работаем с сообществом людей, желающих объяснять феномены, а не рассказывать трогательные истории?

За этим следует «Простая Истина», отдельная аллегория о природе знания и убеждений.

Однако именно когнитивные искажения предоставляют наиболее ясное и прямое представление о нашей психологии, виды эвристик и логику наших ограничений. Именно с искажений мы и начнем. Строка в Чжуан-цзы, пре-Даосского философского трактата, гласит: «Ловушка для рыбы существует из-за рыбы, заполучив рыбу, ты можешь позабыть о ловушке» 24.

Приглашаю исследовать эту книгу именно в таком духе. Используйте ее так, как использовали бы ловушку для рыбы, всегда внимательно следя за целью, для которой вы ее используете. Берите то, что можете использовать, то, что будет полезным, остальное — отбросьте. И пусть ваша цель послужит вам верно.

Благодарности

Я чрезвычайно признателен Nate Soares, Elizabeth Tarleton, Paul Crowley, Brienne Strohl, Adam Freese, Helen Toner и десяткам волонтеров, вычитывавших эту книгу.

Отдельно от всей души хочу сказать спасибо Alex Vermeer, который помог довести эту книгу до конца, и Tsvi Benson-Tilsen, который прочел ее от корки до корки, чтобы убедиться в удобочитаемости и связности изложения.

Что такое рациональность

Элиезер Юдковский


Здесь под «рациональностью» имеется в виду:

Эпистемическая рациональность: образ действий и мыслей, укрепляющий соответствие между местностью и её когнитивной картой, корректировка убеждений в свете новой информации. Искусство обретения убеждений, согласующихся с реальностью настолько близко, насколько возможно. Это соответствие обычно называют «точностью», «правдивостью» или «правильностью», и нас удовлетворяет подобное обозначение.

Инструментальная рациональность: реализация ваших ценностей. «Ваших» не обязательно в смысле «личных» или «эгоистичных»: «твоей ценностью» может быть любая вещь, которая тебе небезразлична. Искусство направлять будущее в сторону более устраивающих тебя результатов. На LW это порой называется «выигрыванием».

Если это кажется довольно неплохим определением, вы можете прекратить чтение здесь; в ином случае продолжаем.

Временами экспериментальные психологи обнаруживают человеческие умозаключения, которые выглядят крайне удивительно — например, кто-то оценивает вероятность «Билл играет джаз» меньше, чем вероятность «Билл — бухгалтер, который играет джаз». Это выглядит странным суждением, так как любой играющий джаз бухгалтер — это явно человек, играющий джаз. Но к каким именно правилам мы обращаемся, называя данное суждение ошибочным?

Экспериментальные психологи применяют два золотых стандарта: теорию вероятностии теорию принятия решений. Поскольку в теории вероятности P(A) ≥ P(A & B), то суждение P(«Билл играет джаз» & «Билл — бухгалтер») > P(«Билл играет джаз») считается неверным.

Говоря формально, это утверждение не байесианское. Убеждения, соответствующие какому-либо логически непротиворечивому распределению вероятности, и решения, максимизирующие вероятностное ожидание логически непротиворечивой функции полезности, называются байесианскими.

Вопрос о том, как применять рациональность на практике, вовсе не исчерпывается этим абзацем. Причиной этому — два весомых обстоятельства.

Во-первых, байесианские алгоритмы «в чистом виде» плохо применимы к большинству задач реального мира из-за своей трудновычислимости. Математик, попытавшийся это сделать, столкнётся примерно с теми же проблемами, что и физик, попытавшийся предсказать поведение фондовой биржи, вычисляя траектории кварков.

Именно поэтому здесь вы видите целый сайт, а не просто список формальных аксиом с жирной точкой в конце. К тому же, совсем другое искусство необходимо для того, чтобы находить истину и достигать цели, находясь в недрах человеческого разума: нужно узнать о недостатках нашей когнитивной архитектуры, победить порождённые ей ошибки (искажения), сорвать с глаз все шоры самообмана, достигнуть хорошей эмоциональной формы перед тем, как столкнуться с истиной, избавиться от влияющих на решение посторонних факторов и так далее и тому подобное.

Во-вторых, иногда корректность самих формул вызывает сомнения. Правила теории вероятности получают удар от, скажем, задач на антропный принцип(English), где неизвестно число наблюдателей. Правила теории принятия решений разваливаются под действием, скажем, задачи Ньюкома(English), где другие агенты могут предсказать ваше решение до того, как оно было совершено.

В таких случаях бессмысленно придумывать альтернативное определение слова «рациональность» и надеяться, что это разрешит проблему. Фраза «Выбранный мною ответ, по определению, рационален» всего лишь создаёт новый вопрос: почему кого-то должно интересовать новое определение? Теорией вероятности пользуются не потому, что она была спущена с небес руками Святого Лапласа. Мы используем корректировку убеждений в байесианском стиле (с априорными вероятностями, выбранными согласно бритве Оккама) потому, что мы считаем, что этот образ мышления систематически приближает нас к точности: к карте, которая отражает местность.

(подробнее о диспутах, где фраза «по определению» выступает в качестве главного аргумента можно почитать здесь(English) и здесь(English))

Не стоит также забывать о вопросах из разряда «как мыслить?», ответов на которые нет ни в теории вероятности, ни в теории принятия решений. Например, какие чувства испытывать по отношению к правде после того, как она найдена? Определение и переопределение «рациональности» не в силах найти ответа, разве что лишь разрешить его.

Из «Двенадцати добродетелей рациональности»:

Как можно улучшить свое представление о рациональности? Явно не за счёт напевания мантры «мой долг — быть рациональным»; так можно лишь закрепить ошибочное представление. Возможно, твоё понимание рациональности состоит в том, что нужно верить словам Великого Учителя; Учитель говорит: «Небо зелёного цвета», ты поднимаешь глаза и видишь, что оно голубое. Если мысль «Можно подумать, что небо голубое, но суть рациональности состоит в доверии словам Великого Учителя» промелькнёт в твоём мозгу, то ты потеряешь шанс обнаружить свою ошибку.

Не спрашивай, как советует поступить Учение; вместо этого спрашивай, какого цвета небо. Чрезмерно говорящий об Учении не достигнет просветления.

Можно попытаться назвать самый главный принцип: например, «карта, отражающая местность» или «опыт успеха и поражений», или «байесианская теория принятия решений». Но ты мог ошибиться в описании безымянной добродетели. Как ты обнаружишь свой промах? Не благодаря тому, что ты сравнишь описание с самим собой, но благодаря тому, что ты сравнишь описанное с неописанным.

Споры о том, какое значение вкладывать в слово, — даже в такое важное слово, как «рациональность», — бессмысленны. Привязка последовательности букв к определённым понятиям нужно для того, чтобы позволить людям обмениваться информацией(English); для того, чтобы помочь перенести мысли из одного разума в другой. Манипулирование этими привязками не может изменить мир.

Если ты понимаешь, примерно в каком направлении мы показываем, говоря о «рациональности», «эпистемической рациональности» и «инструментальной рациональности», то обмен информацией между нами уже произошёл. Нельзя достичь большего, оставаясь в рамках спора об определениях. Пришло время говорить не о том, какое понятие лучше всего привязать к набору слогов «ра-ци-о-наль-ность», а о том, каким образом стоит думать.

С учётом всего этого, имей в виду, что многие из нас будут считать спорным — как минимум — любое ненормативное толкование слова «рациональность».

Например, говорящий «убеждение X рационально, но убеждение Y правдиво», скорее всего, использует слово «рационально» в не совсем принятом здесь смысле (например, считается, что рациональность должна быть логически последовательна при переходе к рефлексии: т.е. «рациональный» взгляд на информацию и «рациональное» моделирование того, как твой разум «рационально» обрабатывает эту информацию, не должны вести к двум разным выводам). Аналогично с «рационально сделать X, но правильно сделать Y» — «рационально» или «правильно» сказавшего это человека почти наверняка не «рационально» или «правильно» большей части читателей.

В таких случаях — да и в любых других случаях, когда слова можно понять превратно, — рекомендуется говорить более конкретно: «Предельно эгоистичный поступок — убежать, но я хотя бы попытался стащить девочку с рельс» или «Причинная теория принятия решений говорит, что в задаче Ньюкома нужно выбрать оба ящика, но я лучше заберу миллион долларов».

Как правило, фраза «X рационально» означает то же, что «я думаю, что X правдиво» или «я думаю, что X хорошо», но просто звучит чуточку более вычурно. Зачем нужны отдельное слово «рациональность», когда есть «правдивость» и «хорошесть»? Потому что так легче говорить о методичных техниках добычи правды и выигрывания.

В слове «рациональность» хватает подводных камней, но есть куча неграничных случаев, в которых это слово отлично выполняет свою коммуникативную функцию; в таких ситуациях не бойтесь его использовать.

Но всё же не стоит злоупотреблять этим словом. Нельзя заработать очки, просто громко произнеся его вслух. Чрезмерно говорящий об Учении не достигнет просветления.

Мне сегодня рационально

Элиезер Юдковский


Есть распространённое мнение, что рациональность противостоит эмоциям: все оттенки грусти и все оттенки радости автоматически нелогичны лишь потому, что это всего лишь чувства. Что удивительно, я не нашел ни одной теоремы в теории вероятностей, которая бы доказывала, что я должен быть холодным и бесчувственным.

Выходит, рациональность вообще не имеет отношения чувствам? Это не так, ведь наши эмоции порождаются нашими моделями реальности. Если я решу, что мой мёртвый брат воскрес, я обрадуюсь; если я проснусь и пойму, что это был сон, я буду расстроен. Пэт Ходжилл однажды сказала: «То, что может быть разрушено правдой, должно быть разрушено». Во сне я был счастлив, но правда этому счастью противоречила. Проснувшись, я ощутил грусть, но эта грусть рациональна: нет такой правды, которая могла бы её разрушить.

Рациональность начинается с вопроса «каков мир на самом деле и как он работает», но словно вирус, распространяется на любую другую мысль, зависящую от того, каков он, по нашим представлениям. Убеждения о том, каков мир на самом деле, могут включать все, что ты думаешь о реальности, что существует, а что нет, и что угодно из класса «вещи, которые могут заставить случаться другие вещи». Если ты считаешь, что в твоем чулане живёт гоблин, который привязывает друг к другу шнурки твоих ботинок, то это — убеждение о том, как работает мир. Шнурки реальны: их можно потрогать. Сущность, которая может их связать, тоже должна быть реальной: она — часть гигантской сети причин и следствий, которую мы называем «вселенной».

Чувство злости на гоблина, за то что он связал шнурки - это состояние разума, которое касается не только того, как работает мир. Если ты, скажем, буддист, или тебе сделали лоботомию, или ты просто родился очень флегматичным человеком, то действия гоблина тебя не разозлят. Это не влияет на твои ожидания: ты все еще уверен, что открыв чулан, увидишь пару ботинок, привязанных друг к другу шнурками. Зол ты или спокоен - это не должно влиять на твои прогнозы, поскольку твои эмоции не влияют на происходящее в чулане (хотя, конечно, может потребоваться некоторое усилие, чтобы рассуждать трезво).

Однако, злость сцеплена с состоянием разума, имеющим отношение к тому, как работает мир: ты злишься потому, что думаешь, что гоблин связал шнурки ботинок. Критерий рациональности рапространяется как вирус: от исходного вопроса, завязал ли гоблин шнурки, и до возникшей в итоге злости.

По мере улучшения представлений о том, каков мир на самом деле, эмоции могут как ослабнуть, так и усилиться. Иногда мы избегаем сильных эмоций, отрицая факты, прячась от мира, порождающего столь сильные эмоции. В таком случае, изучая искусство рациональности и тренируясь не отрицать факты, ты можешь заметить усиление эмоций.

Когда я начинал учиться рациональности, я постоянно сомневался, нормально лииспытывать сильные эмоции, допустимо ли это вообще, и правильно ли. Не думаю, что замешательство было вызвано только лишь моим неверным представлением о рациональности. Я встречал немало людей с подобными проблемами, и эти люди даже и не думали становиться рационалистами. Когда они были счастливы, они сомневались в своём праве быть счастливыми, а когда расстроены - не могли понять, нужно ли бороться с этой эмоцией. Ещё со времён Сократа (а возможно, и гораздо раньше) в кругу людей, считавших себя культурными и утончёнными, было не принято показывать, что вам что-то небезразлично. Испытывать чувства постыдно — в приличном обществе так просто не делают. Надо видеть взгляды, которые на меня бросают люди, узнав, насколько мне важна рациональность. И я подозреваю, что причина кроется не в необычности предмета интереса, а в том, что они не привыкли встречать здравомыслящих взрослых людей, которые демонстрируют, что им важно хоть что-то.

Но сейчас я знаю, что нет ничего постыдного в сильных эмоциях. Усвоив правило «То, что может быть разрушено правдой, должно быть разрушено», я также понял, что «То, что питается правдой, должно расцветать». Когда случается что-то хорошее, я счастлив, и не мучаюсь сомнениями, рационально ли быть счастливым. Когда случается что-то ужасное(English), я не бегу от печали, ища ложные утешения и фальшивые плюсы. Я представляю прошлое и будущее человечества, десятки миллиардов смертей на протяжении всей истории, горе и страх, поиск ответов, дрожащие руки, тянущиеся вверх из рек крови, то, чем мы можем стать в тот день, когда звёзды станут нашими городами, вся эта тьма и весь этот свет; я знаю, что я никогда не смогу полностью это понять, и я не знаю слов, которыми можно было бы передать эти мысли. Несмотря на всю мою философию, я всё ещё смущаюсь показывать сильные эмоции, а тебе, возможно, некомфортно видеть их проявления. Но теперь я знаю, что в чувствах нет ничего иррационального.

Зачем нужна истина?

Элиезер Юдковский


Некоторые комментаторы спрашивают меня, зачем необходимо искать истину (к счастью, почти никому не нужно объяснять, что есть истина). Желание сделать своё мировоззрение рациональным вырастает именно из стремления к истине, и уже благодаря этому желанию все мировоззрения можно разделить на «хорошие» и «плохие».

В «Двенадцати добродетелях рациональности» я писал: «Первая добродетель — любопытство». Любопытство — первая причина искать истину, и, несмотря на то, что эта причина не единственна, в ней есть особая восхитительная чистота. В глазах человека, движимого любопытством, приоритет вопроса зависит от его эстетической ценности. Сложный вопрос, где вероятность неудачи необычно высока, стоит больших усилий, чем простой, где ответ и без того ясен — ведь узнавать новое интересно.

Кто-то может возразить: «Любопытство — эмоция, а эмоции иррациональны». Я называю эмоцию «иррациональной», если она основана на ложных убеждениях или, точнее, поведении, неправильном в свете известной информации: «К твоему лицу подносят железо, и ты веришь, что оно раскалено, но можно видеть, что оно холодно — тогда Учение осуждает твой страх. К твоему лицу подносят железо, и ты веришь, что оно холодно, но можно видеть, что оно раскалено — тогда Учение осуждает твоё спокойствие». И наоборот: эмоцию, вызванную истинными убеждениями либо рациональным с точки зрения желания узнать истину мышлением можно назвать «рациональной эмоцией» (Поэтому удобно считать, что спокойствие — не абсолютный ноль шкалы, а тоже эмоция, не лучше и не хуже всех остальных).

Мне кажется, что люди, противопоставляющие «эмоции» и «рациональность», на самом деле говорят о Системе 1 — системе быстрых, основанных на восприятии суждений — и Системе 2 — системе медленных обоснованных суждений. Обоснованные суждения не всегда правдивы и интуитивные суждения не всегда ложны, поэтому важно не путать эту дихотомию с вопросом о рациональности и иррациональности. Обе системы могут служить как истине, так и самообману.

Что ещё заставляет искать истину, не считая любопытства? Желание достигнуть какой-то цели в реальном мире: например, братья Райт хотят построить самолёт и для этого им необходимо знать правду о законах аэродинамики. Или, более повседневно: я хочу шоколадного молока, и поэтому меня интересует, можно ли купить его в ближайшем магазине: тогда я смогу решить, пойти ли туда, или куда-нибудь ещё. В глазах человека, движимого прагматизмом, приоритет вопроса определяется ожидаемой полезностью ответа на него: степенью влияния на решения, важностью этих решений, вероятностью того, что ответ сместит итоговое решение в сторону от первоначального решения.

Поиск истины в прагматичных целях выглядит неблагородным — разве истина не ценна сама по себе? — но такие поиски очень важны, поскольку они создают внешний критерий проверки. Упавший на землю самолёт или отсутствие молока в магазине говорят о том, что ты сделал что-то неправильно. Ты получаешь обратную связь и можешь понять, какие методы мышления работают, а какие нет. Чистое любопытство прекрасно, но стоит найти ответ — оно исчезает вместе с поразительной загадкой, и ничто уже не заставляет проверять ответы. Любопытство — древняя эмоция, появившаяся задолго до древних греков, руководившая ещё предками их предков. Но легенды о богах и героях удовлетворяют любопытство ничуть не хуже результатов научных экспериментов, и очень долго никто не видел в этом ничего плохого. Лишь наблюдение «некоторые методы мышления отыскивают суждения, позволяющие управлять миром» уверенно направило человечество на путь науки.

Итак, есть любопытство, есть прагматизм, что ещё? Третья причина поиска истины, которая приходит мне в голову — честь. Вера в то, что отыскание истины благородно, нравственно и важно. Такой идеал приписывает истине внутреннюю ценность, но он не похож на любопытство. Мысль «Интересно, что за занавесом» ощущается не так, как мысль «Мой долг — заглянуть за занавес». Паладину истины легче верить в то, что за занавес должен заглянуть кто-то ещё, и легче осуждать кого-то за добровольное закрывание глаз. Из этих соображений я называю «честью» убеждение в том, что истина имеет практическую ценность для общества и поэтому её следует искать всем. Приоритеты паладина истины в отношении белых пятен карты определяются не полезностью и не интересностью, но важностью; кроме того, в одних ситуациях долг искать истину зовёт сильнее, чем в других.

Я с подозрением отношусь к долгу как мотивации для поиска истины: не потому, что идеал плох сам по себе, а потому, что из такого мировоззрения могут вытекать некоторые проблемы. Слишком легко приобрести в корне ошибочные методы мышления. Например, посмотрим на наивный архетип рациональности — мистера Спока из «Звёздного пути». Эмоциональное состояние Спока всегда зафиксировано на отметке «спокойствие», даже когда это совершенно неадекватно ситуации. Он часто сообщает чудовищно неоткалиброванные вероятности, называя при этом слишком много значащих цифр («Капитан! Если ты отправишь Энтерпрайз в эту чёрную дыру, то вероятность нашего выживания всего лишь 2,234%!» — и при этом в девяти случаях из десяти Энтерпрайз отделывается мелкими царапинами. Оценка отличается от реального значения на два порядка; каким идиотом надо быть, чтобы раз за разом называть четыре значащие цифры?). Но при этом многие люди, думая о «долге быть рациональным» представляют себе в качестве примера именно Спока — неудивительно, что они не принимают искренне такой идеал.

Если сделать рациональность моральным долгом, то она теряет все степени свободы и превращается в деспотичный первобытный обычай. Получившие неверный ответ люди возмущённо утверждают, что они действовали в точности по правилам, вместо того, чтобы учиться на ошибках.

Но всё же, если мы желаем стать более рациональными, чем наши предки охотники и собиратели, то нам необходимы обоснованные убеждения о том, как правильно мыслить. Написанные нами ментальные программы рождаются в Системе 2, системе медленных обдуманных решений, и очень медленно переселяются — если вообще переселяются — в цепи и сети нейронов, образующих Систему 1. Поэтому, если мы желаем избежатьнекоторых определённых типов рассуждений, — например, когнитивных искажений — то это желание остаётся внутри Системы 2 в качестве предписания сторониться нежелательных мыслей, превращается в своеобразный профессиональный долг.

Некоторые методы мышления помогают найти истину лучше, чем другие — это приёмы рациональности. Часть приёмов рациональности говорят о преодолении определённого класса препятствий, когнитивных искажений.

Что же такое искажение?

Элиезер Юдковский


Искажения — определённый вид препятствий на пути к истине (то есть их характер как препятствие мешает найти истину, но при этом существует множество других препятствий, искажениями не являющихся).

Если спросить «что такое искажение?» прямо сейчас, то вопрос будет задан слишком рано. Как говорится в английской поговорке, «существует сорок видов безумия, но лишь один вид здравого смысла». Истина — небольшая цель, компактная область в пространстве возможных конфигураций. «Любит она меня или нет?» — простой общий вопрос, однако E=mc2E=mc2 — всего лишь маленькая точка в пространстве всех возможных уравнений, словно выигрышный лотерейный билет в пространстве всех лотерейных билетов. В ошибке нет ничего исключительного, объяснения требует успех — настолько он невероятен априори.

Моральный долг «бороться с искажениями» (потому что искажения — плохие, злобные и Просто Неправильные штуки) — неверный подход к проблеме. Так может думать кто-то, кто приобрёл деонтологический долг «быть рациональным» в результате социального осмоса. Это порождает людей, пытающихся применять техники, не понимая стоящих за техниками причин (а это плохая, злобная и Просто Неправильная штука, если верить замечательной книге «Вы, конечно, шутите, мистер Фейнман»).

Подойдём к проблеме правильно.

По какой-то причине мы желаем попасть к истине, и по пути нам встречаются различные препятствия. Эти препятствия не сильно отличаются друг от друга: например, есть препятствия, имеющие отношение к недостатку вычислительных мощностей или к дороговизне информации. Большая группа препятствий разделяет общие черты — образует кластер в пространстве препятствий-на-пути-к-истине — и члены этого кластера называются искажениями.

Что такое искажение? Можно ли найти простой тест на принадлежность к этому эмпирическому кластеру? Может быть, мы так и не сможем найти объяснения, лучшего чем «показать пальцем на несколько ярких примеров и надеяться, что слушатель поймёт». Порой для учёного, только начавшего изучать огонь, мудрее сказать «огонь — это вон та яркая оранжевая штука», чем «я определяю огонь как алхимическую трансмутацию материи, выделяющую флогистон». Как я сказал в «Простой истине», нельзя игнорировать что-то лишь потому, что ты не знаешь, как это определить. Я не помню уравнения Общей Теории Относительности наизусть, но тем не менее, если я шагну с обрыва, то я упаду. То же самое можно сказать и про искажения — они не перестанут больно кусаться, если выяснится, что никто не может внятно объяснить, что такое «искажение». Поэтому вполне законно рассказать про ошибки в ситуации с логическим «И», эффект знания задним числом, сверхуверенность, эвристику доступности, ошибочную оценку поведения и гиперболическое обесценивание, а после сказать «Что-то типа этого».

Можно заметить, что мы называем «искажениями» те препятствия на пути к истине, которые созданы ни дороговизной информации, ни недостатком вычислительных мощностей, но формой ментального оборудования. Например, эволюция оптимизировала оборудование для целей, противостоящих эпистемологической точности (оборудование выигрывать политические споры). Или давление естественного отбора извратило желание добиться эпистемологической точности (вместо этого люди верят в то же, что и окружающие, приобретая благодаря этому союзников и друзей). Или классическая проблема эвристики, когда оборудование работает по понятному алгоритму, который обычно делает всё правильно, но временами совершает систематические ошибки. Сама по себе, эвристика доступности не является искажением, но она порождает характерные, компактно описываемые искажения. Человеческий мозг делает что-то неправильно, и проведя кучу экспериментов и/или хорошо подумав, кто-нибудь формулирует проблему на понятном Системе 2 языке — тогда мы называем эту ошибку «искажением». Даже если мы так и не узнаем большего, всё же ясно, что эта ошибка возникает — известным образом — из-за определённой формы когнитивного оборудования. Не из-за того, что оборудования слишком мало, а из-за того, что оно особой формы.

«Искажения» — это не ошибки, порождённые информацией внутри мозга (например, перенятые у кого-то убеждения или некого рода моральный долг). Они не называются «искажениями», и их намного проще исправить после того, как они замечены (тем не менее, источником ошибки, или источником источника ошибки, может быть и какое-либо искажение).

«Искажения» — это не ошибки, вызванные каким-то индивидуальным повреждением мозга или впитанными культурными нравами. «Искажения» — следствие работы механизмов, общих для всех людей.

Нельзя сказать «Платон страдал от когнитивных искажений, ведь он не знал теории относительности» — он не мог о ней узнать, его незнание было порождено не формой его ментального оборудования. Но если Платон считал, что лучшими правителями будут философы, из-за того что он сам был философом — а это убеждение, в свою очередь, возникло благодаря универсальному политическому инстинкту рекламировать себя, а не из-за того, что отец Платона говорил «долг каждого — говорить, что его профессия достойна занимать трон правителя», и не из-за того, что в детстве Платон нюхал слишком много клея — то тогда это значит, что Платон страдал от когнитивных искажений, и не имеет значения, знал ли об этом сам Платон.

Возможно, искажения трудно исправить. Возможно, они не исправляются в принципе. Но дело не в этом. Если, взглянув на своё ментальное оборудование, мы видим заурядный пример известного класса ошибок, и эта ошибка возникает из-за созданной эволюцией формы оборудования, а не из-за недостатка оборудования или плохого его содержимого, то мы называем её искажением.

Лично я вижу цель оттачивания навыков рационалиста в усилении способностей находить истину. Задание состоит в том, чтобы добраться до позитивной отметки (истины), а не в том, чтобы избежать негативной отметки (неудачи). Пространство неудач велико, там найдётся бесконечное множество ошибок в бесконечном их разнообразии. Трудно описать столь обширное пространство: «Свойство этого яблока может не быть свойством того яблока. Поэтому про одно яблоко можно рассказать большее, чем про все яблоки в мире». Пространство успеха меньше, и поэтому про него можно рассказать большее.

Я не питаю отвращения к разговорам об определениях, но нельзя забывать, что это не главная наша цель. Мы преследуем великую цель нахождения истины, нам отчаянно нужны знания, и кроме того, мы любопытны. Поэтому мы стремимся преодолеть все лежащие на пути препятствия, и без разницы, как мы их при этом называем.

Доступность

Элиезер Юдковский


Эвристика доступности - суждение о частоте или вероятности события по тому, насколько легко приходят на ум примеры данного события.

В известном исследовании 1978 года «Оценка частоты смертельных исходов»1 изучались ошибки при количественной оценке серьёзности рисков. Испытуемым называли два бедствия и спрашивали, какое из них происходит чаще. Испытуемые считали, что несчастные случаи уносят столько же жизней, сколько и болезни, думали, что убийство является более частой причиной смерти, нежели самоубийство. Хотя на самом деле, число умерших от болезней в шестнадцать раз превосходит число погибших от несчастного случая, а самоубийства происходят в два раза чаще убийств.

Очевидная гипотеза, объясняющая эти искажённые убеждения - что об убийствах чаще говорят, нежели о самоубийствах, и, таким образом, людям проще вспомнить разговор об убийце, нежели о суициднике. Несчастные случаи производят большее впечатление, нежели болезни - возможно, поэтому людям проще запомнить или вспомнить несчастный случай. В 1979 году, следующее исследование Комбса и Словика показало, что суждения с искажённой вероятностью сильно коррелируют (0.85 и 0.89) с искажёнными цифрами, которые были размещены в двух газетах2. Хотя это не проясняет, легче ли вспомнить убийства, потому что о них больше пишут, или же репортёры больше пишут об убийствах, потому что убийства производят большее впечатление (и поэтому легко запоминаются).

Но так или иначе, эвристика доступности тут присутствует. Избирательная отчётность - это один из основных источников искажений доступности. В родоплеменном окружении большая часть ваших знаний была основана на вашем личном опыте или же услышана напрямую от члена племени, который видел это. То есть между вами и фактом был максимум один слой избирательного сообщения. Сегодня, при помощи интернета, вы можете увидеть сообщения, которые проходят через шесть и более рук по пути к вам - шесть последовательных фильтров. По сравнению с нашими предками, мы живём в большем мире, в котором происходит больше событий, информации о которых к нам доходит меньше, поэтому эффект избирательности куда сильнее, что создает большие искажения доступности.

В реальной жизни, едва ли вы встречались с Биллом Гейтсом. Однако благодаря избирательным сообщениям от СМИ, у вас может появиться искушение сравнивать ваш жизненный успех с его - и страдать, соответственно, от полученного результата. Объективная частота встречи таких людей как Билл Гейтс - 0.00000000015, но слышите вы о нем куда чаще. И наоборот, 19% планеты живёт менее чем на один доллар в день, но я сомневаюсь, что хотя бы одна пятая тех постов, что вы сегодня читали, пишут о них.

Использование доступности, похоже, отвечает и за искажение абсурдности; события, которые никогда не происходили, нельзя вспомнить, вследствие чего их вероятность наступления начинает считаться нулевой. Если давно не было наводнений (а вероятности все еще считаются правильно), люди отказываются покупать страховку от наводнения, даже когда стоит она не больше, чем должна, а выплаты по ней немалые. Кунрейтер и соавторы в своём исследовании3 предполагают, что недооценка угрозы наводнения может происходить от «неспособности людей осмыслить концепцию наводнений, которых никогда не было…люди на затапливаемых равнинах, похоже, являются узниками своего опыта…недавно пережившие наводнение имеют тенденцию привязываться к верхней границе потерь, которую потом считают величиной, о которой и следует задумываться».

В исследовании Бёртона и соавторов4 говорится, что когда строятся дамбы и плотины, они уменьшают частоту наводнений, и, видимо, создают ложное ощущение безопасности, приводя к снижению мер безопасности, в то время как постройка дамб уменьшает частоту наводнений, но увеличивает ущерб от тех, что все же могут произойти (4). Мудрый человек экстраполировал бы из памяти о небольших угрозах возможность больши́х. Но вместо этого, прошлый опыт небольших угроз, похоже, устанавливает верхнюю «границу» риска. Общество, хорошо защищённое от малых угроз, не предпринимает действий против больши́х, расселяясь на затапливаемых равнинах как только риск небольших наводнений уходит. Общество рассматривает регулярные небольшие угрозы так, словно таких угроз большего размера не существует, предпринимая меры безопасности против регулярных небольших наводнений, но не против редких крупных наводнений.

Память не всегда хороший проводник даже для вычисления вероятностей прошедших событий, не говоря уже о будущих.

1.Lichtenstein, S., Slovic, P., Fischhoff, B., Layman, M. and Combs, B. 1978. Judged Frequency of Lethal Events. Journal of Experimental Psychology: Human Learning and Memory, 4(6), November: 551-78.

2.Combs, B. and Slovic, P. 1979. Causes of death: Biased newspaper coverage and biased judgments. Journalism Quarterly, 56: 837-843.

3.Kunreuther, H., Hogarth, R. and Meszaros, J. 1993. Insurer ambiguity and market failure. Journal of Risk and Uncertainty, 7: 71-87.

4.Burton, I., Kates, R. and White, G. 1978. Environment as Hazard. New York: Oxford University Press.

Обременительные детали

Элиезер Юдковский


«Простая подтверждающая подробность, чтобы добавить художественной правдоподобности в противном случае сухому и неубедительному рассказу…»

—Pooh-Bah, in Gilbert and Sullivan’s The Mikado (1).

Конъюнктивное заблуждение это когда люди оценивают вероятность P(A, B) выше вероятности P(B), несмотря на то, что доказано P(A, B) ≤ P(B). Например, в ходе эксперимента в 1981, 68% испытуемых эксперимента оценили «Рейган увеличит поддержку незамужних матерей и снизит поддержку местных администраций» выше, чем «Рейган увеличит поддержку незамужних матерей».

Длинная серия ловко разработанных экспериментов, отделивших альтернативные гипотезы и прибивших стандартную интерпретацию, показали, что конъюнктивное заблуждение возникает, потому что мы «подменяем суждением репрезентативности суждение о вероятности». Добавляя дополнительные детали, можно сделать итоги более похожими на процесс их производящий. Слова о том, что Рейган увеличит поддержку для незамужних матерей, будут звучать убедительней, если добавить утверждение о том, что Рейган снизит поддержку местных администраций. Неправдоподобность одного утверждения компенсируется правдоподобностью другого; они усредняются.

Поэтому и говорят: добавив деталей, можно сделать сценарий звучащим более правдоподобно, несмотря на то что события, в совокупности, станут менее вероятными.

Если это так, то мы можем легко найти футуристов, бессовестно распространяющих правдоподобные и детализированные сценарии будущего, или людей, легко принимающих огромные порции неподтвержденных утверждений, сдобренных несколькими звучащими сильно добавками. Если вы сталкиваетесь с конъюнктивным заблуждением лоб в лоб, вы, возможно, преуспеете в преодолении этой конкретной проблемы, постоянно поправляя себя. Но это лишь временное решение.

В эксперименте 1982 года профессиональные прогнозисты назначали систематически более высокие вероятности утверждению «Россия вторгнется в Польшу после приостановки дипломатических отношений между СССР и США», чем «Возникнет приостановка дипломатических отношений между СССР и США». В этом эксперименте каждую группу прогнозистов просили оценивать только одно утверждение (2). Какой стратегии эти прогнозисты, как группа, могли следовать, дабы исключить влияние конъюнктивного заблуждения, если никто не знал про альтернативное утверждение? Если никто не знал, что эксперимент и был про конъюнктивное заблуждение? Как они могли улучшить их суждения о вероятностях?

Вре́менные решения не помогут. Лечить нужно не симптомы, а болезнь.

Что прогнозисты могли предпринять во избежание конъюнктивного заблуждения, не видя с чем сравнивать, не зная даже о том, что тестироваться будет именно конъюнктивное заблуждение? Мне кажется, что им следовало заметить «и». С этим надо быть поосторожней, да не просто так, а бежать от него. Даже без знания, что исследователи специально тестировали их на конъюнктивное заблуждение. Им придется замечать соединение деталей, быть шокированными наглостью просьб оценить вероятности таких безумно сложных предсказаний. Им придется штрафовать вероятность существенно - как минимум в четыре раза, в соответствии с деталями эксперимента.

Размышления о возможных причинах приостановки дипломатических отношений между США и Советским Союзом так же помогли бы прогнозистам. «США и Советский Союз приостановили дипломатические отношения без причины» не являлся сценарием, им был «США и Советский Союз приостановили дипломатические отношения по любой причине».

Что насчет субъектов, оценивавших «Рейган увеличит поддержку незамужних матерей и снизит поддержку местных администраций»? Опять же, они должны быть шокированы союзом «и». Более того, им нужно сложить силу утверждений (логарифм вероятности со знаком минус), а не взять среднее. Им следует думать: «Рейган может снизить поддержку местных администраций, а может и не снизить (1 бит), но увеличение поддержки незамужних матерей кажется маловероятным (4 бита). Итоговая сила утверждения: 5 бит».1 Или: «Рейган не поддержит незамужних матерей. Один промах и он вне игры. Другое предположение только ухудшает дело».

По аналогии, давайте рассмотрим шестигранную игральную кость с четырьмя зелеными гранями и двумя красными. Испытуемым давали на выбор три серии исходов — 1 [КЗККК], 2 [ЗКЗККК] или 3 [ЗККККК] — и просили поставить на ту из них, которая с их точки зрения встретится в серии из двадцати бросков (3). Шестьдесят пять процентов испытуемых выбрали [ЗКЗККК], вероятность получения которой меньше, чем вероятность получения [КЗККК], так как любая серия, содержащая [ЗКЗККК] включает и [КЗККК]. Как испытуемые могли преуспеть больше? Заметив вкрапление? Возможно; но это лишь лечение симптома, оно не решит фундаментальной проблемы. Вычисляя вероятности? Это определенно решило бы фундаментальную проблему, но мы не всегда можем вычислить точную вероятность.

Испытуемые проиграли эвристически, думая: «Ага! Цепочка 2 имеет наибольшую пропорцию зеленых и красных! Я должен ставить на нее!» Чтобы выиграть эвристически, им следовало думать: «Ага! Цепочка 1 короче. Я должен ставить на нее!».

Бритва Оккама должна вызывать у них сильные эмоции - каждая деталь должна ощущаться как бремя, даже один поворот кости.

Однажды, я беседовал кое с кем, очарованным одним неосмотрительным футуристом (тем, который добавляет множество изящно звучащих деталей). Я пытался объяснить почему я не был так же очарован этими потрясающими, невероятными теориями. Так что я рассказал про конъюнктивное заблуждение, конкретно про эксперимент «приостановленные отношения ± вторжение в Польшу». И он сказал: «Ладно, но как это связано с -», и я ответил: «Более вероятно, что вселенная копируется по любой причине, чем что она копируется посредством черных дыр, которые создаются продвинутыми цивилизациями, созданных в результате эволюции этой вселенной для этой конкретной цели». И он сказал «Ох».

До этого он не ощущал дополнительные детали, как бремя. Вместо этого они были подтверждающими деталями, добавляющими художественной правдоподобности рассказу. Кто-то подает вам группу странных идей, одна из них - вселенная копируется. Далее, он предоставляет поддержку утверждению о копировании. Но это не поддержка группы, несмотря на то, что рассказывается, как одна история.

Вам следует распутывать детали. Следует рассматривать их отдельно и вопрошать: «Откуда мы знаем эту деталь?». Кто-то набрасывает картину падения человечества в нанотехнологическое столкновение, где Китай отказывается подчиняться международному соглашению о контроле, за этим следует гонка вооружений… Подождите-ка… Откуда вы знаете, что это будет Китай? Это хрустальный шар в вашем кармане или вы просто рады быть футуристом? Откуда взялись все эти детали? Откуда взялась эта конкретная деталь?

И было сказано: если можешь облегчить бремя свое, сделай это. Нет соломинки, что бессильна сломать твой хребет.

William S. Gilbert and Arthur Sullivan, The Mikado, Opera, 1885.

Tversky and Kahneman, “Extensional Versus Intuitive Reasoning.”

Amos Tversky and Daniel Kahneman, “Judgments of and by Representativeness,” in Judgment Under Uncertainty: Heuristics and Biases, ed. Daniel Kahneman, Paul Slovic, and Amos Tversky (New York: Cambridge University Press, 1982), 84–98.

1.Здесь «сила утверждения» — его двоичный логарифм со знаком минус; чем она больше, тем менее вероятно утверждение. В примере вероятности утверждений должны быть 1/2 и 1/16 соответственно, вероятность всего утверждения — 1/32. — Прим. перев.

Ошибка планирования

Элиезер Юдковский


Международный Аэропорт Денвера открылся на 16 месяцев позже, эта задержка стоила 2 млрд $ (я видел еще и предположение о 3,1 млрд $). Еврофайтер Тайфун, совместный оборонный проект нескольких европейских стран, был закончен 54-ю месяцами позже, стоимость составила 19 млрд $ вместо 7 млрд $. Сиднейский Оперный Театр, возможно, самый легендарный по превышению начальной стоимости проект. Изначально, оценка предполагала завершение в 1967 за 7 млн $, но в итоге был завершен в 1973 за 102 млн $. (1)

Неужели эти отдельные катастрофы привлекли наше внимание благодаря селективной доступности? Неужели они являются симптомами бюрократического или правительственного провала? Да, очень может быть. Но так же тут играет роль соответствующее когнитивное искажение, повторенное экспериментально с отдельными планирующими индивидуумами.

Бюлер и др. просили студентов оценить сроки сдачи своих академических проектов (2). Конкретно они просили сказать, когда проекты будут сданы с 50%, 75%, 99% вероятностью. Попробуйте догадаться сколько студентов закончили до или после оцененного в 50%, 75%, 99% вероятности срока сдачи?

• 13% испытуемых уложились в срок, оцененный с 50% вероятностью успеха.

• 19% уложились в срок, оцененный в 75% вероятности успеха.

• и лишь 45% (менее половины!) уложились в срок, оцененный в 99% вероятности успеха.

Как Бюлер и др. отметили: «Результаты оценки 99% вероятности особенно удивляют: даже если их просили сделать крайне осторожное предсказание, по отношению к которому они чувствовали бы сильную уверенность, самоуверенность студентов намного превзошла их реальные достижения (3).

В целом, этот феномен известен как «ошибка планирования». Ошибка

планирования - это когда люди думают, что могут планировать, ха, ха.

Ньюби-Кларк и др. нашли ключ к скрытой подоплеке алгоритма планирования. Обнаружили, что

• Просьба спрогнозировать сценарии на лучшей реалистичной догадке

и

• Просьба спрогнозировать сценарии на самом удачном стечении обстоятельств…

… Привели к неразличимым результатам (4).

Когда людей просили предоставить «реалистичный» сценарий, они воображали, что все пойдет как запланировано, без неожиданных задержек или непредвиденных катастроф - такой же сценарий, как и при самом удачном стечении обстоятельств.

Как оказалось, реальность преподносит обстоятельства хуже, чем «самое неудачное стечение обстоятельств», какое мы обычно воображаем.

В отличие от большинства когнитивных искажений, для борьбы с ошибкой планирования есть хорошая эвристика. Она не сработает для масштабного бардака вроде Международного Аэропорта Денвера, но пойдет для личного планирования или организации чего-то небольшого масштаба. Просто используйте «наружное наблюдение» вместо «взгляда изнутри».

У людей есть склонность генерировать предсказания, думая о конкретных, уникальных деталях задания, первыми приходящих на ум. И создавать сценарии того, как они будут выполнять задание - это мы, обычно, и называем планированием. Когда вы желаете, чтобы что-то было сделано, вам необходимо спланировать где, когда, и как; подумать сколько времени и ресурсов это потребует; визуализировать все шаги от начала до успешного завершения. Все это - «взгляд изнутри», и он не принимает в расчет неожиданные задержки и непредвиденные катастрофы. Как мы уже увидели, просьба визуализировать «худший сценарий» явно недостаточно сильно гасит оптимизм - они воображают недостаточно Мёрфично.

Взгляд снаружи - когда вы специально избегаете мыслей о конкретных, уникальных деталях проекта, и просто вопрошаете, сколько времени заняло завершение похожего проекта в прошлом. Это кажется контринтуитивным, ведь взгляд изнутри позволяет заметить больше деталей. Мысль об аккуратно сотканном предсказании, в котором было учтена вся доступная информация, выдающем лучшие результаты, искушает.

Но эксперименты показали: чем подробней испытуемые визуализировали, тем оптимистичнее (менее точными) они становились. Бюлер и др. просили испытуемых описать исключительно подробно их планы по шоппингу на Рождество: где, когда и как (5). В среднем, эта группа ожидала покончить с покупками менее чем за неделю до Рождества. Другую группу просто попросили сказать, когда они планируют купить необходимые рождественские подарки; средний ответ: четыре дня. Обе группы закончили в реальности за три дня до Рождества в среднем.

Точно так же, Бюлер и др. сообщили об исследовании, в котором японские студенты ожидали закончить их сочинения за десять дней до срока сдачи. Закончили же они за один день до срока. Когда их спрашивали о прошлых сочинениях, выяснилось, что они так же были закончены «за день до срока» (6). Такова сила взгляда снаружи против взгляда изнутри.

Похожее исследование свидетельствует, что опытные посторонние, знающие меньше деталей конкретного задания, но имеющие в памяти выполнение похожих, менее оптимистичны и более точны, чем те, кто проводит планирование.

Похоже, есть относительно надежный способ исправить ошибку планирования, если вам предстоит делать что-то похожее на то, что вы делали ранее. Просто задайтесь вопросом о том, сколько такие проекты длились в прошлом, игнорируя детали. Еще лучше: посоветуйтесь с опытным аутсайдером о том, сколько времени заняло выполнение похожих проектов в прошлом.

Вы получите ответ, который будет звучать отвратительно долгим, который, очевидно, был дан без учета всех особых причин по которым ваше конкретное задание будет выполнено быстрей. Но ответ остается правдой. Смиритесь.

Roger Buehler, Dale Griffin, and Michael Ross, “Inside the Planning Fallacy: The Causes and Consequences of Optimistic Time Predictions,” in Gilovich, Griffin, and Kahneman, Heuristics and Biases, 250–270.

Roger Buehler, Dale Griffin, and Michael Ross, “Exploring the ‘Planning Fallacy’: Why People Underestimate Their Task Completion Times,” Journal of Personality and Social Psychology 67,


no. 3 (1994): 366–381, doi:10.1037/0022-3514.67.3.366; Roger Buehler, Dale Griffin, and Michael Ross, “It’s About Time: Optimistic Predictions in Work and Love,” European Review of Social Psychology 6, no. 1 (1995): 1–32, doi:10.1080/14792779343000112.

Buehler, Griffin, and Ross, “Inside the Planning Fallacy.”

Ian R. Newby-Clark et al., “People Focus on Optimistic Scenarios and Disregard Pessimistic Scenarios While Predicting Task Completion Times,” Journal of Experimental Psychology: Applied


6, no. 3 (2000): 171–182, doi:10.1037/1076-898X.6.3.171.

Buehler, Griffin, and Ross, “Inside the Planning Fallacy.”

Ibid (?).

Иллюзия прозрачности: почему вас не понимают

Элиезер Юдковский


Существует когнитивное искажение «знание задним числом». Оно проявляется так: люди, знающие, чем закончилась ситуация, верят, что исход можно было легко предсказать заранее. Когда мы знаем результат, мы переосмысливаем ситуацию с учетом этого результата. Даже если мы знаем об этом искажении, мы не можем восприниматьситуацию так, как её воспринимает человек, который не знает того, что знаем мы.

С этим тесно связана иллюзия прозрачности: мы всегда знаем, что означают наши слова, и ожидаем, что остальные тоже это знают. Мы правильно понимаем смысл, читая написанное нами, обладая знаниями о том, что мы действительно имели в виду. Этим смыслом сложно поделиться с кем-то, кто будет руководствоваться лишь словами.

Джун порекомендовала ресторан Марку; Марк обедает там и обнаруживает, что там (а) посредственные еда и сервис или (б) вкусная еда и безупречный сервис. Затем Марк оставляет сообщение на автоответчик Джун: «Джун, я только что пообедал в ресторане, который ты мне порекомендовала, и я должен сказать, что это было изумительно, просто изумительно». Кейсар рассказал сценарий (а) группе людей, и 59% решило, что сообщение Марка было саркастическим и что Джун распознает сарказм.(1)

Среди тех, кому рассказали сценарий (б), только 3% решили, что Джун должна подумать о сообщении Марка как о саркастическом. Keysar и Barr, по видимому, указывают, что испытуемые слышали голосовое сообщение. Keysar показал, что если испытуемым сказали, что ресторан ужасен, но что Марк хотел скрыть свою реакцию, то они верили, что Джун не распознает сарказм в подобном сообщении.

Они предсказывали, что Джун должна распознать сарказм, когда Марк пытался скрыть негативную реакцию, так же легко, как когда он искренне хвалил ресторан. Так что они восприняли сообщение Марка прозрачным. Как будто они ожидали, что Джун поймет всё, что Марк захочет ей сказать.

«The goose hangs high» («Дело на мази») - старая английская идиома, которая не используется в современном языке. Keysar и Bly сказали группе испытуемых, что «the goose hangs high» означает, что будущее выглядит многообещающим; другой группе сказали, что она означает, что будущее кажется мрачным. Затем испытуемых спросили, какое значение из этих двух кажется более подходящим для идиомы. Каждая группа решила, что именно услышанный ими смысл будет восприниматься как значение идиомы.

(Также тестировались другие идиомы: “come the uncle over someone”, “to go by the board” и “to lay out in lavender”. Ах, английский, прелестный язык).

Кейсар и Хенли тестировали калибровку ораторов. Будут ли они недооценивать, переоценивать, или оценивать верно, как часто слушатели понимают их? (6). Ораторам были предоставлены туманные выражения («Мужчина преследует женщину на велосипеде») и «растуманивающие» изображения (мужчина бежит за женщиной, которая едет на велосипеде). Ораторов попросили произнести выражения перед аудиторией и оценить, как много слушателей поняли вложенный смысл. Ораторы думали, что были поняты в 72% случаев, тогда как в настоящая цифра - 61%. Когда слушатели не понимали, ораторы оценивали понимание в 46%. Когда слушатели понимали, ораторы оценивали непонимание в 12%.

Другие субъекты, подслушавшие объяснение, показали отсутствие таких ошибок: они оценивали понимание в 56%.

Как заметили Кейсар и Барр, за два дня до атаки Германии на Польшу, Чемберлен послал письмо, вложив туда намерение показать, что Британия вступит в бой, если вторжение состоится (7). Письмо, составленное из дипломатичных выражений, было воспринято Гитлером как примирительное - и танки поехали.

Так что не стоит винить тех, кто не понял твои очевидные слова, в разговоре или письменно. Есть шанс, что твои слова более туманны, чем кажутся.

Boaz Keysar, “The Illusory Transparency of Intention: Linguistic Perspective Taking in Text,” Cognitive Psychology 26 (2 1994): 165–208, doi:10.1006/cogp.1994.1006.

Keysar and Barr, “Self-Anchoring in Conversation.”

Boaz Keysar, “Language Users as Problem Solvers: Just What Ambiguity Problem Do They Solve?,” in Social and Cognitive Approaches to Interpersonal Communication, ed. Susan R. Fussell and Roger J. Kreuz (Mahwah, NJ: Lawrence Erlbaum Associates, 1998), 175–200.

Keysar and Barr, “Self-Anchoring in Conversation.”

Boaz Keysar and Bridget Bly, “Intuitions of the Transparency of Idioms: Can One Keep a Secret by Spilling the Beans?,” Journal of Memory and Language 34 (1 1995): 89–109,


doi:10.1006/jmla.1995.1005.

Boaz Keysar and Anne S. Henly, “Speakers’ Overestimation of Their Effectiveness,” Psychological Science 13 (3 2002): 207–212, doi:10.1111/1467-9280.00439.

Keysar and Barr, “Self-Anchoring in Conversation.”

Ожидая короткие понятийные расстояния

Элиезер Юдковский



Эволюция приспособила

homo sapiens к жизни в маленьких (

не более 200 человек

)

племенах охотников и собирателей

, не знающих письменности. В этих условиях — в так называемой «среде эволюционной адаптации» — всё накопленное знание сохранялось в памяти и передавалось устно.

В таком мире все фундаментальные знания — всеобщи. Любая информация, которую нельзя назвать строго приватной, является публичной, и из этого правила нет исключений.

В среде эволюционной адаптации было очень маловероятным оказаться от кого-то на расстоянии, большем чем один понятийный шаг, одно логическое умозаключение. Когда ты обнаруживал новый оазис, тебе не надо было рассказывать своим соплеменникам, что такое оазис, или почему стоит пить воду, или как перемещать ноги для того, чтобы ходить. Где находится оазис, знаешь только ты; это знание приватно. Но у всех остальных уже есть предпосылки для того, чтобы понять описание оазиса, все уже владеют понятиями, необходимыми, чтобы думать о воде; это знание универсально. В тех редких случаях, когда какие-то объяснения были необходимы, тебе

почти никогда

не нужно было разъяснять свои понятия. В самом худшем случае, нужно было рассказать об одном новом понятии, но не о двух (или больше) одновременно.

В среде эволюционной адаптации не было абстрактных дисциплин, сжимавших огромные кучи свидетельств в элегантные теории, описанные в книгах, выводы которых

на десятки понятий и сотни умозаключений удалены

от всеобщего информационного фундамента.

В среде эволюционной адаптации лишь лгуны или идиоты пытаются рассказывать о вещах, обоснование которых не очевидно. У их слушателей вряд ли возникнет мысль о том, что, возможно, этот парень располагает какой-либо достоверной фундаментальной информацией, неизвестной никому в твоём окружении. Невозможность такого положения дел была надёжной неизменной характеристикой среды эволюционной адаптации.

И наоборот, если ты сказал что-то вопиюще очевидное, а твой собеседник с этим не согласился, то он либо идиот, либо намеренно упирается с целью позлить тебя.

И к тому же, если кто-то рассказывает о какой-то вещи, обоснование которой не очевидно, а затем ждёт от тебя понимания и поддержки, — и возмущается, не найдя их — то он явно безумен.

И я думаю, что этот эффект (вкупе с

иллюзией прозрачности

и

самоякорением

(English)) объясняет

многие

аспекты тех легендарных затруднений, с которыми сталкиваются учёные, пытающиеся общаться с обывателями (или даже просто с учёными из других областей науки). Я часто вижу следующую картину: объяснение не удаётся. Популяризатор науки делает

один

шаг назад, хотя правильным было бы сделать два, или даже больше шагов назад. Слушатель же, в свою очередь, считает, что всё должно стать понятным через один шаг, хотя на самом деле для этого необходимо больше шагов. Обе стороны ведут себя так, словно понятийное расстояние между ними очень мало; будто бы всеобщие знания очень близки к любому новому знанию.

Биолог, говоря с физиком, может обосновать теорию эволюции, сказав, что она — «простейшее объяснение». Но легендарная история науки не впиталась в души большинства остальных людей; они не видят этих столетий, от Ньютона до Эйнштейна, подаривших фразе «простейшее объяснение» весь её потрясающий смысл, превративших её в Слово Силы, что произносится при рождении теорий и высекается на их надгробных камнях. Для не-учёного фраза «но это — простейшее объяснение!» звучит, как любопытный, но вряд ли решающий аргумент; простота не выглядит могущественным инструментом для постижения офисных интриг или для починки автомобиля. Должно быть, биолог слишком ослеплён любовью к своим идеям для того, чтобы непредвзято взглянуть на альтернативные объяснения, которые звучат настолько же убедительно (они звучат убедительно для меня, поэтому они должны звучать убедительно для любого человека из моего окружения).

Биолог может понять, что впервые теория эволюции звучит странновато. Однако, если кто-то отвергает эволюцию даже после того, как биолог рассказал, что это наиболее простое объяснение и пояснил, почему… Ну, видимо, не-учёные просто глупы, и нет смысла с ними разговаривать.

Хорошее выступление должно

проложить понятийный путь

, начинающийся от позиций, которые аудитория

уже знает или принимает

. Если ты задашь недостаточную глубину рекурсии, то в итоге ты будешь просто разговаривать сам с собой.

Каждое новое заявление должно очевидным образом опираться на аргументы, сказанные тобой ранее и принятые аудиторией. Как только эта цепочка нарушается, аудитория начинает считать тебя жертвой секты.

То же самое произойдёт, если ты позволишь себе опираться на аргумент более сильно, чем готовы разрешить слушатели. Например, если ты посчитаешь фразу «эволюция — простейшее объяснение» решающим аргументом (таким она и является), а не любопытным, чуточку забавным нюансом (так она выглядит в глазах человека, не привыкшего чтить Бритву Оккама).

И не давай слушателям намёков на то, что ты считаешь их отставшими от тебя на дюжину понятийных шагов, или то, что ты думаешь, что располагаешь какими-то особыми неизвестными им фундаментальными знаниями. Слушатели не знают о том, что эволюционная психология предсказывает существование дефекта мышления, ведущего к недооценке понятийных расстояний. Они не думают, что у пробок на дороге общения есть какая-то особенная причина. Поэтому их просто будет раздражать твоя снисходительность.

И если ты считаешь, что можешь кратко объяснить понятие «систематической недооценки понятийных расстояний», быстренько бросив пару слов, то вынужден тебя огорчить…

Линза, видящая свои изъяны

Элиезер Юдковский


Свет покидает Солнце, ударяется о шнурки и отпрыгивает прочь; некоторые фотоны входят в зрачок и попадают на сетчатку; энергия фотонов запускает волну нервных импульсов; нервные импульсы доходят до зрительной коры, где на основе оптической информации строится трёхмерная модель, распознанная как развязанные шнурки; и теперь ты убеждён в том, что твои шнурки и в самом деле развязаны.

Вот секрет осознанной рациональности: в этом процессе передачи сцепленности нет ничего магического, и его можно понять. Ты можешь понять, как ты видишь свои шнурки. Ты можешь думать о том, какие когнитивные процессы создают убеждения, отражающие реальность, и какие когнитивные процессы — нет.

Мыши могут видеть, но они не могут понять зрения. Ты можешь понять зрение, и поэтому ты способен на вещи, которые мышам и не снились. Подивись этому несколько секунд, ведь это действительно чудо.

Мыши видят, но они не знают, что у них есть зрительная кора, и поэтому они не могут систематически бороться с оптическими иллюзиями. Мышь живёт в ментальном мире, где есть кошки, дыры, сыр и мышеловки, — но нет мышиных мозгов. Их камеры не могут сфотографировать линзы собственного объектива. Но люди могут посмотреть на причудливую картину и осознать, что часть того, что они видят, является линзами их объектива. Ты не обязан всегда верить своим глазам, но ты обязан понимать, что у тебя есть глаза — у тебя должны быть отдельные участки памяти для карты и для местности, для чувств и реальности. Если ты считаешь этот навык тривиальным, вспомни, насколько он редок в царстве животных.

Вся идея Науки — это, в сущности, поиск наиболее надёжного способа отразить в зеркале разума содержимое целого мира. Мыши никогда не смогли бы изобрести такую идею. Размышляя о всех вопросах вроде «мы проводим повторяемые эксперименты, чтобы фальсифицировать теорию», мы можем разобраться, почему именно наука работает. Наука — это не отдельный магистерий, далёкий от реальной жизни и непонятный для простых смертных. Нельзя сказать, что науку можно применять только в лабораториях. Наука — это постижимый и объективно существующий процесс, который связывает содержимое мозга с реальностью.

Наука довольно логична, если как следует о ней подумать. Но мыши не могут думать о мышлении, и поэтому у них нет науки. Не проглядите заключённого в этом чуда, не упустите потенциальной мощи, которую нам дарит этот факт. Нам — в смысле «личностям», а не «научным сообществам».

Нужно признать, что задача понять мыслительный механизм может быть сложнее задачи понять часовой механизм — но между этими задачами нет фундаментальных различий.

Однажды я спросил посетителей канала #philosophy: «Верите ли вы в то, что ядерная война случится в течение ближайших 20 лет? Если нет, то почему?». Один человек сказал: «Я не думаю, что в ближайшие 100 лет начнётся ядерная война: все игроки, участвующие в принятии подобных решений, сейчас в ней не заинтересованны». Я спросил: «Но почему ты считаешь, что ситуация сохранится в течении 100 лет?». «Просто надежда», ответил он.

Если поразмыслить об этом мыслительном процессе, то можно увидеть, что перспектива ядерной войны пугает этого человека, и поэтому его мозг отвергает соответствующее убеждение. Но если представить себе миллиард миров — ответвления Эверетта или дупликаты Тегмарка(English) — то станет ясно, что такие размышления не создают корреляции между оптимистами и мирами без ядерной войны, как должно было бы быть, если бы они были бы рациональными.

(В этот момент у кого-то может появится соблазн сказать «Но если у меня есть надежда, я буду работать лучше, заработаю больше денег, тем самым помогу мировой экономике, и в результате страны будет не так просто столкнуть в пучину злобы, бедности и отчаяния, когда возможность ядерной войны всерьёз угрожает будущему. Получается, что надежда имеет отношение к реальности». Раз уж дошло до такого, мне придётся вытащить теорему Байеса и количественно измерить силу этого свидетельства. Оптимизм не может иметь столь огромный эффект на мире; его недостаточно для того, чтобы сместить вероятность ядерной войны на 20%, или насколько там оптимизм смещает степень убеждённости. Сильно изменять свои убеждения из-за события, несущего очень малый заряд сцепленности — практика, не способствующая точному картографированию.)

Задуматься о том, какие убеждения сделают тебя счастливым — посмотреть внутрь, а не наружу. Ответ может сказать что-то новое о твоей психике, но это не свидетельство, сцепленное с окружением. Я не имею ничего против счастья, но счастье должно порождаться картиной мира, а не преступным использованием ментальных карандашей в целях сокрытия правды.

Если ты можешь это увидеть — если ты можешь заметить, что надежда слишком сильно влияет на твои размышления первого уровня; если ты можешь увидеть свой мозг как рисующий карты механизм, в котором есть недочёты — то ты можешь что-нибудь исправить. Мозг — дефектная линза, не совсем точно показывающая действительность. Это верно в отношении мозга как мыши, так и человека. Но мозг человека — это линза, могущая понять свои изъяны, могущая увидеть свои систематические ошибки, свои искажения, а после применить к ним исправления второго уровня. Этот факт делает дефектную линзу намного могущественней на практике. Делает её не совершенной, но намного более эффективной.

Ложные убеждения

Убеждения должны окупаться

Элиезер Юдковский


Начало одной древней притчи звучит так:

Если дерево падает в лесу, и нет никого рядом, чтобы это услышать — создаёт ли дерево звук? Кто-то говорит «да, оно порождает колебания воздуха». Другой говорит «нет, никакой мозг не производит обработку слуховой информации».

Представим, что после того, как дерево упало, эти двое вместе входят в лес. Будет ли первый ожидать увидеть дерево, упавшее влево, а второй — дерево, упавшее вправо? Представим, что перед падением дерева двое оставили рядом с ним включённый диктофон; а после — воспроизводят его запись. Будет ли кто-либо из них ждать не тех звуков, что другой? Представим, что они присоединили электроэнцефалограф к каждому мозгу на планете — планирует ли кто-нибудь увидеть график, который не рассчитывал увидеть второй? Несмотря на то, что эти люди спорят, один говорит «нет», а другой «да», ожидаемые ими переживания не отличаются. Спорщики считают, что у них разные модели мира, но в этих моделях нет никаких различий по отношению к тому, какие будущие наблюдения им предстоят.

Соблазнительно попытаться уничтожить этот класс ошибок с помощью запрета всех убеждений, не являющихся ожиданиями какого-либо чувственного опыта. Но в мире есть многое, что не ощущается напрямую. Мы не видим атомов, из которых состоит кирпич, но эти атомы действительно существуют. Под твоими ногами пол, но ты не ощущаешь его напрямую, ты видишь отражённый от него свет (или, точнее, ты видишь результат обработки этого света сетчаткой и зрительной корой). Сделать вывод о существовании пола на основе его зрительного наблюдения — значит подумать о незримых причинах, стоящих за ощущениями. Этот шаг выглядит очень незначительным и очевидным, но это всё же шаг.

Ты стоишь на вершине небоскрёба, рядом с тикающими старинными часами, имеющими часовую, минутную и секундную стрелки. В твоей руке шар для боулинга, и ты сбрасываешь его с крыши. На какой по счёту щелчок стрелок ты ожидаешь услышать грохот шара, упавшего на землю?

Чтобы точно ответить на этот вопрос, тебе нужно использовать убеждения вроде «гравитация Земли равна 9,8 м/с^2» и «высота этого здания равна 120 метрам». Эти убеждения нельзя назвать бессловесными ожиданиями чувственного опыта; они довольно словесные, пропозициональные. Можно, не сильно погрешив против истины, описать эти убеждения как предложения, составленные из слов. Но эти убеждения имеют выводимое последствие, которое является прямым чувственным ожиданием — если секундная стрелка часов стоит на числе 12, когда ты бросил шар, то ты ожидаешь увидеть её на числе 1, когда ты услышишь грохот пять секунд спустя. Для того, чтобы ожидать чувственный опыт настолько точно, насколько это возможно, необходимо обрабатывать убеждения, не являющиеся ожиданиями чувственного опыта.

Великая сила Homo Sapiens состоит в том, что мы, лучше чем любой другой вид на планете, можем научиться моделировать невидимое. И в этом же состоит одна из наших величайших слабостей. У людей нередко встречаются убеждения о вещах, которые не просто незримы, но и нереальны.

Тот же самый мозг, что может логически вывести и построить сеть причин, лежащую за чувственным опытом, может построить и сеть причин, не соединённую ни с каким чувственным опытом (или очень плохо соединённую). Алхимики были убеждены в том, что флогистон вызывает огонь — очень упрощённо, это можно представить, как узел с надписью «флогистон», от которого тянется стрелка к чувственному опыту тёплого костра — но это убеждение не производило предсказаний на будущее; связь между флогистоном и наблюдениями всегда корректировалась после наблюдений, вместо того, чтобы как-нибудь ограничить наблюдения заранее. Или, скажем, учитель литературы говорит тебе, что знаменитый писатель Валки Вилкинсен — «пост-утопист». Что изменилось в твоих ожиданиях по поводу его книг в свете этой новой информации? Ничего. Это убеждение — если вообще можно называть это убеждением — вообще никак не связано с чувственным опытом. Но, тем не менее, тебе лучше запомнить о связи между Валки Вилкинсеном и атрибутом «пост-утопист»: тогда ты сможешь извергнуть это обратно на будущем экзамене. Если тебе сообщат, что «пост-утописты» показывают «охлаждение колониальных чувств», то ситуация совершенно аналогична: если автор письменного теста спросит, показывал ли Вилкинсен охлаждение колониальных чувств, то стоит ответить утвердительно. Убеждения связаны друг с другом, хоть и не связаны ни с каким ожидаемым опытом.

Люди могут построить целые сети убеждений, соединённые только друг с другом — будем называть это явление «плавающими» убеждениями. Это уникальный человеческий изъян, не имеющий аналогов у остальных животных, извращение способности Homo Sapiens строить абстрактные и гибкие сети убеждений.

Одна из добродетелей рационализма — эмпиризм — состоит в привычке постоянно задаваться вопросом о том, какой опыт предсказывается этим убеждением — или, ещё лучше, какой запрещается. Ты убеждён, что флогистон — причина огня? Тогда что ты ожидаешь увидеть, исходя из этого? Ты считаешь Валки Вилкинсена пост-утопистом? Тогда что ты рассчитываешь встретить в его книгах? Нет, не «охлаждение колониальных чувств»; какое переживание случится с тобой? Веришь ли ты в то, что если дерево падает в лесу, и нет никого рядом, чтобы это услышать, то оно всё равно создаёт звук? Тогда какой опыт должен выпасть на твою долю?

Ещё лучше спросить о том, какой опыт тогда с тобой точно не случится. Ты веришь в то, что жизненная сила объясняет загадочную разницу между живым и неживым? Тогда какие происшествия это убеждение запрещает, какое событие совершенно точно опровергнет это убеждение? Ответ «никакое» говорит о том, что это убеждение не ограничивает возможные переживания. Оно позволяет случиться с тобой чему угодно. Оно плавает.

Споря по поводу вопроса, вроде бы связанного с фактами, всегда держи в уме различие ожиданий будущего, из-за которого происходит спор. Если найти это различие не удаётся, то, скорее всего, вы спорите о названиях ярлыков в сети убеждений — или, ещё хуже, о плавающих убеждениях: ракушках-прилипалах на сети убеждений. Если ты не представляешь, какой опыт следует из того, что Валки Вилкинсен принадлежит к пост-утопистам, то ты можешь спорить бесконечно (а ещё ты можешь опубликовать бесконечное количество статей в литературных журналах).

И самое главное: не спрашивай, во что верить, — спрашивай, чего ожидать. Каждый вопрос об убеждениях должен порождаться вопросом о предсказаниях, и именно этот вопрос о предсказаниях должен быть в центре внимания. Каждое смутное убеждение должно рождаться как смутное ожидание, а затем оплачивать жилплощадь прогнозами будущего. Если убеждение становится злостным неплательщиком — высели его.

Сказ о науке и политике

Элиезер Юдковский


Во времена Византийской империи светская жизнь оказалась разделена на два лагеря: Синий и Зелёный. Синие и Зелёные убивали друг друга на дуэлях, в драках «стенка на стенку», в засадах и погромах. Прокопий Кесарийский говорил о них: «Вражда к противникам возникает у них без причины и остаётся навеки; не уважаются ни родство, ни свойство, ни узы дружбы. Даже родные братья, приставшие один к одному из этих цветов, другой к другому, бывают в раздоре между собою». Эдвард Гиббон писал: «Поддержка одной из группировок стала необходимой для любого кандидата, будь он светским или духовным лицом».

Кто же были эти Синие и Зелёные? Всего лишь спортивные болельщики — сторонники синей и зелёной команд в гонках на колесницах.

А теперь представьте общество будущего, которому пришлось сбежать в сеть подземных туннелей и пещер и закрыть все входы. Мы не будем уточнять, бежали ли они от болезни, войны или от радиации. Первым подземным жителям удалось наладить производство еды, возобновление воздуха, найти воду, организовать освещение и выжить. Их потомки благоденствовали и даже стали строить города. О верхнем мире остались лишь легенды, написанные на клочках бумаги, и один из таких клочков описывал небо, бескрайний простор воздуха над полом без стен. Небо было лазурного цвета, и в нем летали странные объекты, напоминающие пучки белого хлопка. Значение слова «лазурный» вызывало противоречия, некоторые говорили, что оно обозначает синий цвет, а другие — зелёный.

В ранние дни подземного сообщества соперничество Синих и Зелёных доходило до открытого насилия, но теперь царит перемирие — мир, рождённый отвращением к бессмысленной вражде. Культурные обычаи изменились, существует многочисленный и преуспевающий средний класс, воспитанный в духе правового государства и непривычный к насилию. В школах преподаётся история: как долго длилась вражда между Синими и Зелёными, как много людей погибло, как мало в итоге изменилось. Граждане подготовлены к странной новой философии, гласящей, что люди — это люди, не важно, за Синих они или за Зелёных.

Сам конфликт не исчез. Общество всё ещё разделено на Синие и Зелёные области, в любом актуальном культурном или политическом вопросе выделяется «Синяя» и «Зелёная» позиции. Синие ратуют за налоги на личные доходы, Зелёные поддерживают налоги на продажи торговцев. Синие придерживаются более строгих законов о браке, в то время как Зелёные хотели бы упростить бракоразводный процесс. Синие пользуются поддержкой центральных городских районов, а периферийные фермеры и продавцы воды обычно оказываются в лагере Зелёных. Синие верят, что Земля — это огромная шарообразная скала в центре вселенной, а Зелёные считают, что Земля — это огромная плоская скала, вращающаяся вокруг другого объекта, называемого Солнцем. Отнюдь не каждый Синий или Зелёный гражданин принимает «Синюю» или «Зелёную» позицию по любому вопросу, но довольно тяжело найти городского торговца, который считает, что небо было синим, и в то же время голосует за налоги на личные доходы и более свободные законы о браке.

Подземелье всё ещё поляризовано. Царит хрупкий мир. Есть некоторое число людей, искренне считающих, что Синие и Зелёные должны быть друзьями. Обычное дело, когда Зелёный покровительствует Синему магазину или Синий любит посещать Зелёную таверну. Из перемирия, изначально рождённого усталостью, медленно растёт дух терпимости и даже дружбы.

Однажды в Подземелье произошло небольшое землетрясение. Группа из шести туристов почувствовала содрогание земли, находясь на прогулке среди руин древнего поселения, где-то в верхних пещерах. Один из туристов упал и поранил колено, и группа решила повернуть назад, опасаясь новых землетрясений. На обратном пути один из них заметил странное дуновение воздуха, какой-то запах, исходящий из давно заброшенного туннеля. Не обращая внимания на предостережения спутников, этот человек одолжил лампу и направился к туннелю. Каменный коридор шёл выше… и выше… и наконец закончился дырой, выходящей из этого мира. Каменные стены закончились. Пространство, бесконечное пространство простиралось в никуда, здесь хватило бы места для тысячи городов. Невообразимо далеко наверху и слишком ярко, чтобы смотреть не щурясь, жгучий огонёк лучился светом, освещающим всё вокруг, как ничем не прикрытая нить накаливания какой-то гигантской лампы. В воздухе, ничем не поддерживаемые, висели непостижимые пучки белого хлопка. И цвет бескрайнего сияющего потолка был…

На этом месте история разветвляется, в зависимости от того, кто именно из туристов решил последовать по коридору к поверхности.

Адитья Синяя стояла под синей бесконечностью и медленно улыбалась. Улыбка не была радостной. В ней была ненависть и раненная гордость. Она припоминала каждый свой аргумент в спорах с Зелёными, каждое соперничество, каждую вырванную победу. «Ты всё время была права», — шепнуло ей небо, — «и теперь ты можешь это доказать». Какое-то мгновенье Адитья стояла, впитывая послание, упиваясь им, а затем она повернулась и ушла в коридор, неся его миру. Шаг, ещё шаг… её пальцы сжались в кулак. «Перемирие закончено», — сказала она.

Бэррон Зелёный бессмысленно глазел на хаос цветов долгие секунды. А потом запоздавшее понимание взорвалось в его животе, как удар молота. Слёзы потекли из его глаз. Бэррон думал о Катэйской Резне, когда армия Синих вырезала всё население городка Зелёных, включая детей. Он думал о древнем Синем генерале — Аннасе Релле, который объявил Зелёных «чумной ямой, язвой, нуждающейся в прижигании». Он думал об огоньках ненависти, которые он замечал в глазах Синих, и что-то внутри него треснуло. «Как ты можешь быть на их стороне?!» – закричал он небу и начал рыдать. Стоя под злобным синим свечением, он знал, что вселенная всегда была обителью зла.

Чарльз Синий ошеломлённо созерцал синий потолок. Как профессор смешанного колледжа он всегда аккуратно подчёркивал, что Синяя и Зелёная точки зрения в равной степени верны и заслуживают терпимого отношения, небо — это метафизическая сущность, а «лазурный» — цвет, который может восприниматься по-разному. На мгновенье Чарльз задумался, не увидит ли какой-нибудь Зелёный, встав на его место, зелёный потолок, или не будет ли потолок зелёным завтра, но он не стал бы делать выживание цивилизации ставкой в этом споре. Это был всего лишь природный феномен, не имеющий никакого отношения к морали или к обществу… Но феномен, который наверняка поймут неправильно, как опасался Чарльз. Он вздохнул и повернулся к коридору. Завтра он придёт сюда один и закроет проход.

Дарья, когда-то Зелёная, пыталась дышать посреди обломков своего мира. «Я не зажмурюсь» — сказала она себе. — «Я не отвернусь». Всю свою жизнь она была Зелёной, а теперь она должна стать Синей. Её друзья, её семья… все они отвернутся от неё. Говори правду, даже если твой голос дрожит, когда-то говорил ей отец. Но сейчас отец был мёртв, а мать никогда не сможет понять. Дарья смотрела в спокойный синий глаз неба, пытаясь принять его, и наконец её дыхание успокоилось. «Я ошибалась», — скорбно сказала она себе. В конце концов, не так уж это и сложно. Она найдёт новых друзей, и, возможно, семья сможет простить её… А может, они даже отважатся сами встать под этим небом и пройти этот экзамен, подумала она с надеждой. «Небо синее», — произнесла Дарья в качестве эксперимента, и ничего ужасного с ней не произошло, правда, у неё не получилось заставить себя улыбнуться. Дарья Синяя печально выдохнула и пошла обратно в свой мир, думая о том, что она скажет.

Эддин Зелёный посмотрел в синее небо и цинично рассмеялся. Наконец-то он понял учебник мировой истории, правда, ему всё равно не верилось, что они были такими дураками. «Глупцы», — произнёс Эддин, — «глупцы, глупцы, всё это время оно было здесь». Ненависть, убийства, войны, и всё это время оно было просто явлением, о котором кто-то когда-то написал на бумаге, как обычно пишут о любом другом явлении. Никакой поэзии, никакой красоты, ничего такого, о чём любой здравомыслящий человек станет беспокоиться. Просто одно бессмысленное слово, влияние которого распространилось за любые разумные границы. Эддин устало прислонился к стене пещеры, пытаясь придумать, как не дать миру взорваться от этого открытия, и задаваясь вопросом, а не заслуживают ли все они именно этого.

Феррис невольно открыл рот, он замер на месте в абсолютном изумлении и восхищении. Его глаза жадно метались туда-сюда, с неохотой покидая одно зрелище, чтобы впиться взглядом в другое. Синее небо, белые облака, бескрайняя неизвестность снаружи, полная мест и предметов, а, возможно, и людей, которых никогда не видели в Подземелье. «О, так вот какой это цвет», — сказал Феррис и отправился исследовать.

Дополнение от ex-Parrot

Лоретта Зелёная посмотрела на небо и сказала: «Оно синее. Следовательно, это не небо. Несмотря на безграничность, несмотря на открытость и несмотря на эти штуки, похожие на клочки белого хлопка. Вообще, после того, как я задумалась, они не кажутся так уж сильно похожими на хлопок» .

Джон Экуменист сказал: «Как я всегда и говорил. Оно лазурное!»

Вера в убеждения

Элиезер Юдковский


Карл Саган как-то рассказал притчу(English) о человеке (для удобства дадим ему имя Кредерус), который пришёл к нему и заявил: «В моём гараже живёт дракон». Потрясающе! В течение столетий по всему миру гуляли легенды о драконах, но до сих пор ни у кого нет никаких убедительных свидетельств их существования. Конечно же, любой человек ответит: «Я хочу посмотреть на настоящего дракона, где этот гараж?». Но гость вынужден нас огорчить: дракон невидим.

Далее Саган замечает, что невидимость не делает гипотезу о драконе нефальсифицируемой. Можно войти в гараж и услышать громкое дыхание из пустоты, увидеть неожиданно возникающие следы на земле, а потом при помощи инструментов обнаружить, что что-то в гараже поглощает кислород и выделяет углекислый газ.

Поэтому стоит ответить: «Ничего страшного, я попробую услышать его дыхание». Но Кредерус отвечает, что дракон совершенно бесшумен. — А что, если я измерю содержание углекислоты в воздухе? — Нет, дракон не дышит. — Можно распылить в воздухе муку, тогда она налипнет на дракона, и его контур можно будет увидеть. — Дракон проницаем для муки.

Мораль этой басни в том, что плохая гипотеза должна ловко маневрировать, чтобы избежать опровержения. Но я рассказываю эту историю не для того же, что и Карл Саган. Я хочу проиллюстрировать другую идею.

Где-то в недрах разума Кредеруса явно хранится правильная модель ситуации, поскольку он заранее ожидает определённых результатов всех этих проверок (а именно — таких результатов, которые ему придётся оправдывать).

Некоторые философы запутываются в подобных сценариях, не понимая, верит ли Кредерус в дракона, или всё-таки нет. Можно подумать, что в человеческом мозге мало места, и храниться может только одно убеждение за раз! Реальный разум намного сложнее. Как я уже говорил, убеждения бывают разными, не все можно назвать «прямыми ожиданиями чувственного опыта». Кредерус явно не ожидает увидеть в гараже ничего необычного, иначе он не оправдывался бы заранее. Также возможно, что в его фонде словесных убеждений хранится «В моём гараже живёт дракон». Рационалисту может показаться, что эти два убеждения должны конфликтовать друг с другом, даже несмотря на то, что они разных видов. Но, тем не менее, если написать «небо зелёное» на фотографии синего неба, то бумага и не подумает исчезать в языках пламени.

Добродетель эмпиризма должна не позволить нам совершать подобные ошибки. Рационалисты должны постоянно выяснять, какие переживания предсказывают их убеждения — требовать, чтобы убеждения окупались. Но проблема Кредеруса лежит глубже, и её не исцелить этим простым советом. Довольно просто соединить убеждение в драконе с ожидаемым наблюдением гаража: если ты веришь в живущего в гараже дракона, то ты, открыв дверь, рассчитываешь увидеть этого дракона. Если ты не видишь дракона, то это означает, что в гараже дракон не живёт. Действия довольно просты. Ты даже можешь попытаться повторить это со своим гаражом.

Но нет, эта невидимость — симптом чего-то похуже.

Возможно, ты помнишь тот момент из детства, когда ты уже начал сомневаться в существовании деда Мороза, но ещё считал правильным верить в деда Мороза, и поэтому пытался отвергнуть сомнения. Дэниел Деннет заметил: когда трудно верить в X, намного легче верить в то, что ты обязан верить в X. Как можно верить в то, что Первичное Космическое Небо одновременно совершенно синее, и совершенно зелёное? Эта фраза вводит в замешательство; непонятно, что это означает в смысле ожидаемых переживаний, непонятно, во что именно ты бы верил, если бы верил. Намного проще поверить в то, что правильно, хорошо, добродетельно и полезно верить в то, что Первичное Космическое Небо одновременно полностью зелёное и полностью синее. Деннет называет это «верой в убеждение» (того же термина буду придерживаться и я).

Ну и затем, раз мы имеем дело с человеческим разумом, всё как обычно усложняется. Думаю, что даже Деннет слишком сильно упростил то, как эта психологическая уловка работает на практике. К примеру, если человек верит в убеждение, то он не может признаться себе в том, что он просто верит в убеждение: ведь добродетельно верить, а не верить в убеждение, следовательно если ты веришь в убеждение, а не просто веришь, то ты не добродетелен. Никто не скажет (даже про себя): «Я не считаю, что Первичное Космическое Небо одновременно синее и зелёное, но я считаю, что мне следует так считать», разве что этот человек необычайно хорошо умеет признавать свои недостатки. Люди не верят в веру в убеждения, они просто верят в убеждения.

(Если вы находите предыдущий абзац сложным для понимания, попробуйте поизучать математическую логику, которая учит остро различать такие вещи, как утверждение P, доказательство P и доказательство того, что P доказуемо. Такие же коренные различия есть и между P, желанием P, верой в P, желанием верить в P и верой в то, что ты веришь в P.)

Вера в убеждения бывает разной. Она может быть явной: человек осознанно повторяет про себя «Добродетельно верить в то, что Первичное Космическое Небо одновременно совершенно синее, и совершенно зелёное» (и при этом считает, что он в это верит, разве что этот человек необычайно хорошо умеет признавать свои недостатки). Бывают и менее бросающиеся в глаза формы. Возможно, Кредерус боится публичного осмеяния, которое, как он считает, неизбежно последует, если он публично признает, что был неправ (хотя, фактически, любой рационалист искренне порадуется за него, а остальные будут скорее высмеивать Кредеруса, если он, отнюдь, продолжит заявлять о драконе, живущем в гараже). Возможно, Кредеруса передёргивает от перспективы признаться себе в том, что дракона нет (точно также, как его передёргивало бы от физической боли): это противоречит его представлению о себе как о победителе-первооткрывателе, увидевшем в своём гараже то, что упустили все остальные.

Будь все наши мысли теми осознанными предложениями на естественном языке, которыми обычно манипулируют философы, человеческий мозг был бы намного проще для понимания. Быстро утекающие мысленные образы, невысказанные вспышки боли, исполняемые без сознательного ведома желания — всё это составляет такую же часть личности, как и слова.

Несмотря на то, что я не соглашаюсь с Деннетом касательно некоторых деталей и тонкостей, я всё равно считаю, что введённое им понятие вера в убеждение — ключ к понимаю Кредеруса. Однако, необходимо более широко трактовать понятие «убеждения», не ограничивать его вербальными утверждениями. «Убеждение» может включать в себя неявные регуляторы ожиданий. «Вера в убеждение» может содержать неявные ориентиры когнитивного поведения. С точки зрения психологии, утверждение «Кредерус не убеждён в том, что в его гараже живёт дракон; но он убеждён в том, что полезно быть убеждённым в существовании дракона в гараже» в лучшем случае нереалистично. Но вполне допустимо сказать, что Кредерус рассчитывает на отсутствие дракона, и оправдывается,словно он убеждён в наличии дракона.

Человек может каждый день использовать заурядную мысленную картину своего гаража (без драконов), всегда правильно предсказывающую его ощущения после открытия двери, но ни разу в жизни не произнести про себя предложение «В моём гараже драконов нет». Это почти наверняка случалось и с тобой: открывая дверь гаража, или спальни, или чего-нибудь ещё, и ожидая не увидеть драконов, на сознательном уровне ты думаешь о чём угодно, но не о драконах.

И для того, чтобы продолжать стоять на своём и верить в дракона — или чтобы продолжать уклоняться от мысли изменения представления о себе как о верящем в дракона — совсем необязательно думать: «Я хочу верить в дракона, живущего в моём гараже». Достаточно лишь нежелания перспективы признания в ложности заявленных убеждений.

Для того, чтобы правильно готовить оправдания для будущих экспериментальных результатов, Кредерус должен, во-первых, хранить где-то в разуме правильную модель ситуации, контролирующую его ожидания, и, во-вторых, действовать и мыслить таким образом, чтобы защитить либо своё свободно плавающее убеждение о драконе, либо своё представление о себе, как о верящем в дракона.

Если Кредерус верил в убеждение о существовании дракона и вдобавок был убеждён в существовании дракона, то проблема была бы уже не так грозна. Кредерус желал бы рисковать, если речь идёт об экспериментальных предсказаниях, и, возможно, даже согласился бы отказаться от убеждения о существовании дракона, если бы его предсказания бы не сбылись (хотя, если Кредерус был бы не до конца уверен в существовании дракона, то его вера в убеждение могла бы помешать этому признанию). Однако, когда кто-то заранее оправдывается, это обычно требует расхождения убеждения и веры в убеждение.

Байесианское дзюдо

Элиезер Юдковский


Вы можете получить массу удовольствия, общаясь с людьми, чьи ожидания будущего теряют связь с их же верой в убеждения.

Как-то на одном званом обеде я пытался объяснить человеку, чем я зарабатываю на жизнь; и он сказал: «Я не верю в возможность искусственного интеллекта, ведь лишь Бог может создать душу».

Я, должно быть, движимый божественным наитием, немедленно ответил:

— То есть, если я смогу создать искусственный интеллект, то это докажет ложность вашей религии?

— Что? — сказал он.

— Ну, если ваша религия предсказывает, что я неспособен создать искусственный интеллект, то факт создания мной искусственного интеллекта будет означать неправоту вашей религии. Либо ваша религия допускает возможность создания ИИ, либо его создание опровергнет вашу религию.

Повисла пауза — он осознал, что только что сделал свою гипотезу фальсифицируемой — и затем он ответил:

— Ну, я не имел ввиду, что вы не сможете создать интеллект. Я хотел сказать, что он не может испытывать эмоции таким же образом, что и мы.

— Итак, если я создам искусственный интеллект, в который не будет заложено ничего навроде заранее написанного сценария, и моё творение начнёт говорить о чём-то, похожем на нашу духовную жизнь, то тогда ваша религия неверна.

— Ну, гм, видимо нам придётся остаться при своих мнениях на этот счёт. «Согласиться не соглашаться» — в таких случаях говорят англичане.

— На самом деле, так нельзя. Есть теорема из области рациональности — теорема Ауманна о согласии — которая говорит о том, что два рационалиста не могут согласиться не соглашаться. Если два человека не соглашаются друг с другом, то хотя бы один из них должен быть в чем-то неправ.

Мы коротко прошлись по этой теме. И, наконец, он сказал:

— Ну, кажется, на самом деле я пытался сказать вот что: я считаю, что вы не можете создать что-то вечное.

— Ну, я тоже так считаю!— ответил я. — Я рад, что мы смогли прийти к консенсусу по этому вопросу, как и требует теорема Ауманна о согласии.

Я протянул свою руку и он пожал ее, а потом побрёл дальше.

Женщина, которая стояла рядом и слушала наш разговор, серьёзно посмотрев на меня, сказала: «Это было прекрасно».

— Большое спасибо, — ответил я.

Притворная мудрость

Элиезер Юдковский


Самое жаркое место в аду закреплено за теми, кто во время кризиса оставались нейтральными.


– Данте Алигьери, эксперт по аду. Ой, то есть Джон Ф. Кеннеди, который приписывал цитаты кому попало.

Нейтральность и неторопливость с выводами - широко известный прием, который часто применяется в тех случаях, когда люди желают выставить себя взрослыми, мудрыми, непредвзятыми, или просто показать свое превосходство над другими.

Примером этого выступают мои родители, которые отвечали на теологические вопросы вроде «Почему в Древнем Египте, несмотря на обилие хороших записей о множестве разных событий, нет записей о том, что евреи хотя бы были там?» фразами: «Когда я был в твоем возрасте, я тоже задавал такие вопросы, но теперь я это перерос».

Загрузка...