Между группами крови не было войн. Не было даже политических конфликтов. Должно быть, стереотипы возникли исключительно из-за существования ярлыков.
Разумеется, кто-то неминуемо скажет, что это история о классификации людей. Случается ли что-нибудь подобное при классификации растений, камней или офисной мебели? Я такого эксперимента не припоминаю, что, конечно, не означает, что его не проводили. (Я ожидаю, что самое сложное при проведении такого эксперимента — создать такой протокол опроса, который минимизировал бы шанс наталкивания испытуемого на мысль, что ярлык очень важен просто потому, что об этом ярлыке его и спрашивают.) И хотя я не собираюсь основываться на воображаемом свидетельстве, я бы предсказал, что такой эксперимент показал бы положительный результат: я бы ожидал, что само по себе введение ярлыков влияет на всё — по крайней мере в умах людей.
Здесь можно вспомнить про кластеры подобия: если вы нарисовали границу вокруг некоторой группы объектов, ваш разум пытается найти сходство между объектами группы. И, к сожалению, человеческий детектор закономерностей иногда находит закономерности даже там, где их нет. Немного избирательной памяти, и слабая отрицательная корреляция может быть принята за сильную положительную.
Можно вспомнить про нейронные алгоритмы: создать имя для набора предметов — все равно что выделить некоторую подсеть для поиска закономерностей между ними.
Можно вспомнить про ошибки сжатия: вещи с одинаковым названием вполне могут очутиться в одной ментальной папке и слиться в одну точку на карте.
А можно вспомнить про безграничную человеческую способность высасывать из пальца любую чепуху и в неё верить. Просто потому что никто не может доказать, что это на самом деле чепуха. Как только вы ввели имя для категории — можно начинать выдумывать. Штука с выбранным именем не обязана быть наблюдаемой. Она не обязана существовать. Она даже не обязана быть логичной.
И нет, такое происходит не только в Японии. Здесь, на Западе, книга под названием «Правильная еда для твоей группы крови» [В оригинале «Eat Right 4 Your Type» - Прим.перев.] стала бестселлером.
Проведение границы в пространстве вещей — совсем небезобидное действие. Возможно, какой-нибудь более правильно спроектированный байесовский ИИ будет в состоянии рассматривать произвольный класс и это не будет влиять на его поведение. Но у нас, людей, такого варианта нет. Для человеческого мозга категории не статичны — если вы о них думаете, они влияют на ваш разум. И это еще одна причина, почему не стоит считать, что вы можете определять слова как вам захочется.
Контрабанда характеристик
Элиезер Юдковский
Вчера я рассказал, что в Японии типы крови заняли место астрологии - если твоя кровь 4 группы, например, ты должен быть «спокойным и сдержанным».
Предположим, мы решили ввести новое слово «виггин» для обозначения людей с зелеными глазами и темными волосами…
Зеленоглазый и темноволосый мужчина вошел в ресторан.
«Ха» сказал Дэнни, сидя за столиком неподалеку «Ты это видела? Виггин только что зашел в зал. Чертовы виггины. Все они преступники, если хочешь знать”.
Его сестра Эрда вздохнула «Ты ведь не видел его совершающим преступления, так ведь, Дэнни?»
«Мне и не нужно» ответил Дэнни, достав словарь — «Смотри, в Оксфордском Словаре Английского Языка так и написано «Виггин (1) Человек с зеленым глазами и черными волосами» У него черные волосы и зеленые глаза — он виггин. Ты ведь не станешь спорить в Оксфордским словарем? По определению, черноволосый и зеленоглазый человек — виггин»
«Но ты в открытую назвал его виггином» сказала Эрда. «Нехорошо так говорить о тех, кого ты совсем не знаешь. У тебя недостаточно свидетельств, чтобы утверждать, что он много кетчупа положит в свой бургер или что он в детстве запускал бельчат с помощью резинки»
«Но он же виггин». Терпеливо ответил Дэнни. «У него зеленые глаза и черные волосы, так? Вот увидишь, как только ему принесут заказанный бургер, он потянется за кетчупом”.
Человеческий разум переходит от наблюдаемых характеристик к выводимым посредством слов. В высказывании «Все люди смертны, Сократ человек, следовательно, Сократ смертен» наблюдаемыми характеристиками являются одежда Сократа, речь, используемые им инструменты, человеческая форма тела; классифицируется он как человек; выводимая характеристика — отравляемость болиголовом.
Разумеется, граница между «выводимыми» и «наблюдаемыми» характеристиками размыта. Если вы слышите, как кто-то говорит, то у этого существа, скорее всего, человеческая форма тела, при всех прочих равных. И, если вы видите человеческую фигуру в темноте, ceteris paribus — она может говорить.
И все же, некоторые характеристики в большей мере выводимые, чем наблюдаемые. Вы, скорее всего, сделаете вывод, что наблюдаемый вами объект — человек и поэтому сгорит, если его подвергнуть прямому взаимодействию с огнем, чем станете поджигать разные объекты для того, чтобы понять — горят люди или нет.
Если вы посмотрите определение слова «человек» в словаре, то, возможно, увидите там характеристики вроде «интеллект» или «двуногое без перьев», которые полезны для быстрого отделения того что является человеком от всего остального. При этом, в словаре не будет десятков тысяч других возможных человеческих характеристик вроде уязвимости перед болиголовом или сверхуверенности, которые можно вывести из того, что данный объект — человек. Почему так? Может быть, словари предназначены для указывания соответствия между ярлыком и кластером в пространстве вещей. Или вполне может быть, что крупные, видимые характеристики быстрей приходят на ум составителю словаря в силу своей заметности. Не уверен, насколько составители словарей осознают, что именно они делают.
Но кульминация наступает, когда Дэнни достает словарь и видит лишь бросающиеся в глаза признаки: зеленые глаза и черные волосы. Словарь не содержит список множества характеристик, которые ассоциируются с термином «виггин», вроде криминальных наклонностей, кулинарных пристрастий или досадных активностей в детстве.
Как же эти характеристики стали ассоциироваться с термином? Может был знаменитый виггин, продемонстрировавший их. Или может кто-то просто их выдумал и написал ставшие популярными книги («Виггин», «Беседы с виггином», «Воспитание маленьких виггинов», «Виггины в постели»). Может даже виггины в это верят теперь, и ведут себя соответствующим образом. Стоит лишь назвать группу людей «виггинами» и это слово начнет обрастать ассоциациями.
Однако, давайте вспомним «Притчу о болиголове» : если мы будем использовать определения логических классов, как метод определения слов, то мы не сможем установить, что Сократ — «человек», пока не пронаблюдаем его смерть. Когда кто-то апеллирует к словарю, он это делает, обычно, чтобы тайком привнести какие-то ассоциации, а не реально записанное определение.
В конце концов, если полный смысл слова «виггин» это «зеленоглазый и черноволосый человек», почему бы и не называть этих людей «зеленоглазым и черноволосыми»? И если вы интересуетесь, является ли данный человек любителем кетчупа, то почему бы не спросить об этом прямо «он любитель кетчупа?», вместо того, чтобы спрашивать «он виггин?» (прошу отметить замену символа на суть).
Но ведь для понимания настоящего вопроса придется поработать. Надо будет пронаблюдать, действительно ли виггин потянется за кетчупом. Или найти статистику о том, сколько зеленоглазых и черноволосых людей любят кетчуп. В любом случае, вам придется сделать что-то большее, чем сидение в вашем кресле с закрытыми глазами. Люди ленивы. Он предпочтут использовать аргумент «по определению», особенно если им кажется, что «слова можно определять, как захочется».
Но, разумеется, настоящая причина утверждать, что кто-то это «виггин» — в скрытой ассоциации, не записанной в словаре, и порождаемым ей чувстве.
Только представьте — Денни говорит: «Посмотри, у него черные волосы и зеленые глаза, он — виггин! В словаре так и сказано, следовательно, у него черные волосы. Попробуй поспорь с этим!»
Звучит не слишком впечатляюще, так ведь? Если бы суть аргумента действительно была отражена в словаре, если бы аргумент был логически валидным, то он ощущался бы пустым; не привносил ничего нового и не ставил бы вопросов.
Лишь контрабанда характеристики, которая прямо не записана в словаре, дает чувство победы при использовании аргумента «по определению».
Аргумент «по определению»
Элиезер Юдковский
«У этой ощипанной курицы две ноги и нет перьев, следовательно, по определению, она человек!»
Обычно, когда люди спорят про определения, они начинают с бросающихся в глаза или широко принятых характеристик, затем достают словарь и показывают, что эти характеристики соответствуют написанному в словаре определению; потом они делают вывод: «Следовательно, по определению, атеизм — это религия!»
Но бросающиеся в глаза или широко принятые характеристики редко являются настоящим предметом спора. Один лишь факт того, что кто-то видит наличие двух ног достаточно очевидной основой для вывода «Следовательно, по определению, Сократ — человек», свидетельствует о том, что двуногость не выступает конечной целью спора, ведь в противном случае оппонент бы заявил что-то вроде: «Да че ты говоришь, мы ведь об этом и спорим!»
Разумеется, есть правильный способ перехода от очевидных характеристик к не совсем очевидным. Вы вполне оправданно можете, увидев гуманоидную форму тела Сократа, предположить, что он уязвим для болиголова. Но этот вероятностный вывод не основывается на определении в словаре или традиционном понимании; он основывается на существовании во вселенной эмпирических кластеров подобных друг другу вещей.
Такая кластерная структура не изменится просто потому, что вы дадите слову другое определение. Даже если в словаре понятие «человек» будет определено как «все двуногие без перьев, кроме Сократа», то это не изменит степень подобия между Сократом и остальными двуногими без перьев существами.
Когда вы будете выстраивать аргументацию на основе кластерной структуры, вы скажете что-то вроде: «у Сократа две руки, две ноги, нос и язык, он говорит бегло на греческом, использует инструменты, проявляет все крупные и мелкие характеристики Homo sapiens (в то время, когда я наблюдал за ним); так что я предположу, что у него человеческая ДНК, человеческая биохимия, и что он так же уязвим для болиголова, как и другие Homo sapiens, для которых летальность болиголова была подтверждена клинически».
На что я мог бы ответить: «Но я видел, как Сократ разговаривал со знахарем, и думаю, что они собираются приготовить антидот. Так что я ожидаю, что Сократ, приняв болиголов, копыта не откинет. Он будет исключением для общего правила поведения объектов этого кластера. Они не принимали антидот, а он примет».
Как видите, тут уже нет смысла спорить о том, человек Сократ или нет. Разговор должен перейти на более детальный уровень, следует рассмотреть детали категории «человек», а именно — биохимию, и в данном случае, нейротоксичные эффекты кониина.
Вы, разумеется, можете продолжать настаивать на том, что «Сократ — человек и по определению смертен», но вы, на самом деле, лишь будете смазывать в одну точку все, что вы знаете о Сократе, кроме его человечности, как будто единственное верное предсказание может быть построено только на том, что мы ничего о Сократе не знаем, кроме того, что он человек.
Это все равно что настаивать на том, что вероятность выпадения орла или решки составляет 50%, потому что это «симметричная монета», после того, как вы ее подкинули и выпал орел. Это все равно что настаивать на том, что у Фродо десять пальцев, после того, как вы видели, что у него девять пальцев на руках. И это, естественно, некорректно с точки зрения байесовской эпистемологии — вы не можете отказаться от учета наблюдаемых свидетельств.
И вы не можете останавливаться на первой итерации классифицирования и продолжать делать выводы на ее основе, игнорируя остальную информацию.
Не каждое свидетельство, разумеется, окажет сильное влияние на вывод. Если я увижу, что у Сократа лишь девять пальцев, это не повлияет на мое ожидание наблюдать его смерть после приема болиголова, ведь я ожидаю, что потеря пальца не оказала сильного влияния на его биохимию. И это будет правдой независимо от того, что в словаре написано про количество пальцев. Правильный вывод основан на кластерной структуре окружающей среды и причинной структуре биологических процессов, а не на том, что решит написать составитель словаря. И уж тем более не на «традиционном понимании».
Как правило, если вы делаете вывод правильным, логически допустимым путем, вы просто можете сказать: «Содержащийся в болиголове алкалоид кониин вызывает мышечный паралич у людей, что приводит к смерти от удушья». Или еще проще: «Болиголов опасен для людей». Так выстраивается правильный аргумент.
Так в какой же ситуации может возникнуть желание усилить аргумент фразой «по определению»? (Например — «Люди, по определению, уязвимы для болиголова»). Ну разумеется, в случае высказанных оппонентом сомнений по поводу предполагаемой характеристики (есть свидетели разговора между Сократом и знахарем) — поэтому может возникнуть желание затянуть оковы логики.
И когда вы видите такое использование «по определению», знайте, что на самом деле вам говорят что-то вроде «Забудьте лучше этот момент со знахарем, люди по определению смертны».
Люди чувствуют необходимость укрепить курс развития спора словами «Любое Р, по определению, обладает свойством Х!», именно в том случае, когда они видят и без промедления отбрасывают информацию, которая бросает тень сомнений на оригинальный вывод, основанный на кластерах.
Это же касается и аргументов вроде «Х, по определению, — У». Например, «Атеисты верят, что Бога нет; следовательно, они имеют убеждение о Боге, потому что неверие это тоже убеждение; следовательно, атеизм дает ответы на теологические вопросы; следовательно, атеизм, по определению, — религия».
Вам не нужно было бы убеждать нас, что индуизм — это религия, потому что индуизм это, вроде как, и есть религия. И не просто «религия по определению», а настоящая религия.
Атеизм не похож на центральных представителей кластера «религия», поэтому, если бы он не был религией «по определению», вы могли бы воображать себе, что он религией не является. Поэтому вам и приходится давить оппозицию, указывая на то, что «атеизм — это религия» верно по определению, потому что это неверно в любом другом контексте.
То есть люди настаивают на том, что «Х по определению У!» именно в тех случаях, когда они пытаются протащить не указанную прямо в определении характеристику У, а Х не слишком похож на представителей кластера У.
В течение последних тринадцати лет я старался отмечать случаи корректного использования фразы «по определению», не утруждаясь ведением статистики, разумеется. На основе такого поверхностного взгляда я могу сделать вывод, что использование этой фразы где-либо за пределами математики является одним из ярчайших сигналов дефектного аргумента из тех что я видел. Он стоит рядом с «Гитлер», «Бог», «абсолютно уверен» и «ты не можешь доказать это».
Эта эвристика определения такого режима провала не идеальна — впервые я видел корректное употребление этой фразы за пределами математики — у Ричарда Фейнмана; и с тех пор видел еще. Но вам, скорее всего, стоит просто стереть из своего словарного запаса эту фразу и сохранять бдительность, особенно если вам захочется употребить ее с восклицательным знаком или выделить курсивом. Ведь это, по определению, плохая идея!
Где проводить границу?
Элиезер Юдковский
Представьте, что вам кто-то сказал:
Долго я размышлял о том, что же значит слово «искусство», и, наконец, нашел то определение, которое показалось мне удовлетворительным: «Искусство - это то, что предназначено для создания реакции аудитории».
Из существования слова «искусство» не следует существование его смысла, витающего где-то там в пустоте, которое вы можете открыть, подобрав правильное определение.
Хоть так и кажется, но это не так.
Гадая о том, как какое определение дать слову, вы подходите к решению задачи не с той стороны — ищите таинственную эссенцию того, что на самом деле является коммуникационным сигналом.
Разумеется, тут есть место и для задачи, которую рационалист может обоснованно атаковать, но эта задача не в том, чтобы найти удовлетворяющее определению слово. Настоящую задачу можно решать в одиночку, не проронив ни слова вслух. Задача в том, чтобы найти, какие вещи подобны друг другу, какие вещи принадлежат к одному кластеру, и иногда — какие вещи имеют одну и ту же причину.
Если вы определите «электромагнетизм», включив молнию, компас, исключив свет, но включив «животный магнетизм» Месмера (что мы теперь зовем гипнозом), то столкнетесь с проблемой, отвечая на вопрос «как электромагнетизм работает?». Вы скучили вместе вещи, которые располагаются на удалении, и исключили те, которые действительно принадлежат к набору. (Этот пример вполне вероятен - Месмер был до Фарадея).
Можно сказать, что электромагнетизм — неподходящее слово, граница в пространстве вещей, обтекающая и проникающая в кластеры, разрез реальности не по месту естественного соединения частей.
Придумать, где именно разрезать реальность, так чтобы разрез был по месту соединения частей — достойная рационалиста задача. Это то, что людям бы следовало делать, когда они начинают искать плавающую в пустоте эссенцию слова.
Но не стоит себя обманывать. Эта задача может быть и на уровне научной проблемы, если надо догадаться, что дыхание и огонь описываются одним словом. Так что не стоит обращаться за решением к редакторам словарей — у них есть своя работа.
Что такое «искусство», если не эссенция слова, витающая в пустоте?
Предположим, что вы составили длинный список того, что вы готовы и не готовы назвать «искусством».
Маленькая фуга до минор — искусство.
Удар в нос — не искусство.
«Относительность» Эшера — искусство.
Мука — не искусство.
Программный язык Питон — искусство.
Распятье, плавающее в моче — не искусство.
Новеллы Джека Вэнса «Тщай» — искусство.
Современное Искусство — не искусство.
И вот вы мне говорите: «Мне эта граница кажется интуитивно понятной, но не знаю почему — помоги мне найти интенсионал для этого экстенсионала? Дай мне простое описание этой границы».
Я отвечаю: «Думаю, это связано с восхищением искусной работой. Работа на входе, на выходе — диво. Вещи из списка связаны через похожие эстетические переживания, которые они вдохновляют, и направленный на вызов этих переживаний человеческий труд».
Полезно ли это или это лишь нарушение принципов «табу»? Я бы сказал, что список переживаемых эмоций сильней концентрирует массу вероятности, чем список всего что является/не является искусством. Вы можете наблюдать «вспышки» эмоций на ФМРТ — т.е. эмоции далеко не эфемерны.
Но дело, разумеется, не в определении искусства. Дело в том, что вы можете оспорить экстенсионалы или интенсионалы моего определения.
Вы можете сказать мне: «Эстетические переживания — не то, что объединяет эти вещи. Их объединяет намерение вдохновить любую сложную эмоцию просто ради ее вдохновения». И это будет попыткой оспорить мой интенсионал, мою попытку очертить границу через опорные координаты.
Вы можете сказать: «Твое уравнение примерно эти точки описывает, но не подходит под настоящее общее распределение».
Или вы можете оспорить мой экстенсионал, сказав: «Некоторые их этих вещей действительно близко связаны, я вижу к чему ты ведешь, однако язык Питон тогда не должен быть в списке, а Современное Искусство должно». (Это позволит предположить, что вы — лишь легко внушаемый простак, что тоже можно оспорить.) Важный момент: презумпция кривой, генерирующей этот список подобных и не подобных вещей, — схема и основания, пусть вы и не сказали каковы они, но вы видите, как я потерял нить и включил координаты, сгенерированные другим способом.
Задолго до того, как вы поймете, что объединяет электричество и магнетизм, вы начнете сомневаться, основываясь лишь на поверхностных наблюдениях, в том, что «животный магнетизм» действительно входит в список.
Давным-давно люди думали, что слово «рыба» включает в себя дельфинов. Вы, конечно, можете изобразить хитрого спорщика и сказать мне: «Мой список: {лосось, гуппи, акула, дельфин, форель} — всего лишь список. Ты не можешь сказать, что список неверен. Я, с помощью теории множеств, могу доказать, что такой список существует. Так что мое определение «рыб», являющееся лишь экстенсиональным списком не может быть «неверным», что бы ты мне ни говорил».
Или же вы можете прекратить дурацкие игры и признать, что дельфинам не место в этом списке.
Итак, вы составили список вещей, которые, как вам кажется, подобны друг другу. И попробовали догадаться почему они подобны. Но когда вы обнаружите, что же они действительно имеют общего, может оказаться, что ваши догадки были неверными, как и ваш список.
Вам не спрятаться под щитом «верно-по-определению». И экстенсиональное, и интенсиональное определения могут быть неверными, могут разрезать реальность не по месту соединения частей.
Классификация — занятие без гарантий, в котором вы вполне можете понаделать ошибок. Так что, с чисто теоретической точки зрения, полезно будет признать, что ваши догадки-определения могут быть «ошибочными».
Энтропия и короткие сообщения
Элиезер Юдковский
Предположим, у нас есть система Х, которая с одинаковой вероятностью может находиться в любом из 8 возможных состояний:
X1,X2,X3,X4,X5,X6,X7,X8X1,X2,X3,X4,X5,X6,X7,X8
Есть такая экстраординарно распространенная мера, — в физике, математике и даже биологии — называется она «энтропия». И энтропия Х составляет 3 бита. Это значит, что для выяснения состояния Х нам в среднем понадобиться 3 да/нет вопроса. Например, кто-то может нам рассказать о значении Х с помощью такого кода:
(X1:001)(X2:010)(X3:011)(X4:100)(X1:001)(X2:010)(X3:011)(X4:100)
(X5:101)(X6:110)(X7:111)(X8:000)(X5:101)(X6:110)(X7:111)(X8:000)
Так что если я спросил бы «Первый символ — 1?» и получил бы ответ «Да»; «Второй символ — 1?» и услышал бы «Нет»; «Третий символ — 1?» — «Нет»; то я бы знал, что Х находится в состоянии 4.
Теперь предположим, что у системы Y есть четыре возможных состояния с таким распределением вероятностей:
Y1:1/2(0,5)Y1:1/2(0,5)
Y2:1/4(0,25)Y2:1/4(0,25)
Y3:1/8(0,125)Y3:1/8(0,125)
Y4:1/8(0,125)Y4:1/8(0,125)
Тогда энтропия Y будет равна 1,75 бит, что значит нам понадобится 1,75 вопросов в среднем, чтобы узнать значение Y.
В каком смысле можно задать один и три-четвертых вопроса? Представьте, что мы используем следующий код для описания состояния Y:
(Y1:1)(Y2:01)(Y3:001)(Y4:000)(Y1:1)(Y2:01)(Y3:001)(Y4:000)
Сначала вы спросите «Первый символ — 1?», и если ответ «Да», то задача решена: Y находится в состоянии 1. И такое происходит в половине случаев — состояние Y можно вычислить с помощью одного вопроса.
Предположим, что вы получили ответ «Нет». Тогда вы спрашиваете: «Второй символ — 1?». Если ответ «Да», то вы закончили: Y находится в состоянии 2. И это происходит с вероятностью в 1/4, и каждый раз, когда Y в состоянии 2, мы можем узнать это с помощью двух да/нет вопросов — в 25% случаев понадобится два вопроса для определения состояния Y.
Если же вы получили ответ «нет» два раза подряд, и, спросив «Третий символ — 1?», получили ответ «Да», то задача решена и Y в состоянии 3; если нет, то Y в состоянии 4. В 1/8 случаев Y в состоянии 3 и понадобится три вопроса. И в 1/8 случаев Y в состоянии 4 и понадобится три вопроса.
(1/2⋅1)+(1/4⋅2)+(1/8⋅3)+(1/8⋅3)=0,5+0,5+0,375+0,375=1,75.(1/2⋅1)+(1/4⋅2)+(1/8⋅3)+(1/8⋅3)=0,5+0,5+0,375+0,375=1,75.
Общая формула определения энтропии системы S это сумма всех SiSi: −p(Si)⋅log2p(Si)−p(Si)⋅log2p(Si).
Например, log2log2 числа 1/8 — это −3. Получается −(1/8⋅−3)=0,375−(1/8⋅−3)=0,375 — часть энтропии состояния 4 от всей энтропии системы Y — три вопроса.
Закодировать любую систему идеальным кодом получится не всегда, но если вам потребуется передать кому-то сообщение о состоянии случайного количества копий S за один раз, вы можете приблизиться к идеальному коду на случайную величину. (Гуглите «арифметическое кодирование»).
Конечно, вы можете спросить: «Почему бы не закодировать Y4 с помощью 10 вместо 000? Так ведь будет быстрей?»
Но если вы используете 10 для Y4 и получите ответ «да» на вопрос «первый символ 1?», то у вас все еще останется неопределенность: Y1 (1) или Y4 (10). Даже больше, если вы измените код таким образом, вся система полетит к чертям — услышав «1001» вам останется только гадать — «Y4 и Y2» или «Y1 и Y3».
Мораль в том, что короткие слова — ограниченный ресурс.
Ключевой момент в создании хорошего кода, который позволит передавать сообщения максимально компактно, в использовании коротких слов для того, о чем вы будете говорить часто, а длинных — для того, о чем реже.
На своем пике это искусство позволяет добиться почти идеального соответствия между длиной сообщения и вероятностью. Это так называемая «Сообщение минимальной длины» или «Минимальная длина описания», формализация бритвы Оккама.
Так что даже используемые нами ярлыки для слов не совсем случайны. Звуки, которые мы привлекаем для ссылок на идеи могут быть лучше или хуже, мудрей или глупей. И это независимо от традиционного понимания!
Я говорю это все потому, что идея «Вы можете Х так как вам заблагорассудится» сильно мешает понять, как делать Х с умом. «Это свободная страна, и я имею право на свое мнение» стоит на пути у искусства поиска истины. «Я могу определить слово так, как захочу» — стоит на пути разделения реальности на естественные составные части. И даже кажущееся разумным «Прикрепленные к словам ярлыки случайны» стоит на пути осведомленности о компактности. Стихосложения тоже, если уж говорить об этом, — Толкиен однажды заметил, как красиво звучит фраза «cellar door»; таков уровень осведомленности нужен, чтобы использовать язык как Толкиен.
Длина слов так же играет нетривиальную роль к когнитивной науке языка:
Давайте рассмотрим слова «сиденье», «стул» и «мебель». «Сиденье» — более специфическая категория, чем «стул»; «мебель»— более общая. Но большая часть стульев объединена сходными способами их использования — похожие движения, чтобы сесть или встать, похожие причины для сидения — отдых, принятие пищи, чтение. «Сиденья» в этом отношении тоже не слишком отличаются. «Мебель» же включает в себя вещи вроде кроватей, столов, по-разному использующихся и требующих разных телодвижений.
В терминологии когнитивной психологии «стул» относится к базовым категориям.
У людей есть привычка говорить и, предположительно, думать на базовом уровне категоризации. Проводить границы вокруг «стульев», чем вокруг более конкретной категории «сидений», или же вокруг более общей категории «мебели». Человек скорее предложит присесть на стул, чем сесть на сидение или посидеть на мебели.
Так что тут нет совпадения относительно длины этих слов. Базовые категории обычно имеют более короткие названия, и существительные с короткими названиями обычно относятся к базовым категориям. Это не универсальный лингвистический закон, но такая тенденция определенно присутствует. Частое употребление сопутствует коротким словам, а короткие слова — частому употреблению.
Или же как выразил это Дуглас Хофштадтер, есть причины на то, чтобы в английском языке «the» означало «the», а «antidisestablishmentarianism» использовалось для «antidisestablishmentarianism», а не наоборот.
Общая информация и плотность в пространстве вещей
Элиезер Юдковский
Предположим, у вас есть система ХХ, которая может находиться в одном из 8 состояний и все они равновероятны (относительно того, что вы о них знаете на данный момент), и система YY с 4 равновероятными состояниями.
Энтропия ХХ, как следует из рассказанного вчера — 3 бита; нам потребуется задать 3 да/нет вопроса, чтобы точно узнать состояние ХХ. Энтропия YY, как следует из рассказанного вчера — 2 бита; нам потребуется задать 2 да/нет вопроса. Это может показаться очевидным (с учетом того, что 23=823=8 и 22=422=4 — три вопроса помогут выявить правду между 8 возможными вариантами, а 2 между 4), но хочу напомнить, что если бы вероятности не были бы равными, мы смогли бы использовать более хитрый код для обнаружения, например, состояния YY (1,75 вопросов в среднем). Но раз уж для Х и Y вероятности распределены равномерно, схитрить у нас не получится.
Какова общая энтропия объединенной системы (X,Y)(X,Y)?
Возможно вам придет в голову ответ: «Для XX потребует 3 вопроса, для YY — 2, так что нам потребуется задать всего 5 вопросов, чтобы узнать (X,Y)(X,Y)».
Но что если эти две переменные связаны и, узнав что-то о YY, мы узнаем кое-то и о XX?
В данном случае предположим, что обе переменные либо четные либо нечетные.
И если мы получим сообщение в 3 бита (получим 3 ответа), узнаем, что ХХ находится в состоянии 5, то будем знать, что YY либо в состоянии 1 либо в 3, но не в 2 или 4. Так что лишь один вопрос «YY в состоянии 3?» и ответ «нет» понадобится нам, что бы знать состояние объединенной системы
(X,Y):X=X5,Y=Y1(X,Y):X=X5,Y=Y1
И обнаружили мы это с помощью 4 вопросов.
Точно так же, если мы узнаем, что YY в 4 состоянии, с помощью 2 вопросов, то нам понадобится лишь два вопроса, чтобы узнать, в каком из состояний (2,4,6,8)(2,4,6,8) находится ХХ. Опять же, лишь 4 вопроса, чтобы узнать состояние связанной системы.
Общая энтропия двух переменных определяется как разность между энтропией независимых систем и энтропией связанной системы :
I(X;Y)=H(X)+H(Y)−H(X,Y)I(X;Y)=H(X)+H(Y)−H(X,Y)
В данном случае между системами есть 1 бит общей информации. Узнав ХХ, мы получаем 1 бит информации о YY (что сокращает пространство возможностей с 4 до 2, снижает размер в два раза). А информация о состоянии YY сокращает пространство возможностей с 8 до 4.
Но как насчет случаев, где масса вероятности распределена не равномерно? Вчера, например, мы обсуждали случай YY, где вероятности были распределены как 1/21/2, 1/41/4, 1/81/8, 1/81/8 для 4 возможных состояний. Давайте условимся, что так будет выглядеть распределение вероятностей для YY, если мы будем рассматривать YY независимо. Как если бы мы знали YY и больше ничего. И введем еще переменную ZZ с 2 возможными состояниями, с вероятностями 3/83/8 и 5/85/8.
В таком случае, только в том случае, когда объединенное распределение между этими переменными выглядим как описано ниже, — между ними нет общей информации:
(Z1Y1:3/16)(Z1Y2:3/32)(Z1Y3:3/64)(Z1Y3:3/64)(Z1Y1:3/16)(Z1Y2:3/32)(Z1Y3:3/64)(Z1Y3:3/64)
(Z2Y1:5/16)(Z2Y2:5/32)(Z2Y3:5/64)(Z2Y3:5/64)(Z2Y1:5/16)(Z2Y2:5/32)(Z2Y3:5/64)(Z2Y3:5/64)
Это распределение подчиняется закону:
P(Y,Z)=P(Y)P(Z)P(Y,Z)=P(Y)P(Z)
Например,
P(Z1Y2)=P(Z1)P(Y2)=3/8∗1/4=3/32P(Z1Y2)=P(Z1)P(Y2)=3/8∗1/4=3/32
Заметьте, что мы можем узнать маргинальные (независимые) вероятности YY и ZZ просто посмотрев на объединенное распределение:
P(Y1)P(Y1) — полная вероятность всех возможных состояний Y1Y1 в общем распределении:
P(Y1)=P(Z1Y1)+P(Z2Y1)=3/16+5/16=1/2P(Y1)=P(Z1Y1)+P(Z2Y1)=3/16+5/16=1/2
Так что просто проанализировав общее распределение, мы можем определить являются ли маргинальные переменные YY и ZZ независимыми; т.е. когда объединенное распределение разлагается на маргинальные распределение — когда для всех YY и ZZ P(Y,Z)=P(Y)P(Z)P(Y,Z)=P(Y)P(Z).
И это важно, ведь в соответствии с теоремой Байеса:
P(Yi,Zj)=P(Yi)P(Zj)P(Yi,Zj)=P(Yi)P(Zj)
P(Yi,Zj)/P(Zj)=P(Yi)P(Yi,Zj)/P(Zj)=P(Yi)
P(Yi|Zj)=P(Yi)P(Yi|Zj)=P(Yi)
Что можно выразить словами: после того, как мы узнали состояние ZjZj, наше знание о YiYiникак не изменилось.
Так что когда распределение разлагается, когда P(Y,Z)=P(Y)P(Z)P(Y,Z)=P(Y)P(Z), то это равноценно тому, что мы, узнав о YY, не получим никакой информации о ZZ, и наоборот.
И зная это, вы можете, совершенно справедливо, начать подозревать, что между YY и ZZ нет общей информации. А там где нет общей информации, нет и байесианских свидетельств и наоборот.
Предположим, что в вышепоказанном распределении YZYZ мы будем рассматривать каждое возможное сочетание YY и ZZ, как отдельное событие — так что это распределение будет иметь всего 8 возможных вариантов с уже известными вероятностями, тогда мы сможем вычислить энтропию YZYZ точно так же, как и в прошлый раз:
3/16∗log2(3/16)+3/32∗log2(3/32)+3/64∗log2(3/64)+…+5/64∗log2(5/64))3/16∗log2(3/16)+3/32∗log2(3/32)+3/64∗log2(3/64)+…+5/64∗log2(5/64))
У вас получится тот же ответ, как если бы вы отдельно посчитали энтропии систем, а затем сложили бы их. Поскольку между системами нет общей информации, наша неопределенность относительно состояния совмещенных систем точно такая же, как и относительно суммы взятых отдельно. (Вычисления я тут показывать не стану — вы и сами можете это сделать, что касается доказательства — ищите «энтропию Шеннона» («Shannon entropy») или «общую информацию» («mutual information»).)
Но что если объединенное распределение не разлагается? Например:
(Z1Y1:12/64)(Z1Y2:8/64)(Z1Y3:1/64)(Z1Y4:3/64)(Z1Y1:12/64)(Z1Y2:8/64)(Z1Y3:1/64)(Z1Y4:3/64)
(Z2Y1:20/64)(Z2Y2:8/64)(Z2Y3:7/64)(Z2Y4:5/64)(Z2Y1:20/64)(Z2Y2:8/64)(Z2Y3:7/64)(Z2Y4:5/64)
Если вы сложите объединенные вероятности, чтобы получить маргинальные, вы обнаружите, что P(Y1)=1/2,P(Z1)=3/8P(Y1)=1/2,P(Z1)=3/8, и так далее — маргинальные вероятности такие же, как и раньше.
Но объединенные вероятности не всегда равны сумме маргинальных. Например, вероятность P(Z1Y2)=8/64P(Z1Y2)=8/64, где P(Z1)P(Y2)P(Z1)P(Y2) будут 3/8∗1/4=6/643/8∗1/4=6/64. Т.е. вероятность встретить Z1Y2Z1Y2 выше, чем мы бы ожидали, просто учитывая вероятности Z1Z1 и Y2Y2 отдельно.
Что в свою очередь подразумевает:
P(Z1Y2)>P(Z1)P(Y2)P(Z1Y2)>P(Z1)P(Y2)
P(Z1Y2)/P(Y2)>P(Z1)P(Z1Y2)/P(Y2)>P(Z1)
P(Z1|Y2)>P(Z1)P(Z1|Y2)>P(Z1)
И раз тут «необычайно высокая» вероятность P(Z1Y2)P(Z1Y2) определена как более высокая, чем можно предположить, отдельно рассмотрев маргинальные, можно сделать вывод, что наблюдение Y2Y2 увеличит вероятность наблюдать Z1Z1 и наоборот.
Поскольку есть какие-то состояния YY, дающие нам информацию и о ZZ (и наоборот), между ними должна быть общая информация, что вы и обнаружите — я уверен, хоть и не проверял — в результате вычисления энтропии YZYZ вы получите меньше неопределенности, чем в результате вычисления отдельно YY и ZZ. H(Y,Z)=H(Y)+H(Z)−I(Y;Z)H(Y,Z)=H(Y)+H(Z)−I(Y;Z) будут все больше нуля с логической необходимостью.
(Отступлю немного от темы для небольшого замечания. Симметрия общей информации показывает, что YY сообщает нам столько же о ZZ, в среднем, сколько ZZ об YY. В качестве упражнения для читателей я оставлю сопоставление этого и того, что рассказывают на курсах по логике. Что из того, что все вороны черные, следует что все вороны черные, но не следует, что все черные штуки — вороны. Насколько отличается симметричное движение вероятностей байесианства от угловатой логики, даже несмотря на то, что последняя — лишь дегенеративная версия первой?)
И тут вы спросите: «Какое все это имеет отношение к правильному использованию слов?»
В «Пустых ярлыках» и «Замени символ на суть», вы видели пример замены слова его определением с примером:
Все [смертные, ~без перьев, двуногие] смертны
Сократ [смертен, ~без перьев, двуногий]
Следовательно, Сократ смертен
Так зачем же нам нужно слово «человек»? Почему бы просто не сказать «Сократ смертный, без перьев и двуногий»?
Потому что полезно иметь короткие слова для часто встречающихся штук. Если ваш код для отдельных характеристик уже эффективен, то вы не получите никакого преимущества от введения специального слова для конъюнкции: например, «человек» для «смертный, без перьев, двуногий», разве что смертные штуки, штуки без перьев и двуногие штуки встречаются в реальности чаще, чем стоило бы ожидать лишь на основе маргинальных вероятностей.
В эффективных кодах длина сообщения соответствует вероятности, т.е. код для Z1Y2Z1Y2будет такой же длины, как и сумма кодов Z1Z1 и Y2Y2, разве что P(Z1Y2)>P(Z1)P(Y2)P(Z1Y2)>P(Z1)P(Y2), тогда код для Z1Y2Z1Y2 будет короче, чем сумма отдельно взятых кодов.
Это как раз соответствует ситуации, где мы можем сделать вывод об одних характеристиках вещи, пронаблюдав наличие у нее других. Для этого вероятность, что двуногие без перьев окажутся смертными, должна быть более дефолтной.
Разумеется, слово «человек» описывает очень много свойств. Когда вы видите сущность человеческой формы, которая говорит и носит одежду, то можете предположить множество биохимических, анатомических и когнитивных фактов о ней. Чтобы заменить «человек» на описание всего, что мы можем сказать о людях, нам потребуется запредельно много времени. Но это так лишь потому, что говорящие штуки с двумя ногами и без перьев более вероятны, чем маргинальные вероятности позволят предположить, уязвимы для болиголова, или имеют плоские ногти, или сверхуверенны.
Наличие одного слова для вещи вместо перечисления ее свойств позволяет сделать код компактней именно в тех случаях, когда можно предположить наличие одних свойств, основываясь на наблюдении других. (За исключением таких базовых слов как «красный», которое может быть использовано для передачи несжатого описания нашего сенсорного переживания. Но уже в случае с жуком или камнем, мы будем иметь дело со сложными совокупностями свойств, намного превышающими базовый уровень.)
Поэтому наличие слова «виггин» для зеленоглазых черноволосых людей полезней, чем просто «зеленоглазые черноволосые люди», именно тогда:
Когда зеленоглазые люди, в среднем, более вероятно являются еще и черноволосыми (и наоборот), т.е. мы можем сделать вероятностный вывод о «зеленоглазости», после наблюдения «черноволосости» и наоборот.
Или же когда виггины имеют другие свойства, о которых можно сделать вероятностное предположение с большей, чем сумма маргинальных, вероятностью. В данном случае нам потребуется независимо проследить за наличием черных волос и зеленых глаз, а затем можно сделать вероятностный вывод о других свойствах (вроде пристрастия к кетчупу).
Можно даже рассматривать наличие слова как своего рода обещание. Сказать кому-то «Я определяю слово «виггин» как человека с черными волосами и зеленым глазами», в соответствии с импликатурой Грайса, значит пообещать, что слово «виггин» каким-то образом поможет предположить зависимость между черными волосами и зелеными глазами и укоротить код.
Если зеленые глаза и черные волосы не встречаются с большей, чем сумма маргинальных, вероятностью, или же никакое другое свойство не встречается чаще в сочетании с этим цветом волос и цветом глаз, то слово «виггин» является ложью. Оно утверждает, что определенных людей стоит выделять в группу, а они группой не являются.
В данном случае слово «виггин» не помогает более компактно описывать реальность, ведь оно не предназначалось как помогающее сократить длину сообщения. Тогда ему не место в массиве простых объяснений. Точно так же «виггин» не поможет сделать байесианский вывод. Даже если вам неудобно называть слово «ложью», оно, как минимум, — ошибка.
Разрезать реальность по месту естественного соединения частей — проводить границы вокруг необычно плотно сконцентрированных вероятностей в пространстве вещей.
Слова как мысленные кисти
Элиезер Юдковский
Представьте, что я скажу вам: «Удивительно — у светильников в этом отеле треугольные лампочки».
Может быть, вы это уже представили, может быть, нет. Если нет, сделайте это сейчас. Какими именно представляет ваш внутренний взор треугольные лампочки?
В частности, у них острые края или закруглённые?
Насколько мне позволяет судить интроспекция, когда у меня в голове впервые появилось словосочетание «треугольные лампочки» (нет, в отеле их не было), я сразу же увидел лампочку в виде пирамидки с острыми краями. Затем (практически мгновенно) грани сгладились, после чего мой мозг, в качестве альтернативы, выдал замкнутую трубку люминесцентной лампы в форме треугольника со скруглёнными краями.
Кажется, ни одной сформулированной/словесной мысли при этом задействовано не было. Лишь быстрая безмолвная реакция в ответ на воображаемый образ острого стекла, изъяны в форме которого были исправлены до того, как на ум пришло первое слово.
Можете не верить, но люди несколько десятилетий всерьёз спорили о том, можем ли мы создавать визуальные образы в своей голове на самом деле — например, можем ли мы по-настоящему мысленно увидеть изображение стула в каком-нибудь окружении, — или мы лишь наивно думаем, что можем (будучи обмануты этим «самонаблюдением», ужасной и запрещенной деятельностью), а на самом деле в нашем мозге просто активируется маленький ярлычок «стул», что-то вроде указателя в программном коде1.
Сейчас мне очень сложно удержаться от восклицаний вроде «Какая потрясающая нелепость». Такие восклицания — следствия ошибки знания задним числом. Но всё же: какая потрясающая нелепость.
Я думаю, подобная точка зрения в академической среде в значительной степени была безумным наследием бихевиоризма. Бихевиоризм отрицал существование мышления у людей и пытался объяснить все аспекты человеческого поведения (включая речь) «рефлексами». Скорее всего, о бихевиоризме стоит написать отдельно, как о своеобразном извращении рационализма. Но сейчас я пишу о другом.
«Ты называешь это предположение нелепым, — скажете вы, — но откуда ты можешь узнать, что твой мозг производит эти визуальные образы? Тебе достаточно того, что ты просто закрываешь глаза и видишь их?»
Сейчас ответить на этот вопрос проще, чем в те времена. Если вас не устраивает простое самонаблюдение и вы намерены проверить реальность мысленных образов «научно», вам понадобится вывести это из эксперимента. Например, покажите людям два предмета и спросите, можно ли один из них повернуть так, чтобы получить второй. Время ответа линейно зависит от необходимого угла поворота. Такой результат сложно объяснить, если вы только сверяете какие-то особенности изображений. Но если вы действительно представляете предмет в уме и непрерывно вращаете его с постоянной скоростью, то все сходится.
Сегодня мы можем увидеть настоящие нейрообразы небольших картинок из зрительной коры. Так что, да, ваш мозг реально воспроизводит детализированные визуальные образы того, что он видит или представляет. Советую книгу Стивена Косслина «Мозг и Образы: итоги споров о воображении»2.
Людям сложно использовать слова в том числе и потому, что они не понимают всю сложность, что таится за ними.
Вы можете представить «зелёную собаку»? Вы можете представить «сырное яблоко»?
«Яблоко» — это не просто последовательность из трёх слогов или шести букв. Последовательность из шести букв всего лишь тень. Лишь кончик от тигриного хвоста.
Слова, точнее понятия, скрывающиеся за ними, подобны кистям художника. Вы можете писать ими картины в вашем собственном воображении. Писать в буквальном смысле, если вы используете кисти идей, чтобы создать картину на холсте своей зрительной коры. Используя общие ярлыки, вы также можете схватить кисти в головах других людей и написать картины там. Например, набросать маленькую зелёную собачку на чьей-то зрительной коре.
Но, распространяя звуки через воздух или буквы через Интернет, не заблуждайтесь, будто именно звуки и буквы пишут картины в зрительной коре. Эта задача требует более сложных инструкций, чем могла бы вместить последовательность букв. «Яблоко» — это шесть байт, но написание натюрморта с яблоком с нуля потребовало бы гораздо больше данных.
«Яблоко» — это всего навсего ярлык, скреплённый с настоящей и невыразимой словами идеей яблока. Идеей, что может написать картину в вашей зрительной коре, или столкнуться с «сырностью», или распознать яблоко, когда оно будет перед вашими глазами, или почувствовать его образец в яблочном пироге, или даже запустить движение челюсти, привычное при поедании яблока…
И это не просто воспроизведение картинок из памяти. Иначе как вы могли бы визуализировать нечто вроде «треугольной лампочки», наложить треугольность на лампочку и совместить обе сущности, если никогда в своей жизни не видели ничего похожего?
Не совершайте той же ошибки, что и бихевиористы. Речь гораздо сложнее, чем просто звуки в воздухе. Ярлыки служат лишь указателями: «Ищите в сегменте памяти №1387540». Если у вас есть указатель, рано или поздно настанет время перейти по нему и действительно заглянуть в сегмент памяти №1387540.
На что слово указывает?
1.В оригинале «LISP token». — Прим.перев.
2.Stephen M. Kosslyn, Image and Brain: The Resolution of the Imagery Debate (Cambridge, MA: MIT Press, 1994).
Когда слова ошибочны
Элиезер Юдковский
Некоторые читатели утверждают, что было бы лучше назвать эту заметку «37 случаев, в которых слова можно использовать неразумно» или «37 случаев, когда недостаточно оптимальное использование категорий может вызвать негативные эффекты в вашем восприятии». Но одна из основных идей, которым учит этот немаленький список, заключается в том, что утверждение «Не может быть, чтобы мой выбор Х был неверным» практически всегда ошибочно, независимо от теории. Люди могут заблуждаться в любом конкретном случае. Даже если теоретически возможно быть всегда правым, на деле вы будете ошибаться. Не бывает универсального счастливого билета на любой случай, такова жизнь.
Кроме того, я могу определить слово «ошибочен» любым способом, каким захочу — но это не значит, что само слово становится ошибочным. Впрочем, лично я считаю, что в следующих случаях использование понятия «ошибочный» вполне оправдано:
1. Слово потеряло всякую связь с реальностью.
Является ли Сократ асботниктором? Да или нет? (
Притча о кинжале
.)
2. Ваши слова, если бы такое было возможно, принудили бы реальность измениться при изменении словесного определения.
Сократ — человек, а люди по определению смертны. Если вы определите людей как бессмертных существ, будет ли Сократ жить вечно? (
Притча о болиголове
.)
3. Вы пытаетесь установить эмпирические взаимоотношения, как будто бы они верны «по определению».
Сократ — человек, а все люди по определению смертны. В таком случае будет ли логически верным, если мы предскажем результат опыта, в котором Сократ пьёт настойку болиголова и теряет сознание? Ведь является логически возможным и непротиворечивым существование миров, в которых Сократ не потеряет сознание. В которых он будет иметь иммунитет к болиголову, в результате, например, странного сбоя в его биохимических процессах. Логические истины истинны во всех возможных мирах, но эти истины не сообщают, в каком из возможных миров вы находитесь. Поэтому всё, что вы задаёте «по определению» является логически верным. (
Притча о болиголове
.)
4. Вы неосознанно навешиваете условные ярлыки на что-либо, в реальности не используя словесные определения, которые вы только что дали.
Вы точно знаете, что Боб — человек. Хотя, в вашем определении вы не будете называть Боба человеком, не удостоверившись сначала в том, что он смертен. (
Притча о болиголове
.)
5. Факт навешивания словесного ярлыка скрывает спорный индуктивный вывод, который вы делаете.
Если последние 11 извлечённых вами яйцевидных объектов были синими, а последние 8 кубических объектов были красные, то применив индукцию вы можете предположить, что это соотношение сохранится и будущем. Но если вы назовёте синие яйца «сияйцами», а красные кубы «крубами», то вы можете засунуть руку в бочку, нащупать что-то круглое и подумать «Ага, сияйцо». (
Слова как скрытые умозаключения
.)
6. Вы пытаетесь определить одни слова с использованием других, более сложных и формальных понятий, без возможности указать на конкретный образец.
— Что такое «красный»?
— «Красный» это цвет.
— Что такое «цвет»?
— Цвет это свойство вещей.
— Что такое «свойство»? Что такое «вещь»?
Такого не случится, если вы укажете на красный сигнал светофора и на красное яблоко. (
Экстенсионалы и интенсионалы
.)
7. Фактическое определение не совпадает со словесным определением.
Мы не осознаём, что определяем красную точку на небе как «Марс», и это может происходить независимо от того, что мы определим «Марс» как бога войны. (
Экстенсионалы и интенсионалы
.)
8. Ваше словесное определение охватывает всего лишь небольшую часть общих характеристик категории, но вы пытаетесь рассуждать, будто определение полное.
Когда философы в платоновской академии решили, что лучшим определением человека является «двуногое без перьев», киник Диоген предъявил им ощипанного петуха и провозгласил, что это и есть «человек Платона». Тогда ученики Платона просто исправили определение на «двуногое без перьев и с плоскими когтями». (
Кластеры подобия
.)
9. Вы пытаетесь рассматривать членство в определённой категории по принципу всё или ничего, не обращая внимания на то, что могут существовать подгруппы более или менее типичных членов.
Утки и пингвины являются менее типичными птицами по сравнению с малиновками и голубями. Интересно, что межгрупповые эксперименты показали, что люди думают, будто болезни легче передаются от малиновок к уткам на островах, чем от уток к малиновкам. (
Типичность и асимметричное подобие
.)
10. Словесное определение хорошо работает, чтобы на практике указывать на группы сходны объектов, но вы придираетесь к исключениям.
Не каждый человек имеет десять пальцев, или носит одежду, или использует язык. Однако, если посмотреть на реальные группы объектов, которые разделяют эти характеристики, вы получите достаточно информации, чтобы попадающиеся время от времени люди с девятью пальцами не ввели вас в заблуждение. (
Кластерная структура пространства вещей
.)
11. Вы спрашиваете, принадлежит ли объект некоторой категории, но не называете вопрос, ответ на который вы на самом деле хотите получить.
Что есть «человек»? Является ли младенец Барни человеком? Правильный ответ на этот вопрос может сильно зависеть от того, что вы действительно хотите выяснить: «Хорошо ли кормить Барни болиголовом?» или «Будет ли Барни хорошим мужем?». (
Замаскированые вопросы
.)
12. Вы рассматриваете интуитивно воспринимаемые иерархические категории, как единственно верный способ анализа мира, не осознавая, что возможны и другие способы делать статистически выводы, даже если вы их не используете.
Для человека значительно проще определить, является ли предмет сияйцом или крубом, чем обратить внимание на то, что красные предметы никогда не светятся в темноте, но красные мохнатые предметы обладают всеми прочими характеристиками сияиц. Прочие статические алгоритмы работают иначе. (
Нейронные категории
.)
13. Вы рассуждаете о категориях, будто они как манна упали из мира идей Платона, хотя это всего лишь ярлыки в вашем сознании, связанные с определённой концепцией.
Древние философы говорили «Сократ человек», а не «Мой мозг посредством ощущений определяет Сократа, как попадающего в концепцию «человек». (
Как алгоритм ощущается изнутри
.)
14. Вы продолжаете спорить о принадлежности к категории после отсеивания всех вопросов, которые могут зависеть от выводов, основанных на категориях.
После того, как вы определили, что предмет синий, яйцеобразный, мохнатый, гибкий, непрозрачный, светящийся в темноте и содержащий палладий, что является всеми признаками сияиц, какой смысл спрашивать «Сияйцо ли это?» Однако, если распределяющая нейронная сеть вашего мозга содержит условный центр, связанный с выведением понятия сияйцности, то может показаться, что такой вопрос всё-таки существует. (
Как алгоритм ощущается изнутри
.)
15. Вы позволяете дискуссии сместиться в область обсуждения определений, несмотря на то, что вы изначально не планировали об этом спорить.
Если перед началом спора о том, производит ли «шум» падающее дерево в лесу, когда звук падения никто не слышит, вы спросите двух будущих спорщиков о том, что они будут подразумевать под «шумом», звуковые волны или слуховые переживания, они, возможно, предложат вам бросить монетку. Но после начала дискуссии определение всё равно станет обсуждаться. (
Споры об определениях
.)
16. Вы считаете, что слово имеет смысл само по себе, а не потому, что оно является меткой, связанной с некоторыми понятиями в вашем мозгу.
Когда кто-то кричит «А-а-а! Тигр!», эволюция не предпочтёт организмы, которые подумают: «Ммм… Я только что услышал слоги «ти» и «игр», которые члены моего племени связывают со своей внутренней моделью, соответствующей моему личному понятию «тигр», и которое А-А-А! ХРУМ ХРУМ ХРУМ». Поэтому мозг сокращает цепочку рассуждений, и кажется, что смысл тигриности несёт само слово. Люди спорят о правильном значении слов, например слова «шум». (
Ощути смысл
.)
17. Вы спорите о значении слов даже в том случае, когда все стороны прекрасно понимают, что остальные имеют в виду под этим словом.
Свойство человека связывать ярлыки с определёнными понятиями является средством общения. Когда люди хотят общаться, их тяжело остановить. Если у людей нет общего языка, они общаются рисуя картинки на песке. Когда каждый поймёт, что находится в разуме у остальных, дело будет сделано. (
Аргумент к традиционному пониманию
.)
18. Вы обращаетесь к словарю в разгаре спора о практических вещах или о морали.
Редакторы словарей скорее историки языка, нежели его законодатели. Если обычное определение содержит сложность, например, Марс определён, как бог войны, дельфин как вид рыб, или негры как нелюди, то словарь отражает распространённое заблуждение. (
Аргумент к традиционному пониманию
.)
19. Вы обращаетесь к словарю в разгаре любого спора.
Вы и вправду считаете, что редакторы словарей являются авторитетными специалистами в области определения атеизма как религии, или в любой другой? Даже если ставки в вашем споре крайне высоки, неужели вы считаете, что редакторы словарей достигли просветления, которое поможет им разрешить любой ваш диспут? (
Аргумент к традиционному пониманию
.)
20. Вы игнорируете распространённое определение без повода, лишая окружающих всякой возможности вас понять.
Быстро встаёт плутоний с бочками без ручек. (
Аргумент к традиционному пониманию
.)
21. Вы используете сложные термины взамен простых чтобы создать иллюзию получения выводов.
Если «человек» определить как «смертное двуногое без перьев», то можно написать: Все смертные двуногие без перьев смертны. Сократ — смертное двуногое без перьев, поэтому Сократ смертен. Выглядит не так впечатляюще в данном случае, не так ли? (
Пустые ярлыки
.)
22. Вы вступаете в спор, которого могли бы избежать, если бы не использовали конкретное слово.
Если Альберт и Барри не смогут использовать слово «шум», то Альберту придётся сказать: «Дерево, падающее в лесу, в котором никого нет, производит звуковые волны. А Барри скажет: «Дерево, падающее в лесу, в котором никого нет, не вызывает слуховых переживаний». Если слово создаёт проблему, то простейшим решением будет исключение этого слова из употребления, как и его синонимов. (
Табуируй свои слова
.)
23. Ваше внимание отвлекается на короткое изящное слово, и вы не можете обдумать данное понятие во всех подробностях.
Что происходит в школах, если перестать это называть образованием? Что такое степень, если не называть это «степенью»? Если монета упала «орлом», то какова её радиальная ориентация? Как может быть нечто «истинно», если нельзя употребить «точный», «правильный», «представлять», «отражать», «семантический», «убеждение», «знание», «карта», «реальный» или любые другие простые термины? (
Замени символ на суть
.)
24. У вас есть только одно слово, которому соответствуют два или более реальных объектов. И из-за этого все связанные с этими объектами факты собираются в одну кучу у вас в голове.
Частью обычной работы детектива является наблюдение за тем, носила ли Кэрол красное платье прошлым вечером, или что у неё чёрные волосы. Также детектив может поинтересоваться, красит ли Кэрол волосы. Но более сообразительный детектив может также задуматься, а может Кэрол было двое, одна носила красное платье, вторая была с чёрными волосами. (
Ошибки сжатия
.)
25. Вы устанавливаете зависимости там, где их не существует, извлекая некие свойства их ваших определений, даже в случаях, когда нет сходства между данными областями.
В Японии считается, что люди с первой группой крови серьёзные и творческие, со второй — импульсивные и жизнерадостные, с третьей — хорошо социализированные и приятные, с четвёртой — сдержанные и с хорошим самообладанием. (
У классификации есть последствия
.)
26. Вы добавляете побочные смысл к слову, основываясь на определении, которое не включает в себя побочные смыслы.
«Виггин» определён в словаре как человек с чёрными волосами и зелёными глазами. Но это слово также имеет побочный смысл, обозначая людей, совершающих преступления и издевающихся над животными, но этого нет в словаре. И вы показывается не кого-то пальцем и сообщаете: «Чёрные волосы и зелёные глаза? Ага, он Виггин! Смотрите, сейчас он будет красть серебряные ложки». (
Контрабанда характеристик
.)
27. Вы утверждаете, что X суть Y по определению. В таких случаях вы почти наверняка добавите дополнительные смыслы к Y, чего не было в исходном определении.
Вы определяете человека как двуногое без перьев, и, показывая на Сократа, сообщаете: «Нет перьев, две ноги, должно быть, это человек!» Но на самом деле вы думаете о чём-то ином, например о смертности человека. Если подобное случится во время дискуссии о количестве ног у Сократа, ваш оппонент может возразить: «Как же так, у Сократа две ноги? Это же как раз то, с чего мы начали спорить!» (
Аргумент «по определению»
.)
28. Вы утверждаете, что объекты P по определению являются объектами типа Q.
Если вы видите, как Сократ в компании биологов собирает травы, которые могут вызвать сопротивляемость к болиголову, то нет смысла оспаривать утверждение «Люди по определению смертны». В большей части случаев, когда вам кажется, что надо сильнее надавить и настоять на некоем утверждении «по определению», в реальности существуют иные факты, ставящие ваш вывод под сомнение. (
Аргумент «по определению»
.)
29. Вы пытаетесь установить принадлежность к реально существующей группе «по определению».
Не требуется утверждать, что «Индуизм, по определению, является религией», потому что индуизм действительно является религией. Это не религия «по определению», а, можно сказать, реальная религия. Атеизм же не похож на основных членов группы «религии», так что, если бы внезапно не оказалось, что атеизм является религией по определению, то вы бы пришли к выводу, что это всё-таки не религия. По этой причине вы можете подавить любых противников, сообщая, что утверждение «Атеизм является религией» верно по определению, хотя во всех остальных случаях это всё же не верно. (
Аргумент «по определению»
.)
30. Ваше определение ограничивает группу неких объектов, которые не связаны друг с другом.
Вы можете, если захотите, утверждать, что слово «рыба» относится к лососям, гуппи, акулам, дельфинам и форели, но не к медузам или водорослям. Вы можете утверждать, что это всего лишь список, и не может быть, чтобы список был ошибочным. Или вы можете перестать валять дурака и признать, что вы допустили ошибку и дельфины не принадлежат к списку, в которых входят рыбы. (
Где проводить границу?
)
31. Вы используете короткое слово для того, что не нужно часто упоминать, или длинное слово для того, что упоминается часто. Это может приводить к неэффективном рассуждениям, или даже к некорректному применению Бритвы Оккама — если ваш разум будет считать, что короткие предложение звучат «проще».
Что звучит правдоподобнее: «Бог сотворил чудо» или «Сверхъестественная сущность, создавшая вселенную, временно изменила законы физики»? (
Энтропия и короткие сообщения
.)
32. Вы ограничиваете определённое пространство идей, которое не содержит какое-то отличное от окружающего пространства количество понятий. В результате слово, обозначающее группу объединённых понятий не связано с хоть сколь-нибудь производительным Байесовским выводом.
Раз уж зеленоглазые люди не имеют чёрные волосы чаще, чем волосы другого цвета, и чёрные волосы также не связаны с зеленоглазостью, и кроме того людей с зелёными глазами и чёрными волосами не объединяют какие-либо иные значимые черты, то зачем вообще нужно слово «уиггин»? (
Mutual Information, and Density in Thingspace
.)
33. Вы ограничиваете множество вещей без значимой причины для такого действия.
Придумывание слова для всех людей, кроме негров, выглядит несколько подозрительным. Если вы не сообщаете причины такого разграничения, создавая произвольные термины, это может выглядеть примерно следующим образом, как если бы детектив сказал: «Знаете, у меня нет не единого повода предпочесть одного или другого человека, кто бы мог убить тех сирот. Однако, может рассмотрим Джона Вифлхайма, как подозреваемого?» ([Superexponential Conceptspace, and Simple Words.(
http://lesswrong.com/lw/o3/superexponential_conceptspace_and_simple_words/
).)
34. Вы используете классификации, чтобы делать выводы о свойствах, не имеющих реальных структур, а именно, условная независимость данных групп в случае хорошего приближения при использовании простой интерпретации теоремы Байеса.
Я ни за что не буду пытаться это резюмировать, просто прочитайте соответствующую заметку. (Которая пока не переведена,
прим. пер.
) (
Conditional Independence, and Naive Bayes
.)
35. Вы полагаете, что слова больше похожи на маленькие символы языка ЛИСП, нежели на на ярлыки, действующие как манипуляторы, которые управляют сложными ментальными кистями, рисующими подробные картины на мысленном холсте.
Представьте «треугольную электролампу». Что вы видите? (
Words as Mental Paintbrush Handles
.)
36. Вы используете слово, имеющее разные значения в различных ситуациях, будто оно имеет всегда один и тот же смысл, создавая иллюзию чего-то непостоянного и изменчивого.
«Мартин сказал Бобу свернуть налево». Но «налево» является функциональным словом, принимающим во внимание расположение говорящего относительно его окружения. Какое же «налево» имеется в виду, Боба или Мартина? (
Variable Question Fallacies
.)
37. Вы считаете, что определения не могут быть ошибочны, или что «Я могу определить любое слово так, как пожелаю!»
Такое отношение заставляет вас яростно отстаивать ваши прошлые поступки, вместо того, чтобы учесть их последствия или признать свои ошибки. (
Когда слова могут быть ошибочны
.)
Всё, что происходит в вашем разуме, имеет какой-либо результат, и ваш мозг движется вперёд без вашего руководства, не осознавая происходящее.
Утверждать «Слова можно использовать как угодно, я могу определить любое слово, как пожелаю» столь же осмысленно, как и вести автомобиль по тонком льду с выжатой до отказа педалью газа, рассуждая: «Посмотрите на руль, я не считаю, что любой его угол поворота чем-то выделяется на фоне других, поэтому я могу рулить так, как захочу».
Если вы хотите куда-то добраться или просто попробовать выжить, вам стоит начать уделять внимание трём или шести десяткам оптимальных критериев, контролирующих ваше использование слов, определений, категорий, классов, разграничений, ярлыков и концепций.
Просто реальность
Правда закономерна
Единый огонь
Элиезер Юдковский
В фэнтезийной книге Л. Спрэг де Кампа «Дипломированный чародей» [Э. Юдковский почему-то не упоминает второго автора, Флетчера Прэтта - Прим.перев.] (которая породила множество последующих подражаний) главный герой, Гарольд Ши, переместился из своей вселенной во вселенную скандинавских мифов. Вселенная скандинавских мифов основана скорее на магии, нежели на технологии, поэтому естественно, что, когда Наш Герой попробовал зажечь огонь спичкой, принесенной с Земли, та его подвела.
Я понимаю, что это всего лишь фентези, но… как бы изложить…
Нет, не так.
В конце 18 века Антуан Лоран Лавуазье открыл огонь. «Что?» — воскликнете вы. Разве к тому времени огонь не использовали уже несколько сотен тысяч лет? Да, действительно, люди использовали огонь — обжигающий, яркий, примерно оранжевого цвета и очень удобный для приготовления пищи. Но никто не знал, как он работает. Греки и средневековые алхимики полагали, что Огонь является одним из четырех базовых элементов. К временам Лавуазье алхимическая парадигма включала в себя множество поправок и стала чрезвычайно сложной, но огонь по-прежнему оставался основополагающей сущностью — уже в виде «флогистона», некоего загадочного вещества, которое, как утверждалось, объясняло огонь, а также все остальные алхимические явления.
Важнейшая новая идея Лавуазье заключалась в том, чтобы взвесить абсолютно все части химической головоломки, как до химической реакции, так и после. До него считалось, что некоторые химические процессы способны изменять вес используемого материала. Например, если мелко протёртую сурьму подвергнуть воздействию направленного через увеличительное стекло солнечного света, то через час сурьма обратится в пепел, а сам пепел будет весить на одну десятую больше, чем исходный объем сурьмы — даже несмотря на то, что при горении от сурьмы исходит густой белый дым. Лавуазье взвесил совершенно все компоненты таких реакций, включая воздух, в котором они протекали, и обнаружил, что материя не создаётся и не разрушается. Увеличение массы сгоревшего пепла взаимосвязано с уменьшением массы воздуха.
Лавуазье также было известно, как разделять газы, и он обнаружил, что горящая свеча уменьшает количество одного вида газа — «жизненного воздуха» и создает иной газ — «связанный воздух». Сегодня мы бы их назвали кислородом и углекислым газом. Когда жизненный воздух заканчивается, пламя угасает. Можно было предположить, что горение преобразует жизненный воздух в связанный, а топливо — в пепел, причём длительность преобразования ограничена количеством доступного жизненного воздуха.
Идея Лавуазье полностью противоречили существующей теории флогистона. Одного этого хватило бы, чтобы потрясти всех, но после этого выяснилось…
Чтобы оценить дальнейшие события, нужно представить себя человеком XVIII века с его ограниченными познаниями. Забудьте об открытии ДНК, которое случилось лишь в 1953. Забудьте всё, что вам известно о клеточной теории в биологии, сформулированной в 1839. Представьте, как вы смотрите на свои руки, сгибаете пальцы… и абсолютно не понимаете, почему они сгибаются. Анатомия мышц и костей была известна, но никто не имел ни малейшего представления «как они работают» — почему мышцы сгибаются и сокращаются, хотя слепок из глины похожей формы остается неподвижен. Представьте, что ваше собственное тело состоит из загадочной, непостижимой субстанции. А теперь представьте открытие…
…что люди в процессе дыхания потребляют жизненный воздух и выдыхают связанный. В людях тоже происходит горение! Лавуазье измерил количество тепла, которое животные (и помощник Лавуазье, Сеген) производят при упражнениях, объем потребленного жизненного воздуха и объём выдыхаемого связанного воздуха. Когда животные производят больше тепла, они потребляют больше жизненного воздуха и выдыхают больше связанного. Люди, подобно пламени, потребляют топливо и кислород, люди, подобно пламени, вырабатывают тепло и углекислый газ. Лиши человека кислорода или топлива, и огонь исчезнет.
Спички загораются из-за фосфора — у «безопасных спичек» есть фосфор на зажигательной ленте, у сесквисульфидных спичек фосфор нанесен на головку. Фосфор очень быстро вступает в химические реакции — чистый фосфор светится в темноте и может спонтанно воспламениться. (Хенниг Бранд, выделивший чистый фосфор в 1669, утверждал, что обнаружил Элемент Огня.) К тому же фосфор вполне соответствует своему назначению в аденозинтрифосфате, АТФ, — веществе, благодаря которому в организме накапливается энергия химических реакций. АТФ порой называют «молекулярной валютой». Она дает силы мышцам и заряжает нейроны. Практически все метаболические реакции зависят от АТФ, и, следовательно, от химических свойств фосфора.
Если спичка перестает функционировать, то и вы тоже. Невозможно поменять что-то одно.
Нет очевидной связи между утверждениями поверхностного уровня «Спичка зажигается от чирканья» и «Людям нужен воздух, чтобы дышать». Потребовались столетия, чтобы обнаружить эту связь, и даже сейчас, судя по всему, это какой-то несущественный факт, которому учат в школе и который важен лишь для небольшого круга специалистов. Нам слишком легко вообразить мир, где одно из этих правил работает, а второе — нет, перестать верить в одно, но не в другое. Но это лишь воображение, а не реальность. Если вы разделили карту на четыре части, чтобы её было проще хранить, это не значит, что сама территория также разделена на четыре обособленные части. Наш разум хранит отдельные правила поверхностного уровня в обособленных отсеках, но это не отражает никакой обособленности законов, управляющих Природой.
Мы можем извлечь из всего этого урок. Поведение фосфора проистекает из ещё более глубоких законов: законов электродинамики и хромодинамики. «Фосфор» — это лишь наше слово для обозначения электронов и кварков, организованных определенным образом. Нельзя изменить химические свойства фосфора, не изменив законы, которым подчиняются электроны и кварки.
Если вы окажетесь в мире, где спички не зажигаются, вы перестанете быть организованной материей.
Реальность сплетена гораздо плотнее, чем люди предпочитают верить.
Единый закон
Элиезер Юдковский
Антуан Лоран Лавуазье обнаружил, что дыхание и огонь (горение) работают по одному принципу. Это было одно из наиболее поразительных объединений в истории науки, оно слило вместе мирскую сферу материи и священное таинство жизни, которые люди делили на отдельные мистерии.
Первое великое объединение было сделано Исааком Ньютоном, который сказал, что движение планет подчиняется тем же законам что и падающее яблоко. Шок от этого открытия был больше, чем от открытия Лавуазье. Дело было не только в том, что Ньютон осмелился объединить земное царство материи с явно отличной и священной небесной сферой, когда-то считавшейся обителью богов. Открытие Ньютона породило понятие универсального закона, который одинаков везде и всегда, буквально не имея исключений.
Люди живут в мире поверхностных явлений, которые делятся на категории, из которых вытекает большое количество исключений. Тигр ведет себя не так, как буйвол. Большинство буйволов имеют четыре ноги, но, возможно, у этого есть три. Зачем кому-то думать что есть законы, которые верны везде? Это, очевидно, не так.
Только в одном случае, похоже, мы хотим закон, который бы выполнялся везде — это когда мы говорим о моральных законах — социальных правилах поведения. Некоторые члены племени могут попробовать взять больше, чем их доля от буйвола, возможно с каким-либо умным оправданием, так что в случае моральных законов мы, кажется, в самом деле имеем инстинкт универсальности. Да, правило о разделе мяса применяется и к вам, нравится ли вам это или нет. Но даже тут есть исключения. Если по некоторой аномальной причине более сильное племя угрожает перебить вас, если Боб не получит в два раза больше мяса, нежели все остальные, вы дадите Бобу двойную порцию. Идея правила, которое вообще не имеет исключений, кажется слишком жесткой, продуктом ограниченного мышления фанатиков, поскольку, находясь в тисках своей идеи, они не могут осознать богатства и сложности реального мира.
Это обычное обвинение в адрес ученых — профессиональных знатоков богатства и сложности реальной Вселенной. Потому что когда вы на самом деле смотрите на вселенную, оказывается, что она является, по человеческим меркам, безумно жесткой в применении своих правил. Насколько мы знаем, не было ни одного нарушения сохранения импульса с незапамятных времен до наших дней.
Иногда, очень редко, мы наблюдаем явное нарушение наших моделей фундаментальных законов. Хотя наши научные модели могут существовать в течение одного или двух поколений, они не являются стабильными на протяжении веков. Но не думайте, что это делает саму Вселенную капризной. Это смешение карты с территорией. Ибо, когда пыль уляжется, и старая теория будет заменена, то получается, что Вселенная всегда действовала в соответствии с новым обобщением, которое мы обнаружили, которое опять будет абсолютно универсальным в свете текущих человеческих знаний. Когда было обнаружено, что ньютоновская гравитация была частным случаем общей теории относительности, было видно, что общая теория относительности формировала орбиты Меркурия за десятилетия до того, как человек узнал об этом, и позже стало очевидным, что общая теория относительности управляла коллапсом звезд в течение миллиардов лет, прежде чем появилось человечество. Ошибаются только наши модели — сам Закон был всегда абсолютно постоянным или так наша новая модель говорит нам.
Я могу утверждать, что уверен только на 80 %, что предел скорости света в следующую сотню тысяч лет останется таким же, однако это не значит что предел является таковым только 80 % времени, а в остальное время меняется. Предположение, в котором я обозначил вероятность в 80 % это то, что действительное положение дел (скорость света) останется таким на всем протяжении пространства-времени.
Одна из причин, по которой древние греки не занимались наукой, это то, что они не представляли, как можно обобщать эксперименты. Греческие философы были заинтересованы в «обычных» явлениях. Если вы проводите выдуманный эксперимент, то вы скорее всего получите аномальный результат, который не будет иметь ничего общего с тем, как на самом деле работают вещи.
Вот как люди пытаются мечтать, прежде чем начинают учиться; но о чем мечтала Вселенная сама по себе, прежде чем начала мечтать о людях? Если вы действительно хотите научиться думать в соответствии с реальностью — для этого здесь приводится это дао:
С самого начала
Ни одна необычная вещь
Не случалась
Реальность безобразна?
Элиезер Юдковский
Читать после: О красоте математики, Предполагая красоту
Вчера я говорил о последовательности кубов {1, 8, 27, 64, 125, …} и как поначалу последовательность из их разностей первого порядка {7, 19, 37, 61, …} не содержит очевидного паттерна, но если взять последовательность разностей второго порядка {12, 18, 24, …}, то закономерность становится простой. Вычисление разностей третьего порядка {6, 6, …} приводит нас к идеально стабильному уровню, где хаос разрешается в порядок.
Но это (как я заметил) довольно искусственный пример. Может быть, «беспорядочному реальному миру» не достает красоты подобных абстрактных математических объектов? Может быть, будет более правильно поговорить здесь о нейронауке или сети экспресии генов?
Абстрактная математика, созданная одним только воображением, строится на простых основаниях – небольшом наборе первоначальных аксиом — и является закрытой системой; условия, которые могут выглядеть как не особенно природные и невероятноспособствующие аккуратности.
Другими словами: в чистой математике вам не надо беспокоиться о тигре, которые может выпрыгнуть из кустов и съесть треугольник Паскаля.
Так что же, реальный мир безобразнее, чем математика?
Странно, что люди спрашивают об этом. В смысле, этот вопрос мог бы быть разумным две с половиной тысячи лет назад…
Еще когда греческие философы спорили о том, из чего может состоять эта штуковина под названием «реальность», было много мнений. Гераклит сказал: «Всё есть огонь». Фалес сказал: «Всё есть вода». Пифагор сказал: «Всё есть число».
Счет: Гераклит 0 Фалес 0 Пифагор 1
Под сложными формами и конструкциями на поверхности реальности существует простой уровень, точный и стабильный уровень, законы которого мы называем «физика». Это удивительное открытие уже случилось к моменту нашего появления, но это не значит, что мы забыли, каким оно было неожиданным. Однажды давным давно люди вышли на поиски основополагающей красоты, не имея никаких гарантий, что найдут её. И случилось так, что они нашли её; и сейчас о ней знают все; и она принимается как должное.
Так почему мы не можем узнать местоположение каждого тигра в кустах так же просто, как мы можем узнать шестой куб?
Я вижу три источника неопределенности даже в мире чистой математики — два очевидных и один не очень.
Первый источник неопределенности заключается в том, что даже создание чистой математики, живущее внутри мира чистой математики, может не знать её. Люди ходили по Земле задолго до того как Галилей/Ньютон/Эйнштейн открыли законы гравитации, которые не дают нам упасть в космос. Вами могут управлять фундаментальные законы, о которых вы ничего не знаете. Нет такого физического закона, который говорит, что мозг, управляемый физическими законами, должен явным образом знать о них.
У нас всё ещё нет Теории Всего. Наши лучшие на данный момент теории состоят из математики, но они не идеально стыкуются друг с другом. Наиболее вероятное объяснение — как уже случалось раньше — мы видим поверхностные проявления более глубокой математики. Так что пока мы думаем, что, скорее всего, реальность сделана из математики, но мы еще не знаем, из какой именно.
Но физикам приходится строить огромные ускорители частиц, чтобы отличить теории между собой — чтобы зафиксировать оставшуюся неопределенность хоть в какой-нибудь видимой форме. То, что физики доходят до такого и остаются неуверенными, подсказывает, что это не источник неопределенности цен на акции.
Второй очевидный источник неопределенности заключается в том, что даже если вы знаете все релевантные законы физики, у вас может не хватать вычислительных мощностей, чтобы делать выводы на их основе. Мы знаем все фундаментальные законы физики, относящиеся к тому, как цепочки аминокислот сворачиваются в белок. Но мы всё ещё не в состоянии предсказать форму белка по аминокислотам. Одна крошечная 5-нанометровая молекула, сворачивающаяся за микросекунду, это слишком много информации, чтобы современные компьютеры смогли с ней справиться (не говоря уже о тиграх или ценах на акции). Наши перспективные разработки в свертывании белков чаще используют хитроумные приближения, а не фундаментальное уравнение Шрёдингера. Когда дело доходит до описания 5-нанометрового объекта с помощью действительно базовой физики, на уровне кварков - что ж, можно даже не пытаться.
Мы должны использовать инструменты вроде рентгеновской кристаллографии и ядерно-магнитного резонанса, чтобы узнавать формы белков, которые полностью заданы физикой, которую мы знаем, и цепочкой ДНК, которую мы знаем. Мы не обладаем логическим всеведением. Мы не можем видеть всех последствий наших мыслей. Мы не знаем, во что мы верим.
Третий источник сомнения наиболее сложен для понимания, и Ник Бостром даже написал о нём книгу. Предположим, что последовательность {1, 8, 27, 64, 125, …} существует, примем это за факт. Далее, допустим, что на каждом кубе сидит маленький человечек, один человечек на куб, также примем это за факт.
Если вы стоите снаружи и видите глобальную перспективу – глядя сверху вниз на последовательность кубов и маленьких человечков на них – эти два факта говорят всё, что можно знать о последовательности и о человечках.
Но если вы – один из маленьких человечков, стоящих на кубе, и знаете эти два факта, существует еще третий кусочек информации, который нужен чтобы делать предсказания: «На каком кубе я стою?».
Вы ожидаете, что стоите на кубе; вы не ожидаете, что можете быть на числе 7. Ваши ожидания определённо ограничены вашим знанием базовых законов физики; ваши убеждения фальсифицируемы. Но вам всё ещё нужно посмотреть вниз, чтобы узнать стоите вы на 1728 или на 517717. Если вы можете быстро считать в уме, то достаточно увидеть первые две цифры четырехзначного куба 17__ , чтобы догадаться, что последние цифры 2 и 8. Иначе вам придется посмотреть и на них тоже.
Чтобы узнать, как выглядит ночное небо, недостаточно знать законы физики. Недостаточно даже обладать логическим всеведением про их последствия. Нужно еще знать, где вы во вселенной. Нужно знать, что вы смотрите на ночное небо с Земли. Необходима не только информация, достаточная для определения положения Земли в видимой вселенной, но во всей вселенной, включая все те части, которые наши телескопы не могут увидеть, потому что они слишком далеко, и другие инфляционные вселенные, а также альтернативные ветви Эверетта.
Предположение, что «неопределенность в исходных данных на границе» на самом деле относится к указанию на некоторое место (мы будем называть ее индексной неопределенностью), — хорошее. Но если нет, то это эмпирическая неопределенность, неопределенность в вопросе, как выглядит вселенная в глобальной перспективе, то есть неопределенность того же класса, что и неопределенность в фундаментальных законах.
Как бы то ни было, идея в том, что «реальность» включает в себя безнадежнобеспорядочный компонент из-за второго или третьего источника неопределенности: логической неопределенности и индексной неопределенности.
Незнание фундаментальных законов не говорит, что то, что выглядит беспорядочным, действительно беспорядочно. Возможно, мы просто еще не уловили закономерность.
Но когда речь идет о беспорядочной сети экспрессии генов, мы уже нашли скрытую красоту — стабильный уровень, уровень физики, которая лежит в основе всего этого. И из того, что мы уже нашли основной порядок, мы можем сделать вывод, что мы уже не найдем больше никакого секрета, который бы сделал биологию простой, как последовательность кубов. Мы знаем правила игры, и поэтому знаем, что игра сложная. У нас не хватает вычислительных мощностей, чтобы заниматься химией белков на основе фундаментальной физики (второй источник неопределенности) и эволюция могла пойти разными путями на разных планетах (третий источник неопределенности). Новые открытия в фундаментальной физике нам здесь не помогут.
Если вы — древний грек, и смотрите на сырые данные из эксперимента по биологии, будет очень мудро поискать какое-нибудь скрытое пифагорейское изящество, когда все протеины складываются в идеальный икосаэдер. Но в биологии мы уже нашли пифагорейское изящество, и его, как мы знаем, недостаточно, чтобы преодолеть индексную и логическую неопределенность.
Точно так же мы можем быть уверены, что никто никогда не сможет предсказать результаты какого-нибудь квантового эксперимента, только потому, что наша фундаментальная теория ясно говорит нам, что разные версии нас будут видеть разные результаты. Если знание фундаментальных законов говорит, что существует последовательность кубов, и что маленький человечек стоит на каждом из них, и что все эти человечки одинаковые, за исключением того, что стоят на разных кубах, и что вы — один из этих человечков, то вы знаете, что у вас нет способа узнать, на каком вы кубе, кроме как посмотреть.
Современное знание говорит, что «реальность» — это идеально постоянный, детерминированный и очень большой математический объект, который очень дорого и трудно моделируется. Так что «реальная жизнь» не особенно похожа на предсказание следующего куба в цепочке кубов, а больше похожа на знание, что очень много маленьких человечков стоят на кубах, не зная, кто они и на каких именно кубах они стоят. А, и еще они не очень быстро считают в уме. Наше знание правил слегка ограничивает наши предсказания, но не полностью.
Вот. Теперь это похоже на реальность?
Но неопределенность существует в карте, а не в территории. Если мы не знаем о феномене, это говорит что-то о нашем состоянии сознания, а не о самом феномене. Эмпирическая неопределенность, логическая неопределенность и индексная неопределенность – просто имена для нашей неразберихи. Пока мы все равно думаем, что мир состоит из математики, а математика совершенно стабильна и определена. Беспорядок только в глазах смотрящего.
Даже самые жуткие трясины блогосферы определены той же самой совершенной физикой, что и {1, 8, 27, 64, 125, …}
Так что интернет — не огромная помойка… это серии кубов.
Прекрасная вероятность
Элиезер Юдковский
Должны ли мы ожидать, что на определенном уровне рациональность будет простой? Должны ли мы надеяться и искать красоту в искусстве убеждения и выбора?
Позвольте мне привести цитату покойного мастера Байесианства Джейнса (1990):
«Два медика-исследователя используют одинаковую методику лечения независимо друг от друга в разных больницах. Ни один из них не фальсифицирует данные, однако один решил заранее, что из-за ограниченности ресурсов он остановится после лечения N=100 пациентов, сколько бы вылечившихся ни было. Другой поставил на кон свою репутацию и решил, что он не остановится, пока данные не покажут, что процент вылеченных больше 60%, сколько бы пациентов ни потребовалось. На деле, оба остановились на почти одинаковых данных: n=100 [пациентов], r=70 [вылеченных]. Должны ли мы сделать разные выводы из их экспериментов?» (по-видимому, две контрольные группы также дали равные результаты).
В соответствии со статистической процедурой старой школы — которой, я верю, все еще обучают сегодня — два исследователя выполнили разные эксперименты с разными условиями прекращения. Два эксперимента могли быть прекращены с разными данными и таким образом представлять разные тесты гипотезы, требуя различных методов статистического анализа. Поэтому весьма возможно, что первый эксперимент будет «статистически значимым», а второй нет.
То, волнует ли вас это или нет, говорит о том, волнует ли вас теория вероятности и рациональность сама по себе.
Статистики-небайесианцы могут пожимать плечами, говоря «ну, не все статистические инструменты имеют одни и те же сильные и слабые стороны, вы же знаете, молоток не похож на отвертку, и если вы применяете разные статистические инструменты, вы можете получить разные результаты, в зависимости от того, обрабатываем мы данные вычисляя линейную регрессию или тренируя нейронную сеть. Вы должны использовать правильный инструмент для каждого отдельного случая. Жизнь запутанна».
И тогда Байесианцы отвечают: «Извините? Очевидное влияние фиксированного экспериментального метода, продуцирующего одинаковые данные, зависит от частных мыслей исследователя? И вы еще умудряетесь обвинять нас в «чрезмерной субъективности?»
Если Природа устроена одним образом, то так же данные, пришедшие путем, который мы видели, должны представлять одно явление. Если Природа устроена другим образом, то данные должны отражать что-то еще. Однако состояние Природы, которое отражено в данных, никак не зависит от намерений исследователя. Так что каковы бы не были наши гипотезы о Природе, отношение правдоподобия остается одним и тем же, и доказательное влияние то же самое, и апостериорное убеждение должно быть тем же самым между двумя экспериментами. По меньшей мере один из двух методов старой школы должен учитывать не всю информацию, или просто вычисляться с ошибкой, чтобы два метода дали разные ответы.
Древняя война между байесианцами и сторонниками частотного подхода тянется уже десятилетия, и я не собираюсь рассматривать всю эту историю в данном посте.
Но один из центральных конфликтов в том, что байесианцы ожидают, что теория вероятности будет… как же это сказать? Стройной? Ясной? Самосогласующейся?
Как говорит Джейнс, теоремы байесианской вероятности — это просто теоремы когерентной системы доказательств. Не имеет значения, как вы обрабатываете данные в этом случае, результаты байесианской теории вероятности должны быть всегда одни и те же — каждая теорема совместима с любой другой теоремой.
Если вы хотите узнать сумму 10+10, вы можете вычислять это как (2 × 5) + (7 + 3) или как (2 × (4 + 6)) или использовать любой другой метод который вам нравится, но результат должен быть всегда один и то же, в данном случае 20. Если же в одном случае получается 20, а в другом 19, тогда вы можете заключить, что вы сделали что-то неправильно по крайней мере в одном из вычислений. (В математике недопустимой операцией обычно является деление на ноль; в теории вероятности это обычно бесконечность, что нельзя использовать как предел конечного процесса.)
Если вы принимаете результат 19=20, внимательно рассмотрите ошибку, которую вы сделали, поскольку не может быть, чтобы вы могли математически обмануть себя. Если бы кто-то преуспел в получении реального противоречия в байесианской теории вероятности — такого, скажем, как два различных доказательных воздействия от одного и того же экспериментального метода, принимающего на вход одинаковые результаты, тогда вся конструкция была бы дымом. Вместе с теорией множеств, поскольку я считаю, что теория множеств обеспечивает модель для теории вероятности.
Математическая! Вот слово которое я искал. Байесианцы ожидают что теория вероятности будет математической. Вот почему мы заинтересованы в теореме Кокса и ее расширениях, показывающих, что любое представление неопределенности, которое подчиняется определенным ограничениям, должно отображаться посредством теории вероятности. Когерентная математика это великолепно, но уникальная математика еще лучше.
И еще, должна ли рациональность быть «математична»? Не является предопределенным то, что вероятность должна быть красивой. Реальный мир сложен — так, возможно, вам нужно будет сложное мышление, чтобы с этим справиться? Возможно, что статистики-небайесианцы с их большой коллекцией специальных методов и обоснований более компетентны, поскольку у них строго больший инструментарий. Хорошо, когда проблемы ясны, но обычно это не так, и вам придется с этим жить.
В конце концов, хорошо известно, что вы не можете использовать байесовские методы на множестве проблем из-за того, что байесовские вычисления сложны для подсчетов. Так почему бы не позволить цвести многим цветам? Почему бы не иметь больше одного инструмента в вашем наборе?
Это фундаментальное различие в сознании. Статистики старой школы думают в терминах инструментов и трюков, применяемых для определенных проблем. Байесианцы, по крайней мере этот байесианец, хотя я не думаю, что говорю только за себя, — мы думаем в терминах законов.
Поиск законов — это не то же самое, что поиск особенно чистых и красивых инструментов. Второй закон термодинамики — это не одно и то же, что и чистый и красивый холодильник.
Цикл Карно это идеальный двигатель — на самом деле идеальный. Нет двигателя, который бы питался от двух накопителей тепла и был бы эффективней, чем двигатель Карно. Как следствие, все термодинамически обратимые двигатели, которые функционируют между одинаковыми накопителями тепла, имеют одинаковую эффективность.
Но, конечно, вы не можете использовать двигатель Карно для питания реальной машины. Двигатель машины имеет такое же сходство с двигателем Карно, что и шины автомобиля с идеальными катящимися цилиндрами.
Тогда ясно, что двигатель Карно — бесполезный инструмент для постройки настоящей машины. Второй закон термодинамики, очевидно, неприменим здесь. Чересчур сложно сделать двигатель, который будет отвечать таким условиям, в реальности. Просто игнорируйте термодинамику — используйте все, что работает.
Это определенный род путаницы, который, как я думаю, управляет теми, кто все еще цепляется за старые методы.
Нет, вы не можете всегда делать точные байесовские вычисления для проблемы. Иногда вам надо искать аппроксимацию; на самом деле, часто. Это не значит, что теорию вероятности нужно прекратить применять, так же как ваша неспособность вычислить аэродинамику самолета из атомных взаимодействий не означает, что самолет не сделан из атомов. Какую бы аппроксимацию вы не использовали, она будет работать, если является аппроксимацией идеального байесовского вычисления — и не будет работать в любом другом случае.
Доказательства когерентности и уникальности байесианства отметают оба пути. Также, как любой расчет, который подчиняется аксиомам когерентности Кокса (или любой из его переформулировок или обобщений), должен отображаться в вероятностях, любой не байесовский расчет должен провалить какой-либо из тестов на когерентность. Что, в свою очередь, приводит к наказаниям, таким как голландское бронирование (прием комбинаций ставок, которые приводят к точным убыткам или отказу от комбинаций, которые дают точные выгоды).
Вы можете быть не способны вычислить оптимальный ответ. Но любая аппроксимация которую вы используете, с ее достоинствами и недостатками, должна быть объяснима с позиции байесовской теории вероятности. Вы можете не знать объяснения: но это не значит, что его не существует.
Так вы хотите использовать линейную регрессию вместо байесовских обновлений? Но посмотрите на структуру, лежащую в основе линейной регрессии, и вы увидите, что она выбирает лучшую точку с позиции оценки, данной гауссовской функцией правдоподобия, и ставит исходное над параметрами.
Вы хотите использовать регуляризованную линейную регрессию, потому что она работает на практике лучше? Ну, она соответствует (говорит байесианец) тому, чтобы ставить гауссову априорную информацию над весами.
Иногда вы не можете использовать байесовские методы так, как это описано в литературе; на самом деле это бывает довольно часто. Но когда вы можете использовать точное байесовское вычисление, которое использует каждый кусочек доступной вам информации, делайте это. Вы никогда не найдете статистический метод, который даст вам лучший ответ. Вы можете найти простую аппроксимацию, которая работает отлично почти все время, и так будет проще, но не точнее. Не будет, пока другие методы используют знания, возможно, в форме неявной априорной информации, что не позволяется при байесовских вычислениях; и тогда, когда вы применяете априорную информацию для байесовского вычисления, оно будет либо равно по результатам, либо будет лучше.
Когда вы используете специальный статистический инструмент старой школы с каким-либо (часто достаточно интересным) обоснованием, вы никогда не знаете, если у кого-то завтра появиться более продвинутый инструмент. Но когда вы напрямую можете использовать вычисление, которое отражает байесовский закон, вы делаете что-то наподобие помещения двигателя Карно в свою машину. Это, как говорится, по-байесовски оптимально.
Мне кажется, что те, кто пользуется множеством инструментов, смотрят на последовательность кубов {1, 8, 27, 64, 125, …}, указывают на разности {7, 19, 37, 61, …} и говорят «смотрите, жизнь не всегда проста — вам нужно адаптироваться к обстоятельствам». И байесианцы, которые указывают на лежащий в основе стабильный уровень {6, 6, 6, 6, 6, …}. И критики говорят: «Что за чушь вы несете? Это 7, 19, 37, а не 6, 6, 6. Вы упрощаете проблему, вы слишком привязаны к простоте».
Бесполезно быть простым на поверхностном уровне. Вы должны погрузиться глубже, чтобы найти стабильность.
Мыслите законами, а не инструментами. Необходимость вычислять приближения (аппроксимации) к закону не меняет закон. Самолеты по-прежнему состоят из атомов, они не станут исключением только из-за аэродинамических вычислений. Аппроксимация существует на карте, не на территории. Вы можете знать второй закон термодинамики и все еще пробовать себя как инженера, строя несовершенный двигатель машины. Второй закон не станет неприменим; ваше знание этого закона и цикла Карно помогает вам приблизиться к наибольшей эффективности, которую вы только можете достигнуть.
Мы не очаровываемся байесовскими методами только потому, что они красивы. Красота всего лишь побочный эффект. Теоремы Байеса изящны, когерентны, оптимальны и доказуемо однозначны потому, что они относятся к законам.
Приложение: Cyan отсылает нас к главе 37 книги о статистике Маккая, где данная проблема рассматривается более подробно.
Jaynes, E. T. (1990.) Probability Theory as Logic. In: P. F. Fougere (Ed.), Maximum Entropy and Bayesian Methods. Kluwer Academic Publishers.
MacKay, D. (2003.) Information Theory, Inference, and Learning Algorithms. Cambridge: Cambridge University Press.
Вне лаборатории
Элиезер Юдковский
«Вне лаборатории ученые не мудрее, чем кто-либо еще». Иногда эта пословица говорится учеными, чтобы с сожалением напомнить себе о своей ошибочности. Иногда эта пословица говорится по менее похвальным причинам, чтобы девальвировать нежелательные экспертные рекомендации. Правдива ли пословица? Наверное, нет, в абсолютном смысле. Это кажется слишком пессимистичным — говорить, что ученые буквально не выше среднего уровня.
Но поговорка кажется в какой-то степени верной, и мы должны быть обеспокоены этим фактом. Мы не должны грустно вздыхать и мотать головой. Скорее, мы должны встревоженно подобраться. Почему? Предположим, пастушонок обучен считать овец, каждый раз, как овца проходит. Он знает, когда все овцы ушли и когда вернулись. Тогда ты даешь пастуху яблоки и спрашиваешь: «Сколько яблок?» Но он тупо на тебя смотрит. Он не обучен считать яблоки. Только овец. Вы, вероятно, заподозрите, что пастух плохо понимает счет. Теперь предположим, что мы видим, что кандидат экономических наук покупает каждую неделю лотерейный билет. Мы должны спросить себя — этот человек действительно понимает ожидаемую полезность на инстинктивном уровне? Или просто обучен выполнению различных алгебраических трюков?
Один пример мыслей Ричарда Фейнмана об ошибках в системе обучения физике:
«После длительного расследования я, наконец, понял, что студенты все запоминали, но ничего не понимали. Когда они слышали: «свет, отраженный от преломляющей среды», они не понимали, что под средой имеется в виду, например, вода. Они не понимали, что «направление распространения света» — это направление, в котором видишь что-то, когда смотришь на него, и т.д. Все только запоминалось, и ничего не переводилось в осмысленные понятия. Так что, если я спрашивал: «Что такое угол Брюстера?», я обращался к компьютеру с правильными ключевыми словами. Hо, если я говорил: «Посмотрите на воду», — ничего не срабатывало. У них ничего не было закодировано под этими словами».
Предположим, у нас есть компетентный ученый, который знает, как поставить эксперимент на N предметов. N субъектов получат одинаковый препарат. Судьи слепым методом будут классифицировать результаты. И тогда мы обработаем результаты на компьютере и увидим, будут ли они значимы на 0.05 доверительной вероятности.
И это не просто ритуал. Как, например, «салат следует есть вилкой». Это ритуал для проверки гипотез экспериментально. Почему вы должны экспериментально проверить гипотезу? Потому что знаете, что это требование журнала для публикации? Потому что в колледже научились? Потому что все вокруг будут в унисон говорить, что эксперимент важен, и будут смеяться над вами, если вы говорите иначе?
Нет. Потому что для построения карты территории вы должны пойти и посмотреть на территорию. Невозможно сидеть с закрытыми глазами и строить точную карту города, просто медитируя на то, каким вы хотите видеть город. Вы должны пойти, погулять и нарисовать на бумаге линии, которые вы увидите. Это происходит каждый раз, когда вы смотрите на развязанные шнурки. Фотоны летят от солнца, отскакивают от шнурков, попадают в сетчатку, активируют нейроны и активируют в зрительной коре шаблон, сильно коррелирующий с формой ваших шнурков. Чтобы нарисовать карту — пройдись по территории. Взаимодействие мозга с окружением — реальный физический процесс. Процессы мышления — не магия. Вы можете описать, как это работает. Чтобы найти эти вещи вы должны пойти и посмотреть.
Так что нам теперь думать про ученого, компетентного в лаборатории, но за её пределами верящего в духовный мир? Мы спросим: «Почему?», и ученый ответит что-то вроде: «Ну, никто ведь на самом деле не знает. Это религия, и она не может быть опровергнута тем или иным наблюдением». Я не могу не прийти к выводу, что человек буквально не знает, почему мы должны смотреть на вещи.
Вероятно, они выучили определенный ритуал проведения эксперимента, но они не понимают причин необходимости этого — чтобы нарисовать карту территории, вы должны её увидеть — чтобы получить информацию об окружающей среде, вы должны создать процесс причинно-следственной связи, в котором вы взаимодействуете с окружающей средой и корректируете карту. Это верно как в отношении двойного слепого метода сбора информации о лекарствах, так и в отношении сбора информации вашим глазом о шнурках.
Может быть, наш верящий в духов ученый скажет «Но это не задача для эксперимента. Духи говорят со мной в моём сердце». Что ж. Если мы предположим, что духи действительно могут говорить каким-либо образом с нами, то тут может быть причинно-следственное взаимодействие и необходимы наблюдения. Теория вероятностей всё ещё работает. Если у вас есть предположение, что некий «голос духов» может быть свидетельством реальных духов, то вы должны предположить, что есть рациональная вероятность для того, чтобы «голос духов» вызывался духами, относительно других объяснений «голоса духов», являющаяся достаточно сильной для преодоления предварительной невероятности факта сложного убеждения со многими частями. В противном случае объяснение «духи говорят со мной в моём сердце» является примером «причинного взаимодействия», по аналогии с которым студент не видит за определением «среда с индексом преломления» воду.
Легко быть одураченным, возможно, потому, что люди в лабораторных халатах используют фразы вроде «причинного взаимодействия», а люди в бусах — фразы вроде «духи говорят». Участники дискуссии в разных одеждах, как мы все знаем, разграничены разными сферами существования — «непересекающимися магистериями», согласно известной чуши от Стивена Гулда. 1
На самом деле «причинно-следственная связь» — просто ещё один способ сказать: «Что-то происходит по причине того, что что-то сделано». И теорию вероятностей не волнует одежда, которую вы носите.
В современном обществе имеется распространенное убеждение о том, что духовные вопросы не могут быть решены с помощью логики и наблюдений, поэтому вы можете иметь любые религиозные убеждения, какие вам нравится. Если ученый попадается на это и решает жить своей «внелабораторной» жизнью таким образом, то это говорит мне, что он понимает экспериментальный принцип как «общественный договор». Они знают, когда должны проводить эксперименты и проверять результаты ради статистической значимости. Но переведем это в контекст, где социальный обычай — следовать дурацким верованиям без проверки, и они будут счастливы так это и делать.
Ученик-пастушок скажет, что если вышли семь овец и потом вышли восемь овец, то лучше бы вернулись пятнадцать овец. Почему пятнадцать, а не «четырнадцать» или «три»? Потому что в противном случае останешься без ужина, вот почему! И это своего рода то, как работает профессиональная подготовка, но если социальный договор — единственная причина, по которой восемь овец и семь овец составляют пятнадцать овец, — то может семь яблок и восемь яблок будет три яблока? Кто сказал, что правила для яблок не должны быть другими?
Но если вы понимаете, почему работают правила — вы знаете, что сложение одинаково и для овец, и для яблок. Исаак Ньютон справедливо почитается — не только за его устаревшую теорию гравитации, но за обнаружение — удивительное и неожиданное — того, что небесные тела следуют тем же правилам, что и падающие яблоки. В макромире — в окружающей нас повседневной среде — на разных деревьях растут разные фрукты, разные люди в разное время следуют разным обычаям. Действительно, единая вселенная со стационарными универсальными законами — весьма нелогичное понятие для человека. Только ученые действительно в это верят, хотя некоторые религии хорошо играют словами относительно «единства всех вещей».
Как сказал Ричард Фейнман:
Если мы смотрим на стакан достаточно близко — мы видим всю вселенную. Это означает «думать, как физик»: скрученная жидкость, которая испаряется в зависимости от ветра и непогоды, отражение в стекле, а наша фантазия добавляет атомы. Стекло — продукт дистилляции земных пород, и в его составе мы видим тайны возраста вселенной и эволюции звезд. Что за странный массив химических элементов есть в вине? Как они получились? Это ферменты, энзимы, субстраты и продукты. В вине находится большое обобщение — вся жизнь, ферментация (брожение). Никто не смог бы обнаружить химию вина без обнаружения, как это сделал Луи Пастер, причины множества болезней. Яркость красного вина определяется в сознании того, кто на него смотрит. Если наш маленький ум, для некоторого комфорта, делит эту вселенную на части — физика, биология, геология, астрономия, психология, и так далее — помните, что природа этого не знает! Итак, давайте сложим всё это вместе, не забывая в итоге для чего это. Пусть это даст нам ещё одно заключительное удовольствие — пить и забыть всё это.
Некоторые религии, особенно созданные или подправленные после Исаака Ньютона, могут исповедовать, что «всё связано со всем остальным». (Поскольку существует тривиальный изоморфизм между графами и их дополнениями, эта Глубокая Мудрость передает такую же полезную информацию, как граф без ребер.)
Но когда дело доходит до фактической сути религии, пророки и священники следуют древней человеческой традиции принятия всего вместе. И они создают одно правило для девушек до двенадцати, ещё одно для мужчин за тридцать, одно правило для шаббата и другие для будней, одни правила для науки и другие — для колдовства. Реальность, как мы выучили к нашему шоку — не набор отдельных магистериев, но единый процесс, регулируемый математически простыми правилами низкого уровня. Различные здания на территории института не принадлежат к разным вселенным, хотя иногда так и может показаться. Вселенная не делится на разум и материю, на живое и неживое, атомы в наших головах легко взаимодействуют с атомами окружающего воздуха. Теорема Байеса не меняется от места к месту.
Если за пределами своей сферы деятельности ученый восприимчив к дурацким идеям так же, как кто-либо ещё, он, вероятно, так и не понял, почему научные правила работают. Может, они могут, как попугаи, повторять положения критического рационализма. Но они не понимают, на глубинном уровне, на алгебраическом уровне теории вероятностей, причинно-следственный уровень «мышления-как-машины». Они были обучены вести себя определенным образом в лаборатории, но они не любят быть ограничены данными. Когда они приходят домой и снимают халат — они расслабляются в некоторой комфортной глупости. И да, вот что мне интересно — могу ли я доверять ученым, даже в их области, особенно когда дело доходит до любого спорного вопроса, любого открытого вопроса, всё, что ещё не прибито гвоздями массовых доказательств и социальных конвенций. Может, мы можем победить поговорку — быть рациональными в нашей личной жизни, не только в профессиональной жизни. Мы не должны позволить поговорке остановить нас. «Остроумная поговорка ничего не доказывает» — как сказал Вольтер. Может быть, мы сможем делать лучше, если достаточно изучим теорию вероятностей, чтобы понять, почему правила работают, и экспериментальную психологию, чтобы увидеть, как они применяются в реальных случаях, если мы сможем научиться «смотреть на воду». Амбиции не должны мешать возможности признать, что за пределами своей специализации ты не лучше кого-либо другого. Но если наши теории рациональности не применимы в обычной жизни — мы делаем что-то неправильно. Нет разницы между вселенной внутри и снаружи лаборатории.
1.От себя позволю скопировать фрагмент текста из статьи о Гулде, чтобы внести немного ясности в термин «магистерий»: «Двойственность, если не двусмысленность эволюционной позиции Гулда, привела к такой же двойственности его точки зрения на соотношение науки и религии. Кратко эта точка зрения может быть выражена в принципе равноценности и непересекаемости науки и религии, означающем по Гулду, что наука и религия принадлежат к „непересекающимся магистериям“ (сокращенно — NOMA), то есть к разным областям, и имеют дело с разными вопросами человеческого бытия. Таким образом, между ними не может быть никакого конфликта: наука имеет дело с фактами, а религия касается вопросов этики, ценностей и целей. Свой тезис „непересекающихся магистерий“ Гулд обстоятельно развил в двух книгах, получивших многочисленные отклики. В первой он поставил перед собой честолюбивую цель — „определить идеальные отношения между наукой и религией таким способом, чтобы максимизировать выгоду от каждой для общества“, выявить „принципиальное средство ухода от ненужного конфликта между теологами и учеными“. Он выступал против представления, что наука и религия несовместимы и противоречат друг другу. Таковыми они становятся в том случае, если религия трактуется в узком смысле вероучения, которое требует удивительных вмешательств Бога в историю и природу и которое отказывается признавать доказательства эволюции. Если же религия понимается в более широком смысле — как философский теизм, свободный от суеверия или как светский гуманизм, основанный на этических нормах, то Гулд не видит никакого конфликта между двумя магистериями. Тогда наука и религии как две самостоятельные области не только могут быть объединены в единой концептуальной схеме, но и „процветать рядом подобно двум независимым нациям в мире друг с другом“».
Второй закон термодинамики и двигатели познания
Элиезер Юдковский
Первый закон термодинамики, более известный как закон сохранения энергии, утверждает, что нельзя создать энергию из ничего. Первый закон запрещает вечный двигатель первого рода — устройство, способное работать бесконечно долго без затрат топлива или других энергетических ресурсов. Согласно современной физике, энергия сохраняется при абсолютно каждом взаимодействии частиц. Применяя математическую индукцию, мы получаем, что, каким бы большим ни было множество частиц, оно не сможет произвести энергию из ничего — во всяком случае, без нарушения известных нам законов физики.
Именно поэтому, если вы попробуете запатентовать гениальное изобретение, состоящее из колёс и шестерёнок, в которой одна пружина разжимается, а другая сжимается и так далее, и которая, по вашим расчётам будет работать вечно, Патентное ведомство США без раздумий отклонит вашу заявку. Полностью доказано, что для работы такой машины хотя бы одна её деталь должна нарушать законы физики (в стандартной модели). Поэтому, если вы не можете объяснить, как одна деталь нарушает законы физики, вы не сможете объяснить, как их нарушает вся машина.