Может ли машина быть сознательной? Может ли надлежащим образом запрограммированный компьютер действительно иметь ум? Эти вопросы были предметом громадного множества дискуссий в последние десятилетия. Исследования в области искусственного интеллекта (или ИИ) в значительной своей части были нацелены на воспроизведение ментального в вычислительных машинах. О серьезном прогрессе говорить пока не приходится, но сторонники этого подхода доказывают, что у нас есть все основания считать, что в итоге компьютеры действительно обретут ум. В то же время, оппоненты доказывают, что у компьютеров есть некие ограничения, которых лишены люди, так что не стоит и вопроса о том, чтобы сознающий ум возникал в силу одних лишь вычислительных процессов.
Есть два вида типичных возражений против искусственного интеллекта. Это могут быть внешние возражения, когда пытаются показать, что вычислительные системы никогда не смогли бы даже вести себя подобно когнитивным системам. Согласно этим возражениям, люди обладают определенными функциональными способностями, которые никогда не могли бы быть у компьютеров. Так, иногда утверждается, что, поскольку эти системы следуют правилам, они никогда не смогут демонстрировать творческое или гибкое поведение, свойственное людям (напр., Dreyfus 1972). Другие доказывали, что компьютеры никогда не смогут воспроизвести математические интуиции человека, так как вычислительные системы, в отличие от людей, ограничены теоремой Геделя (Lucas 1961; Penrose 1989).
Внешние возражения наталкивались на трудности, связанные с успехами вычислительных симуляций физических процессов в целом. Кажется, в частности, что у нас есть серьезное основание верить в вычислимость законов физики, так что мы по крайней мере должны быть способны осуществить вычислительную симуляцию человеческого поведения. Иногда это оспаривается доводами о невычислимом компоненте физических законов (так поступает Пенроуз) или о нефизической причинности (как это делает Лукас), но очевидно, что сторонники подобных доводов ведут неравный бой.
Большее распространение получили возражения, называемые мной внутренними. Те, кто высказывает их, хотя бы в целях своей аргументации признают, что компьютеры могли бы симулировать человеческое поведение, но доказывают, что они все равно были бы лишены ментального. В частности, предполагается, что у них не было бы внутренней жизни: ни сознательного опыта, ни подлинного понимания. В лучшем случае компьютер мог бы симулировать, но не воспроизводить ментальность. Наиболее известным возражением этого типа является аргумент «Китайской комнаты» Джона Серла (Searle 1980). Согласно этим возражениям, вычислительные системы в лучшем случае были бы наделены пустыми оболочками ментального: они были бы кремниевыми разновидностями зомби.
Сторонники нередуктивного взгляда на сознательный опыт нередко симпатизировали внутренним возражениям против искусственного интеллекта, и многие доказывали, что простой компьютер не может обладать сознанием. Более того, те, на кого произвела впечатление проблема сознания, подчас характеризовали эту проблему, указывая на сознание как на такую черту, которая есть у нас, но отсутствовала бы у любого компьютера! Многим оказалось трудно поверить, что искусственная, небиологическая система могла бы быть тем, что могло бы порождать сознательный опыт.
Однако нередуктивный взгляд на сознание вовсе не автоматически приводит к пессимистическим воззрениям на ИИ. Это совершенно разные вопросы. Первый имеет отношение к прочности сопряжения физических систем и сознания: конституируется ли сознание физическими процессами, или же оно всего лишь возникает из этих процессов? Второй вопрос касается формы этого сопряжения: какие именно физические системы порождают сознание? Разумеется, не очевидно, что выполнение надлежащего вычисления должно порождать сознание; но не очевидно и то, что нейронные процессы в мозге должны порождать его. И, на первый взгляд, не ясно, почему компьютеры должны уступать мозгу в этом отношении. Признав удивительный факт порождения мозгом сознания, мы не испытаем нового удивления, обнаружив, что вычисление могло бы порождать сознание. Так что само по себе принятие нередуктивного взгляда на сознание должно было бы оставлять рассматриваемый нами вопрос открытым.
Рис. 9.1. Bloom County о сильном ИИ (© 1985, Washington Post Writers Group. Перепечатано с разрешения).
(1) — Я мыслю. Следовательно…
(2) — Я существую. Я существую!
(3) — Я мыслю! Следовательно, я живой! Я живой, у меня есть жизнь, мысли и психика! Сладкое сознание!.. И бессмертная душа! — Хлоп!
В этой главе я пойду дальше и попытаюсь показать оправданность амбиций сторонников искусственного интеллекта (рис. 9.1). В частности, я буду отстаивать позицию, которую Серл называет сильным искусственным интеллектом и которая состоит в том, что существует непустой класс вычислений, такой, что осуществление любого вычисления этого класса достаточно для ментального и в том числе для существования сознательного опыта. Конечно, эта достаточность имеет силу лишь естественной необходимости: осуществление любого из этих вычислений при отсутствии сознания является логически возможным. Но мы видели, что это верно и для мозга. При оценке перспектив машинного сознания в актуальном мире нас интересует естественная возможность и необходимость.
(Чтобы этот не вывод не казался тривиальностью, учитывая панпсихистские предположения, высказанные в предыдущей главе, замечу, что ничто в этой главе не зависит от тех соображений. В самом деле, я буду доказывать не только то, что осуществление надлежащего вычисления достаточно для сознания, но и то, что осуществление надлежащего вычисления достаточно для богатого сознательного опыта, подобного нашему.)
Я уже выполнил большую часть работы, которая требуется для указанной защиты сильного ИИ, обосновывая в главе 7 принцип организационной инвариантности. Если тот аргумент верен, то он устанавливает, что любая система с надлежащим типом функциональной организации наделена сознанием — неважно, из чего она сделана. Так что мы уже знаем, что, скажем, кремниевый состав не является преградой для обладания сознанием. Остается лишь прояснить связь между вычислением и функциональной организацией, чтобы установить, что осуществление надлежащего вычисления гарантирует наличие релевантной функциональной организации. Если это сделано, то отсюда вытекает сильный ИИ. Я также отвечу на ряд возражений, выдвинутых против проекта сильного ИИ.
Стандартная теория вычисления имеет дело исключительно с абстрактными объектами: машинами Тьюринга, программами на Паскале, конечными автоматами и т. п. Это — математические сущности, населяющие математическое пространство. Когнитивные же системы, существующие в реальном мире, это конкретные объекты, имеющие физическое воплощение и каузально взаимодействующие с другими объектами физического мира. Но зачастую мы хотим использовать теорию вычисления для получения выводов о конкретных объектах в реальном мире. Для этого нам нужен мост между областью абстрактного и областью конкретного[179].
Таким мостом является понятие имплементации — отношения между абстрактными вычислительными объектами, или, коротко, «вычислениями» и физическими системами, имеющееся тогда, когда физическая система «реализует» вычисление, или когда вычисление «описывает» физическую систему. Вычисления часто имплементируются на синтетических, кремниевых компьютерах, но их можно имплементировать и иначе. К примеру, нередко говорят, что вычисления имплементируют природные системы, такие как человеческий мозг. Вычислительные описания применяются к самым разнообразным физическим системам. И всякий раз в подобных случаях неявно или явно задействуется понятие имплементации.
Понятие имплементации нечасто подвергается детальному анализу; обычно его просто принимают как данность. Но для защиты сильного ИИ мы нуждаемся в его детальном объяснении. Тезис о сильном ИИ выражен в вычислительных терминах и говорит о том, что имплементация надлежащего вычисления достаточна для сознания. Чтобы оценить это утверждение, мы должны знать, в каком именно случае физическая система имплементирует вычисление. Разобравшись в этом, мы сможем присоединить это знание к проделанному нами ранее анализу психофизических законов, чтобы понять, может ли из этого вытекать интересующий нас вывод.
Некоторые авторы доказывали невозможность дать сколь-либо содержательное объяснение имплементации. В частности, Серл (Searle 1990b) доказывал, что имплементация не является чем-то объективным, а, наоборот, зависит от наблюдателя: любая система может быть истолкована как имплементирующая любое вычисление при надлежащей интерпретации. Серл, к примеру, считает, что о его стене можно рассуждать так, будто она имплементирует его текстовый редактор Wordstar. Если бы это было так, то трудно было бы понять, как вычислительные понятия могут играть какую-то основополагающую роль в теории, в конечном счете имеющей дело с конкретными системами. Что же до сильного ИИ, то он либо оказался бы лишен всякого содержания, либо подразумевал бы признание сильной разновидности панпсихизма. Думаю, однако, что пессимизм такого рода неоснователен: не существует препятствий для объективной характеристики имплементации. В этом параграфе я схематично представлю эту характеристику (она будет несколько технической, но оставшаяся часть главы должна быть понятной, даже если проскочить эти детали).
Любое объяснение имплементации вычисления будет зависеть от того, о каком классе вычислений идет речь. Существует множество разных вычислительных формализмов, которым соответствует различные классы вычислений: машины Тьюринга, конечные автоматы, программы на Паскале, коннекционистские сети, клеточные автоматы и т. д. В принципе, нам нужно объяснение имплементации для каждого из этих формализмов. Я объясню имплементацию только для одного формализма, а именно для формализма комбинаторных автоматов. Этот класс вычислений достаточно абстрактен для того, чтобы можно было без труда перенести на другие классы связанную с ним концепцию имплементации.
Комбинаторный автомат — более рафинированный родственник конечного автомата. Конечный автомат (КА) специфицируется заданием конечного набора данных на входе, конечного набора внутренних состояний, конечного набора данных на выходе и указанием сопряженного с ними набора отношений перехода от состоянию к состоянию. Внутреннее состояние КА — это простой элемент Si, лишенный внутренней структуры; это же справедливо для данных на входе и на выходе. Отношения перехода специфицируют для каждой возможной пары данных на входе и внутренних состояний новое внутреннее состояние и имеющийся на выходе результат. Если дано начальное состояние какого-то КА, то эти отношения перехода от состояния к состоянию специфицируют, каким образом он будет изменяться во времени и что он будет давать на выходе в зависимости от того, что он получает на входе. Вычислительная структура КА представляет собой этот относительно простой набор отношений перехода от состояния к состоянию в наборе неструктурированных состояний.
Конечные автоматы непригодны для репрезентации структуры большинства вычислений, имеющих практическое значение, так как состояния и отношения перехода от состояния к состоянию в них обычно имеют сложную внутреннюю структуру. Никакое описание КА не может, к примеру, передать всю структуру программы на Паскале, машины Тьюринга или клеточного автомата. Полезней поэтому сконцентрироваться на классе автоматов со структурированными внутренними состояниями.
Комбинаторные автоматы (КоА) ничем не отличаются от КА, за исключением того, что их внутренние состояния структурированы. Состояние комбинаторного автомата представляет собой вектор [S1, S2,…,Sn]. Этот вектор может быть конечным или бесконечным, но я сосредоточусь на первом случае. Элементы этого вектора можно мыслить в качестве компонентов внутреннего состояния; они соответствуют клеткам клеточного автомата или ячейкам ленты и состоянию управляющего устройства машины Тьюринга. Каждый элемент Si может иметь конечное множество значений Sij, где Sij — j-e возможное значение i-го элемента. Эти значения можно трактовать в качестве «подсостояний» общего состояния. Данные на входе и на выходе имеют аналогичную комплексную структуру: первые являют собой вектор [I1,…, Ik], вторые — вектор [О1,…, Оm].
КоА детерминируется специфицированием набора векторов внутренних состояний и векторов данных на входе и на выходе и специфицированием набора правил перехода от состояния к состоянию, определяющих изменение состояния КоА во времени. Для каждого элемента вектора внутреннего состояния правило перехода от состояния к состоянию определяет то, как его новое значение зависит от прежних значений данных на входе и векторов внутреннего состояния. Для каждого элемента исходящего вектора правило перехода от состояния к состоянию определяет то, как его новое значение зависит от прежних значений вектора внутреннего состояния. Каждый конечный КоА может быть представлен как КА с равными вычислительными возможностями, но КА — описание приносило бы в жертву большинство структурных моментов, существенных для КоА. Эта структура имеет ключевое значение при использовании КоА для уяснения той организации, которая лежит в основе ментального.
Теперь мы уже можем дать объяснение имплементации. Вычисления, такие как КоА — это абстрактные объекты, формальная структура которых определяется их состояниями и отношениями перехода от состояния к состоянию. Физические системы — это конкретные объекты, каузальная структура которых определяется их внутренними состояниями и каузальными отношениями между ними. В неформальном плане мы говорим, что физическая система имплементирует вычисление, если каузальная структура этой системы отражает формальную структуру вычисления. То есть, система имплементирует вычисление, если можно установить такое соответствие между состояниями этой системы и вычислительными состояниями, при котором каузально соотнесенные физические состояния соответствуют формально соотнесенным формальным состояниям.
Эта интуитивная идея может быть напрямую использована для получения представления об имплементации в случае КоА. Физическая система имплементирует КоА, если можно так разложить внутренние состояния системы на подсостояния, и данные системы на входе и на выходе — на подсостояния этих данных, и так соотнести подсостояния системы с подсостояниями КоА, что отношения каузального перехода от состояния к состоянию для физических состояний, данных на входе и на выходе отражают формальные отношения перехода от состояния к состоянию для соответствующих формальных состояний, данных на входе и на выходе.
Формальный критерий имплементации КоА выглядит таким образом:
Физическая система Р имплементирует КоА М, если можно разложить внутренние состояния Р на компоненты [s1,…, sn] и установить соответствие f между подсостояниями sj и соответствующими подсостояниями Sj в М, а также произвести сходную операцию разложения и установления соответствия для данных на входе и на выходе, так, что для каждого правила перехода от состоянию к состоянию
([I1,…, Ik], [S1,…, Sn]) —> ([S'1,…, S'n], [О1,…, Оl])
в М: если Р находится во внутреннем состоянии [s1,…sn] и получает на входе [i1…., iп], соответствующие формальному состоянию и данным на входе [S1,…, Sn] и [I1,…, Ik], то это каузальным образом с неизбежностью приводит к тому что она переходит к такому внутреннему состоянию и порождает такие данные на выходе, которые надлежащим образом соответствуют [S'1,…, S'n] и [О1,…, Оl].
Мы можем допустить, что при разложении состояния физической системы на вектор подсостояний значение каждого элемента этого вектора должно быть супервентно на отдельном участке физической системы, чтобы гарантировать, что каузальная организация соотносит различные компоненты этой системы. В ином случае не очевидно, что детальная каузальная структура действительно присутствует в физической системе. Эти и другие детали приведенной выше дефиниции можно уточнять и дальше. Понятие имплементации не выбито на скрижалях, и оно допускает как расширение, так и сужение — в зависимости от поставленных целей. Но здесь даны главные его контуры, общие для всех концепций имплементации.
Могло бы показаться, что КоА немногим лучше КА. В конце концов, для любого конечного КоА мы можем найти соответствующий ему КА с тем же поведением на входе — выходе. Но между ними все же есть существенные различия. Первое и главное из них состоит в том, что условия имплементации для КоА гораздо более ограничены, чем аналогичные условия для КА. Имплементация КоА предполагает сложное каузальное взаимодействие множества отдельных частей; и поэтому КоА-описание может передавать каузальную организацию системы с гораздо большей степенью детализации. Во-вторых, КоА позволяют сформулировать единое объяснение условий имплементации, значимое как для конечных, так и для бесконечных машин. И, в-третьих, КоА может напрямую отражать комплексную формальную организацию вычислительных объектов, таких как машины Тьюринга и клеточные автоматы. В соответствующих КА была бы утрачена большая часть этих структурных моментов.
На деле мы можем использовать эту дефиницию имплементации для прямого получения критериев имплементации для других видов вычислений. К примеру, для конкретизации условий имплементации машины Тьюринга нам нужно просто переописать машину Тьюринга как КоА и применить данную выше дефиницию. Для этого мы описываем состояние машины Тьюринга как громадный вектор. Один из элементов этого вектора репрезентирует состояние ее управляющего устройства, есть элементы и для каждой ячейки ее ленты, репрезентирующие символ в этой ячейке и указывающие, находится ли управляющее устройство на ней. Правила перехода от состояния к состоянию для векторов естественным образом извлекаются из механизмов, специфицирующих поведение управляющего устройства машины и ленты. Разумеется, векторы здесь бесконечны, но условия имплементации для случая с бесконечностью являются непосредственным расширением условий для конечных случаев. При переводе с языка формализма машины Тьюринга на язык формализма КоА мы сможем сказать, что машина Тьюринга имплементируется всякий раз, когда имплементируется соответствующий КоА. Аналогичные переводы можно сделать и для вычислений в других формализмах, таких как клеточные автоматы или программы на Паскале, что позволит сформулировать условия имплементации для вычислений в каждом из этих классов.
Это дает совершенно объективный критерий для имплементации вычисления. Имплементация вычисления не выхолащивается, как полагал Серл. Конечно, некоторые вычисления будут имплементироваться любой системой. К примеру, одноэлементный КоА с одним состоянием будет имплементироваться любой системой, почти также широко будет имплементироваться и двухэлементный КоА. Верно также, что большинство систем будет имплементировать более чем одно вычисление — в зависимости от того, как мы будем очерчивать состояния этой системы. В этом нет ничего удивительного: вполне ожидаемым представляется то, что моя рабочая станция, как и мой мозг, имплементирует множество вычислений.
Существенно, однако, то, что нет оснований считать, что любой КоА будет имплементирован любой системой. Если взять любой сложный КоА, то окажется, что существует лишь очень немного физических систем, наделенных каузальной организацией, необходимой для его имплементации. Если мы возьмем КоА, векторы состояний которого имеют тысячу элементов, с десятью опциями для каждого элемента, то аргументы, подобные тем, что выдвигались в главе 7, покажут, что шанс случайного набора физических состояний, имеющих нужные каузальные отношения, чуть меньше 1 из (101000)10^1000 (на деле гораздо меньше из-за требования прочности отношений перехода от состояния к состоянию[180]).
Так как же быть с утверждением Серла о том, что вычислительные описания зависимы от наблюдателя? Верно то, что здесь имеется определенная степень такой зависимости: любая физическая система будет имплементировать множество вычислений, и то, на каком из них сосредоточится наблюдатель, зависит от целей этого наблюдателя. Но это не несет в себе угрозу для ИИ или для вычислительной когнитивной науки. По-прежнему верно, что по отношению к любому вычислению можно говорить о фактичности того, что та или иная система имплементирует или не имплементирует его, и в качестве его имплементаций будет выступать лишь ограниченный класс систем. И этого достаточно для того чтобы вычислительные концепции имели метафизическое и объяснительное значение.
Утверждение о том, что физическая система имплементирует комплексное вычисление Р, равносильно совершенно нетривиальному утверждению о каузальной структуре этой системы, которое может быть весьма полезным для когнитивных объяснений, а, быть может, и для понимания основы сознания. Лишь системы с очень специфичной разновидностью каузальной организации могут рассчитывать на соответствие сильным ограничительным условиям имплементации. Так что здесь нет опасности выхолащивания, и можно надеяться, что понятие вычисления окажется прочной основой для анализа когнитивных систем.
Имплементация КоА поразительно напоминает реализацию функциональной организации. Вспомним, что функциональная организация определяется специфицированием множества абстрактных компонентов, множества состояний каждого компонента и системы отношений зависимости, указующих на то, как состояния каждого компонента зависят от предыдущих состояний и от данных на входе, а также на то, как данные на выходе зависят от предшествующих состояний. Понятие КоА, по сути дела, является непосредственной формализацией указанного понятия.
Действительно, при наличии любой функциональной организации того типа, который был описан в главе 7, из нее можно напрямую извлечь КоА. Нужно лишь допустить, что векторы состояния КоА располагают элементами для каждого компонента этой организации и что формальные переходы состояний КоА соответствуют отношениям каузальной зависимости между компонентами. Реализация функциональной организации практически не отличается от имплементации соответствующего КоА. Небольшие различия, связанные, в частностью, с различным обращением с данными на входе и выходе, есть, но они несущественны.
Предложенная мной концепция имплементации, таким образом, проясняет связь между каузальной и вычислительной организацией. Так мы можем увидеть, что при применении вычислительных описаний к физическим системам они, по сути, предоставляют нам формальное описание каузальной организации системы. Вычислительный язык оптимально подходит для спецификации подобной абстрактной каузальной организации. Можно даже попробовать показать, что именно поэтому вычислительные понятия получили столь широкое распространение в когнитивной науке. В объяснении поведения сложной когнитивной системы наибольшее значение имеет абстрактная каузальная организация системы, и вычислительные формализмы оказываются идеальным каркасом, с помощью которого может быть описана и проанализирована подобная организация[181].
Указанная связь упрощает защиту сильного искусственного интеллекта. Я уже приводил доводы в пользу принципа организационной инвариантности, согласно которому относительно любой системы, наделенной сознательными переживаниями, верно, что система, обладающая такой же высокодетализированной функциональной организацией, будет обладать качественно идентичными сознательными переживаниями. Мы, однако, знаем, что любая функциональная организация может быть абстрагирована в КоА, всегда имплементируемый при реализации этой организации. Из этого следует, что для данной сознательной системы М ее высокодетализированная функциональная организация может быть абстрагирована в КоА М, такой, что любая система, имплементирующая М, будет реализовывать такую же функциональную организацию и поэтому будет обладать сознательными переживаниями, качественно неотличимыми от переживаний исходной системы. А это и есть сильный искусственный интеллект.
К примеру, на основе нейронного описания мозга мы могли бы получить абстрактный КоА, располагающий элементами вектора состояния для каждого нейрона и подсостояниями для каждого элемента, отражающими соответствующий диапазон состояний для каждого из нейронов. Правила перехода от состояния к состоянию в КоА отражают тип зависимости состояния каждого нейрона от состояния других нейронов и соотнесенность нейронных состояний и данных на входе и на выходе. Если значимы не только нейронные компоненты мозга, то можно включить и их. Любая физическая система, имплементирующая этот КоА, будет иметь такую высокодетализированную функциональную организацию, которая будет дуплицировать функциональную организацию мозга на нейронном уровне. Согласно принципу инвариантности, эта система будет обладать переживаниями, неотличимыми от тех, которые связаны с мозгом.
Заманчиво представлять компьютер просто как устройство с входом и выходом, между которыми есть место лишь для формальных математических манипуляций. Подобный взгляд на вещи, однако, игнорирует тот ключевой факт, что внутри компьютера — так же как и внутри мозга — имеется богатая каузальная динамика. В самом деле, в обычном компьютере, понейронно имплементирующем симуляцию моего мозга, есть место для реальной каузальности напряжений различных цепей, в точности отражающей паттерны каузальности между нейронами. Каждому нейрону будет соответствовать участок памяти, репрезентирующий этот нейрон, и каждый из этих участков будет физически реализован напряжением в каком-то физическом месте. За возникающий сознательный опыт отвечают именно эти каузальные паттерны электрических цепей, так же как за его возникновение отвечают каузальные паттерны нейронов мозга.
Тезис сильного искусственного интеллекта можно защищать и напрямую, используя аргументы от блекнущих и от скачущих квалиа. При наличии любых двух имплементаций КоА между ними будет спектр случаев, в которых физические компоненты имплементации заменяются по одному при сохранении паттерна их каузального взаимодействия с остальной частью системы. Если одна из систем обладает сознанием, и если КоА является абстрактным выражением ее высокодетализированной функциональной организации, то из упомянутых аргументов следует, что вторая система должна обладать сознанием и что она должна быть наделена неотличимыми сознательными переживаниями. Если бы вторая система не обладала сознанием, то существовала бы промежуточная система с блекнущими квалиа. Если бы вторая система не обладала сознанием или имела другие осознанные переживания, то мы смогли бы сконструировать промежуточную систему со скачущими квалиа. Такие последствия неправдоподобны по причинам, указанным в главе 7. Но если принять, что квалиа не могут блекнуть или скакать подобным образом, то из этого следует, что вторая из изначально имевшихся у нас систем обладает переживаниями, неотличимыми от переживаний первой системы, что и означает признание истинности тезиса о сильном искусственном интеллекте.
Здесь есть небольшая тонкость. Аргумент предполагает, что организация мозга может быть абстрагирована в КоА-описание. Для этого нужно лишь, чтобы релевантная организация могла быть описана в терминах конечного множества частей, каждая из которых имеет конечное множество релевантных состояний. Однако это можно было бы оспорить. Не исключено, к примеру, что для каждого нейрона требуется бесконечное множество состояний, чтобы передать непрерывность соответствующих процессов, имеющую важное значение. И можно было бы утверждать, что переходы между этими бесконечными состояниями могли бы оказаться невычислимыми. Позже я еще рассмотрю подобное возражение; пока же я готов принять вывод, что если когнитивная динамика вычислима, то надлежащая вычислительная организация будет порождать сознание. Иначе говоря, тут меня больше интересуют внутренние, а не внешние возражения. Тем не менее позже в этой главе я отвечу на ряд внешних возражений.
Противники сильного ИИ, конечно же, подчас выдвигали конкретные доводы против этой позиции. Наиболее известным из них мы обязаны Джону Серлу, излагающему их, в частности, в статье 1980 г. «Сознания, мозги и программы». Я отвечу на них в рамках очерченной модели.
В ходе знаменитого аргумента против сильного ИИ, Серл (Searle 1980) доказывает, что любая программа может быть имплементирована без порождения ментального. Доказательство построено на демонстрации того, что он считает контрпримером для тезиса о сильном ИИ: Китайской комнаты, внутри которой субъект, манипулирующий символами, симулирует человека, понимающего китайский язык. Китайская комната задумана как иллюстрация системы, имплементирующей программу — какой бы они ни была — при отсутствии релевантного сознательного опыта.
В изначальной версии Серл направляет свой аргумент скорее против машинной интенциональности, чем против машинного сознания, доказывая, что у Китайской комнаты отсутствует «понимание». Ясно тем не менее, что, по сути, речь идет о сознании. Ядро этого аргумента, если он верен, напрямую устанавливает, что система Китайской комнаты лишена сознательных состояний, таких как сознательное переживание понимания китайского языка. Серл считает, что интенциональность предполагает сознание, так что этого достаточно для того, чтобы убедиться, что комната лишена и интенциональности. Другие, впрочем, отрицают это. В любом случае, мы можем отвлечься от вопроса о связи между сознанием и интенциональностью и сформулировать проблему исключительно в терминах сознания. При этом можно чуть лучше высветить спорные моменты.
(Иначе говоря, мы можем разделить выводы Серла на две части: (1) программы не достаточно для сознания; и (2) программы не достаточно для интенциональности. Серл полагает, что из (1) следует (2), но другие отрицают это. Яснее всего будет, если сфокусировать аргумент о сильном ИИ на (1): все стороны согласятся, что, если (1) верен, то наиболее интересная разновидность сильного ИИ обречена, и даже Серл согласился бы, что опровержение (1) показало бы, что аргумент Китайской комнаты не проходит. Связь между сознанием и интенциональностью можно выделить тогда в отдельный вопрос, не критичный для аргумента против ИИ.
Действуя подобным образом, мы избегаем ситуации, при которой оппоненты выступают против (2), не беспокоясь об опровержении (1). К примеру, возражения, сфокусированные на связи между Китайской комнатой и ее окружением (Fodor 1980; Rey 1986), и возражения, процедурно или функционально объясняющие интенциональность (Boden 1988; Thagard 1986), могут в лучшем случае прояснить вопрос об интенциональности, но они никак не повышают правдоподобность вывода о сознательности Китайской комнаты. В результате они оставляют такое чувство, будто проблема, которую ставит перед ИИ этот сценарий, так и не была рассмотрена. Максимум, что они делают, так это оспаривают вспомогательную посылку о том, что интенциональность предполагает сознание [182].)
Аргумент Китайской комнаты разворачивается следующим образом. Возьмем любую программу, которая, как предполагается, передает какой-то из аспектов сознания, к примеру, понимание китайского языка или наличие ощущения красного. Далее эта программа может быть имплементирована англоязычным субъектом, не знающим других языков, — будем называть его демоном — в черно-белой комнате. Демон вручную следует всем правилам, специфицированным программой, ведя записи о всех релевантных внутренних состояниях и переменных на клочках бумаги, при необходимости стирая и обновляя их. Мы можем также вообразить, что демон соединен с роботизированным телом, получая цифровые данные от перцептивных датчиков, манипулируя ими согласно программным спецификациям и посылая результирующие данные на моторные эффекторы. Здесь можно говорить о совершенной имплементации программы. Тем не менее кажется очевидным, что у демона нет сознательного понимания китайского и что он лишен ощущения красного. Поэтому имплементация программы не достаточна для этих сознательных переживаний. Сознание предполагает не только имплементацию релевантной программы.
Защитники сильного ИИ обычно возражали так, что они соглашались, что демон не понимает по-китайски, но доказывали, что понимание и сознание должны быть атрибутированы системе, включающей в свой состав демона и клочки бумаги. Серл заявлял об очевиднейшей неубедительности такого возражения. Действительно, в утверждении о том, что система, состоящая из субъекта и клочков бумаги, обладает коллективным сознанием, есть нечто контринтуитивное. На этой стадии аргумент заходит в тупик. Защитники ИИ доказывают, что система обладает сознанием, оппоненты находят этот вывод нелепым, и дальнейшее продвижение кажется затруднительным. Думаю, однако, что приведенные ранее доводы дают возможность выйти из тупика к сильному ИИ.
Допустим, что программа, о которой мы говорим, в действительности является комбинаторным автоматом, отражающим на нейронном уровне организацию носителя китайского языка, смотрящего на сочное красное яблоко. Демон в комнате имплементирует этот КоА, располагая клочками бумаги для каждого элемента вектора состояния и обновляя их на каждом временном шагу в соответствии с правилами перехода от состояния к состоянию. Мы можем развернуть аргументы блекнущих и скачущих квалиа, сконструировав спектр случаев, занимающих промежуточное положение между исходным носителем китайского языка и Китайской комнатой[183]. Сделать это нетрудно. Вначале мы можем вообразить, что нейроны в голове носителя китайского языка последовательно заменяются крошечными демонами, каждый из которых дуплицирует входяще — исходящую функцию нейрона[184]. При получении стимулов со стороны соседних нейронов демон производит соответствующие вычисления и, в свою очередь, стимулирует соседние нейроны. По мере замены все большего количества нейронов демоны берут верх, пока весь череп не оказывается заполнен миллиардами демонов, реагирующих на сигналы друг друга и на входящие чувственные данные, производящих вычисления, сигнализирующих другим демонам и, в свою очередь, стимулирующих моторные окончания. (Если кто-то будет возражать, сказав, что все эти демоны никогда не смогут поместиться в череп, то взамен можно вообразить сценарий с устройствами радиопередачи, находящимися вне черепа.)
Далее, мы постепенно уменьшаем число демонов, удваивая их работу. Сперва мы заменяем два соседних демона одним демоном, делающим их работу. Новый демон будет фиксировать внутреннее состояние обоих симулируемых им нейронов — можно представить, что эта запись будет храниться на клочке бумаги в каждой из локаций. Каждый из этих клочков бумаги будет обновляться в зависимости от сигналов, поступающих от соседних нейронов и от состояния другого клочка бумаги. Консолидация демонов будет продолжена, пока в конце концов на их месте не окажется один-единственный демон и миллиарды крошечных клочков бумаги. Можно представить, будто каждый из этих клочков находится в месте изначального расположения соответствующего ему нейрона, а демон мечется по мозгу, обновляя каждый из этих клочков в качестве функции состояний соседних клочков и, при необходимости, чувственных данных.
Несмотря на все эти изменения, итоговая система имеет ту же функциональную организацию, что и исходный мозг. Каузальные отношения между нейронами в исходном случае отражаются в каузальных отношениях между демонами в промежуточном случае и между клочками бумаги — в конечном случае. В этом конечном случае каузальные отношения опосредуются действиями демона — клочок бумаги воздействует на состояние демона, который воздействует на соседний клочок бумаги — но они тем не менее являются каузальными отношениями. Если мы посмотрим на функционирование этой системы в ускоренном режиме, то мы увидим вихрь каузальных взаимодействий, точно соответствующий нейронному вихрю.
Мы, таким образом, сможем применить аргументы от блекнущих и скачущих квалиа. Если итоговая система лишена сознательного опыта, то должна существовать промежуточная система с блеклыми сознательными переживаниями. А это неправдоподобно по уже известным нам причинам. Мы можем также вообразить, что мы поочередно подключаем то нейронную цепь, то соответствующую ей резервную цепь, имплементированную демонами или одним демоном и клочками бумаги. Как и прежде, это привело бы к скачущим квалиа при неизменной функциональной организации, так что система не смогла бы заметить разницу. И опять-таки гораздо более правдоподобным выглядит допущение, что квалиа не будут меняться.
Оправданным, стало быть, кажется заключение, что итоговая система имеет точно такие же сознательные переживания, что и исходная система. Если нейронная система порождала переживания чего-то ярко-красного, то их будет порождать и система демонов, равно как и сеть клочков бумаги, опосредованных демоном. Но этот итоговый случай, разумеется, всего лишь копия системы, находящейся в Китайской комнате. Мы тем самым нашли позитивное основание считать, что та система действительно обладает сознательными переживаниями, в частности, теми, которые связаны с пониманием китайского языка и переживанием красного.
Подобный взгляд на вещи проясняет два момента, которые могли бы оставаться затемненными серловским описанием Китайской комнаты. Во-первых, «клочки бумаги» в комнате — это не просто кучи формальных символов. Они образуют конкретную динамическую систему, каузальная организация которой прямо соответствует организации исходного мозга. Это обстоятельство затемняется медлительностью связываемой с ними манипуляции символами, а также присутствием демона, осуществляющего эту манипуляцию; и тем не менее сознательный опыт порождает именно конкретная динамика этих клочков бумаги. Во-вторых, демон играет сугубо второстепенную роль. Ключевая каузальная динамика связана с клочками бумаги, соответствующими нейронам в исходном случае. Демон всего лишь оказывает вспоможение этим каузальным отношениям. Образ демона, мечущегося внутри черепной коробки, делает очевидным то обстоятельство, что атрибутирование переживаний системы демону было бы серьезным смешением уровней. Факт сознательности демона может искушать на предположение, что если переживания системы вообще где-то существуют, то они существуют именно в демоне; но в действительности сознательность демона не имеет никакого отношения к функционированию системы. Функции демона могла бы выполнить простая таблица соответствий. Ключевым аспектом системы является динамика символов.
Аргумент Серла интуитивно впечатляет нас из-за причудливости программной имплементации, затемняющей реализацию релевантной каузальной динамики. Но при избавлении от образов, навеваемых присутствием нерелевантного демона и медлительностью перетасовки символов, мы увидим, что каузальная динамика в комнате в точности отражает каузальную динамику в черепной коробке. И тогда предположение о том, что эта система порождает опыт, уже не будет казаться столь неправдоподобным.
В одной из версий серловского аргумента демон запоминает правила вычисления и внутренним образом имплементирует программу. Конечно, на практике люди не могут запомнить даже сотню правил и символов, не говоря уже о многих миллиардах, но можно вообразить, что демон с модулем суперпамяти был бы в состоянии запомнить все правила и состояния всех символов. В этом случае опять-таки можно ожидать, что система породит сознательные переживания, которые не будут переживаниями демона. Серл доказывает, что если кто-то и должен иметь переживания, то им может быть только демон, так как все процессы обработки информации протекают внутри него, однако эта ситуация должна рассматриваться как пример реализации двух ментальных систем в одном и том же физическом пространстве. Устройство, порождающее китайские переживания, никак не совпадает с организацией, порождающей переживания демона. Понимающее китайский устройство состоит в каузальных отношениях миллиардов локаций модуля суперпамяти; демон же, повторю, действует лишь в качестве каузального вспоможения. Это становится очевидным при рассмотрении спектра случаев, когда демон, мечущийся в черепной коробке, постепенно запоминает правила и символы — до тех пор, пока не интернализирует все их. Соответствующая структура постепенно перемещается из черепной коробки в суперпамять демона, но опыт остается неизменным и совершенно обособленным от переживаний демона.
Можно было бы предположить, что поскольку мой аргумент предполагает дуплицирование организации мозга, он устанавливает лишь слабую разновидность сильного ИИ, тесно увязанную с биологией. (При обсуждении возражения, называемого им «Симулятором мозга», Серл выказывает удивление тем обстоятельством, что сторонник ИИ выдвигает возражение, подразумевающее детальную симуляцию человеческой биологии.) Однако в таком случае мы недооценили бы силу этого аргумента. Программа симуляции мозга — это просто тонкий край нашего клина. Узнав, что одна программа может порождать ментальное даже при ее имплементации в духе Китайской комнаты, мы полностью нейтрализуем аргумент Серла, претендующий на универсальный характер: мы знаем, что демон и бумага в Китайской комнате действительно могут фундировать независимое сознание. И тогда мы открываем шлюзы для целого спектра программ, которые могли бы оказаться кандидатами на роль программ, порождающих сознательный опыт. Границы этого спектра — это открытый вопрос, но Китайская комната не является препятствием на этом пути.
Второй аргумент, выдвинутый Серлом (Searle 1984), звучит так:
1. Компьютерная программа имеет синтаксический характер.
2. Синтаксис недостаточен для семантики.
3. Сознания семантичны.
4. Поэтому имплементации программы недостаточно для сознания.
Опять-таки, это выдвигается как аргумент об интенциональности, но он может рассматриваться и как аргумент о сознании. Серл считает, что главной разновидностью интенциональности является феноменологическая интенциональность, внутренне присущая сознанию.
Этот аргумент можно интерпретировать и критиковать разными способами, но главная его проблема состоит в том, что он не придает должного значения ключевой роли имплементации. Программы — это абстрактные вычислительные объекты, и они сугубо синтаксичны. Можно быть уверенным, что ни одна программа как таковая не может претендовать на наличие в ней ментального. Но имплементации программ — это конкретные системы с каузальной динамикой, и они не есть нечто сугубо синтаксичное. Имплементация имеет каузальный вес в реальном мире, и благодаря этому весу возникает сознание и интенциональность. Синтаксична программа; имплементация же имеет семантическое содержание.
Серл мог бы попробовать доказать, что и имплементации в определенном смысле синтаксичны — возможно, потому, что динамика имплементаций детерминируется формальными принципами. Однако «синтаксичность» имплементаций имеет смысл, никак не связанный с тем, в котором можно правдоподобно утверждать, что синтаксис недостаточен для семантики. Хотя тезис о том, что статичный набор абстрактных символов лишен внутренних семантических свойств, и может быть правдоподобным, гораздо менее очевидным кажется утверждение, что формально специфицированные каузальные процессы не могут фундировать ментальное.
Мы можем следующим образом спародировать этот аргумент:
1. Рецепты синтаксичны.
2. Синтаксис недостаточен для рассыпчатости.
3. Пирожные рассыпчаты.
4. Значит, имплементации рецепта недостаточно для пирожного.
В таком виде указанный дефект бросается в глаза. Аргумент не проводит различия между рецептами, являющимися синтаксическими объектами, и имплементациями рецептов, полноценными физическими системами в реальном мире. Вся работа, опять-таки, проделывается отношением имплементации, соотносящим области абстрактного и конкретного. Рецепт имплицитно специфицирует класс физических систем, которые могут рассматриваться как имплементации этого рецепта, и именно эти системы обладают такими характеристиками, как рассыпчатость. Аналогичным образом программа имплицитно специфицирует класс физических систем, которые могут рассматриваться в качестве ее имплементаций, и именно они порождают такие характеристики, как ментальное.
Одно из популярных возражений против искусственного интеллекта (напр., Searle 1980; Hamad 1989) состоит в том, что симуляция феномена не тождественна его воспроизведению. К примеру, при компьютерной симуляции пищеварения никакая пища в действительности не переваривается. Симуляция урагана — это не настоящий ураган; при его симуляции на компьютере никто не промокает. При симуляции тепла реальное тепло не выделяется. Так почему же мы должны ожидать появления настоящего сознания при его симуляции? Почему мы должны ожидать, что именно в этом случае вычислительный процесс не просто симуляция, но и нечто реальное?
Нет сомнений, что для многих свойств симуляция не является воспроизведением. Симулированное тепло — это не реальное тепло. Имеются, однако, и такие свойства, для которых симуляция есть воспроизведение. К примеру, симуляция системы с каузальной петлей есть система с каузальной петлей. Так что реальный вопрос состоит здесь в том, как отличить типы X, при которых симуляция X действительно есть X, от иных?
Ответ, как я полагаю, может быть таким: симуляция X оказывается X именно в тех случаях, когда свойство быть X является организационным инвариантом. Дефиниция организационного инварианта — такая же, как и раньше: свойство есть организационный инвариант, когда оно зависит только от функциональной организации фундирующей системы, а не от каких бы то ни было иных деталей. Вычислительная симуляция физической системы может ухватывать ее абстрактную каузальную организацию и гарантировать ее воспроизводимость при любой имплементации, вне зависимости от состава имплементирующей инстанции. Подобная имплементация будет в таком случае воспроизводить любые организационные инварианты изначальной системы, однако другие свойства будет утрачены.
Свойство быть ураганом не является организационным инвариантом, так как оно отчасти зависит от таких неорганизационных свойств, как скорость, форма и физических состав фундирующей системы (система с теми же каузальными взаимодействиями, очень медленно имплементированная на большом количестве бильярдных шаров, не была бы ураганом). Пищеварение и тепло сходным образом зависят от различных аспектов фундирующих физических субстратов, не являющихся всецело организационными. Мы могли бы постепенно заменять биологические компоненты пищеварительной системы — так, чтобы реакции, основанные на действии кислоты, заменялись каузально изоморфными взаимодействиями кусочков металла, и это уже не было бы пищеварением. Так что нам не стоит ожидать, что симуляция систем с этими свойствами сама будет обладать ими.
Но феноменальные свойства не таковы. Как я доказывал в главе 7, эти свойства представляют собой организационные инварианты. И если это так, то отсюда следует, что надлежащая симуляция системы с феноменальными свойствами сама будет обладать ими — благодаря воспроизведению высокодетализированной функциональной организации изначальной системы. Организационная инвариантность принципиально отличает сознание от других упомянутых свойств и открывает путь сильному ИИ.
По большей части меня интересовали внутренние возражения против сильного искусственного интеллекта, так как они наиболее значимы в контексте этой книги, однако я хотя бы упомяну некоторые внешние возражения. Я уже отмечал, что позиции противников внешних возражений против искусственного интеллекта изначально кажутся сильными: есть все основания считать, что законы физики, по крайней мере в их нынешнем понимании, вычислимы, и что человеческое поведение определяется физическими законами. Если так, то из этого следует, что вычислительная система может симулировать человеческое поведение. Тем не менее возражения время от времени выдвигаются, так что я кратко обсужу их.
Возможно, самое давнее внешнее возражение против ИИ состоит в том, что вычислительные системы всегда следуют правилам и поэтому неизбежно будут лишены ряда человеческих способностей, вроде креативности или гибкости. Во многих отношениях это самое слабое из внешних возражений, в частности из-за его явной нечеткости и неконкретности. В самом деле, на него можно легко ответить, сказав, в свою очередь, что на нейронном уровне человеческий мозг может быть вполне механичным и рефлекторным, но это никоим образом не препятствует креативности и гибкости на макроскопическом уровне. Конечно, оппонент опять-таки всегда может не согласиться с утверждением о механичности нейронного уровня, но в любом случае не видно хорошего аргумента в пользу тезиса о том, что вычислительная динамика на базовом каузальном уровне несовместима с креативностью и гибкостью на макроскопическом уровне.
Подобное возражение может подкрепляться неявным отождествлением вычислительных систем с символьными вычислительными системами: системами, производящими символьные манипуляции с высокоуровневыми концептуальными репрезентациями — в предельном случае, с системами, жестко выводящими заключения из посылок логики предикатов. Не исключено, что в этой области указанное возражение не лишено оснований, хотя даже это не очевидно. Но в любом случае класс вычислительных систем гораздо шире. К примеру, низкоуровневая симуляция мозга представляет собой некое вычисление, но не символьное вычисление того рода. Если говорить о промежуточном уровне, то к несимвольным вычислениям обращались коннекционистские модели в когнитивной науке. В этих случаях на каком-то уровне система может следовать правилам, но это напрямую не отражается на поведенческом уровне; и в самом деле, коннекционисты часто говорят, что их метод позволяет получить гибкость на высоком уровне из низкоуровневой механистичности. Как выразился Хофштадтер (Hofstadter 1979), уровень, на котором я мыслю, не обязательно совпадает с уровнем, на котором я существую[185].
Иногда утверждается, что теорема Геделя показывает, что вычислительным системам свойственны ограничения, которых нет у людей. Теорема Геделя говорит нам, что в любой непротиворечивой формальной системе, достаточно богатой для произведения арифметических операций, будет существовать некое истинное предложение — Геделевское предложение системы — которое эта система не сможет доказать. И аргумент состоит в том, что поскольку мы, однако же, можем понять, что оно истинно, мы обладаем некоей способностью, отсутствующей у этой формальной системы. Из этого следует, что никакая формальная система не может в точности передавать человеческие способности. (Подобные аргументы выдвигали среди прочих Лукас (Lucas 1961) и Пенроуз (Penrose 1989, 1994).)
Краткий ответ на эти аргументы состоит в том, что нет оснований считать, что и люди могут знать об истинности соответствующих Геделевских предложений. В лучшем случае мы можем знать, что если система непротиворечива, то ее Геделевское предложение истинно, но нет оснований полагать, что мы можем установить непротиворечивость произвольных формальных систем[186]. В особенности это справедливо в случае сложных формальных систем, таких как система, симулирующая реакции человеческого мозга: задача определения непротиворечивости подобной системы вполне может выходить за пределы наших возможностей. Так что вполне может оказаться так, что каждый из нас может симулироваться сложной формальной системой F, такой, что мы не в состоянии установить, является ли она непротиворечивой. И если это так, то мы не сможем узнать, будут ли истинными наши собственные Геделевские предложения.
Существует множество вариаций этого геделевского аргумента, с реакциями оппонентов на это предположение и ответными репликами, нацеленными на то, чтобы обойти эти возражения. Здесь я не буду обсуждать их (хотя я подробно обсуждаю их в Chalmers 1995с). Эти вопросы связаны со множеством интересных и стимулятивных моментов, но, думаю, мы вправе сказать, что тезис о том, что геделевские ограничения не применимы к людям, никогда не был убедительным образом обоснован.
Приведенные выше возражения являют собой «высокоуровневые» аргументы о невычислимости когнитивных процессов. Но можно было бы попробовать атаковать позиции ИИ и на низком уровне, доказывая невычислимость физических процессов. К примеру, Пенроуз (Penrose 1994) доказывает, что в адекватной теории квантовой гравитации мог бы быть невычислимый элемент. Единственным основанием для такого вывода, однако, оказывается у него вышеупомянутый геделевский аргумент. В самой физической теории нет ничего, что фундировало бы этот вывод; так что если отбросить геделевский аргумент, то исчезает основание верить в невычислимые физические законы. В самом деле, можно было бы попробовать показать, что если каждый элемент мозга, такой как нейрон, имеет лишь конечное множество релевантных состояний, и если существует лишь конечное множество релевантных элементов, то релевантная каузальная структура мозга должна выражаться вычислительным описанием.
Это ведет нас к последнему возражению, которое состоит в том, что процессы в мозге могут быть сущностным образом непрерывными, тогда как вычислительные процессы дискретны, и что эта континуальность может быть сущностной чертой нашей когнитивной компетентности, так что никакая дискретная симуляция не смогла бы воспроизвести эту компетентность. Быть может, создавая приблизительную копию нейрона с помощью элемента, имеющего лишь конечное множество состояний, мы утрачиваем нечто жизненно важное в плане реализации его функций. Оппонент может ссылаться, к примеру, на «чувствительную зависимость от изначальных условий» в определенных нелинейных системах, означающую, что даже небольшая округляющая ошибка на одной из стадий процесса может вести к масштабным макроскопическим различиям на более поздней стадии. Если процессы в мозге именно таковы, то любая дискретная симуляция мозга будет приводить к результатам, отличающимся от тех, которые получаются в континуальной реальности.
Имеется, однако, серьезное основание полагать, что абсолютная континуальность не может быть сущностной характеристикой нашей когнитивной компетентности. Наличие фонового шума в биологических системах означает, что никакой процесс не может зависеть от требования такого уровня точности, который выходит за определенные пределы. За пределами, скажем, 10-10 по соответствующей шкале неконтролируемые флуктуации фонового шума будут препятствовать дальнейшему уточнению. Иначе говоря, если мы создаем приблизительную копию состояния системы с таким уровнем точности (быть может, для надежности, еще более продвинутую — к примеру, на уровне 10-20), то ее работа будет приносить те же результаты, которые реально могли бы быть и у той системы. Конечно, вследствие нелинейных эффектов эта приблизительная копия может продуцировать поведение, отличное от поведения, продуцируемого той системой по данному поводу, — но она продуцировала бы поведение, которое могла бы продуцировать и та система при несколько ином биологическом шуме. При желании мы можем даже приблизительно смоделировать сам процесс шума[187]. В результате симулирующая система будет обладать такими же поведенческими способностями, что и изначальная система, даже если она и продуцирует иное конкретное поведение в конкретных случаях. Мораль такова, что, когда речь идет о дуплицировании наших когнитивных способностей, близкое сходство не хуже тождества.
Верно то, что система с безграничной степенью точности могла бы обладать когнитивными способностями, которые никогда не смогла бы получить в свое распоряжение какая-либо дискретная система. Можно было бы, к примеру, закодировать аналоговую величину, соответствующую реальному числу, n-ое бинарное значение которого равно 1, если и только если n — ая машина Тьюринга останавливается при любых данных на входе. Используя эту величину, совершенная континуальная система могла бы решить проблему остановки, с которой не может справиться никакая дискретная система. Наличие шума, однако, означает, что никакие биологические процессы не смогли бы надежно имплементировать эту систему. Биологические системы предполагают лишь лимитированную точность, и поэтому человеческие и животные мозги должны ограничиваться такими способностями, которые могут быть у дискретных систем.
Вывод таков, что, похоже, не существует принципиальных преград, которые могли бы сдержать амбиции искусственного интеллекта. Внешние возражения не выглядят очень уж сильными. Внутренние возражения могли бы доставлять большее беспокойство, но анализ аргументов, подкрепляющих эти возражения, показывает, что они не являются убедительными; более того, если аргументы, которые я приводил в предыдущих главах, верны, то у нас имеется серьезное позитивное основание считать, что имплементация надлежащего вычисления повлечет за собой появление сознательного опыта. Так что перспективы машинного сознания можно признать хорошими — пусть и не на практике, но хотя бы в принципе.
Я мало говорил о том, какого рода вычисления, скорее всего, достаточны для сознательного опыта. В большинстве аргументов я использовал для иллюстрации понейронную симуляцию мозга; но вероятно, что для этого могло бы быть достаточным и множество других видов вычислений. Могло бы, к примеру, быть так, что вычисление, отражающее каузальную организацию мозга на гораздо более грубом уровне, передавало бы тем не менее те моменты, которые релевантны для возникновения сознательного опыта. Вероятно и то, что вычисления совершенного иного вида, соответствующие совершенно другим типам каузальной организации, при их имплементации тоже могли бы порождать богатые сознательные переживания.
Эта картина в равной мере совместима как с символьным, так и с коннекционистским подходом к познанию, а также и с другими вычислительными подходами. Действительно, можно было бы попробовать доказать, что центральная роль вычисления в исследовании познания связана с тем, что вычислительные конструкции могут передавать практически любую разновидность каузальной организации. Мы можем рассматривать вычислительные формализмы в качестве источника идеального формализма для выражения паттернов каузальной организации и, более того (в сочетании с методами имплементации), в качестве идеального инструмента для их воспроизведения. Какая бы каузальная организация ни оказалась ключевой для познания и сознания, мы можем ожидать, что какая-то вычислительная конструкция сможет точно передать ее. Можно было бы даже попытаться показать, что именно эта гибкость скрывается за часто упоминаемой универсальностью вычислительных систем. Сторонники искусственного интеллекта не обязаны подписываться под каким-то одним видом вычисления, только и достаточным для ментальности; тезис ИИ столь правдоподобен именно из-за широты класса вычислительных систем[188].
Так что вопрос о том, какой именно класс вычислений достаточен для воспроизведения человеческой ментальности, остается открытым; но у нас есть серьезное основание верить, что этот класс не является пустым.
Проблема квантовой механики почти столь же трудна, как проблема сознания. Квантовая механика дает нам удивительно точные формулы для предсказания результатов эмпирических наблюдений, но картина мира, которую она при этом рисует, лишь с очень большим трудом поддается осмыслению. Как наш мир может быть таким, каким он должен быть, чтобы предсказания квантовой механики оказывались успешными? В ответе на этот вопрос нет ничего даже отдаленного напоминающего консенсус. Как и в случае с сознанием, нередко кажется, что ни одно из решений проблемы квантовой механики не может быть удовлетворительным.
Многие полагали, что между двумя этими наиболее загадочными проблемами могла бы существовать какая-то глубокая связь (напр., Bohm 1980; Hodgson 1988; Lockwood 1989; Penrose 1989; Squires 1990; Stapp 1993; Wigner 1961). Если есть две тайны, то соблазнительно предположить, что у них имеется общий исток. Это искушение усиливается тем обстоятельством, что проблемы квантовой механики кажутся тесно сопряженными с понятием наблюдения, сущностным образом предполагающим отношение между опытом какого-то субъекта и всем остальным миром.
Чаще всего высказывалось предположение, что квантовая механика могла бы оказаться ключом к физическому объяснению сознания. Но, как мы видели, этот проект обречен на неудачу. Квантовые «теории» сознания в итоге страдают от такого же провала в объяснении, что и классические теории. В любом случае опыт должен рассматриваться как нечто выходящее за пределы физических свойств мира. Квантовая механика, возможно, могла бы содействовать характеристике психофизической связи, но одна лишь квантовая теория не может сказать нам, почему существует сознание.
Впрочем, две эти проблемы могут быть увязаны и более тонким образом. Даже если квантовая механика и не объясняет сознание, не исключено, что теория сознания могла бы пролить свет на проблемы квантовой механики. В конце концов, многие признают, что эти проблемы каким-то образом связаны с наблюдением и опытом. Естественно предположить, что теория опыта могла бы помочь нам разобраться в этом. Некоторые говорили об активной роли сознания в квантовой теории — допуская, к примеру, что сознание осуществляет «коллапс волновой функции» — но я буду отстаивать позицию, согласно которой роль сознания во всем этом не столь непосредственна. В частности, я попытаюсь показать, что мы можем переосмыслить проблемы квантовой теории, представив их в качестве проблем отношения между физической структурой мира и нашим опытом мира, и что, следовательно, надлежащая теория сознания может подкрепить неортодоксальные интерпретации квантовой механики.
Основным каркасом квантовой механики является исчисление для предсказания результатов экспериментальных измерений. Здесь я охарактеризую одну из версий этого исчисления, оставляя в стороне множество технических деталей, чтобы дать простое описание, покрывающее большинство существенных черт. В этом параграфе я трактую этот каркас только как исчисление для эмпирических предсказаний, оставляя открытым вопрос о том, дает ли он прямое описание физической реальности. Глубокие интерпретационные проблемы обсуждаются в следующем параграфе.
В классической модели состояние физической системы может быть выражено в очень простых терминах. Состояние частицы, к примеру, выражается путем указания определенных значений каждого из множества свойств, таких как положение и импульс. Мы можем назвать простое значение такого рода базовым значением. В квантовой модели все не так просто. В общем, состояние системы должно быть выражено волновой функцией или вектором состояния. Релевантные свойства не могут выражаться здесь простыми значениями, а должны выражаться некоей комбинацией базовых значений. Квантовое состояние может рассматриваться как суперпозиция более простых состояний.
Простейшим примером является такое свойство, как спин, имеющий только два базовых значения [189]. Эти базовые значения могут быть поименованы как «вверх» и «вниз». Впрочем, в квантовой механике спин частицы не всегда оказывается «вверх» или «вниз». В общем, спин частицы должен выражаться комбинацией «вверх» и «вниз», в каждом случае со своей комплексной магнитудой. Спин частицы поэтому лучше всего рассматривать как вектор в двумерном векторном пространстве. И его наиболее естественной визуализацией будет суперпозиция состояния спина-«вверх» и состояния спина-«вниз», с различными соответствующими им магнитудами.
Это же верно для положения и импульса, разве что они имеют бесконечное множество базовых значений. Положение и импульс классической частицы могут принимать любое из бесконечного множества значений в континууме. Соответственно, положение квантовой частицы должно выражаться бесконечномерным вектором с различной магнитудой для каждого из этих местоположений. Этот вектор лучше всего трактовать как волну с различными амплитудами в различных местах пространства; функция, соотносящая место с соответствующей амплитудой, есть волновая функция. Импульс квантовой частицы тоже может рассматриваться в качестве волны с различными амплитудами при разных базовых значениях импульса. Положение или импульс такой частицы можно опять-таки мыслить в качестве суперпозиции базовых значений положения или импульса.
Поскольку эти состояния — всего лишь векторы, они могут быть разложены на свои компоненты разными способами. Хотя зачастую полезно рассматривать вектор двумерного спина в качестве суммы компонента «вверх» и компонента «вниз», его можно разложить и множеством других способов, в зависимости от того, что принимается за базис векторного пространства. Все эти базисы в равной степени «естественны»; ни один из них не является предпочтительным для природы. На деле оказывается, что один и тот же вектор репрезентирует как положение, так и импульс частицы. При разложении по одному базису мы получаем «позиционные» амплитуды; при разложении по другому — «импульсные» амплитуды. В общем, релевантное в том или ином случае разложение зависит от того, к какой из величин мы проявляем интерес, и, в частности, от того, какую из величин мы решаем измерить, о чем я вскоре еще поговорю.
Состояния систем из более чем одной частицы несколько более сложны, но главная идея остается неизменной. Возьмем систему, состоящую из двух частиц, А и В. Состояние этой системы, как правило, нельзя выразить простой комбинацией волновой функции А и волновой функции В; состояния двух этих частиц часто будут нераздельными. Состояние данной системы должно быть выражено, скорее, в виде волновой функции в более сложном пространстве. Однако эта волновая функция может рассматриваться как некая суперпозиция более простых состояний системы с двумя частицами, так что общая картина все равно будет применима к данному случаю. Это же верно и для более сложных систем, состояние которых по-прежнему лучше всего будет репрезентировать волновой функцией, соответствующей суперпозиции состояний.
Все это контринтуитивно, но еще не парадоксально. Если мы буквально истолкуем этот формализм как описание реальности, то осмыслить его будет не слишком трудно. Некоторые полагали, что он несовместим с «объективным» представлением о мире, так как из него вытекает, что вещам в мире не может быть присуще объективного, определенного состояния. Однако это вовсе не следует из сказанного. Согласно данной картине, состояние некоей сущности лучше всего выражается волновой функцией, а не дискретными величинами, но оно тем не менее является совершенно определенным состоянием. Эта картина просто говорит нам, что на базовом уровне реальность подобна волне. Это требует нового образа мысли, но мы можем привыкнуть к нему. В конце концов, базовый уровень микроскопической реальности очень далек от макроскопического уровня, с которым мы обычно имеем дело, и не кажется чем-то совершенно удивительным то, что здесь могут встречаться какие-то необычные свойства. Проблемы возникают из-за других характеристик квантовой механики.
Ядро квантовой механики составляют два принципа, определяющие динамику волновой функции: уравнение Шредингера и постулат измерения. Два этих совершенно разных принципа совместно определяют изменение волновой функции той или иной системы с течением времени.
Основное содержание квантовой механики заключено в уравнении Шредингера. Это дифференциальное уравнение, определяющее изменение волновой функции системы почти при любых обстоятельствах. Детальная структура этого уравнения не важна для наших целей. Наиболее важной характеристикой является в данном случае то, что оно представляет собой линейное дифференциальное уравнение: если имеются два состояния, А и В, такие, что А изменяется в А' а В — в В', то состояние, оказывающееся суперпозицией А и Б, будет трансформироваться в суперпозицию A' и В'. Стоит также отметить, что динамика уравнения Шредингера такова, что относительно дискретные состояния имеют тенденцию к размытию с течением времени. Состояние, изначально являющееся суперпозицией значений в каком-то ограниченном диапазоне, как правило, трансформируются в суперпозицию значений в гораздо большем диапазоне. Наконец, уравнение Шредингера является абсолютно детерминистическим.
Уравнение Шредингера весьма прозрачно и не вызывает больших вопросов. Именно в нем заключена содержательная часть квантовой теории. При применении квантовой теории к практическим или экспериментальным проблемам дело по большей части сводится к вычислению эволюции различных состояний согласно шредингеровской динамике.
Уравнение Шредингера, однако, не исчерпывает сути дела. Согласно этому уравнению, подавляющее большинство физических состояний вскоре трансформируется в суперпозицию широкого диапазона состояний. Но это не сочетается с наблюдаемым нами миром. Когда мы измеряем положение частицы, мы получаем какое-то определенное значение, а не суперпозицию значений, которую предсказывало бы уравнение Шредингера. Если бы квантовая динамика сводилась к уравнению Шредингера, то даже на макроскопическом уровне мир оказался бы в состоянии дикой суперпозиции. Но наш опыт говорит, что этого не происходит. Стрелки расположены определенным образом, движущиеся объекты наделены определенным и поддающимся измерению импульсом и т. п. Так что здесь должно быть еще что-то, позволяющее нам переходить от этого уравнения к таким дискретным событиям, которые характеризуют наш опыт.
Второй частью картины в стандартном формализме является постулат измерения (известный также как постулат коллапса или проекции). В нем утверждается, что при определенных обстоятельствах шредингеровская динамика оказывается неприменимой. А именно, утверждается, что при проведении измерения волновая функция коллапсирует в нечто более определенное. Тип ее коллапсирования зависит от того, какое свойство подвергается измерению. К примеру, если мы измеряем спин частицы, то, даже если до этого она находилась в состоянии суперпозиции, она коллапсирует в состояние, в котором спин будет либо вверх, либо вниз. Если мы измеряем положение частицы, то ее волновая функция коллапсирует в состояние с вполне определенным положением[190]. Итоговое состояние по-прежнему соответствует волновой функции, но эта волновая функция такова, что вся ее амплитуда сконцентрирована в определенном положении; во всех остальных местах она оказывается равной нулю. Любой величине, которую мы могли бы измерить, соответствует оператор, и при измерении данное состояние коллапсирует в состояние, являющееся собственным состоянием этого оператора. Собственное состояние оператора — это всегда состояние, в котором соответствующая ему измеряемая величина имеет какое-то определенное значение. Из этого следует, что когда мы измеряем величину, результатом всегда будет определенное значение этой величины, что в точности согласуется с имеющимся у нас опытом.
Динамика коллапса имеет скорее вероятностный, чем детерминистический характер. Если частица находится в состоянии, являющемся суперпозицией каких-то положений, то при измерении ее положения мы знаем, что она коллапсирует в состояние с определенным положением, но не знаем, каким оно будет. Скорее для каждого потенциально коллапсированного состояния постулат измерения конкретизирует вероятность того, что данная система коллапсирует в это состояние. Эта вероятность[191] задается квадратом амплитуды волновой функции в положении, соответствующем определенному значению, о котором идет речь. К примеру, если спин частицы — суперпозиция спина — «вверх» (с амплитудой 1/2) и спина — «вниз» (с амплитудой √3/2), то при измерении спина он коллапсирует в состояние спина — «вверх» с вероятностью 1/4 и в состояние спина — «вниз» с вероятностью 3/4. Амплитуды волновой функции всегда таковы, что сумма соответствующих вероятностей равна 1.
Два этих принципа вместе составляют исключительно мощное исчисление для предсказания результатов экспериментальных измерений. Для предсказания результатов эксперимента мы выражаем состояние системы в виде волновой функции и вычисляем, как эта волновая функция изменяется во времени в соответствии с уравнением Шредингера до момента измерения. При измерении мы используем амплитуды вычисленной волновой функции для определения вероятности появления различных коллапсированных состояний и того, что измерение даст нам ту или иную величину. Экспериментальные результаты однозначно подкрепляли предсказания данной теории; мало какие научные теории были столь же успешны в плане предсказаний. В качестве исчисления эта теория очень прочна.
Проблемы возникают, когда мы задаемся вопросом о том, как могло бы работать это исчисление. Что могло бы случаться в реальном мире для обеспечения столь высокой точности предсказаний данного исчисления? Это проблема интерпретации квантовой механики. Существует множество вариантов решения этой проблемы, но все они не лишены недостатков.
Первой естественной реакцией было бы истолковать формализм квантовой механики в буквальном смысле, как мы это делаем с большинством научных теорий. Данное исчисление содержит волновую функцию, задаваемую динамикой уравнения Шредингера и постулатом измерения, и оно работает, так что мы должны предполагать, что оно рисует нам непосредственную картину происходящего в мире. Иначе говоря, состояние системы на самом деле является именно этим волновым состоянием, выражаемым волновой функцией и изменяющимся сообразно динамике, выражаемой двумя упомянутыми базовыми принципами. В основном это состояние изменяется в соответствии с уравнением Шредингера, но при измерении оно изменяется в соответствии с постулатом измерения. Согласно этому воззрению, мир состоит из волн, обычно линейно изменяющихся в суперпозиции и иногда коллапсирующих в более определенное состояние при осуществлении измерения.
Осмыслить эту картину, однако, не так просто. Все проблемы идут от постулата измерения. В соответствии с этим постулатом, коллапс происходит при выполнении измерения, но что считать измерением? Как природа узнает о том, в какой момент производится измерение? «Измерение» уж точно не является каким-то базовым термином законов природы; если постулат измерения должен хотя бы отдаленно напоминать фундаментальный закон, понятие измерения должно быть заменено чем-то более ясным и основополагающим. Если коллапс волновой функции — объективно существующий процесс в мире, то нам нужны ясные, объективные критерии, позволяющие установить, когда этот процесс имеет место.
Очевидно ошибочным было бы сказать, что коллапс происходит в тех случаях, когда квантовая система взаимодействует с измерительным прибором. Проблема здесь в том, что наличие понятия «измерительного прибора» в базовых законах столь же неправдоподобно, как и наличие в них понятия «измерения». Раньше нам нужны были критерии для измерения; теперь нам требуются критерии для измерительного прибора.
На заре квантовой механики часто говорили, что измерительный прибор — это классическая система, и что измерение происходит при любом взаимодействии квантовой системы с классической системой. Ясно, однако, что это неудовлетворительное решение. Квантовая теория имеет, как предполагается, универсальный характер, и она должна быть применима к процессам внутри измерительного прибора ничуть не меньше, чем ко всем остальным. Если мы не готовы допустить, что в мире существует два фундаментально различных вида физических объектов — а это допущение потребовало бы создания совершенно новой теории — то выражение «классическая система» не может быть термином, используемым в фундаментальном законе природы — ничуть не отличаясь этим от «измерения».
Указанной идее аналогично и предположение, что измерение происходит всякий раз, когда квантовая система взаимодействует с макроскопической системой. Ведь столь же очевидно, что «макроскопическое» не является понятием, которое может фигурировать в базовом законе. Оно должно быть заменено чем-то более точным: чем-то вроде «система, имеющая массу в один грамм или больше». Однако крайним произволом было бы, если бы в базовом законе фигурировало нечто подобное.
Нет такого физического критерия, который казался хотя бы отдаленно пригодным для определения коллапса. Критерии, выдвинутые на микроскопическом уровне — допускающие, к примеру, что коллапс происходит, когда система взаимодействует с протоном — исключаются экспериментальными данными. Альтернатива состоит в том, что критерий должен содержать отсылку к высокоуровневому физическому свойству, так что коллапс происходит, когда система имеет определенную высокоуровневую конфигурацию. Однако любое подобное высокоуровневое свойство казалось бы произвольным, и хороших кандидатов пока не предлагалось. В предположении, что шредингеровская динамика микроскопических систем неожиданно отменялась бы при попадании этих систем в контекст каких-то конкретных конфигураций, есть что-то очень странное.
Из всех выдвигавшихся критериев какие-то шансы есть лишь у того, согласно которому измерение происходит, когда квантовая система затрагивает сознание какого-то существа. В отличие от предыдущих критериев, он хотя бы определен и непроизволен[192]. Соответствующая интерпретация исчисления весьма элегантна и проста, и это единственная буквальная интерпретация данного исчисления, получившая достаточно широкое распространение. Она была впервые предложена Лондоном и Бауэром (London and Bauer 1939), но чаще всего ассоциируется с Вигнером (Wigner 1961).
Заметим, что эта интерпретация предполагает дуализм сознания и тела. Если бы сознание было всего лишь еще одним физическим свойством, то возникли бы все упомянутые выше проблемы. Эта позиция оказалась бы одной из разновидностей концепции «высокоуровневого свойства», согласно которой попросту случается так, что волновые функции физических систем коллапсируют в контексте каких-то сложных физических конфигураций. Но если дуализм верен, то критерий коллапсирования может быть подлинно фундаментальным. Кроме того, тот факт, что причина коллапса является чем-то внешним для физических процессов, позволяет создать гораздо более простую теорию. Все чисто физические системы управляются теперь одной лишь шредингеровской динамикой, а совершенно иная динамика измерения имеет независимый источник.
У этой интерпретации, однако, имеется ряд контринтуитивных следствий. Возьмем измерительное устройство, к примеру стрелку, позволяющую измерить состояние электрона, и предположим, что это состояние изначально характеризуется суперпозицией. Когда поблизости нет сознания, вся система будет подчиняться линейной шредингеровской динамике: если различные дискретные состояния электрона дают различные дискретные состояния стрелки, то из этого следует, что состояние электрона, характеризующееся суперпозицией, будет порождать такое состояние стрелки, которое тоже будет характеризоваться суперпозицией. Иными словами, эта теория предсказывает, что стрелка одновременно указывает на множество разных мест! Она указывает на какое-то определенное место лишь тогда, когда я смотрю на эту стрелку.
Сценарий с кошкой Шредингера ведет к еще более странным последствиям. В этом сценарии некая кошка закрыта в камере, какое-то устройство измеряет спин электрона, и система настроена так, что кошка гибнет лишь тогда, когда спин электрона оказывается в положении «вверх». (Допустим, что кошка находится под анестезией, так что сознание не принимает участие во всех этих процессах.) Если электрон изначально находится в состоянии суперпозиции, то кошка попадет в состояние, являющееся суперпозицией жизни и смерти! Только когда сознающее существо заглянет в камеру, определится, является ли кошка мертвой или живой.
Согласно этой картине, любой макроскопической системе, как правило, будет свойственна масштабная суперпозиция при отсутствии поблизости сознания. До возникновения сознания в процессе эволюции весь мир находился в состоянии гигантской суперпозиции, пока первая крупинка сознания, судя по всему, не привела его к внезапному коллапсу. Это может звучать безумно, но таково прямое следствие единственной внятной буквалистской интерпретации принципов квантовой механики. Надеюсь, что это поможет уяснить, насколько странной является квантовая механика и насколько серьезны проблемы, связанные с ее интерпретацией.
Не исключено, что указанные контринтуитивные следствия можно было бы и принять, но я тем не менее не являюсь сторонником этой интерпретации. Начать с того, что она не сочетается с той позицией, которую я отстаивал, а именно с идеей повсеместности сознания. Если сознание связано даже с очень простыми системами, то, согласно этой интерпретации, коллапс будет происходить на самом базовом уровне и очень часто. Это не стыкуется с физическими данными, предполагающими, что низкоуровневые суперпозиции зачастую продолжительное время существуют в неколлапсированном состоянии. Вторая проблема состоит в том, что не существует даже намека на основательную теорию о том, какого рода воздействие на сознание порождает коллапс, равно как и о том, какой вид принимает итоговый коллапс. Можно по-разному отвечать на эти вопросы, но ни одна из конкретизаций не кажется особо убедительной.
Другие проблемы связаны с самим понятием коллапса. Начать с того, что коллапс должен быть нелокальным: если две частицы имеют сцепленные состояния, измерение первой частицы вызовет одновременный коллапс состояния второй частицы. Это приводит к определенной нестыковке с теорией относительности. К примеру, кажется, что нелокальный коллапс подразумевает отсылку к привилегированной системе отсчета. Без нее время коллапса второй частицы будет недостаточно определенным, так как у нас нет четкой дефиниции одновременности в разных местах.
Более общая трудность состоит в том, что процесс коллапса в целом не очень хорошо сочетается со всей остальной физикой. Если брать его в буквальном смысле, то это мгновенный, дискретный, темпорально асимметричный нелокальный процесс, радикально отличный от всех других процессов, в существовании которых нас убеждает физическая теория. Кажется странным, что такой необычный процесс должен сосуществовать с прямолинейным, континуальным, темпорально симметричным и локальным уравнением Шредингера. В самом деле, сравнивая коллапс с элегантностью и мощью уравнения Шредингера, составляющего ядро квантовой теории, мы можем счесть его каким-то случайным привнесением. И что-то несообразное есть в представлении о том, что мир на своем базовом уровне содержит два столь совершенно разных вида динамики.
Эти аргументы, конечно, далеко не решают дело, и интерпретация, согласно которой сознание коллапсирует волновую функцию, заслуживает очень серьезного отношения. Тем не менее, на мой взгляд, имеется серьезное основание поискать другую интерпретацию, рисующую более простую и непосредственную картину фундаментальных природных процессов.
Все проблемы буквалистской интерпретации связаны с признанием постулата измерения фундаментальным законом. Заманчиво поэтому предположить, что этот постулат мог бы не иметь базового характера, а оказываться следствием более фундаментальных принципов. Тут есть два возможных пути. Мы могли бы попытаться ввести дополнительные базовые принципы, не столь проблематичные, как постулат измерения, но приводящие к тем же результатам. Это стратегия четвертого варианта. Или же мы могли бы попробовать получить те же результаты в качестве следствия уже известных базовых принципов, таких как уравнение Шредингера. То есть мы могли бы попытаться получить постулат измерения даром.
Интуитивную мотивацию в пользу этой стратегии нетрудно понять. Интуиция говорит нам, что эффекты суперпозиции проявляются по большей части на микроскопическом уровне и что они могли бы каким-то образом «отменяться» на макроскопическом уровне. Быть может, при наличии множества микроскопических суперпозиций они взаимодействуют так, что порождают относительно определенное макроскопическое состояние. Благодаря ряду математических свойств сложных конфигураций мы могли бы понять, каким образом эффективный коллапс мог бы оказываться следствием микроскопической неопределенности. Базовый пробабилистический коллапс был бы в таком случае заменен эмерджентным статистическим процессом, протекающим в той или иной сложной системе.
Предпринималось множество попыток проработать математическую сторону этого предположения, с целью чего нередко обращались к статистическим принципам термодинамики (напр., Daneri, Loinger, and Prosperi 1962). К сожалению, все эти попытки провалились, и сегодня многие считают, что они и должны проваливаться. Поскольку шредингеровская динамика линейна, всегда можно сконструировать ситуации, в которых микроскопические суперпозиции ведут к макроскопическим суперпозициям. Если электрон в положении «вверх» ведет к одному макроскопическому состоянию, а электрон в положении «вниз» — к другому, то электрон в состоянии суперпозиции должен вести к макроскопической суперпозиции (Алберт (Albert 1992, с. 75) очень четко обосновывает это заключение). Таким образом, без введения дополнительных базовых принципов приходится ожидать, что мы обнаружим суперпозицию на макроскопическом уровне.
Эти стратегии небесполезны. Подобное использование статистики, а также более поздние работы о «декогеренции» (Gell-Mann and Hartle 1990 и др.) показывают, что волновая функция с суперпозицией будет не какой-то хаотичной мешаниной, а зачастую будет разрешаться в сравнительно четко очерченную суперпозицию раздельных макроскопических состояний. Эти макроскопические состояния «декогерируют» друг от друга лишь с минимальными интерференционными взаимовлияниями. Это по крайней мере помогает нам отыскать какой-то элемент привычного классического мира в волновой функции с характерной для нее суперпозицией. Но суперпозиция волновой функции никуда не исчезает, и подобные работы ничего не говорят нам о том, почему лишь один из элементов макроскопической суперпозиции должен быть актуальным. Так что для решения этой базовой проблемы требуются дополнительные усилия. Они могут оказаться наиболее продуктивными в сочетании с другими вариантами решения, в частности с тем, который рассмотрен тут под номером 5.
Возможно, самой распространенной позицией среди практикующих физиков является та, согласно которой мы попросту не должны задаваться вопросом о том, что происходит в реальном мире за пределами исчисления квантовой механики. Исчисление работает, и этого достаточно. Есть две разновидности этой позиции. В соответствии с первой из них, в мире, возможно, что-то и происходит, но мы никогда не сможем узнать, что именно. Исчисление дает нам всю в принципе доступную эмпирическую информацию, так что все остальное есть чистая спекуляция. Мы вполне могли бы оставить свое беспокойство и продолжать вычисления. Эта позиция оправдана в практических целях, но она не может удовлетворить тех, кто хочет, чтобы физика рассказывала нам о базовом уровне реальности. Если исчисление работает, то мы хотели бы иметь хоть какое-то представление о том, как оно могло бы работать. Не исключено, что мы никогда не сможем узнать об этом наверняка, но спрашивать об этом все же имеет смысл.
Вторая разновидность указанной позиции имеет более жесткий характер. Здесь утверждается, что вопросу о том, что происходит в мире, не соответствует никакого фактического содержания. Согласно этому воззрению, факты исчерпываются фактом работоспособности исчисления. Оно не часто формулируется в столь эксплицитном виде, так как при подобной формулировке в эти утверждения почти невозможно поверить. Оно предлагает нам такую картину реальности, в которой нет места миру! Эта позиция ведет к одной из версий идеализма, в соответствии с которым все, что существует, — это наши перцепции или что-то вроде того. Перед тем, как мы открыли контейнер с кошкой Шредингера, она не мертва, она не жива, и она не находится в состоянии суперпозиции; она вообще не находится ни в каком состоянии. Отрицая факты за пределами наших измерений, эта концепция отрицает независимо существующую реальность.
«Копенгагенскую интерпретацию», выдвинутую Бором и его коллегами, нередко считают одной из вариаций этого воззрения, хотя сочинения Бора несколько неоднозначны и сложны для толкования. В них можно найти намеки и на какие-то моменты, характерные для первого варианта решения, равно как и на эпистемологическую версию данного варианта. Бор всячески подчеркивал «классическую» природу измерительных приборов, и его позицию можно понять так, будто он считал, что только классические (или макроскопические) объекты имеют объективные состояния. На вопросы же о реальном состоянии объекта, описываемого с помощью суперпозиции, попросту накладывается запрет. Это, однако, предполагает разведение классических и квантовых систем, которое трудно осуществить по объективным основаниям; трудно также представить, что реальность просто «растворяется» по мере того, как мы переходим от макроскопического к микроскопическому уровню. Многим казалось, что если принимать идеи Бора всерьез, то они приведут к жесткому операционализму, обсуждавшемуся в предыдущем абзаце. Они тоже рисуют такую картину базового уровня реальности, которая ничего не изображает.
Если буквалистская интерпретация постулата измерения неприемлема и если он не может быть выведен из имеющихся физических принципов, то естественно предположить, что эти принципы не исчерпывают того, что здесь происходит. Быть может, если мы постулируем дополнительные базовые физические принципы, то мы сможем менее проблематично объяснить эффективность квантово-механического исчисления.
Первый способ сделать это — удержать идею коллапса, но дать ей иное объяснение. Подобная стратегия сохраняет допущение, что базовые физические состояния — это волновые функции, задаваемые уравнением Шредингера, но вводит новые принципы для объяснения того, как микроскопические суперпозиции превращаются в макроскопическую дискретность.
Самым известным примером данной стратегии является «ЖРВ» — интерпретация, которой мы обязаны Жирарди, Римини и Веберу (Ghirardi, Rimini, and Weber 1986; см. также Bell 1987а)[193]. В этой интерпретации постулируется фундаментальный закон, в соответствии с которым вектор состояния положения любой элементарной частицы может претерпевать микроскопический «коллапс» в любой момент с очень небольшой вероятностью (шанс того, что частица коллапсирует в данную секунду, примерно равен 1 из 1015). Когда подобный коллапс происходит, это, как правило, приводит к коллапсу состояния той макроскопической системы, в которую она включена, вследствие наличия там неразрывных связей. В любой макроскопической системе имеется множество таких частиц, так что из сказанного следует, что любая макроскопическая система в любое время, как правило, будет находиться в относительно дискретном состоянии. И можно показать, что итоговый результат будет очень близок к тому, чтобы воспроизводить предсказания постулата измерения.
Альтернатива состоит в том, чтобы исключить необходимость в коллапсе путем отрицания того, что базовый уровень реальности репрезентируется волновой функцией с присущей ей суперпозицией. Если такие свойства, как положение, имеют определенные значения даже на базовом уровне, то в коллапсе не будет никакой необходимости. Подобная теория постулирует «скрытые параметры» на базовом уровне, напрямую объясняющие дискретность реальности на макроскопическом уровне. Ценой этого предположения оказывается то, что теперь мы нуждаемся в новых принципах, которые позволили бы объяснить, почему принципы изменения волновой функции и коллапса кажутся настолько эффективными.
Наиболее известной в этой связи является теория, разработанная Бомом (Bohm 1952). Согласно этой теории, положение базовых частиц всегда является чем-то определенным. Волновая функция сохраняет роль некоей «волны-пилота», направляющей изменение положения частицы, и сама волновая функция подчиняется уравнению Шредингера. Вероятностные предсказания постулата измерения получают новую интерпретацию и трактуются в качестве статистических законов. В соответствии с этой теорией оказывается, что мы никогда не можем знать точного положения частицы до соответствующего измерения, а можем знать только ее волновую функцию. Постулат измерения говорит нам о том, какая пропорция частиц при данной волновой функции будет иметь то или иное положение. Поэтому он дает нам наилучшие статистические предсказания, которые мы только можем ожидать, учитывая отсутствие у нас знания об этом.
Все предложения указанного типа сталкиваются с проблемами. Как ЖРВ — интерпретация, так и интерпретация Бома подчеркивают определенность положения, нарушая тем самым симметрию между положением и импульсом в квантово-механическом исчислении. Это оправдано в целях предсказания, так как можно попробовать показать, что наши суждения о макроскопической определенности всегда предполагают отсылку к каким-то определенным положениям (примером может быть положение стрелки), но делает теорию менее элегантной. По сходным причинам очень непросто согласовать эти подходы и с теорий относительности.
ЖРВ — теория сталкивается и с дополнительными трудностями, наиболее серьезной из которых, возможно, является то, что из нее, строго говоря, не следует, что макроскопический мир вообще дискретен. Макроскопическое состояние по-прежнему репрезентируется волновой функцией с суперпозицией: хотя ее амплитуда по большей части концентрируется в одном месте, она не равна нулю везде, где не равна нулю амплитуда неколлапсированной волновой функции. И это возобновляет проблемы, связанные с суперпозицией. Стрелка по-прежнему показывает на множество мест, даже после измерения. Конечно, амплитуда, связанная с большинством этих мест, очень невелика, но трудно понять, почему низкоамплитудная суперпозиция хоть в чем-то более приемлема, чем высокоамплитудная.
Теория Бома имеет меньше технических проблем в сравнении с ЖРВ — интерпретацией, но из нее вытекает ряд странных следствий. Наиболее поразительным из них является ее крайняя нелокалъностъ. (Любая теория, говорящая о скрытых параметрах и сообразная с предсказаниями данного исчисления, должна быть нелокальной по причинам, указанным Беллом, — см. Bell 1964[194].) Дело не сводится к тому, что свойства одной частицы могут мгновенно влиять на свойства другой частицы, находящейся на расстоянии от нее. Оказывается, что при определении траектории частицы мы, возможно, должны принимать во внимание волновые функции частиц, существующих в других галактиках! Все они содействуют формированию глобальной волновой функции, и эта волновая функция одновременно управляет траекториями частиц во всей вселенной.
Но, возможно, наиболее фундаментальным основанием с подозрением относиться к этим интерпретациям является то, что они постулируют наличие чего-то сложного за чем-то простым. Невзирая на проблемы квантово-механического исчисления, оно исключительно просто и элегантно. Эти же интерпретации вводят сложные дополнительные принципы, имеющие к тому же характер допущений, сделанных сравнительно ad hoc, для замены и объяснения этого простого каркаса. Сказанное несколько в меньшей степени применимо к ЖРВ-интерпретации, дополнительное усложнение которой состоит только во введении двух новых фундаментальных констант и нарушении симметрии между положением и импульсом; но остается удивительной «удачей» то, что значения констант оказываются именно такими, что они могут почти воспроизводить предсказания стандартной модели. Дополнительные усложнения, связанные с интерпретацией Бома, хуже тех; она постулирует определенность положений и волновую функцию, сложный новый фундаментальный принцип, посредством которого волновая функция определяет положение частиц, а также нарушает симметрию изначальной модели.
Мы могли бы сказать, что эти интерпретации создают такое впечатление, будто мир был создан Декартовым злым демоном, так как они заставляют нас верить, что мир устроен не так, как в действительности. Как выражаются Алберт и Левер (Albert and Loewer 1989), Бог у Бома не играет в кости, но наделен извращенным чувством юмора. Сценарий, в котором сложная бомовская интерпретация воспроизводит предсказания простой модели лишь по своей степени отличается от того случая, когда данные, поступающие в мозг в бочке, выстраиваются таким образом, чтобы создавать видимость непосредственно данного внешнего мира. Она напоминает «интерпретацию» эволюционной теории, согласно которой Бог в готовом виде создал окаменелости несколько тысяч лет назад, обеспечив тем самым воспроизведение предсказаний эволюционной теории. Простота объяснительной модели была принесена в жертву ради сложной гипотезы, которой удается воспроизвести результаты изначальной теории.
Квантово-механическая модель настолько проста и элегантна, что базовая теория, не воспроизводящая эту простоту и элегантность, никогда не будет удовлетворять нас или не будет абсолютно убедительной.
Если бы в квантовой теории были какие-то аномалии, какие-то экспериментальные результаты, в полной мере не предсказуемые в этой модели, то более правдоподобным мог бы оказаться вывод, что эта простота является всего лишь верхушкой сложного айсберга. В настоящий момент, однако, эта модель кажется настолько надежной, что представление о необходимости постулировать сложный механизм для объяснения простых предсказаний в рамках этой модели кажется чем-то экстраординарным.
Учитывая, что ни одна из интерпретаций квантовой механики не лишена проблем, эти интерпретации заслуживают серьезного отношения. Но естественным будет поискать какую-то более простую картину мира.
Основой квантовой механики является уравнение Шредингера, и оно так или иначе присутствует в любой интерпретации квантовой механики. Все рассмотренные нами интерпретации добавляли что-то к уравнению Шредингера для объяснения макроскопической дискретности мира. Но самой простой из имеющихся интерпретаций является та, которая говорит о верности уравнения Шредингера и заявляет, что больше ничего и не требуется. Иными словами, физическое состояние мира полностью характеризуется волновой функцией, и ее изменение целиком описывается уравнением Шредингера. Это интерпретация Эверетта (Everett 1957, 1973).
Одна из очерченных выше стратегий (вариант 2) также предполагает возможность ограничиться уравнением Шредингера, но при этом утверждает, что это можно совместить с дискретностью на макроскопическом уровне. Мы видели, что это не должно проходить по ясным математическими соображениям. Интерпретация Эверетта гораздо более радикальна. Уравнение Шредингера не подвергается здесь никаким сомнениям, и состояние мира описывается волновой функцией на каждом из его уровней. Из этого следует, что в противоположность имеющейся видимости, мир находится в состоянии суперпозиции даже на макроскопическом уровне.
Мотивы, стоящие за этой интерпретацией, очевидны. Ядром квантовой механики является уравнение Шредингера. Постулат измерения и все другие предлагавшиеся принципы кажутся какими-то добавками. Так почему бы не избавиться от них? В равной степени очевидна и проблема, связанная с этой интерпретацией. Если все исчерпывается уравнением Шредингера, то на каждом из своих уровней мир оказывается в состоянии суперпозиции. Но он не выглядит таковым: мы никогда не наблюдаем стрелки, оказывающиеся в суперпозиции двух состояний. Почему же?
Эта интерпретация в самом лучшем случае крайне контринтуитивна. Согласно этому воззрению, суперпозицией лучше всего описывать не только состояние электрона, но и состояние измеряющей его стрелки! Если рассуждать объективно, то, строго говоря, неверно утверждать, что стрелка показывает вверх или вниз. Скорее, она находится в суперпозиции состояний указывания вверх и указывания вниз. Это же верно для макроскопических состояний почти всего, что находится в состоянии, описываемом волновой функцией, которая почти никогда не соответствует единичному «дискретному» состоянию. Согласно этому воззрению, суперпозиция существует повсюду. Но почему же тогда мир кажется дискретным?
Ответ Эверетта состоит в том, чтобы расширить суперпозицию до такой степени, чтобы она затрагивала и сознание. Если мы принимаем уравнение Шредингера всерьез, то если стрелка, измеряющая электрон, находится в суперпозиции состояний, то суперпозиция будет свойственна и мозгу субъекта, наблюдающего эту стрелку. Состояние мозга будет описываться как суперпозиция состояния, в котором он воспринимает стрелку, направленную вверх, и состояния, в котором он воспринимает стрелку, направленную вниз. Ключевой шаг Эверетта состоит в предположении, что каждое из этих двух состояний должно связываться с отдельным наблюдателем. В результате такого измерения порождаются два наблюдателя. Один из них ощущает стрелку-«вверх», другой — стрелку-«вниз». Это значит, что каждый из них будет ощущать дискретное состояние мира.
Далее Эверетт показывает, что при такой схеме эти наблюдатели будут наделены большинством из тех свойств, которые мы ожидаем у них найти, и что отсюда можно извлечь большинство предсказаний квантово-механического исчисления. Нетрудно, к примеру, увидеть, что каждое из двух состояний, накладывающихся друг на друга, не будет иметь здесь доступа к другому состоянию такого рода, так что суперпозиция сознания не будет чем-либо выдавать себя ни в одном из состояний. Можно даже показать, что когда наблюдатель, производящий измерение, воспринимает другого наблюдателя, измеряющего ту же самую величину, воспринятые результаты измерения будут согласовываться друг с другом, так что мир будет казаться чем-то вполне когерентным. Одним словом, любой наблюдатель будет воспринимать мир во многом именно так, как мы ожидаем, хотя сам мир и находится в состоянии суперпозиции.
Эту интерпретацию не надо смешивать с интерпретацией расщепляющихся миров, согласно которой мир в буквальном смысле расщепляется на множество отдельных миров всякий раз, когда производится измерение. Существует один мир, в котором стрелка направлена вверх, и совершенно обособленный мир, в котором стрелка направлена вниз. При таком рассмотрении эта позиция менее всего напоминает что-то простое. Начать с того, что она требует наличия нового и предельно фундаментального принципа для описания процесса «расщепления». Далеко не очевидно, когда именно должно осуществляться «расщепление» (проблема «измерения» возобновляется в новом виде), и крайне неясно, что должны представлять собой миры, возникающие в результате расщепления. Для осуществления буквального расщепления волновая функция должна «разделиться» на множество компонентов, но имеется множество вариантов декомпозиции волновой функции, и квантовая механика ничего не говорит о предпочтительности какого-либо базиса для подобной декомпозиции. Эта интерпретация кажется даже более сложной — и в большей степени имеющей ad hoc характер — чем разного рода «коллапсионные» интерпретации, и не существует серьезных оснований принимать ее.
Концепция расщепления часто приписывается Эверетту (во многом благодаря изложению работ Эверетта в трудах Девитта (DeWitt 1970, 1971)), но ее невозможно найти в его сочинениях. Собственная позиция Эверетта не вполне ясна, но гораздо более естественно толковать ее в моем ключе; и именно такую интерпретацию рекомендуют Алберт и Левер (Albert and Loewer 1988), а также Локвуд (Lockwood 1989). Согласно этой трактовке, никакого объективного «расщепления» не происходит. Скорее, волновая функция трансформируется в суперпозицию состояний, при которой состояния, находящиеся в отношении суперпозиции, лучше всего рассматривать в качестве компонентов одного-единственного мира. Концепция Эверетта иногда называется интерпретацией множественных миров (наводя тем самым на мысль о расщепляющихся мирах), но обсуждаемую мной позицию точнее назвать интерпретацией одного большого мира. Есть только один мир, но он больше, чем мы могли бы подумать[195].
В соответствии с этой концепцией, если расщепление и происходит, то оно происходит только в умах наблюдателей. Поскольку суперпозиции влияют на состояние, в котором находится мозг субъекта, возникает множество обособленных сознаний, соответствующих компонентам суперпозиции. Каждое из них воспринимает отдельный дискретный мир, соответствующий тому типу мира, который воспринимаем мы — назовем его мини — миром, в противоположность макси-миру суперпозиции. Реальный мир — это макси-мир, а мини — миры существуют лишь в сознаниях субъектов. Эверетт называет эту позицию интерпретацией относительности состояния: состояние минимира, в котором стрелки указывают на дискретные точки, считается его состоянием лишь относительно спецификации наблюдателя. Объективное состояние мира — это суперпозиция.
Ключевой элемент этой концепции, однако, остается без анализа. Почему мы вправе отождествлять каждый компонент такого состояния мозга с отдельным наблюдателем? Почему вместо этого не существует один-единственный наблюдатель со спутанным суперпозиционным ментальным состоянием? И вообще, почему подобное некогерентное состояние мозга порождает сознания? Эверетт обходит эти ключевые вопросы. Более того, может показаться, что увязывая волновую функцию состояния мозга с множеством сознаний, каждое из которых воспринимает какое-то дискретное состояние, Эверетт незаконным образом отсылает к предпочтительному базису, так же как и интерпретация расщепляющихся миров. Волновая функция не является объективно делимой на какие-то компоненты, а может быть разложена самыми разными способами, в зависимости от того, какой базис для соответствующего векторного пространства мы выбираем. Зачастую в наших целях естественным может быть разложение волновой функции каким-то одним способом, опираясь на конкретный базис, но подобное разложение не отражает какого-либо объективного свойства волновой функции. Там, где состояние мозга может быть разложено на состояния «восприятия — верхнего» и «восприятия — нижнего», оно в равной степени может быть разложено на два таких состояния, с каждым из которых будет связаны спутанные восприятия. Создается впечатление, что, постулируя объективную декомпозицию, Эверетт выходит за те пределы, которые определяются уравнением Шредингера.
Ключевым элементом, упущенным Эвереттом при рассмотрении этих проблем, является анализ отношения между сознанием и телом. Эверетт допускает, что суперпозиционное состояние мозга будет связано со множеством отдельных субъектов опыта, но он даже не пытается обосновать это утверждение. Ясно, что этот вопрос существенным образом зависит от теории сознания. Сходное предположение высказывает Пенроуз:
В частности, я не понимаю, почему сознающее существо должно осознавать лишь «одну» из альтернатив линейной суперпозиции? Что есть такого в сознании, что требует признания невозможности «осознания» той заманчивой линейной комбинации мертвой и живой кошки? Думаю, что для согласования концепции множественных миров с тем, что мы действительно наблюдаем, нам потребовалась бы некая теория сознания (Penrose 1989, с. 296).
В самом деле, главный вопрос квантовой механики можно понять как вопрос об отношении между физическими процессами и опытом. Центральное место в квантовой механике занимает картина, на которой микроскопическая реальность описывается суперпозиционной волновой функцией, изменяющейся в соответствии с уравнением Шредингера. Но в опыте мир дискретен. И главный вопрос: как это получается? Различные интерпретации дают разные ответы на него. Некоторые (к примеру, бомовская) отрицают первую посылку, полагая, что реальность дискретна даже на базовом уровне. Другие выдвигают базовые принципы (постулат измерения или закон коллапса в интерпретации ЖРВ) для опосредования перехода от того, чему свойственна суперпозиция, к дискретному. Ряд теорий (см. второй вариант) пытается объяснить, как суперпозиционные микроскопические состояния могут статистически порождать дискретную макроскопическую реальность. Все три последние стратегии — непрямые, старающиеся объяснить дискретность опыта объяснением дискретности макроскопической реальности, которая лежит в основании этого опыта.
Альтернативная стратегия предполагает прямой ответ на вопрос об опыте. Если мы всерьез принимаем тезис о примате уравнения Шредингера, то главный вопрос состоит в том, почему при такой физической структуре мира мы воспринимаем его именно так? Но это не что иное, как вопрос о том, как определенные физические структуры порождают опыт. Иначе говоря, это вопрос того типа, который я обсуждал на протяжении всей этой книги и на который должна отвечать теория сознания.
Если мы должны постулировать ad hoc теорию сознания для ответа на этот вопрос, то это существенно уменьшает привлекательность интерпретации Эверетта. Лучшей ее чертой всегда была простота, но новые и произвольные психофизические законы придали бы ей такой же ad hoc характер, который свойствен и бомовской интерпретации. Но если ответ на этот вопрос может дать независимо мотивированная теория сознания, то интерпретация Эверетта действительно покажется привлекательной.
Теория сознания, которую я отстаивал, может дать ответ на этот вопрос, причем надлежащего вида. Дело обстоит так, что эта теория предсказывает, что суперпозиционное состояние мозга должно быть связано с множеством раздельных субъектов дискретного опыта. Чтобы убедиться в этом, примем, что максимальное феноменальное состояние — это феноменальное состояние, характеризующее совокупный опыт субъекта в определенное время. Максимальным же физическим состоянием мы будем считать физическое состояние, в полной мере характеризующее внутреннее физическое состояние системы в определенное время. Для получения вывода достаточно признать следующий принцип суперпозиции:
Если теория предсказывает, что система в максимальном физическом состоянии Р порождает связанное с ним максимальное феноменальное состояние Е, то эта теория предсказывает, что система суперпозиции Р с ортогональными физическими состояниями также будет порождать Е.
Если этот принцип верен, то суперпозиция ортогональных физических состояний будет по меньшей мере порождать максимальные феноменальные состояния, которые отдельно порождались бы этими физическими состояниями. Именно этого и требует интерпретация Эверетта. Если мозг находится в суперпозиции состояний «восприятия верхнего» и «восприятия нижнего», то он породит хотя бы двух субъектов опыта, один из которых будет воспринимать стрелку, направленную вверх, а другой будет воспринимать стрелку, направленную вниз. (Разумеется, они будут двумя раздельными субъектами опыта, так как каждое из феноменальных состояний является максимальным феноменальным состоянием субъекта.) Это верно и в общем случае. Суперпозиция всегда будет порождать группу субъектов, что и требуется интерпретацией Эверетта.
Итак, нам нужно установить, что из очерченной мной теории вытекает принцип суперпозиции. Самый простой способ сделать это — обратиться к модели из главы 9 и, в частности, к тезису о том, что сознание возникает из имплементации надлежащего вычисления. Чтобы использовать его для установления данного принципа, нам надо установить, что, если вычисление имплементируется системой в максимальном физическом состоянии Р, оно также имплементируется системой, представляющей собой суперпозицию Р с ортогональными физическими состояниями.
Допустим, таким образом, что изначальная система (в максимальном физическом состоянии Р) имплементирует вычисление С. Иначе говоря, между физическими подсостояними системы и формальными подсостояниями С имеется такое соответствие, что каузальные отношения между физическими подсостояними соответствуют формальным отношениям между формальными подсостояниями. Тогда одна из версий подобного соответствия будет также фундировать имплементацию С в системе с суперпозицией. Для некоего подсостояния S изначальной системы мы можем отыскать соответствующее подсостояние S' системы с суперпозицией, использовав очевидное отношение проекции: система с суперпозицией находится в S', если система, получающаяся в результате ее проекции на гиперплоскость Р, находится в S. Поскольку система с суперпозицией представляет собой суперпозицию Р с ортогональными состояниями, из этого следует, что если изначальная система находится в S, система с суперпозицией находится в S'. А поскольку уравнение Шредингера линейно, то из этого также вытекает, что отношения перехода между подсостояниями S' в точности отражают отношения между изначальными подсостояними S. Мы знаем, что эти отношения, в свою очередь, в точности отражают формальные отношения между подсостояниями С. Из этого следует, что система с суперпозицией также имплементирует С, что нам и нужно было установить. В соответствии с принципом организационной инвариантности, если изначальная система порождает субъект опыта, система с суперпозицией тоже будет порождать качественно неотличимый от него субъект опыта.
Принцип суперпозиции можно доказывать и на основе использования двуаспектной теории информации и того довода, что релевантная информация, воплощенная в изначальном физическом состоянии, имеется также и в суперпозиции. Однако поскольку эта теория лишена однозначности, этот аргумент не столь ясен, как предыдущий, так что я не буду здесь разворачивать его. Важно то, что теория сознания, которую я частично разработал, так или иначе предсказывает результаты, требующиеся интерпретацией Эверетта. То есть она предсказывает, что, даже если мир находится в громадной суперпозиции, все равно будут существовать субъекты, воспринимающие его в опыте в качестве дискретного мира.
При отсутствии других проблем, из этого следует, что сочетание уравнения Шредингера с независимо мотивированной теорией сознания может предсказывать тот образ мира, который является нам в опыте. Иначе говоря, единственным физическим принципом, нужным для квантовой механики, оказывается уравнение Шредингера, а постулат измерения и другие базовые принципы — это всего лишь необязательный багаж.
Конечно, нам нужны и психофизические принципы, но они нужны в любом случае, и выясняется, что эти принципы, кажущиеся правдоподобными по независимым причинам, могут выполнять здесь необходимую работу. Это усиливает идею всерьез отнестись к интерпретации Эверетта.
Интерпретацию Эверетта часто критикуют, хотя вес критических замечаний неодинаков. Я распределю эти возражения на несколько групп.
Многие возражения идут от интерпретации — верной или неверной — позиции Эверетта как концепции «расщепляющихся миров». Это понятно, учитывая, что ее нередко называют интерпретацией «множественных миров». К примеру, Белл (Bell 1976) говорит о неясности того, когда должно происходить «ветвящее» событие, неясности, связанной с неясностью понятия измерения, а также об отсутствии предпочтительного базиса для разделения на миры. Понятно, однако, что эти возражения неприменимы к данной интерпретации, не требующей ни объективного «ветвления», ни предпочтительного базиса. Хьюз (Hughes 1989) в сходном ключе возражает против «онтологического ливня», проливающегося в процессе расщепления, а Хили (Healy 1984) отмечает, что создание новых миров нарушает сохранение массы-энергии! Жаль, что «расщепляющая» интерпретация концепции Эверетта обрела такую большую популярность, так как ее очевидные трудности привели к тому, что более интересной интерпретации не уделялось того внимания, которого она заслуживала.
Некоторые из возражений против интерпретации расщепляющихся миров опираются на то, что она нуждается в предпочтительном базисе, но так обстоит дело и с возражениями против одномирной версии. В частности, возникает вопрос: почему сознания, связанные с суперпозиционным состоянием мозга, соответствуют только его декомпозиции сообразно некоему предпочтительному базису? Почему нет сознаний, порождаемых другими декомпозициями или вообще суперпозиционным состоянием в целом? Это правомочное возражение против версии самого Эверетта, которая, как кажется, требует такой канонической декомпозиции. Но оно не может быть выдвинуто против той версии, о которой я говорил, из которой следует, что суперпозиция порождает соответствующих субъектов дискретного опыта без необходимости постулирования предпочтительного базиса. И я не нуждался в допущении, что это единственные сознания, порождаемые подобной суперпозиционной системой.
Возникает вопрос: «А связаны ли с суперпозицией другие сознания?». Ответ: «возможно». Если принимается двуаспектная теория информации, то мы уже знаем, что с низкоуровневыми процессами в такой системе могут быть сопряжены переживания. Субъекты опыта могут быть сопряжены с процессуальной структурой и при суперпозиции. Не исключено, что сознания сопряжены с другими декомпозициями системы или что большое суперпозиционное сознание сопряжено со всей суперпозиционной системой. Допущение таких сознаний зависит от деталей теории сознания, но трудно понять, как их существование может быть проблемой.
Можно было бы попробовать построить возражение против данной теории на тезисе о возможности суперпозиционных сознаний. Возражение: почему мое сознание не находится в состоянии суперпозиции? Ответ: потому что я есть тот, кто я есть. Теория предсказывает существование несуперпозиционных сознаний, и мое сознание оказывается одним из них. Спрашивать, почему мое сознание не является одним из суперпозиционных сознаний, это все равно что спрашивать, почему я не мышь. Это просто часть нередуцируемой индексикальности моего существования. Мышиные сознания существуют, суперпозиционные сознания могут существовать, но мое сознание не является одним из них. Возражение: почему у меня нет никакого доступа к суперпозиционным сознаниям, к примеру, к воспоминаниям о суперпозиционных переживаниях? Ответ: данная теория предсказывает, что дискретные сознания, о которых идет речь, будут воспринимать мир всецело дискретным, и что у них не будет прямого доступа к другим частям суперпозиции. Все их воспоминания, к примеру, будут воспоминаниями о дискретных наблюдениях.
В любом случае, интересными сознаниями, связанными с суперпозиционной системой, будут, похоже, только привычные дискретные сознания. Эти сознания сложны и когерентны, и их опыт отражает структуру рациональных процессов. Любые другие сопряженные с ней сознания будут относительно некогерентны и по большей части лишены интересной структуры. Этот вывод подкрепляется «декогеренционной» моделью Гелл — Манна и Хартла (Gell-Mann and Hartle 1990) и др. Согласно этой модели, интересная структура в волноподобной, сложной адаптивной системе обычно обнаруживается среди компонентов «естественной» декомпозиции; система естественным образом «декогерирует» в определенном направлении. В рациональных системах, таким образом, когерентная когнитивная структура может быть обнаружена только в компонентах этой естественной декомпозиции, и только они будут порождать сложные, когерентные сознания. Любые другие субъекты опыта в такой системе не будут причисляться к субъектам, которых можно называть личностями.
Целый кластер интуитивных беспокойств связан с тождеством наблюдателя. Возьмем сознание M1, которое, как я помню, существовало примерно в это время вчера. Сегодня в различных «ветвях» суперпозиции имеется множество сознаний, восходящих к тому сознанию. Мое сознание М2 есть лишь одно из них. И я вполне мог бы спросить: почему я оказался здесь, а не в какой-то другой ветви? Как выражается Хофштадтер (Hofstadter 1985b):
Почему мое единое чувство самого себя распространяется по этой случайной ветви, а не по какой-то другой? Какой закон определяет случайный выбор, выделяющий ту ветвь, за которой, как я чувствую, я следую? Почему мое чувство себя не сопровождает другого меня после расщепления и не идет другими путями? Что привязывает яйность к точке зрения этого тела, изменяющегося в этой ветви универсума в данный момент времени?
В ответ на это мы опять-таки должны сослаться на нередуцируемую индексикальность: мое сознание — вот это, и это вся история. Есть чувство, что за этим должно стоять что-то более глубокое, и что факт того, что вчерашнее сознание М1 превратилось в сегодняшнее сознание М2, а не в какое-то другое, немаловажен для мира. Но если смотреть с объективной позиции, в этой ветви нет ничего особо привилегированного. Даже с позиции М1 все сегодняшние сознания равнозначны. Ни одно из них не является единственным законным наследником М1: все они в равной степени несут «яйность» М1. М2 кажется привилегированным только с этой позиции, с позиции М2 (разумеется, другие мои двойники в суперпозиции ощущают то же самое по отношению к самим себе). Привилегированная роль М2 есть лишь еще один индексикальный феномен, подобный тому факту, что я — Дэвид Чалмерс, а не Рольф Харрис. Это сознание — здесь, а не там. Индексикальные факты вообще загадочны, но этот факт не выбивается из их ряда и не привносит в мир дополнительной асимметрии.
У нас есть сильная интуиция того, что личное тождество всегда должно быть связано с каким-то фактом: если из моего нынешнего состояния возникает множество сознаний, должен существовать некий факт, говорящий о том, какое из них будет мной. Но эта идея была подвергнута мощной критике Парфитом (Parfit 1984), убедительно доказывающим, что фактическая сторона личного тождества исчерпывается фактами о психологической континуальности, памяти и т. п. Если мы соглашаемся с этим анализом, то все завтрашние сознания в одинаковой степени могут претендовать на то, чтобы называться мной, и нет такого факта, который позволил бы различить их. В этом выводе есть что-то неприятное, превращающее определенный «поток» личного тождества в иллюзию, но анализ Парфита дает основание полагать, что такой поток всегда и был ею.
Наиболее существенным возражением против интерпретации Эверетта является то, что с ее помощью нельзя осмыслить вероятности, поставляемые постулатом измерения[196]. В каком-то случае постулат измерения может говорить нам, что при проведении определенного измерения шанс обнаружения стрелки, указующей вверх, равен 0,9, а шанс обнаружения стрелки, указующей вниз, равен 0,1. По интерпретации Эверетта, на деле происходит то, что как стрелка, так и состояние мозга наблюдателя оказываются в суперпозиции, из чего получается (по меньшей мере) два субъекта опыта. Один из них ощущает стрелку, указующую вверх, другой — указующую вниз. Точно такую же картину мы наблюдали бы, если бы вероятности были 50:50. Конечно, в случае 90:10 амплитуда суперпозиционной волновой функции по большей части сконцентрирована в области «верхнего» состояния мозга, но как это связано с вероятностями?
Эверетт решает этот вопрос, вводя меру на пространстве наблюдателей, соответствующую вероятностям, заданным постулатом измерения (то есть соответствующую квадрату амплитуды соответствующей части волновой функции). Используя эту меру, он доказывает, что в пределе большинство наблюдателей (то есть подмножество наблюдателей с мерой 1) будет обладать воспоминаниями о наблюдениях, согласующимися с частотами, предсказанными вероятностями в постулате измерения. К примеру, среди наблюдателей, проводящих измерение, подобное тому, которое было описано выше множество раз, большинство будет вспоминать, что они обнаружили стрелку, указующую вверх, 90 процентов времени, вниз — 10 процентов времени. Так мы и находим роль для вероятностей. Возникает, однако, вопрос: как обосновать эту меру на пространстве наблюдателей? Если бы мы измеряли это пространство иначе, могли бы возникнуть весьма отличные от тех вероятности. К примеру, если бы мы назначали равные меры всякий раз, когда два субъекта возникают из суперпозиции (независимо от амплитуды), большинство наблюдателей вспоминали бы пропорцию «верхнего» и «нижнего» равной 50:50. Ни уравнение Шредингера, ни психофизические законы не гарантируют «верность» той или иной меры.
Алберт и Левер (Albert and Loewer 1988) решают эту проблему, отказываясь от мер. Взамен они постулируют более радикальные психофизические законы, по которым с каждым состоянием мозга сопряжено бесконечное множество сознаний. С каждым сознанием, постулированным предыдущей концепцией, эта теория соотносит бесконечное множество качественно неотличимых сознаний. Далее, там, где теория Эверетта предсказывает, что сознание разойдется на два сознания, эта теория говорит, что любое сознание пойдет одним или другим путем, с вероятностью, заданной постулатом измерения. Поэтому, если мы берем любое сознание, связанное с состоянием мозга перед вышеупомянутым измерением, то можно будет говорить о 90–процентной вероятности, что оно трансформируется в состояние «восприятия верхнего», и 10–процентной вероятности, что оно трансформируется в состояние «восприятия нижнего». Так сохраняются вероятностные предсказания квантово-механического исчисления.
Ясно, что здесь уже нет той простоты. Новые психофизические законы лишены какой-либо независимой мотивации, и данная теория нуждается также в дополнительных «интрапсихических» законах, управляющих трансформацией сознаний. Вводя эти ad hoc постулаты, теория приносит в жертву ряд ключевых достоинств интерпретации Эверетта. Можно также попробовать показать проблематичность этих интрапсихических законов, поскольку они постулируют фундаментальные нередуцируемые факты относительно тождества личности во времени. Трудно понять, что делать с этими фактами. Так, их признание потребовало бы отказа от парфитовского анализа личного тождества. У них нет даже естественной супервентности на физических фактах, и это усложняет метафизическую картину. Эту интерпретацию нельзя сбрасывать со счетов, но ее цена велика.
Альтернатива состоит в том, чтобы обойтись без дополнительных ухищрений и посмотреть, нельзя ли сохранить вероятности как-то иначе. Заманчиво истолковать это как проблему индексикальности. Почему из всех мест волновой функции, в которых я мог бы оказаться, я оказался там, где мои воспоминания согласуются с предсказаниями исчисления? Одна из возможностей состоит попросту в том, чтобы признать это элементарным индексикальным фактом: в этой области есть какие-то сознания и мне случается быть одним из них. Это, однако, кажется неудовлетворительным, так как примечательная регулярность вычисления оказывается удивительным совпадением. Нам нужно показать, что это не так.
Даже если мы признаем, что мое попадание сюда — счастливое совпадение, тут неявно присутствует идея некоей меры на пространстве сознаний. Суть в том, что антецедентно более вероятным является то, что я должен оказаться сознанием одного, а не другого типа, возможно, из-за относительной избыточности тех классов. Такие неявные меры присутствуют во многих наших рассуждениях о мире. Когда я индуктивно рассуждаю, отталкиваясь от каких-то данных и делая тот или иной вывод, я знаю, что для некоторых наблюдателей в сходном эпистемическом положении вывод не будет верным, но я допускаю, что для большинства таких наблюдателей он будет верным, даже если в каждом из классов имеется бесконечное множество членов. То есть я допускаю, что антецедентно более вероятно, что я окажусь скорее в одном, чем в другом классе. Подобное рассуждение неявно предполагает некую меру на пространстве сознаний.
Так что не исключено, что мы можем обосновать вероятности, эксплицитно вводя подобную меру. Наверняка большая часть амплитуды волновой функции сосредоточена там, где воспоминания наблюдателей соответствуют предсказания исчисления. Возможно, то, что мое сознание должно оказаться в высокоамплитудной, а не в низкоамплитудной области, является более вероятным. В частности, если мы допустим, что антецедентная вероятность того, что я окажусь одним, а не другим сознанием, пропорциональна квадрату амплитуды соответствующей части волновой функции, то из этого следует, что частотность моих воспоминаний почти наверняка будет предсказана квантово-механическим исчислением.
Но чему объективно соответствует эта мера? Надо ли признавать ее в качестве базового факта о распределении самостей? Можно ли каким-то образом обосновать ее в качестве канонической меры на этом пространстве? Это трудные вопросы, тесно связанные с тайной самой индексикальности — почему я оказываюсь этой, а не какой-то другой личностью? Это одна из главных тайн, и совершенно неясно, как можно разрешить ее. Тем не менее идея меры на пространстве сознаний не лишена перспектив и может даже понадобиться для других целей, таких как обоснование индукции. Пока же интерпретация вероятностей остается самой серьезной трудностью, с которой сталкивается интерпретация Эверетта.
Надо признать, что в интерпретацию Эверетта практически невозможно поверить. Она постулирует, что мир намного больше, чем мы когда-либо думали. Согласно этой интерпретации, на деле мир представляет собой громадную суперпозицию состояний, изменяющихся различными путями с начала времен, и в опыте нам дана лишь крошечная его часть. Она также постулирует неопределенность моего будущего: через минуту появится множество сознаний, с равным правом могущих претендовать на то, чтобы считаться мной. С тех пор, как я написал предыдущее предложение, прошла минута; и кто знает, чем заняты сейчас эти другие сознания?
Ясно, с другой стороны, что все ныне существующие интерпретации квантовой механики в известном отношении безумны. В этом фундаментальный парадокс квантовой механики. Три главных кандидата на роль интерпретации — это, возможно, интерпретация Вигнера, согласно которой сознание производит коллапс, бомовская интерпретация, допускающая нелокальные скрытые параметры, и интерпретация Эверетта. Если брать эти интерпретации, то из вигнеровской вытекает, что макроскопические объекты часто находятся в суперпозиции — до тех пор, пока случайный взгляд наблюдателя не приводит к их коллапсу. Интерпретация Бома ведет к представлению о том, что траектория каждой частицы в универсуме зависит от состояния каждой из имеющихся в нем частиц. А из концепции Эверетта вытекает, что мир гораздо больше, чем мы могли бы подумать.
Из них концепция Бома, возможно, наименее безумна, Эверетта — наиболее, а вигнеровская в этом плане находится где-то между ними.
Но если выстраивать их по теоретической ценности, то все будет наоборот. Концепция Бома неудовлетворительна из-за ее сложности и искусственности. Концепция Вигнера вполне элегантна, и два ее базовых динамических закона отражают квантово-механическое исчисление, при условии проработки всех ее деталей. Но самой простой оказывается концепция Эверетта. Она постулирует лишь уравнение Шредингера, принцип, признающийся всеми интерпретациями квантовой механики. К ее достоинствам, отсутствующим у других, относится то, что это полностью локальная теория, а также то, что она напрямую совместима с теорией относительности.
Стоит также отметить, что контринтуитивные моменты интерпретации Эверетта содержатся и в двух других интерпретациях. Согласно концепции Вигнера, мы должны признавать, что мир менялся по образцу гигантской суперпозиции Эверетта — и что в нем могли быть суперпозиционные звезды и камни, если и не суперпозиционные кошки — по крайней мере, до тех пор, пока в нем не эволюционировало первое сознательное существо, произведшее коллапс волновой функции. Согласно концепции Бома, неколлапсированная волновая функция Эверетта присутствует в качестве «волны-пилота», определяющей положение различных частиц. Вся структура, имеющаяся в других компонентах, таким образом, наличествует в состоянии мира, хотя ее большая часть нерелевантна для эволюции частиц. Поскольку эти концепции также отводят центральные роли неколлапсированной волновой функции, можно было бы попробовать доказать, что это снижает относительную неправдоподобность концепции Эверетта.
Разумеется, никогда нельзя исключать возможности создания новой теории, которая превзойдет перечисленные концепции по своей правдоподобности и теоретической ценности. Но это не кажется столь уж вероятным. Полное отсутствие экспериментальных аномалий наводит на мысль, что квантово-механическое исчисление сохранится как предсказательная теория. Если это так, то мы не можем ожидать решения этой проблемы под влиянием эмпирических факторов. Не исключено, что новая и усовершенствованная интерпретация могла бы возникнуть вследствие концептуальных разработок, но может оказаться так, что самые перспективные ниши в концептуальном пространстве к настоящему времени уже освоены. В таком случае мы можем застрять в спектре возможностей, похожем на тот, что уже имеется — с существенными уточнениями, быть может, но с плюсами и минусами, сходными с нынешними по своим качественным параметрам. И если говорить об этих возможностях, то интерпретация Эверетта во многих отношениях кажется наиболее привлекательной, хотя в то же время верно, что труднее всего согласиться именно с ней.
В этой работе я отстаивал ряд контринтуитивных концепций. Долгое время я сопротивлялся дуализму сознания и тела, но теперь я одобряю его, и не только в качестве единственной позиции, которую можно защитить, но и удовлетворительной самой по себе. Нельзя исключать, что я где-то запутался или проглядел новую, радикальную возможность; но я не чувствую дискомфорта, когда говорю, что дуализм скорее всего верен. Я также рассуждал о возможности панпсихизма. Подобно дуализму сознания и тела, он поначалу контринтуитивен, но эта контринтуитивность исчезает со временем. Я не уверен, истинна или нет эта концепция, но она по крайней мере интеллектуально привлекательна, а если поразмыслить над ней, то и не столь безумна, чтобы с ней нельзя было согласиться.
Безумность интерпретации Эверетта — величина иного порядка. Я легко допускаю, что это наиболее интеллектуально привлекательная интерпретация квантовой механики, но признаюсь, что не могу искренне поверить в нее. Если бы Бог вынудил меня поставить на кон мою жизнь в зависимости от истинности или ложности концепций, которые я отстаивал, я достаточно уверенно сказал бы о фундаментальности опыта и с гораздо меньшей уверенностью — о повсеместности опыта. Что же касается интерпретации Эверетта, я разрывался бы на части и, возможно, в конце концов мне не хватило бы смелости сделать ставку на нее[197]. Быть может, она просто слишком уж необычна, чтобы в нее можно было поверить. Неясно тем не менее, можно ли в конечном счете придавать большое значение этим интуитивным сомнениям. Эта концепция проста и элегантна, и она предсказывает существование наблюдателей, которые видят мир именно так, как его вижу я. Разве этого недостаточно? Не исключено, что мы никогда не сможем эмоционально одобрить ее, но мы, по крайней мере, должны всерьез относиться к тому, что она может оказаться истинной.