Эта книга представляет итог более чем десятилетних исследований, предпринятых совместно с д-ром Артуро Розенблютом, работавшим тогда в Гарвардской медицинской школе, а ныне перешедшим в Национальный институт кардиологии в Мексике. В то время д-р Розенблют, коллега и сотрудник покойного д-ра Уолтера Б. Кеннона, ежемесячно устраивал дискуссии о научном методе. В этих дискуссиях участвовали главным образом молодые ученые Гарвардской медицинской школы. Мы собирались на обед за круглым столом в Вандербилт-Холле. Беседа была живой и непринужденной. Здесь было неподходящее место для игры в амбицию, да это и не поощрялось. После обеда кто-нибудь из нашей группы или из гостей делал доклады на какую-либо научную тему, причем обычно в этих докладах вопросы методологии ставились на первое или хотя бы на почетное место. На докладчика обрушивалась резкая критика, благожелательная, но беспощадная. Она была великолепным лекарством от незрелых мыслей, недостаточной самокритичности, излишней самоуверенности и напыщенности. Кто не мог выдержать испытание, не возвращался в нашу среду, но многие из нас, бывших завсегдатаев этих встреч, чувствуют, что эти встречи были постоянным существенным вкладом в наше научное развитие.
На этих собраниях присутствовали не только врачи и ученые-медики. К постоянным и активным участникам наших споров принадлежал д-р Мануэль Сандоваль Вальярта, профессор физики Массачусетсского технологического института, один из самых первых моих [c.43] студентов в те годы, когда я пришел в МТИ после I мировой воины. Как и д-р Розенблют, д-р Вальярта был мексиканец. Он имел обыкновение приводить на эти встречи своих коллег по институту. На одну из встреч он привел и меня; так я встретился впервые с д-ром Розенблютом. Я давно интересовался методологией науки и в 1911-1913 гг. принимал участие в семинаре по этим вопросам, который вел Джосайя Ройс в Гарвардском университете. Чувствовалось, что на подобных собраниях необходимо присутствие человека, способного критически рассматривать математические вопросы. Поэтому я был активным членом группы до того момента, пока д-р Розенблют не был вызван в Мексику в 1944 г. и пока общий беспорядок, связанный с войной, не положил конец этим собраниям.
В течение многих лет д-р Розенблют разделял со мной убеждение, что самыми плодотворными для развития наук являются области, оставленные в пренебрежении по той причине, что они были «ничьей территорией» между различными сложившимися науками. После Лейбница, быть может, уже не было человека, который бы полностью обнимал всю интеллектуальную жизнь своего времени. С той поры наука становится все более делом специалистов, области компетенции которых обнаруживают тенденцию ко все большему сужению. Сто лет тому назад хотя и не было таких ученых, как Лейбниц, но были такие, как Гаусс, Фарадей, Дарвин.
В настоящее же время лишь немногие ученые могут назвать себя или математиками, или физиками, или биологами, не прибавляя к этому дальнейшего ограничения. Ученый становится теперь топологом, или акустиком, или специалистом по жесткокрылым. Он набит жаргоном своей специальной дисциплины и знает всю литературу по ней и все ее подразделы. Но всякий вопрос, сколько-нибудь выходящий за эти узкие пределы, такой ученый чаще всего будет рассматривать как нечто, относящееся к коллеге, который работает через три комнаты дальше по коридору. Более того, всякий интерес со своей стороны к подобному вопросу он будет считать совершенно непозволительным нарушением чужой тайны.
Специализация дисциплин все время возрастает и [c.44] захватывает все новые области. В результате создается ситуация, похожая на ту, которая возникла, когда в Орегоне одновременно находились и поселенцы из Соединенных Штатов, и англичане, и мексиканцы, и русские, — сложный и запутанный клубок открытий, названий и законов. Ниже мы увидим, что существуют области научной работы, исследуемые с разных сторон чистой математикой, статистикой, электротехникой и нейрофизиологией. В этих областях каждое понятие получает особое название у каждой группы специалистов, и многие важные исследования проделываются трижды или четырежды. В то же время другие важные исследования задерживаются из-за того, что в одной области не известны результаты, уже давно ставшие классическими в смежной области.
Именно такие пограничные области науки открывают перед надлежаще подготовленным исследователем богатейшие возможности. Но изучение таких областей представляет и наибольшие трудности для обычного метода массового наступления с разделением труда.
Если трудность физиологической проблемы по существу математическая, то десять несведущих в математике физиологов сделают не больше, чем один несведущий в математике физиолог. Очевидно также, что если физиолог, не знающий математики, работает вместе с математиком, не знающим физиологии, то физиолог не в состоянии изложить проблему в выражениях, понятных математику; математик, в свою очередь, не сможет дать совет в понятной для физиолога форме.
Д-р Розенблют всегда настойчиво утверждал, что действенное изучение этих белых пятен на карте науки может быть предпринято только коллективом ученых, каждый из которых, будучи специалистом в своей области, должен быть, однако, основательно знаком с областями науки своих коллег. При этом необходимо, чтобы все привыкли работать совместно, зная склад ума другого, оценивая значение новых идей коллеги, прежде чем эти идеи будут точно сформулированы. От математика не требуется умения провести физиологический эксперимент, но он должен уметь понимать такой эксперимент, уметь подвергнуть его критике и уметь предложить новый эксперимент. От физиолога не требуется умения доказать определенную математическую [c.45] теорему, но физиолог должен быть в состоянии понять ее значение для физиологии и указать математику направление поисков. В течение многих лет мы мечтали об обществе независимых ученых, работающих вместе в одной из этих неисследованных областей науки, и не под началом какого-нибудь высокопоставленного администратора, а объединенных желанием, даже духовной необходимостью, понимать науку как нечто целое и передавать друг другу силу такого понимания.
Мы пришли к согласию по этим вопросам задолго до того, как выбрали область наших совместных исследований и наметили, какое каждый примет в них участие. На наш выбор существенно повлияла война. Я давно знал, что в случае войны мое участие в ней определялось бы в значительной степени двумя обстоятельствами: моим тесным контактом с программой создания вычислительных машин, проводимой д-ром Ванневаром Бушем, и моей совместной работой с д-ром Юк Винг Ли по синтезу электрических схем. Действительно, оба обстоятельства сыграли значительную роль. Летом 1940 г. я стал уделять много внимания разработке вычислительных машин для решения дифференциальных уравнений в частных производных. Я давно интересовался этим, и у меня сложилось убеждение, что здесь, в отличие от обыкновенных дифференциальных уравнений, так хорошо решавшихся на дифференциальном анализаторе д-ра Буша, главной является проблема представления функций многих переменных. Я был убежден также, что процесс развертки, применяемый в телевидении, дает ответ на этот вопрос и что в действительности телевидение принесет технике больше пользы именно созданием таких новых процессов, чем само по себе, как особая отрасль.
Было ясно, что всякий процесс развертки должен значительно увеличить количество используемых данных по сравнению с тем, которое встречается в задачах, сводимых к обыкновенным дифференциальным уравнениям. Поэтому для получения приемлемых результатов в приемлемое время необходимо довести до максимума скорость элементарных процессов и добиться, чтобы течение этих процессов не прерывалось существенно более медленными шагами. Необходимо также повысить точность выполнения элементарных процессов [c.46] настолько, чтобы их частое повторение не приводило к накоплению слишком большой ошибки. В результате были сформулированы следующие требования:
1) Центральные суммирующие и множительные устройства должны быть цифровыми, как в обычном арифмометре, а не основываться на измерении, как в дифференциальном анализаторе Буша.
2) Эти устройства, являющиеся по существу переключателями, должны состоять из электронных ламп, а не из зубчатых передач или электромеханических реле. Это необходимо, чтобы обеспечить достаточное быстродействие.
3) В соответствии с принципами, принятыми для ряда существующих машин Белловских телефонных лабораторий, должна использоваться более экономичная двоичная, а не десятичная система счисления.
4) Последовательность действия должна планироваться самой машиной так, чтобы человек не вмешивался в процесс решения задачи с момента введения исходных данных до снятия окончательных результатов. Все логические операции, необходимые для этого, должна выполнять сама машина.
5) Машина должна содержать устройство для запасания данных. Это устройство должно быстро их записывать, надежно хранить до стирания, быстро считывать, быстро стирать их и немедленно подготавливаться к запасанию нового материала.
Эти рекомендации вместе с предложениями по их реализации были направлены д-ру Ванневару Бушу для возможного применения их в случае войны. На той стадии подготовки к войне казалось, что они не столь важны, чтобы приступить к немедленной работе над ними. Тем не менее все эти рекомендации представляют собой идеи, положенные в основу современной сверхбыстрой вычислительной машины. Эти мысли почти носились тогда в воздухе, и я не хочу в данный момент заявлять какие-либо претензии на исключительный приоритет в их формулировке. Все же указанные рекомендации оказались полезными, и я надеюсь, что они имели некоторое влияние на популяризацию этого круга идей среди инженеров. Во всяком случае, как мы увидим в основной части книги, такие идеи интересны в связи с изучением нервной системы. [c.47]
Итак, эта работа была отложена. Хотя она и принесла некоторую пользу, но непосредственно она не привела д-ра Розенблюта и меня к каким-либо проектам. Наше действительное сотрудничество возникло в связи с другой задачей, также имевшей непосредственное отношение к последней войне. В начале войны господство Германии в воздухе и оборонительная позиция Англии сосредоточили внимание многих ученых на задаче усовершенствования зенитной артиллерии. Уже до войны стало ясно, что возрастающая скорость самолетов опрокинула классические методы управления огнем и что необходимо встроить в прибор управления огнем все вычислительные устройства, обеспечивающие расчеты для выстрела. Эти вычислительные устройства оказались очень сложными вследствие того обстоятельства, что, в отличие от других целей, самолет имеет скорость, сравнимую со скоростью зенитного снаряда. Поэтому необходимо стрелять не прямо в цель, а в некоторую точку, в которой, согласно расчетам, должны по прошествии некоторого времени встретиться самолет и снаряд. Следовательно, мы должны найти какой-нибудь метод предсказания будущего положения самолета.
Простейший метод — продолжить наблюдаемый курс самолета по прямой. Этот метод заслуживает серьезного внимания. Чем больше самолет кружит при полете, чем больше он делает виражей, тем меньше его эффективная скорость, тем меньше времени он имеет для выполнения боевого задания, тем дольше он остается в поражаемом пространстве. При прочих равных условиях самолет будет по возможности лететь по прямой. Однако после разрыва первого снаряда эти прочие условия уже не равны, и пилот, вероятно, начнет выполнять зигзагообразный полет, фигуры высшего пилотажа или другой противозенитный маневр.
Если бы этот маневр зависел только от пилота и задача пилота сводилась бы к разумному использованию своих шансов, такому, какое мы, например, ожидаем от хорошего игрока в покер, то к моменту разрыва снаряда пилот мог бы настолько изменить положение самолета, что шансы на удачное попадание стали бы пренебрежимо малы, если только не применять весьма неэкономного заградительного огня. Но пилот не имеет возможности неограниченного маневра. Во-первых, пилот [c.48] находится в самолете, летящем с чрезвычайно большой скоростью, и всякое внезапное отклонение от курса создаст огромную нагрузку, при которой пилот может потерять сознание, а самолет — развалиться. Далее, управлять самолетом можно только посредством движения рулевых поверхностей, и для перехода в новый режим полета потребуется некоторое время.
Однако перевод рулевых поверхностей в новое положение изменит лишь ускорение самолета, и это изменение ускорения еще должно перейти в изменение скорости и затем в изменение положения, прежде чем оно даст эффект. Наконец, находясь в напряженных условиях боя, летчик едва ли будет способен к очень сложному и ничем не ограниченному сознательному поведению. Вероятнее всего, он будет просто выполнять ту программу действий, которой его ранее обучили.
Все это делало целесообразным разработку проблемы предсказания полета по кривой, независимо от того, насколько благоприятными окажутся результаты для действительного применения прибора управления огнем, использующего такие методы предсказания. Для предсказания будущей криволинейной траектории необходимо выполнить определенные операции над прошлыми наблюдениями траектории. Точный оператор предсказания вообще нельзя осуществить с помощью какой бы то ни было реальной аппаратуры. Но некоторые операторы дают известное приближение и притом допускают реализацию с помощью аппаратуры, которую мы можем построить. Я сказал профессору Массачусетсского технологического института Сэмьюэлу Колдуэллу, что следовало бы испытать эти операторы. Он немедленно предложил мне начать испытания, используя дифференциальный анализатор д-ра Буша как готовую модель требуемых приборов для управления огнем. Мы провели испытания и получили результаты, описанные в основной части книги. Во всяком случае, я оказался работающим над военным проектом, в котором г-н Джулиан X. Бигелоу и я совместно проводили разработку теории предсказания и конструирование устройств, воплощающих ее результаты.
Таким образом, я во второй раз занялся изучением электромеханической системы, предназначенной узурпировать [c.49] специфические функции человека: в первом случае речь шла о выполнении сложных вычислений, во втором — о предсказании будущего. При этом во втором случае мы не могли обойтись без исследования того, как выполняет некоторые функции человек. Правда, в ряде приборов управления огнем исходные данные для наводки поступают непосредственно с радиолокатора, но обычно огнем управляет живой, а не механический наводчик. Люди: вертикальный наводчик, горизонтальный наводчик или оба вместе — действуют в качестве неотъемлемой части системы управления огнем. Чтобы математически описать их участие в работе управляемой ими машины, необходимо знать их характеристики. Кроме того, их цель — самолет — также управляется человеком, и желательно знать рабочие характеристики такой цели.
Мы с Бигелоу пришли к заключению, что исключительно важным фактором в сознательной деятельности служит явление, которое в технике получило название обратной связи. Этот вопрос освещен мною весьма подробно в соответствующих главах книги. Здесь я отмечу только одно обстоятельство. Когда мы хотим, чтобы некоторое устройство выполняло заданное движение, разница между заданным и фактическим движением используется как новый входной сигнал, заставляющий регулируемую часть устройства двигаться так, чтобы фактическое движение устройства все более приближалось к заданному.
Например, в одном из типов корабельной рулевой машины поворот штурвала воздействует на L-образное колено, присоединенное к румпелю. Это колено так регулирует клапаны рулевой машины, чтобы румпель двигался в положение, при котором эти клапаны закрыты. Поэтому румпель поворачивается так, чтобы привести другой конец названного колена на серединную, нейтральную линию, и тем самым угловое положение штурвала воспроизводится как угловое положение румпеля. Конечно, любое трение или другая задерживающая сила, тормозящая движение румпеля, будет увеличивать впуск пара в клапаны на одной стороне и уменьшать его на другой, чтобы увеличить вращающий момент, стремящийся привести румпель в требуемое положение. Таким образом, система с обратной связью стремится [c.50] сделать работу рулевой машины относительно независимой от нагрузки.
Но при некоторых условиях, например при наличии задержки во времени и т. п., обратная связь, осуществляемая слишком резко, заставит руль пройти за требуемое положение, а затем обратная связь, действующая в другом направлении, вызовет еще большее отклонение руля от требуемого положения. В результате рулевой механизм будет испытывать сильные колебания, или рысканье, пока совсем не сломается. В таких книгах, как монография Маккола[91], можно найти весьма точное описание обратной связи, условий, при которых обратная связь оказывается применимой, а также условий, при которых она отказывает. Обратная связь — это явление, которое мы хорошо понимаем с количественной точки зрения.
Допустим теперь, что я поднимаю карандаш. Чтобы это сделать, я должен привести в движение определенные мышцы. Однако никто, за исключением специалистов-анатомов, не знает, какие это мышцы. Даже среди анатомов лишь немногие, да и то вряд ли, сумеют поднять карандаш посредством сознательного акта последовательного сокращения отдельных мышц. Нами осознается лишь конечная цель — поднять карандаш. Когда мы решили это сделать, наше движение совершается так, что, грубо говоря, степень, в которой карандаш еще не взят, на каждом этапе уменьшается. Все движение мы выполняем почти бессознательно.
Чтобы действие выполнялось таким способом, на каждом этапе движения в нервную систему должны сознательно или бессознательно подаваться сведения о том, насколько положение нашей руки отличается от положения, при котором мы возьмем карандаш. Если мы смотрим на карандаш, то эти сведения могут быть зрительными, хотя бы частично; но обычно они бывают кинестетическими, или, употребляя термин, который сейчас в ходу, проприоцептивными. Если проприоцептивные ощущения отсутствуют и мы не заменим их зрительными или какими-либо другими, то мы не сможем поднять карандаш — состояние, называемое атаксией. [c.51] Атаксия этого типа обычна при той форме сифилиса центральной нервной системы, которая носит название спинной сухотки (tabes dorsalis). При ней кинестетические ощущения, передаваемые спинномозговыми нервами, более или менее утрачиваются.
Но чрезмерная обратная связь, очевидно, должна быть столь же серьезным препятствием для организованной деятельности, как и недостаточная обратная связь. Принимая во внимание эту возможность, мы с Бигелоу обратились к д-ру Розенблюту с одним специальным вопросом. Существует ли патологическое состояние, при котором больной, пытаясь выполнить сознательное действие, например поднять карандаш, проскакивает мимо цели и совершает не поддающиеся контролю колебания? Д-р Розенблют ответил, что такое состояние существует и хорошо известно. Называется оно интенционным тремором и часто связано с повреждением мозжечка.
Итак, мы нашли весьма существенное подтверждение нашей гипотезы относительно природы сознательной деятельности или, по крайней мере, некоторых видов этой деятельности. Следует отметить, что эта точка зрения идет значительно дальше обычной точки зрения, распространенной среди нейрофизиологов. Центральная нервная система уже не представляется автономным, независимым органом, получающим раздражения от органов чувств и передающим их в мышцы. Наоборот, некоторые характерные виды деятельности центральной нервной системы объяснимы только как круговые процессы, идущие от нервной системы в мышцы и снова возвращающиеся в нервную систему через органы чувств. При этом не важно, являются ли эти органы чувств проприоцепторами или внешними органами чувств. Нам казалось, что такой подход означает новый шаг в изучении того раздела нейрофизиологии, который затрагивает не только элементарные процессы в нервах и синапсах, но и деятельность нервной системы как единого целого.
Мы трое сочли необходимым написать и опубликовать статью, излагающую эту новую точку зрения[92]. Как [c.52] д-р Розенблют, так и я предвидели, что эта статья может быть только изложением программы большой экспериментальной работы. Мы решили, что если когда-нибудь нам удастся создать институт, занимающийся проблемами связей между разными науками, то эта тема была бы почти идеальным объектом для нашей деятельности.
Что касается техники связи, то для г-на Бигелоу и для меня уже стало очевидным, что техника управления и техника связи неотделимы друг от друга и что они концентрируются не вокруг понятий электротехники, а вокруг более фундаментального понятия сообщения. При этом не существенно, передается ли сообщение посредством электрических, или механических, или нервных систем. Сообщение представляет собой дискретную или непрерывную последовательность измеримых событий, распределенных во времени, т. е. в точности то, что статистики называют временным рядом.
Предсказание будущего отрезка сообщения производится применением некоторого оператора к прошлому отрезку сообщения, независимо от того, реализуется ли этот оператор алгорифмом математических вычислений или электрическими и механическими устройствами. В связи с этим мы нашли, что идеальные предсказывающие устройства, которые мы сначала рассматривали, подвержены воздействию ошибок двух противоположных видов. Первоначально спроектированный нами предсказывающий прибор можно было сделать таким, чтобы он предугадывал весьма гладкую кривую с любой степенью точности. Однако повышение точности достигалось ценой повышения чувствительности прибора. Чем лучше был прибор для гладких сигналов, тем сильнее он приводился в колебания небольшими нарушениями гладкости и тем продолжительнее были такие колебания. Таким образом, хорошая экстраполяция гладкой кривой, по-видимому, требовала применения более точного и чувствительного прибора, чем наилучшее возможное предсказание негладкой кривой; в каждом отдельном случае выбор прибора зависел бы от статистической природы предсказываемого явления. Можно было думать, что эти два вида взаимозависимых ошибок имеют нечто общее с противоречивыми задачами измерения положения и количества [c.53] движения, рассматриваемыми в квантовой механике Гейзенберга в соответствии с его принципом неопределенности.
После того как мы уяснили, что решение задачи оптимального предсказания можно получить лишь обратившись к статистике предсказываемого временного ряда, было уже легко превратить то, что сперва представлялось трудностью для теории предсказания, в эффективное средство решения задачи предсказания. Приняв определенную статистику для временного ряда, можно найти явное выражение для среднего квадрата ошибки предсказания при данном методе и на данное время вперед. А располагая таким выражением, мы можем свести задачу оптимального предсказания к нахождению определенного оператора, при котором становилась бы минимальной некоторая положительная величина, зависящая от этого оператора. Задачи на минимум такого типа решаются в хорошо развитой отрасли математики — вариационном исчислении, и эта отрасль имеет хорошо развитую методику. Благодаря этой методике мы оказались в состоянии получить в явном виде наилучшее решение задачи предсказания будущего отрезка временного ряда на основе его статистических свойств и, более того, найти физическую реализацию этого решения посредством реальных приборов.
Проделав это, мы увидели, что по крайней мере одна задача технического проектирования приняла совершенно новый вид. Ведь обычно техническое проектирование считается скорее искусством, чем наукой. Сведя задачу такого рода к разысканию определенного минимума, мы поставили дело проектирования на более научную основу. Нам пришла мысль, что перед нами не изолированный случай и что существует целая область инженерной работы, в которой аналогичные задачи проектирования можно решать методами вариационного исчисления.
Мы обратились к другим аналогичным задачам и решили их этими методами. В числе решенных задач была задача проектирования волновых фильтров. Часто бывает так, что передаваемое сообщение искажают посторонние помехи, так называемый шумовой фон. Тогда встает задача восстановления посланного сообщения из искаженного сообщения при помощи [c.54] некоторого оператора. При этом может потребоваться восстановление посланного сообщения либо в первоначальном виде, либо с данным упреждением, либо с данным запаздыванием. Выбор оптимального оператора и прибора, его реализующего, определяется статистическими свойствами сообщения и шума, рассматриваемых по отдельности и совместно. Так в проектировании волновых фильтров мы заменили старые методы, носившие эмпирический и довольно-таки случайный характер, методами, допускающими четкое научное обоснование.
Но тем самым мы сделали из проектирования систем связи статистическую науку, раздел статистической механики. И действительно, понятия статистической механики вторгаются во все отрасли науки уже более ста лет. Мы увидим далее, что эта преобладающая роль статистической механики в современной физике имеет самое существенное значение для понимания природы времени. В случае же техники связи значение статистического элемента непосредственно очевидно. Передача информации возможна лишь как передача альтернатив. Если нужно передавать одну-единственную возможность, то лучше всего и легче всего это сделать тем, что не посылать вообще никакого сообщения. Телефон и телеграф могут выполнять свои функции только в том случае, когда передаваемые ими сообщения беспрерывно изменяются, причем эти изменения не определяются полностью прошлой частью сообщений. С другой стороны, эффективное проектирование телефона и телеграфа возможно только при том условии, что изменения передаваемых сообщений подчиняются каким-нибудь статистическим закономерностям.
Чтобы подойти к технике связи с этой стороны, нам пришлось разрабатывать статистическую теорию количества информации. В этой теории за единицу количества информации принимается количество информации, передаваемое при одном выборе между равновероятными альтернативами. Такая мысль возникла почти одновременно у нескольких авторов, в том числе у статистика Р.А. Фишера, у д-ра Шеннона из Белловских телефонных лабораторий и у автора настоящей книги[93]. При этом Фишер исходил из классической [c.55] статистической теории, Шеннон — из проблемы кодирования информации, автор настоящей книги — из проблемы сообщения и шумов в электрических фильтрах. Следует, однако, отметить, что некоторые мои изыскания в этом направлении связаны с более ранней работой Колмогорова[94] в России, хотя значительная часть моей работы была сделана до того, как я обратился к трудам русской школы.
Понятие количества информации совершенно естественно связывается с классическим понятием статистической механики — понятием энтропии. Как количество информации в системе есть мера организованности системы, точно так же энтропия системы есть мера дезорганизованности системы; одно равно другому, взятому с обратным знаком. Эта точка зрения приводит нас к ряду рассуждений относительно второго закона термодинамики и к изучению возможности так называемых «демонов» Максвелла. Вопросы такого рода возникают совершенно независимо при изучении энзимов и других катализаторов, и их рассмотрение существенно для правильного понимания таких основных свойств живой материи, как обмен веществ и размножение. Третье фундаментальное свойство жизни — свойство раздражимости — относится к области теории связи и попадает в группу идей, которые мы только что разбирали[95].
Таким образом, четыре года назад группа ученых, объединенных вокруг д-ра Розенблюта и меня, уже понимала принципиальное единство ряда задач, в центре которых находились вопросы связи, управления и статистической механики, и притом как в машине, так и в живой ткани. Но наша работа затруднялась отсутствием единства в литературе, где эти задачи трактовались, и отсутствием общей терминологии или хотя бы единого названия для этой области. После продолжительного обсуждения мы пришли к выводу, что вся [c.56] существующая терминология так или иначе слишком однобока и не может способствовать в надлежащей степени развитию этой области. По примеру других ученых, нам пришлось придумать хотя бы одно искусственное неогреческое выражение для устранения пробела. Было решено назвать всю теорию управления и связи в машинах и живых организмах кибернетикой, от греческого κυβερνήτησ — «кормчий»[96]. Выбирая этот термин, мы тем самым признавали, что первой значительной работой по механизмам с обратной связью была статья о регуляторах, опубликованная Кларком Максвеллом в 1868 г.[97], и что слово «governor», которым Максвелл обозначал регулятор, происходит от латинского искажения слова «κυβερνήτησ». Мы хотели также отметить, что судовые рулевые машины были действительно одними из самых первых хорошо разработанных устройств с обратной связью[98].
Несмотря на то, что термин «кибернетика» появился только летом 1947 г., мы сочли удобным использовать его в ссылках, относящихся к более ранним периодам развития этой области науки. Приблизительно с 1942 г. развитие кибернетики проходило по нескольким направлениям. Сначала идеи совместной статьи Бигелоу, Розенблюта и Винера были изложены д-ром Розенблютом [c.57] на совещании, проведенном фондом Джосайи Мейси в Нью-Йорке в 1942 г. Совещание было посвящено проблемам центрального торможения в нервной системе. На совещании присутствовал д-р Уоррен Мак-Каллох из Медицинской школы Иллинойсского университета, уже давно поддерживавший связь с д-ром Розенблютом и со мною и интересовавшийся изучением организации коры головного мозга.
Примерно в это же время на сцену выступает фактор, который неоднократно появляется в истории кибернетики, — влияние математической логики. Если бы мне пришлось выбирать в анналах истории наук святого — покровителя кибернетики, то я выбрал бы Лейбница. Философия Лейбница концентрируется вокруг двух основных идей, тесно связанных между собой: идеи универсальной символики и идеи логического исчисления.
Из этих двух идей возникли современный математический анализ и современная символическая логика. И как в арифметическом исчислении была заложена возможность развития его механизации от абака и арифмометра до современных сверхбыстрых вычислительных машин, так в calculus ratiocinator[99] Лейбница содержится в зародыше machina rationatrix — думающая машина. Сам Лейбниц, подобно своему предшественнику Паскалю, интересовался созданием вычислительных машин в металле. Поэтому совсем неудивительно, что тот же самый умственный толчок, который привел к развитию математической логики, одновременно привел к гипотетической или действительной механизации процессов мышления.
Всякое математическое доказательство, за которым мы можем следить, выразимо конечным числом символов. Эти символы, правда, могут быть связаны с понятием бесконечности, но связь эта такова, что ее можно установить за конечное число шагов. Так, когда в случае математической индукции мы доказываем теорему, зависящую от параметра n, мы доказываем ее сначала для n=0 и затем устанавливаем, что случай, когда параметр имеет значение n+1, вытекает из случая, когда параметр имеет значение n. Тем самым мы убеждаемся [c.58] в правильности теоремы для всех положительных значений параметра n. Более того, число правил действия в нашем дедуктивном механизме должно быть конечным, даже если оно кажется неограниченным из-за ссылки на понятие бесконечности. Ведь и само понятие бесконечности выразимо в конечных терминах. Короче говоря, как номиналистам (Гильберт), так и интуиционистам (Вейль) стало совершенно очевидно, что развитие той или иной математико-логической теории подчиняется ограничениям того же рода, что и работа вычислительной машины. Как мы увидим позже, можно даже интерпретировать с этой точки зрения парадоксы Кантора и Рассела.
Я сам в прошлом ученик Рассела и многим обязан его влиянию. Д-р Шеннон взял как тему своей докторской диссертации в Массачусетсском технологическом институте применение методов классической булевой алгебры классов к изучению переключательных систем в электротехнике[100]. Тьюринг был, пожалуй, первым среди ученых, исследовавших логические возможности машин с помощью мысленных экспериментов. Во время войны он работал для английского правительства в области электроники. В настоящее время он возглавляет программу по созданию вычислительных машин современного образца, принятую Национальной физической лабораторией в Теддингтоне.
Другим молодым ученым, перешедшим из математической логики в кибернетику, был Уолтер Питтс. Он был учеником Карнапа в Чикаго и был связан с проф. Рашевским и его школой биофизиков. Заметим попутно, что эта последняя группа сделала очень много для того, чтобы направить внимание ученых-математиков на возможности биологических наук. Правда, некоторым из нас кажется, что она находится под слишком большим влиянием задач об энергии и потенциалах и методов классической физики, чтобы наилучшим образом решать задачи по изучению систем, подобных нервной системе, которые весьма далеки от энергетической замкнутости. [c.59]
Г-н Питтс весьма удачно попал под влияние Мак-Каллоха; они вместе начали работать над проблемами, связанными с соединением нервных волокон синапсами в системы, обладающие заданными общими свойствами. Независимо от Шеннона они использовали аппарат математической логики для решения проблем, являющихся прежде всего переключательными проблемами. Мак-Каллох и Питтс ввели принципы, остававшиеся в тени в ранней работе Шеннона, хотя и вытекающие, несомненно, из идей Тьюринга: использование времени как параметра, рассмотрение сетей, содержащих циклы, и рассмотрение синаптических и других задержек[101].
Летом 1943 г. я встретил д-ра Дж. Леттвина из Бостонской городской больницы, весьма интересовавшегося вопросами, связанными с нервными механизмами. Он был близким другом г-на Питтса и познакомил меня с его работой[102]. Он убедил Питтса приехать в Бостон и встретиться с д-ром Розенблютом и со мной. Мы с радостью пригласили его в нашу группу. Г-н Питтс перешел в Массачусетсский технологический институт осенью 1943 г., чтобы работать вместе со мной и чтобы углубить свою математическую подготовку для исследований в этой науке — кибернетике, к тому времени уже родившейся, но еще не окрещенной.
Г-н Питтс был тогда основательно знаком с математической логикой и нейрофизиологией, но не имел случая сколько-нибудь близко соприкасаться с техникой. В частности, он не был знаком с работой д-ра Шеннона и недостаточно ясно представлял себе возможности электроники. Он очень заинтересовался, когда я показал ему образцы современных вакуумных ламп и объяснил, что они являются идеальным средством для реализации в металле эквивалентов рассматриваемых им нейронных сетей и систем. С этого времени нам стало [c.60] ясно, что сверхбыстрая вычислительная машина, поскольку вся она строится на последовательном соединении переключательных устройств, является идеальной моделью для решения задач, возникающих при изучении нервной системы. Возбуждение нейронов по принципу «все или ничего» в точности подобно однократному выбору, производимому при определении разряда двоичного числа; а двоичная система счисления уже признавалась не одним из нас за наиболее удовлетворительную основу для проектирования вычислительных машин. Синапс есть не что иное, как механизм, определяющий, будет ли некоторая комбинация выходных сигналов от данных предыдущих элементов служить подходящим стимулом для возбуждения следующего элемента или нет; тем самым синапс в точности подобен устройствам вычислительной машины. Наконец, проблема объяснения природы и разновидностей памяти у животных находит параллель в задаче создания искусственных органов памяти для машин.
Тем временем оказалось, что создание вычислительных машин имеет гораздо более важное значение для военных целей, чем предполагал ранее д-р Буш. Строительство новых машин развернулось в нескольких центрах, и притом в направлении, которое не очень отличалось от указанного в моем первом докладе. Гарвардский университет, испытательный полигон в Абердине и Пенсильванский университет уже построили вычислительные машины, а Институт высших исследований в Принстоне[103] и Массачусетсский технологический институт должны были к этому вскоре приступить. В программе строительства вычислительных машин наблюдался постепенный переход от механических систем к электрическим, от десятичной системы счисления к двоичной, от механического реле к электрическому, от ручного управления операциями к автоматическому управлению. Короче говоря, каждая новая машина все более и более походила на образец, описанный в том докладе, [c.61] который я в свое время направил д-ру Бушу. Множество народа жадно интересовалось этими вопросами; у нас была возможность передавать свои идеи коллегам, в частности д-ру Эйкену из Гарвардского университета, д-ру фон Нейману из Института высших исследований и д-ру Голдстайну, работавшему над машинами ЭНИАК[104] и ЭДВАК[105] в Пенсильванском университете. Везде нас внимательно выслушивали, и скоро словарь инженеров стал пестреть выражениями, употребляемыми нейрофизиологами и психологами.
На этой стадии работ д-р Нейман и я сочли необходимым провести объединенное совещание всех интересующихся тем, что мы сейчас называем кибернетикой. Такое совещание было организовано в Принстоне в конце зимы 1943-1944 гг. Присутствовали и инженеры, и физиологи, и математики. Д-р Розенблют не мог быть среди нас, так как он только что принял приглашение на должность заведующего лабораторией физиологии в Национальном институте кардиологии в Мексике; но от физиологов присутствовали д-р Мак-Каллох и д-р Лоренте де Но из Рокфеллеровского института. Д-р Эйкен не смог присутствовать, но в совещании участвовало несколько конструкторов вычислительных машин и среди них д-р Голдстайн. Д-р фон Нейман, г-н Питтс и я представляли математиков. Физиологи сделали совместное изложение задач кибернетики с их точки зрения, аналогичным образом конструкторы вычислительных машин изложили свои цели и методы. В конце совещания всем стало ясно, что существует значительная идейная общность между работниками разных [c.62] специальностей, что представители каждой группы уже могут пользоваться понятиями, выработанными представителями других групп, и что поэтому необходимо попытаться создать общую для всех терминологию.
Значительно раньше военная исследовательская группа, руководимая д-ром Уорреном Уивером, выпустила отчет, сначала секретный, а затем для ограниченного пользования, где излагалась работа г-на Бигелоу и моя по предсказывающим приборам и волновым фильтрам[106]. Было установлено, что конструирование специальных приборов для криволинейного предсказания не оправдывается условиями ведения зенитного огня. Но принципы оказались верными и были использованы государственными органами при решении задач на сглаживание и в некоторых смежных областях. В частности, оказалось, что интегральное уравнение того типа, к которому сводится рассматриваемая нами задача вариационного исчисления, появляется в проблемах волноводов и во многих других проблемах прикладной математики. Таким образом, к концу войны идеи теории предсказания, идеи статистического подхода к технике связи так или иначе стали уже знакомы значительной части статистиков и инженеров-связистов в Соединенных Штатах и Великобритании; кроме моего военного отчета, ныне совершенно разошедшегося, к этому времени вышло большое число объяснительных статей, написанных Левинсоном, Уоллменом, Дэниеллом, Филлипсом и другими[107] для заполнения пробела. Сам я в течение нескольких лет готовил большую математическую статью с целью окончательно зафиксировать проделанную работу, но затем не зависящие от меня обстоятельства воспрепятствовали быстрой публикации этой статьи. Наконец, после совместного совещания Американского математического общества и Института математической статистики, организованного в Нью-Йорке весной 1947 г. (оно было посвящено изучению стохастических процессов с точки зрения, весьма близкой к кибернетике), я переслал проф. Дубу из Иллинойсского университета готовую часть рукописи с тем, [c.63] чтобы он переработал ее в своих обозначениях и в соответствии со своими идеями для книги, которая должна выйти в серии математических обзоров Американского математического общества[108]. Часть работы уже излагалась в курсе лекций, читанном мною на математическом отделении МТИ летом 1945 г. После этого вернулся из Китая мой старый ученик и сотрудник[109] д-р Ю.В. Ли. Сейчас, осенью 1947 г., он читает лекции о новых методах проектирования волновых фильтров и других аналогичных приборов в МТИ на электротехническом отделении. На основе этого курса лекций он собирается издавать книгу. В то же время намечается переиздание моего военного отчета, разошедшегося полностью[110].
Как я уже сказал, д-р Розенблют вернулся в начале 1944 г. в Мексику. Весной 1945 г. я получил приглашение от Мексиканского математического общества принять участие в совещании, которое должно было состояться в июне в Гвадалахаре. К этому приглашению присоединилась Комиссия по поощрению и координации научных исследований, руководимая д-ром Мануэлем Сандовалем Вальяртой, о котором я уже говорил. Д-р Розенблют предложил мне провести совместно какое-либо исследование, и Национальный институт кардиологии, где директором был д-р Игнасио Чавес, оказал мне свое гостеприимство.
Я тогда пробыл в Мексике около десяти недель. Мы с д-ром Розенблютом решил продолжать работу, которую уже обсуждали ранее с д-ром Уолтером Б. Кенноном, также гостившим у д-ра Розенблюта; к несчастью, эта поездка оказалась для д-ра Кеннона последней. Наша работа посвящалась зависимости между тоническими, клоническимн и фазовыми судорогами при эпилепсии, с одной стороны, и тонической спазмой, [c.64] биением и мерцанием сердца, с другой. Мы полагали, что сердечная мышца благодаря своей раздражимости столь же полезна для изучения механизмов проводимости, как и нервная ткань, а анастомозы и перекресты волокон сердечной мышцы ставят нас перед меньшими трудностями, чем нервные синапсы. Мы были глубоко благодарны д-ру Чавесу за его щедрое гостеприимство; и хотя институт никогда не стремился ограничить д-ра Розенблюта одними лишь исследованиями сердца, мы были весьма рады возможности способствовать выполнению основной задачи института.
Исследования наши приняли два направления: изучение явлений проводимости и покоя в однородных проводящих средах двух и более измерений и статистическое изучение свойств проводимости случайных сетей проводящих волокон. Первое направление привело нас к наброскам теории трепетания сердца, второе — к некоторому возможному пониманию явления мерцания. Оба направления изложены в опубликованной нами статье[111]. Конечно, наши первые результаты потребовали затем значительного пересмотра. Но работу о трепетании продолжает г-н Оливер Г. Селфридж из Массачусетсского технологического института, а статистические методы, примененные при изучении сетей волокон сердечной мышцы, были распространены на нейронные сети г-ном Уолтером Питтсом, ныне стипендиатом фонда Джона Саймона Гуггенгейма. Д-р Розенблют проводит экспериментальную работу, в чем ему помогает д-р. Ф. Гарсия Рамос, сотрудник Национального института кардиологии и Мексиканской военно-медицинской школы.
В Гвадалахаре на заседании Мексиканского математического общества мы с д-ром Розенблютом доложили [c.65] часть полученных результатов. Мы сделали вывод, что наши прежние предположения о возможном сотрудничестве оказались вполне реальными. Нам повезло, и мы получили возможность изложить наши результаты большой аудитории слушателей. Весной 1946 г. д-р Мак-Каллох договорился с фондом Джосайи Мейси об организации первого из совещаний по вопросам обратной связи, которые должны были состояться в Нью-Йорке. Эти совещания проводились в соответствии с традициями фонда Мейси. Организацией совещаний занимался по поручению фонда д-р Фрэнк Фремонт-Смит, разработавший весьма эффективный порядок. Предполагалось собирать небольшую — не свыше, скажем, двадцати человек — группу специалистов по различным связанным между собой отраслям науки, чтобы эти специалисты проводили вместе пару дней в постоянном общении на неофициальных докладах, дискуссиях и совместных обедах; группа будет собираться до тех пор, пока ее члены не преодолеют своих разногласий и преуспеют в выработке общего мнения. Основным ядром наших собраний была группа, сложившаяся в Принстоне в 1944 г.; однако доктора Мак-Каллох и Фремонт-Смит, правильно оценив возможность психологических и социологических применений наших идей, включили в группу ряд ведущих психологов, социологов и антропологов. Необходимость привлечения к работе психологов была очевидна с самого начала. Кто изучает нервную систему, не может забывать о мышлении, а кто изучает мышление, обязан постоянно помнить о нервной системе. Значительная часть психологии прошлого, по существу, была не чем иным, как физиологией внешних органов чувств; а комплекс идей, вносимых в психологию кибернетикой, затрагивает в первую очередь анатомию и физиологию высокоспециализированных областей коры головного мозга, связанных с этими внешними органами чувств. С самого начала мы догадывались, что проблема восприятия гештальта[112], или иначе говоря, проблема образования обобщений при [c.66] восприятии, имеет тот же характер. Каков механизм, при помощи которого мы опознаем квадрат как квадрат, независимо от его положения, размеров и ориентации? Чтобы помочь нам в таких вопросах и, в свою очередь, получить информацию о возможных применениях наших концепций в своей области, среди нас присутствовали психологи: проф. Клювер из Чикагского университета, покойный д-р Курт Левин из Массачусетсского технологического института и д-р М. Эриксон из Нью-Йорка.
Что касается социологии и антропологии, то очевидно, что информация и связь как механизмы организации действуют не только в индивидууме, но и в обществе. Совершенно невозможно понять устройство таких социальных систем, как муравейник, без подробного анализа их средств связи; здесь нам очень пригодилась помощь, которую оказал д-р Шнейрла. При рассмотрении аналогичных проблем, касающихся организации человеческого общества, мы обращались к антропологам д-ру Бейтсону и д-ру Маргарите Мид. Д-р Моргенштерн из Института высших исследований был нашим консультантом в той важной области социальной организации, которая связана с экономическими вопросами. Между прочим, его очень ценная книга по теории игр, написанная им совместно с д-ром фон Нейманом, принадлежит к наиболее интересным исследованиям социальной организации[113]. Методы, которыми это исследование выполнено, тесно связаны с методами кибернетики, хотя и отличны от них. Д-р Левин и другие представляли новое направление в теории изучения общественного мнения и практике его формирования, а д-р Нортроп интересовался анализом философского значения нашей работы.
Это, однако, не составляет полного списка нашей группы. Расширяя группу, мы пополнили ее также новыми инженерами и математиками (Бигелоу и Сэведж), новыми нейроанатомами и нейрофизиологами (фон Бонин и Ллойд) и т. д. Наше первое совещание, состоявшееся весной 1946 г., было посвящено в основном ознакомительным докладам бывших участников [c.67] Принстонского совещания и общей оценке новой области всеми присутствующими. Мнение совещания было следующим. Идеи кибернетики достаточно важны и интересны, и имеет смысл устраивать такие совещания каждые полгода. Перед ближайшим совещанием надо устроить небольшой семинар для лиц, обладающих меньшей математической подготовкой, и объяснить им как можно проще существо используемых математических понятий.
Летом 1946 г., воспользовавшись поддержкой Рокфеллеровского фонда и гостеприимством Национального института кардиологии, я возвратился в Мексику, чтобы продолжить нашу совместную с д-ром Розенблютом работу. На сей раз мы решили взять неврологическую задачу, непосредственно затрагивающую вопросы обратной связи, и посмотреть, чего здесь можно добиться экспериментальным путем. В качестве подопытного животного мы выбрали кошку и решили изучать у нее четырехглавую мышцу — разгибатель бедра. Мы перереза́ли место прикрепления мышцы, присоединяли ее под известным напряжением[114] к рычагу и записывали ее сокращения в изометрических и в изотонических условиях. Для записи электрических изменений в самой мышце мы пользовались осциллографом. Обычно мы работали с кошкой, которая была сначала децеребрирована под эфирным наркозом, а затем превращена в спинномозговой препарат перерезкою спинного мозга на уровне груди. Во многих случаях для усиления рефлекторных реакций использовался стрихнин. Мышца нагружалась до тех пор, пока легкое надавливание не вызывало у нее периодических сокращений, которые на языке физиологов называются клонусом. Мы исследовали эти периодические сокращения с учетом физиологического состояния кошки, нагрузки мышцы, частоты колебаний, основного уровня, вокруг которого происходят колебания, и их амплитуды. Эти колебания мы пытались анализировать теми же методами, которыми анализировали бы механическую или электрическую систему, обнаруживающую рысканье такой же формы. Например, мы применяли методы, изложенные в книге Маккола о сервомеханизмах. [c.68]
Здесь не место обсуждать подробно значение наших результатов. Сейчас мы их проверяем и готовимся изложить для публикации. Однако установлены или весьма вероятны следующие положения: во-первых, частота клонических колебаний гораздо менее чувствительна к изменениям условий нагрузки, чем мы ожидали; во-вторых, эта частота определяется почти исключительно константами замкнутой дуги «эфферентный нерв — мышца — конечное кинестетическое тело — афферентный нерв — центральный синапс — эфферентный нерв». Эта цепь не является даже в первом приближении цепью линейных операторов относительно числа импульсов, передаваемых в секунду эфферентным нервом, но становится почти что линейной, если вместо числа импульсов взять его логарифм. Это соответствует тому обстоятельству, что огибающая раздражения эфферентного нерва весьма далека от синусоиды, но логарифм этой кривой гораздо ближе к синусоиде. Между тем в линейной колебательной системе с постоянным уровнем энергии кривая раздражения должна быть синусоидой во всех случаях, кроме множества случаев нулевой вероятности. С другой стороны, понятия проторения и торможения по своей природе являются скорее мультипликативными, чем аддитивными. Так, полное торможение означает умножение на нуль, а частичное торможение — умножение на малый множитель. С помощью понятий торможения и проторения и обсуждалась эта рефлекторная дуга[115]. Далее, синапс есть регистратор совпадений, и выходное волокно раздражается лишь тогда, когда число импульсов, поступивших на входы в течение некоторого малого времени суммации, превышает определенный порог. Если этот порог достаточно низок по сравнению с общим числом входных сигналов, то синаптический механизм служит просто для умножения вероятностей и может рассматриваться как приблизительное линейное звено лишь в логарифмической системе. Этот приблизительно логарифмический характер синаптического механизма, несомненно, связан с приблизительно логарифмическим характером закона интенсивности ощущения [c.69] Вебера—Фехнера, хотя названный закон и является лишь первым приближением.
Самое интересное — это то, что, приняв логарифмическую шкалу и использовав данные, полученные при изучении прохождения одиночных импульсов через различные звенья нервно-мышечной дуги, мы смогли получить весьма хорошее приближение к экспериментальным значениям периода клонических судорог при помощи методов, применяемых в теории сервомеханизмов для определения частоты колебаний рысканья в перерегулированных системах с обратной связью. Теоретически мы получили колебания приблизительно в 13,9 гц для условий, в которых частота экспериментально наблюдаемых колебаний изменялась от 7 до 30 гц, оставаясь, однако, большей частью в пределах от 12 до 17 гц. Учитывая условия исследования, совпадение следует считать очень хорошим.
Частота клонических судорог не является единственным важным явлением, которое мы наблюдали. Мы также встретили относительно медленное изменение основного упругого напряжения и еще более медленное изменение амплитуды. Эти явления, конечно, носят совсем нелинейный характер. Однако достаточно медленные изменения параметров линейной колебательной системы можно рассматривать в первом приближении как бесконечно медленные, а тогда на протяжении каждого этапа колебаний система ведет себя как система с постоянными параметрами. Этот метод известен в других разделах физики под названием метода вековых возмущений. Он может применяться и для изучения изменений основного уровня, и амплитуды клонуса. Эта работа еще не закончена, но ясно, что она является перспективной и обещающей.
Есть серьезные основания для следующего предположения: хотя при клонусе синхронизация главной дуги свидетельствует о ее принадлежности к двухнейронным дугам, усиление импульсов в этой дуге изменяется в одной, а может быть, и в нескольких точках, так что некоторая часть общего усиления определяется медленными, многонейронными процессами, протекающими в отделах центральной нервной системы, расположенных гораздо выше спинномозговой цепочки, ответственной за синхронизацию клонических судорог. На это [c.70] переменное усиление влияет уровень центральной активности, применение стрихнина или анестезирующих средств, децеребрация и многие другие причины.
Таковы главные результаты, доложенные д-ром Розенблютом и мною на Мейсиевском совещании осенью 1946 г. и на заседании Нью-Йоркской академии наук. Это заседание академии состоялось той же осенью и преследовало цель пропаганды кибернетики в широких массах слушателей. Хотя мы были удовлетворены нашими результатами и целиком убеждены в осуществимости работ в этом направлении, мы чувствовали, что наша совместная работа продолжалась слишком мало и проводилась в слишком стесненных обстоятельствах и что поэтому не стоило публиковать результаты без дальнейших экспериментальных подтверждений. Сейчас, летом и осенью 1947 г., мы ищем эти подтверждения, которые, впрочем, могут оказаться и опровержением.
Рокфеллеровский фонд ранее уже предоставил д-ру Розенблюту субсидию на оборудование нового лабораторного здания в Национальном институте кардиологии. Мы решили, что наступило подходящее время для нашего совместного обращения в этот фонд к д-ру Уоррену Уиверу, заведующему отделом физических наук, и д-ру Роберту Морисону, заведующему отделом медицинских наук. Помощь фонда дала бы нам основу для длительного научного сотрудничества и тем самым позволила бы выполнять нашу программу более медленно, но более основательно. В этом нас горячо поддержали наши учреждения. Д-р Джордж Гаррисон, декан отделения точных наук, был главным представителем Массачусетсского технологического института во время этих переговоров, а д-р Игнасио Чавес выступал от имени Национального института кардиологии. Во время переговоров выяснилось, что лабораторный центр нашей совместной работы следует организовать в Национальном институте кардиологии, так как, во-первых, это позволяло избежать дублирования лабораторного оборудования и, во-вторых, Рокфеллеровский фонд был весьма заинтересован в развитии научных центров в Латинской Америке. Наконец, был принят план на пять лет, в течение которых я должен был проводить по шести месяцев каждый второй год в Национальном [c.71] институте кардиологии, а д-р Розенблют — по шести месяцев в Массачусетсском технологическом институте все остальные годы. Время пребывания в Национальном институте кардиологии предполагалось посвятить получению и разъяснению экспериментальных данных, относящихся к кибернетике, а остальное время — изысканиям более теоретического характера и, самое главное, исключительно трудной задаче составления программы подготовки для людей, желающих работать в этой новой области. Необходимо было, чтобы эта программа обеспечивала им приобретение необходимых математических, физических и технических знаний и наряду с этим надлежащее знакомство с методами биологии, психологии и медицины.
Весной 1947 г. д-р Мак-Каллох и г-н Питтс сделали работу, имеющую большое значение для кибернетики. Перед д-ром Мак-Каллохом стояла задача сконструировать аппарат, дающий возможность слепому воспринимать печатный текст на слух. Получение звуков разных тонов от разных букв через посредство фотоэлементов — давно известная вещь. Осуществить ее можно многими способами. Основная трудность заключается в том, чтобы получить один и тот же звук для букв данной формы, независимо от их величины. Это точный аналог задачи восприятия формы, или гештальта, восприятия, позволяющего нам опознавать квадрат как квадрат, независимо от бесчисленных изменений размера и ориентации. Прибор Мак-Каллоха обеспечивал избирательное чтение печатной буквы при различных ее увеличениях. Такое избирательное чтение может выполняться автоматически посредством процесса развертки. Идея развертки, позволяющей производить сравнение между исследуемой фигурой и данной стандартной фигурой фиксированного, но совсем другого размера, уже предлагалась мною на одном из Мейсиевских совещаний. Схема прибора, осуществляющего избирательное чтение, привлекла внимание д-ра фон Бонина, который тут же спросил: «Это схема четвёртого слоя зрительной коры головного мозга?» Основываясь на этой идее, д-р Мак-Каллох с помощью г-на Питтса разработал теорию, связывающую анатомию и физиологию зрительной коры головного мозга. В этой теории операция развертки по некоторому множеству [c.72] преобразований играет большую роль. Указанная теория была доложена весной 1947 г. на Мейсиевском совещании и на заседании Нью-йоркской академии наук.
Упомянутый процесс последовательного перебора занимает определенный период времени, соответствующий так называемому «времени развертки» в обычном телевидении. Различные анатомические соображения позволяют определить этот период по длине цепочки последовательных синапсов, необходимых для осуществления одного цикла работы. Эти соображения дают время порядка одной десятой секунды для полного завершения цикла операций, что приблизительно равно периоду так называемого «альфа-ритма» головного мозга. Между прочим, совершенно другие соображения уже давно говорили за то, что альфа-ритм связан со зрительным восприятием и играет важную роль в процессе восприятия формы.
Весной 1947 г. я получил приглашение принять участие в математической конференции в Нанси (Франция) по проблемам гармонического анализа. Я принял его и по пути в Нанси и обратно провел в целом около трех недель в Англии в гостях у моего старого друга проф. Дж. Б.С. Холдэйна. Это был прекрасный случай встретиться с большинством специалистов, работавших по сверхбыстрым вычислительным машинам, особенно в Манчестере и в Национальной физической лаборатории в Теддингтоне. Но больше всего я был ряд возможности побеседовать в Теддингтоне об основных идеях кибернетики с г-ном Тьюрингом. Я посетил также Психологическую лабораторию в Кембридже и имел возможность обсудить подробно работу, которую вели проф. Ф.К. Бартлетт и его сотрудники. Они занимались оценкой человеческого фактора в управляющих системах, содержащих такой фактор. Я нашел, что в общем в Англии так же сильно интересуются кибернетикой и так же хорошо разбираются в ней, как и в Соединенных Штатах, и что инженерно-технические работы поставлены превосходно, хотя и ограничены в масштабах из-за меньших размеров выделенных средств. Я обнаружил большой интерес к кибернетике и большое понимание ее возможностей у многих, а профессора Холдэйн, X. Леви и Бернал смотрели на нее совершенно определенно, как на один из самых актуальных вопросов, [c.73] стоящих перед наукой и научной философией. Однако в деле объединения всей этой области и сближения друг с другом различных линий научно-исследовательской работы я не обнаружил такого продвижения, как у нас, в Штатах.
Во Франции, на конференции по гармоническому анализу в Нанси, был сделан ряд докладов, в которых статистические понятия соединялись с понятиями из техники связи совершенно в духе идей кибернетики. В особенности должны быть упомянуты г-н Блан-Лапьерр и г-н Лоэв. Я обнаружил также, что этой темой весьма интересуются математики, физиологи и физико-химики, особенно в связи с ее термодинамическими аспектами, затрагивающими более общую проблему природы самой жизни. Между прочим, когда венгерский биохимик проф. Сент-Дьёрдьи обсуждал со мной эти вопросы в Бостоне еще до моего отъезда, оказалось, что его взгляды вполне гармонируют с моими.
Еще одно событие во время моего пребывания во Франции заслуживает здесь особого упоминания. Мой коллега проф. Дж. де Саптильяна из Массачусетсского технологического института познакомил меня с г-ном Фрейманом из издательской фирмы «Герман и Ко», и г-н Фрейман предложил мне издать настоящую книгу. Я был очень рад его предложению, так как г-н Фрейман — мексиканец, а эта книга писалась в Мексике и значительная часть подготовительной научной работы проводилась также в Мексике.
Как уже упоминалось выше, одно из направлений работы, наметившихся на Мейсиевских совещаниях, касалось значения, которое могут иметь понятия и методы теории связи при изучении общественной системы. Нет сомнения, что общественная система является организованным целым, подобно индивидууму; что она скрепляется в целое системой связи; что она обладает динамикой, в которой круговые процессы обратной связи играют важную роль. Это относится как к общим вопросам антропологии и социологии, так и к более специальным вопросам экономики. В частности, весьма важная работа фон Неймана и Моргенштерна, о которой мы уже говорили, относится к этому кругу идей. На этом основании д-р Грегори Бейтсон и д-р Маргарита Мид убеждали меня, ввиду крайне неотложного [c.74] характера социально-экономических проблем в наш век беспорядка, посвятить значительную часть моих сил обсуждению этой стороны кибернетики.
Однако при всей солидарности с их уверенностью, что ситуация не терпит промедления, и при всей надежде, что они и другие компетентные работники займутся проблемами такого рода (эти проблемы обсуждаются в последней главе настоящей книги), я не могу разделить ни их мнения, что мне следует заниматься этими вопросами в первую очередь, ни их надежд, что в этом направлении можно добиться результатов, которые оказали бы ощутимое терапевтическое действие на теперешние болезни общества. Начать с того, что основные величины, действующие на общество, не только являются статистическими, но более того, определяются чрезвычайно короткими статистическими рядами. Что толку объединять данные об экономике сталелитейной промышленности до и после введения бессемеровского процесса или сравнивать статистику производства резины до и после расцвета автомобильной промышленности и культивации гевеи в Малайе? Точно так же нет глубокого смысла собирать статистику венерических заболеваний, в одной таблице, охватывающей период до и после введения сальварсана, если только специально не имеется в виду выяснить эффективность лекарства. Для хорошей статистики общества нужно собирать данные в течение длительного отрезка времени при существенно постоянных условиях, как для хорошего разрешения света нужен объектив с большим отверстием диафрагмы. Эффективное отверстие диафрагмы не возрастает заметно с увеличением ее номинального отверстия, если только объектив не сделан из столь однородного материала, что задержка света при прохождении различных частей объектива соответствует нужным теоретическим значениям с точностью до малой доли длины волны. Подобно этому, долговременные статистические ряды, составленные при весьма изменчивых условиях, дают лишь кажущуюся, ложную точность.
Итак, гуманитарные науки — убогое поприще для новых математических методов. Настолько же убогой была бы статистическая механика газа для существа с размерами того же порядка, что и молекула. Флюктуации, [c.75] которые мы игнорируем с более широкой точки зрения, представляли бы для него как раз наибольший интерес. Более того, при отсутствии надежной стандартной методики расчетов роль суждения эксперта в оценке социологических, антропологических и экономических факторов настолько велика, что новичку, еще не приобретшему огромного опыта, свойственного обычно эксперту, здесь нечего делать. Замечу в скобках, что современный аппарат теории малых выборок, как только он выходит за рамки простого подсчета своих собственных, специально определенных параметров и превращается в метод положительных статистических выводов для новых случаев, уже не внушает мне никакого доверия. Исключение составляет случай, когда этот аппарат применяется статистиком, который явно знает или хотя бы неявно чувствует основные элементы динамики исследуемой ситуации.
Я говорил только что об области, в которой мои надежды на кибернетику являются довольно умеренными ввиду существования ограничений на данные, которые мы хотим получить. Однако имеются две области, где, по моему мнению, можно добиться практических результатов с помощью кибернетических идей, но где для этого еще потребуются дальнейшие исследования. Одна из них — протезирование утерянных или парализованных конечностей. Как мы видели при обсуждении гештальта, идеи техники связи уже применялись Мак-Каллохом к проблеме замены утраченных органов чувств, когда он строил прибор, который бы позволил слепому читать печатный текст на слух. Здесь важно, что прибор Мак-Каллоха берет на себя в совершенно явной форме не только функции глаза, но и некоторые функции зрительной области коры головного мозга. Очевидно, нечто подобное возможно и в случае искусственных конечностей. Потеря части конечности означает не только потерю чисто пассивной опоры, доставляемой потерянной частью как механическим продолжением уцелевшей части, и не только потерю способности сокращения соответствующих мышц. Она означает также потерю всех кожных и кинестетических ощущений, возникавших в потерянной части. Первые две потери протезист в настоящее время пытается заменить. Замена третьей пока что была вне его возможностей. В случае [c.76] простой деревянной ноги это не имеет значения: брусок, заменяющий утраченную конечность, не обладает собственными степенями свободы, и кинестетический механизм культи вполне достаточен для регистрации положения и скорости протеза. Иное дело — шарнирный протез с подвижным коленом и лодыжкой, который при ходьбе выбрасывается протезируемым вперед с помощью оставшейся мускулатуры. В этом случае у протезируемого нет достаточных сведений о положении и скорости частей протеза, и протезируемый ступает по неровному грунту неуверенно. Снабдить искусственные суставы и подошву искусственной ступни датчиками натяжения или давления, действующими электрически или как-либо иначе (например, через вибраторы) на нетронутые участки кожи, — это вряд ли непреодолимая трудность. Существующие протезы устраняют некоторые ограничения подвижности, вызванные ампутацией, но оставляют атаксию. Применение подходящих рецепторов позволило бы устранить в значительной степени и атаксию, так что протезируемый мог бы выработать, например, такие рефлексы, которыми все мы пользуемся при управлении автомобилем. Это позволило бы ему ходить гораздо увереннее. Все сказанное о ноге можно применить с еще большим основанием к руке. Рисунок человека в разрезе, знакомый всем читателям книг по неврологии, показывает, что сенсорная потеря при удалении одного только большого пальца руки намного больше, чем при удалении ноги даже до тазобедренного сустава.
Эти доводы я пытался изложить соответствующим авторитетам, но до сего времени мало чего добился. Не знаю, высказывались ли подобные идеи кем-либо раньше, как и не знаю, проводилась ли их проверка и не были ли они отвергнуты за технической неосуществимостью. Если они еще не получили надлежащего практического рассмотрения, то, по всей видимости, получат таковое в ближайшем будущем.
Перейдем теперь к другому вопросу, заслуживающему, по моему мнению, внимания. Для меня давно сделалось ясно, что современная сверхбыстрая вычислительная машина в принципе является идеальной центральной нервной системой для устройств автоматического управления. Ее входные и выходные сигналы не обязательно [c.77] должны иметь вид чисел или графиков, а могут быть также показаниями искусственных органов чувств, например фотоэлементов или термометров, и соответственно сигналами для двигателей и соленоидов. Тензометры и другие подобные средства позволяют наблюдать работу таких двигательных органов и, замыкая обратную связь, передавать эти наблюдения в центральную управляющую систему как искусственные кинестетические ощущения. С помощью этих средств мы уже в состоянии построить искусственные машины почти со сколь угодно сложным поведением. Еще задолго до Нагасаки и до того, как общественности стало известно о существовании атомной бомбы, мне пришла мысль, что мы стоим перед лицом другой социальной силы, несущей неслыханные возможности для добра и для зла. Заводы-автоматы, сборочные конвейеры без рабочих появятся так скоро, как только мы решим затратить на них столько же усилий, сколько мы, например, затратили на развитие техники радиолокации во время II мировой войны[116].
Я сказал, что это новое развитие техники несет неограниченные возможности для добра и для зла. С одной стороны, оно делает метафорическое господство машин, о котором фантазировал Сэмьюэл Батлер[117], самой непосредственной и неметафорической проблемой. Оно дает человеческой расе новый, весьма эффективный набор механических рабов для несения ее трудов. Такой механический труд обладает многими экономическими качествами рабского труда, хотя, в отличие от последнего, он свободен от деморализующего влияния [c.78] человеческой жестокости. С другой стороны, всякий труд, принимающий условия конкуренции с рабским трудом, принимает и условия рабского труда, а тем самым становится по существу рабским. В этой формуле главное понятие — конкуренция. Быть может, для человечества было бы хорошо, если бы машины избавили его от необходимости выполнять грязные и неприятные работы. А быть может, это было бы плохо — я не знаю. К этим новым возможностям нельзя подходить с точки зрения рынка, с точки зрения сэкономленных денег. Но как раз лозунг свободного рынка — «пятой свободы»@В 1947 г., в эпоху борьбы с фашизмом, президент Ф.Д. Рузвельт выставил лозунг «четырех свобод» (слова, совести, «от нужды», «от страха»). — Прим. ред.@ — стал лозунгом того сектора американского общественного мнения, который представлен Национальной ассоциацией промышленников и журналом «Сатердей ивнинг пост». Я говорю об американском общественном мнении потому, что как американец, знаком с ним лучше всего; но торгаши не знают национальных границ.
Быть может, исторические корни настоящего положения вещей станут яснее, если вспомнить, что I промышленная революция — революция «темных сатанинских фабрик»[118] — была обесценением человеческих рук вследствие конкуренции машин. Любая заработная плата, на которую мог бы прожить землекоп в Соединенных Штатах, будет слишком высока, чтобы позволить ему конкурировать с экскаватором. Современная промышленная революция должна обесценить человеческий мозг, по крайней мере в его наиболее простых и рутинных функциях. Разумеется, подобно тому, как квалифицированный плотник, квалифицированный механик или квалифицированный портной пережили так или иначе I промышленную революцию, квалифицированный ученый и квалифицированный администратор могут пережить и вторую. Но представим себе, что вторая революция завершена. Тогда средний человек со средними или еще меньшими способностями не сможет предложить для продажи ничего, за что стоило бы платить деньги. [c.79]
Выход один — построить общество, основанное на человеческих ценностях, отличных от купли-продажи. Для строительства такого общества потребуется большая подготовка и большая борьба, которая при благоприятных обстоятельствах может вестись в идейной плоскости, а в противном случае — кто знает как? Поэтому я счел своим долгом передать мои сведения и мое понимание положения тем, кто активно заинтересован условиями и будущим труда, т. е. профсоюзам. Я принял меры к установлению контактов с одним-двумя лицами из руководства Конгресса производственных профсоюзов. Они выслушали меня с большим пониманием и сочувствием. Более этого ни я, ни они сделать не смогли. По их мнению, как и по моим предыдущим наблюдениям и сведениям, профсоюзы и рабочее движение в Соединенных Штатах и в Англии находятся в руках группы весьма ограниченных лиц, хорошо разбирающихся в специальных вопросах деятельности цеховых старост и борьбы за заработную плату и условия работы, но совершенно не подготовленных для занятия большими политическими, техническими, социологическими и экономическими проблемами, касающимися самого существования труда. Причины ясны. Профсоюзный работник, переходя от напряженной жизни рабочего к напряженной жизни администратора, обычно лишен возможности получить широкое образование. Тех же, кто имеет такое образование, обычно не привлекает карьера профсоюзного деятеля. В свою очередь, профсоюзы, вполне естественно, не заинтересованы в приеме таких людей.
Те из нас, кто способствовал развитию новой науки — кибернетики, находятся, мягко говоря, не в очень-то утешительном моральном положении. Эта новая наука, которой мы помогли возникнуть, ведет к техническим достижениям, создающим, как я сказал, огромные возможности для добра и для зла. Мы можем передать наши знания только в окружающий нас мир, а это — мир Бельзена и Хиросимы. Мы даже не имеем возможности задержать новые технические достижения. Они носятся в воздухе, и самое большее, чего добился бы кто-либо из нас своим отказом от исследований по кибернетике, был бы переход всего дела в руки самых безответственных и самых корыстных из наших [c.80] инженеров. Самое лучшее, что мы может сделать, — это позаботиться о том, чтобы широкая публика понимала общее направление и значение этой работы, и ограничиться в своей собственной деятельности такими далекими от войны и эксплуатации областями, как физиология и психология. Как упоминалось выше, есть и такие, кто надеется, что польза от лучшего понимания человека и общества, которое дает эта новая наука, сможет предупредить и перевесить наше невольное содействие концентрации власти (которая всегда — по самим условиям своего существования — сосредоточивается в руках людей, наиболее неразборчивых в средствах). Но я пишу это в 1947 г. и должен заявить, что надежда на такой исход очень слаба.
Автор желает выразить благодарность г-ну Уолтеру Питтсу, г-ну Оливеру Селфриджу, г-ну Жоржу Дюбе и г-ну Фредерику Уэбстеру за помощь при корректировании рукописи и подготовке материала к изданию.
Национальный институт кардиологии,
г. Мехико.
Ноябрь, 1947 г. [c.81]
Есть маленький гимн или песня, знакомая каждому немецкому ребенку:
Weißt du, wieviel Sternlein stehen
An dem blauen Himmelszelt?
Weißt du, wieviel Wolken gehen
Weithin über alle Welt?
Gott, der Herr, hat sie gezählet,
Daß ihm auch nicht eines fehlet
An der ganzen, großen Zahl
В переводе это значит: «Знаешь ли ты, сколько звездочек стоит на синем шатре небес? Знаешь ли ты, сколько облаков проходит надо всем миром? Господь бог их сосчитал, чтобы не пропало у него ничего из всего огромного числа».
Эта песенка интересна для философа и для историка науки, ибо в ней сопоставляются две отрасли знания, имеющие то сходство, что в них рассматривается небесный свод, но совершенно различные во всех других отношениях: астрономия, древнейшая наука, и метеорология, одна из самых молодых наук, лишь сейчас начинающая заслуживать название науки. Обычные астрономические явления могут быть предсказаны за много веков, а точное предсказание погоды на завтра, вообще говоря, затруднительно и во многих случаях является очень грубым.
Что касается стихотворения, то на первый вопрос следует ответить, что в определенных границах мы действительно знаем, сколько звезд на небе. Оставляя в стороне мелкие спорные детали, касающиеся некоторых двойных и переменных звезд, можно сказать, что звезда — вполне определенный объект, весьма удобный для [c.82] счета и каталогизации; и если человеческий перебор[120] звезд, как мы можем назвать эти каталоги, останавливается на звездах не слишком слабой величины, то мысль о том, что некий божественный перебор может пойти в этом направлении значительно дальше, не кажется нам слишком нелепой.
Напротив, если вы попросите метеоролога дать аналогичный перебор облаков, то он рассмеется вам в лицо или, быть может, терпеливо объяснит, что в метеорологии нет понятия облака как определенного объекта, остающегося всегда более или менее тождественным самому себе, и что если бы таковое и существовало, то у него, у метеоролога, нет средств сосчитать облака, да, по существу, счет облаков его и не интересует. Метеоролог со склонностью к топологии, пожалуй, мог бы определить облако как связную область пространства, в которой плотность воды, имеющейся в твердом или жидком состоянии, превосходит некоторое значение. Но это определение не имело бы ни для кого ни малейшей ценности и описывало бы в лучшем случае весьма преходящее состояние. Метеоролога интересуют в действительности лишь статистические утверждения, например: «Бостон, 17 января 1950 г., облачность 38%, перисто-кучевые облака».
Правда, есть раздел астрономии, имеющий дело, так сказать, с космической метеорологией — исследованием галактик, туманностей, звездных скоплений и их статистики, чем занимается, например, Чандрасекар. Но это очень молодой раздел астрономии, моложе метеорологии, и он лежит несколько в стороне от основного направления классической астрономии, которая, вне рамок чистой классификации и перебора, первоначально занималась больше Солнечной системой, чем миром неподвижных звезд. Именно астрономия Солнечной системы тесно связана с именами Коперника, Кеплера, Галилея и Ньютона и явилась кормилицей современной физики.
Это действительно идеально простая наука. Даже до появления какой-либо динамической теории еще в Вавилоне понимали, что затмения происходят через правильные, предсказуемые периоды и что можно [c.83] узнать их наступление в прошлом и в будущем. Люди поняли, что и само время лучше всего измерять перемещением звезд по их путям. Моделью всех событий в Солнечной системе считалось вращение колеса или ряда колес, как в птолемеевской теории эпициклов или в коперниковской теории орбит; и в любой такой теории будущее в некоторой степени повторяло прошедшее. Музыка сфер — палиндром[121] — и книга астрономии читаются одинаково в прямом и обратном направлениях. Прямое и обратное движения планетария различаются лишь начальными положениями и направлениями перемещения светил. Наконец, когда Ньютон свел все это к формальной системе постулатов и к замкнутой механике, было установлено, что основные законы не изменяются при замене переменной времени t на —t.
Таким образом, если снять кинофильм движения планет, ускоренного так, чтобы изменения их положения были заметны, и затем пустить этот фильм в обратном направлении, то картина движения планет была бы все же возможной и согласной с механикой Ньютона. Напротив, если бы мы сняли кинофильм турбулентного движения облаков в области фронта грозы и пустили бы этот фильм в обратном направлении, то получилась бы совершенно неверная картина. Мы увидели бы нисходящие токи там, где должны быть восходящие; размеры турбулентных образований увеличивались бы; молния предшествовала бы тем изменениям строения тучи, за которыми она обычно следует, и т. д. до бесконечности.
В чем же различие природы астрономических и метеорологических явлений, вызывающее все эти особенности, и в частности то, что в астрономии время столь очевидно обратимо, а в метеорологии оно столь очевидно необратимо? Дело прежде всего в том, что метеорологическая система всегда содержит большое число приблизительно одинаковых частиц, причем некоторые из них очень тесно связаны между собой. Напротив, астрономическая, а именно Солнечная система содержит лишь сравнительно небольшое число частиц, притом [c.84] весьма различного размера и связанных между собой настолько слабо, что связи второго порядка не меняют общего характера наблюдаемой нами картины, а связи высших порядков можно совершенно не учитывать. Планеты движутся при условиях, более благоприятных обособлению некоторой ограниченной системы сил, чем условия любого физического опыта, который мы можем поставить в лаборатории. Планеты и даже Солнце по сравнению с расстояниями между ними являются настоящими точками. Упругие и пластические деформации планет настолько малы, что планеты можно считать абсолютно твердыми телами; а если даже это и не так, то во всяком случае внутренние силы планет имеют сравнительно малое значение при рассмотрении относительного движения их центров. Пространство, в котором движутся планеты, почти совершенно свободно от вещества, препятствующего их движению, а при рассмотрении взаимного притяжения планет вполне можно считать, что их массы сосредоточены в центрах и постоянны. Отклонения силы тяготения от закона обратной пропорциональности квадрату расстояния совершенно ничтожны. Положения, скорости и массы тел Солнечной системы в любой момент известны с исключительной точностью, а их будущие и прошлые положения вычисляются легко и точно — хотя бы в принципе, если и не всегда на практике. Напротив, в метеорологии число рассматриваемых частиц так велико, что точная запись их начальных положений и скоростей совершенно невозможна, а если даже и составить такую запись и вычислить будущие положения и скорости всех частиц, то мы получим лишь необозримое множество цифр, которые нужно было бы коренным образом переосмыслить, прежде чем мы смогли бы их использовать. Термины «облако», «температура», «турбулентность» и т. д. относятся не к отдельному физическому состоянию, а к распределению возможных состояний, из которых реализуется лишь одно. Если собрать все одновременные наблюдения всех метеостанций мира, то эти наблюдения не составят и одной миллиардной доли данных, необходимых для описания мгновенного состояния атмосферы в ньютонианском смысле. Они дадут лишь некоторые константы, совместимые с бесконечным числом различных атмосфер и в лучшем случае способные — при некоторых [c.85] априорных допущениях — определить в виде распределения вероятностей лишь некоторую меру на множестве возможных атмосфер. При помощи законов Ньютона или любой другой системы причинных законов мы можем предсказать на будущий момент лишь распределение вероятностей для констант метеорологической системы, причем надежность даже и этого предсказания уменьшается с увеличением времени.
Но и в ньютоновой системе, в которой время вполне обратимо, в задачах на вероятность и предсказание получаются асимметрические ответы для прошлого и будущего, потому что сами эти задачи асимметричны. Если я ставлю физический опыт, я перевожу рассматриваемую мной систему из прошлого в настоящее, фиксируя некоторые величины и считая себя вправе предполагать, что некоторые другие величины имеют известные статистические распределения. Затем я наблюдаю статистическое распределение результатов после данного промежутка времени. Этот процесс я не могу обратить. Для этого нужно было бы подобрать благоприятное распределение систем, которые без нашего вмешательства заканчивали бы свои процессы в определенных статистических пределах, и найти, каковы были условия в данный момент прежде. Но событие, при котором система, начавшая свой процесс с неизвестного состояния, заканчивает его в строго определенном статистическом диапазоне, бывает настолько редко, что мы можем считать это чудом. Очевидно, мы не можем основывать наши экспериментальные методы на ожидании и счете чудес. Говоря коротко, наше время направлено и наше отношение к будущему отлично от отношения к прошлому. Все вопросы, которые мы ставим, содержат эту асимметрию, и ответы на них также асимметричны.
Очень интересный астрономический вопрос относительно направления времени возникает в связи с астрофизическим временем. Ведь в астрофизике, при однократном наблюдении отдаленных небесных тел, опыт по своей сущности как будто не является однонаправленным. Почему же однонаправленная термодинамика, основанная на экспериментальных земных наблюдениях, оказывается столь полезной в астрофизике? Ответ на этот вопрос довольно интересный и не такой простой. Мы наблюдаем звезды через посредство лучей или [c.86] частиц света, исходящих от наблюдаемого объекта и воспринимаемых нами. Мы можем воспринимать приходящий свет, но не можем воспринимать уходящий свет. По крайней мере, восприятия уходящего света нельзя добиться таким же простым и непосредственным экспериментом, как восприятия приходящего света. Мы воспринимаем приходящий свет при помощи глаза или фотографической пластинки. Мы подготавливаем их для восприятия образов, изолируя их от прошлого в течение некоторого времени: мы смотрим предварительно в темноту, чтобы устранить следы предшествующих образов, и завертываем пластинки в черную бумагу во избежание засвечивания. Очевидно, только такие глаза и такие пластинки могут быть пригодны; сохранять предыдущие образы — все равно, что быть слепым, и если бы нам нужно было завертывать пластинки в черную бумагу после их применения и проявлять их до применения, то фотография была бы очень трудным делом. Поэтому мы можем видеть звезды, испускающие свет для нас и для всей Вселенной, а если существуют звезды, развивающиеся в обратном направлении, они будут притягивать излучения от всех небесных светил. Но притяжение света, даже исходящего от нас, никак нельзя будет заметить, потому что мы знаем свое прошлое, но не будущее. Итак, видимая нами часть Вселенной должна иметь соотношения между прошлым и будущим, согласные с существующими на Земле, поскольку дело касается светового излучения. Сам факт, что мы видим звезду, означает, что ее термодинамика подобна нашей термодинамике.
Очень интересный мысленный опыт — вообразить разумное существо, время которого течет в обратном направлении по отношению к нашему времени. Для такого существа никакая связь с нами не была бы возможна. Сигнал, который оно послало бы нам, дошел бы к нам в логическом потоке следствий — с его точки зрения — и причин — с нашей точки зрения. Эти причины уже содержались в нашем опыте и служили бы нам естественным объяснением его сигнала без предположения о том, что разумное существо послало сигнал. Если бы оно нарисовало нам квадрат, остатки квадрата представились бы нам предвестниками последнего, и квадрат казался бы нам любопытной кристаллизацией этих [c.87] остатков, всегда вполне объяснимой. Его значение казалось бы нам столь же случайным, как те лица, которые представляются нам при созерцании гор и утесов. Рисование квадрата показалось бы нам катастрофической гибелью квадрата — внезапной, но объяснимой естественными законами. У этого существа были бы такие же представления о нас. Мы можем сообщаться только с мирами, имеющими такое же направление времени.
Вернемся к различию между ньютоновой астрономией и метеорологией. Большинство наук занимает промежуточное положение между ними, но ближе к метеорологии, чем к астрономии. Да и астрономия, как мы видели, включает в себя космическую метеорологию. Она включает также чрезвычайно интересную область, которую изучал сэр Джордж Дарвин, известную под наименованием теории приливной эволюции. Мы сказали, что можно рассматривать относительные движения Солнца и планет как движения твердых тел, но это не совсем так. Земля, например, большей частью покрыта океанами. Вода, расположенная ближе к Луне, чем центр Земли, притягивается Луной сильнее, чем твердая часть Земли, а вода, расположенная на другой стороне, — слабее. Вследствие этого, сравнительно небольшого воздействия вода образует два возвышения: одно — под Луной, другое — в противоположном пункте. На совершенно жидкой сфере эти возвышения следовали бы за движением Луны вокруг сферы, не рассеивая значительной энергии, и поэтому оставались бы все время почти точно под Луной и в противоположном пункте. Вследствие этого они задерживали бы Луну лишь весьма незначительно и не оказывали бы большого влияния на ее угловое положение на небосводе. Но приливная волна, образуемая ими на Земле, задерживается на берегах и в мелких морях, таких, например, как Берингово море и Ирландское море. Поэтому приливная волна отстает от Луны, причем силы, вызывающие отставание, в основном суть турбулентные, диссипативные силы, весьма сходные с силами, наблюдаемыми в метеорологии, и они требуют статистического подхода. По существу океанографию можно назвать метеорологией — но не атмосферы, а гидросферы.
Эти силы трения задерживают Луну в ее движении вокруг Земли и ускоряют вращение Земли. Они стремятся [c.88] приблизить друг к другу продолжительности месяца и дня. Действительно, день Луны — месяц, и Луна всегда повернута к Земле почти одной и той же стороной. Высказывалось предположение, что это произошло вследствие давней приливной эволюции, когда на Луне имелась или жидкость, или газ, или пластическое вещество, которые подвергались притяжению Земли и при этом рассеивали большое количество энергии. Явление приливной эволюции не ограничивается Луной и Землей, его можно наблюдать в некоторой степени во всех гравитационных системах. В прошедшие эпохи приливы значительно изменили облик Солнечной системы, хотя за время, сравнимое с историческим периодом, это изменение было незначительным по сравнению с движением планет Солнечной системы как твердых тел.
Итак, даже гравитационная астрономия связана с задерживающими процессами трения. Нет ни одной науки, которая полностью подчинялась бы концепции Ньютона. В биологических науках, бесспорно, однонаправленные явления господствуют. Рождение не есть процесс, в точности противоположный смерти. Анаболизм — образование тканей — не является точной противоположностью катаболизму — их разрушению. Деление клеток, так же как соединение зародышевых клеток при оплодотворении яйца, происходит по схеме, которая не симметрична во времени. Индивидуум — стрела, устремленная во времени в одном направлении, и раса точно так же направлена из прошлого в будущее. Палеонтологическая летопись указывает для большого промежутка времени на определенную тенденцию развития, часто прерываемую и запутанную, но идущую от простого к сложному. К середине прошлого столетия эта тенденция стала очевидной для всех честных, непредубежденных ученых, и не случайно задача открытия ее механизма была решена благодаря одной и той же великой догадке почти одновременно двух ученых: Чарлза Дарвина и Альфреда Уоллеса. Эта догадка состояла в том, что простое случайное изменение особей вида может вылиться в развитие, идущее более или менее по одной или немногим направлениям для каждой линии, благодаря различным степеням жизнеспособности разных изменений с точки зрения особи или вида. Собака, вследствие мутации оказавшаяся без ног, конечно, [c.89] погибнет, а длинная, тонкая ящерица, развившая у себя механизм ползания на ребрах, может выжить, если ее тело гладко и не имеет выступающих членов. Водное животное — рыба, ящерица или млекопитающее — будет плавать лучше при веретенообразной форме тела и наличии сильных мышц и захватывающего воду заднего придатка. Если оно добывает пищу погоней за быстрыми животными, то шансы его выживания, возможно, будут определяться тем, что его тело получит такое строение.
Дарвиновская эволюция, таким образом, представляет собой некоторый механизм, при помощи которого более или менее случайные изменения комбинируются в весьма определенную структуру. Принцип Дарвина остается справедливым и в настоящее время, хотя мы знаем гораздо лучше механизм, лежащий в его основе. Работа Менделя дала нам значительно более точное и последовательное представление о наследственности, чем то, которое было у Дарвина, а идея мутации со времени Де Фриза совершенно изменила наше понимание статистической основы мутации. Мы изучили тонкую анатомию хромосомы и локализовали в ней ген. Список современных генетиков большой и включает выдающихся ученых. Некоторые из них, например Холдэйн, сделали статистические законы менделизма эффективным орудием исследования эволюции.
Мы уже говорили о теории приливной эволюции сэра Джорджа Дарвина, сына Чарлза Дарвина. Связь идей сына с идеями отца, как и выбор названия «эволюция», не случайны. В приливной эволюции, как и в происхождении видов, мы встречаемся с механизмом, который преобразует динамическим путем случайные изменения, а именно случайные движения волн и молекул воды при приливе, в однонаправленное развитие. Теория приливной эволюции есть не что иное, как теория Дарвина-старшего в применении к астрономии.
Третий представитель династии Дарвинов, сэр Чарлз, является одним из авторитетов в современной квантовой механике. Этот факт может показаться случайным, но тем не менее он означает дальнейшее вторжение статистических принципов и в ньютонову механику. Последовательность имен Максвелл—Больцман—Гиббс характеризует все большее сведение [c.90] термодинамики к статистической механике, т. е. сведение явлений, связанных с теплотой и температурой, к явлениям, при рассмотрении которых ньютонова механика применяется не к одиночной динамической системе, а к статистическому распределению динамических систем, и выводы относятся не ко всем таким системам, но к их подавляющему большинству. К 1900 г. стало очевидно, что в термодинамике имеются серьезные упущения, в частности, когда речь шла об излучении. Закон Планка показал, что эфир поглощает излучения высокой частоты в значительно меньшей степени, чем это допускалось всеми существовавшими тогда механическими теориями излучения. Планк предложил квазиатомистическую теорию излучения — квантовую теорию, которая достаточно удовлетворительно объясняла эти явления, но расходилась со всей остальной физикой. После этого Нильс Бор предложил теорию атома, также построенную ad hoc[122]. Таким образом, Ньютон и Планк—Бор составили соответственно тезис и антитезис гегелевой антиномии. Синтезом является статистическая теория, открытая Гейзенбергом в 1925 г., в которой статистическая ньютонова динамика Гиббса заменена статистической теорией, весьма близкой к теории Ньютона и Гиббса для макроскопических явлений, но в которой полное собрание данных для прошлого и настоящего позволяет предсказать будущее лишь статистически. Поэтому не будет слишком смелым сказать, что не только ньютонова астрономия, но и ньютонова физика стала ареной усредненных результатов статистической ситуации и, следовательно, рассказом об эволюционном процессе.
Этот переход от ньютонова обратимого времени к гиббсову необратимому получил философские отклики. Бергсон подчеркнул различие между обратимым временем физики, в котором не случается ничего нового, и необратимым временем эволюции и биологии, в котором всегда имеется что-нибудь новое. Догадка, что ньютонова физика не составляла подходящей основы для биологии, была, пожалуй, главным вопросом в старом споре между витализмом и механицизмом, хотя этот спор осложнялся еще желанием сохранить в той или иной форме хотя бы тени души и бога от атак материализма. [c.91] В конце концов, как мы видели, витализм доказал слишком много. Вместо сооружения стены между требованиями жизни и требованиями физики была воздвигнута стена, заключающая столь обширную территорию, что и материя, и жизнь оказались внутри нее. Истина в том, что материя новейшей физики не есть материя Ньютона. Но она также очень далека от антропоморфических представлений виталистов. Случайность в квантовой теории — не то, что нравственная свобода у блаженного Августина, и Тиха — столь же неумолимая владычица, как Ананка[123].
Идеи каждой эпохи отражаются в ее технике. Инженерами древности были землемеры, астрономы и мореплаватели; инженерами XVII и начала XVIII столетия — часовщики и шлифовальщики линз. Как и в древности, ремесленники создавали свои инструменты по образу небесных светил. Ведь часы не что иное, как карманный планетарий, движущийся в силу необходимости, подобно небесным сферам, а если в часах играет некоторую роль трение и рассеяние энергии, то это явления нужно устранить, чтобы движение стрелок было по возможности периодическим и правильным. Основным практическим результатом этой техники, основанной на идеях Гюйгенса и Ньютона, была эпоха мореплавания, когда впервые стало возможно вычислять долготы с приемлемой точностью, и торговля с заокеанскими странами, бывшая чем-то случайным и рискованным, превратилась в правильно поставленное предприятие. Это была техника коммерсантов.
Купца сменил фабрикант, а место хронометра заняла паровая машина. От машины Ньюкомена почти до настоящего времени основной областью техники было исследование первичных двигателей. Тепло было превращено в полезную энергию вращения и поступательного движения, а физика Ньютона была дополнена физикой Румфорда, Карно и Джоуля. Появилась термодинамика — наука, в которой время, по существу, необратимо; и хотя на первых шагах эта наука, по-видимому, представляла собой область мышления, почти не имевшую точек соприкосновения с ньютоновой [c.92] динамикой, однако теория сохранения энергии и последующее статистическое истолкование принципа Карно, или второго закона термодинамики, или принципа вырождения энергии, — этого принципа, на основании которого максимальный коэффициент полезного действия, достижимый для паровой машины, зависит от рабочих температур котла и конденсатора, — все эти открытия привели к слиянию термодинамики и ньютоновой динамики в одну науку, взятую соответственно в ее статистическом и нестатистическом аспектах.
Если XVII столетие и начало XVIII столетия — века часов, а конец XVIII и все XIX столетие — века паровых машин, то настоящее время есть век связи и управления. В электротехнике существует разделение на области, называемые в Германии техникой сильных токов и техникой слабых токов, а в США и Англии — энергетикой и техникой связи. Это и есть та граница, которая отделяет прошедший век от того, в котором мы сейчас живем. В действительности техника связи может иметь дело с токами любой силы и с двигателями большой мощности, способными вращать орудийные башни; от энергетики ее отличает то, что ее в основном интересует не экономия энергии, а точное воспроизведение сигнала. Этим сигналом может быть удар ключа, воспроизводимый ударом приемного механизма в телеграфном аппарате на другом конце линии, или звук, передаваемый и принимаемый через телефонный аппарат, или поворот штурвала, принимаемый в виде углового положения руля. Техника связи началась с Гаусса, Уитстона и первых телеграфистов. Она получила первую достаточно научную трактовку у лорда Кельвина, после повреждения первого трансатлантического кабеля в середине прошлого столетия. С 80-х годов, по-видимому, больше всего сделал для приведения ее в современный вид Хевисайд. Изобретение и использование радиолокации во II мировой войне, наряду с требованиями управления зенитным артиллерийским огнем, привлекло в эту область большое число квалифицированных математиков и физиков. Чудеса автоматической вычислительной машины принадлежат к тому же кругу идей — идей, которые, бесспорно, никогда еще не разрабатывались так интересно, как сейчас.
На всех ступенях развития техники со времени [c.93] Дедала и Герона Александрийского людей интересовала возможность создания машин, подражающих живому организму. Это стремление к созданию и изучению автоматов всегда выражалось на языке существовавшей в данное время техники. В дни магии мы встречаем причудливое и зловещее представление о Големе — глиняной фигуре, в которую раввин из Праги вдохнул жизнь кощунством против Неизрекаемого Имени Божия[124]. Во времена Ньютона автомат принимает вид часового музыкального ящика с фигурками на крышке, совершающими чопорные пируэты. В XIX столетии автомат — это прославленный тепловой двигатель, сжигающий горючее подобно тому, как человеческие мышцы сжигают гликоген. Наконец, современный автомат открывает двери при помощи фотоэлементов, или направляет пушки на то место, где луч радиолокатора обнаруживает самолет, или решает дифференциальное уравнение.
И автомат древних греков, и магический автомат лежат в стороне от основных линий развития современных машин, и по-видимому, не оказали большого влияния на серьезную философскую мысль. Совсем иначе обстоит дело с часовым автоматом. Эта идея действительно сыграла важную роль в ранней истории новой философии, хотя мы склонны ее игнорировать.
Начать с того, что Декарт считает низших животных автоматами, дабы не подвергать сомнению ортодоксальное христианское положение о том, что животные не имеют души, которая может быть спасена или осуждена. Вопрос о том, как действуют эти живые [c.94] автоматы. Декарт, насколько мне известно, нигде не обсуждает. Но важный родственный вопрос о способе соединения человеческой души в сфере ощущений и воли с ее материальным окружением Декарт рассматривает, хотя и весьма неудовлетворительным образом. Он считает местом этого соединения одну известную ему среднюю часть мозга — шишковидную железу. Характер соединения — является ли оно непосредственным действием духа на материю и материи на дух — ему не особенно ясен. Вероятно, он рассматривает это соединение как непосредственное действие в том и другом направлении, но он считает, что истинность человеческого опыта по отношению ко внешнему миру обусловлена благостью и справедливостью бога.
Роль, приписываемая в этом смысле богу, неясна. Либо бог полностью пассивен, и тогда объяснение Декарта ничего в действительности не объясняет, либо он активный участник, тогда гарантия, основанная на его справедливости, может состоять лишь в активном участии бога в акте ощущения. Таким образом, параллельно причинной цепи материальных явлений проходит причинная цепь, начинающаяся с акта, совершаемого богом, которым он производит в нас восприятия, соответствующие данному материальному состоянию. После такого допущения вполне естественно приписать подобному же божественному вмешательству соответствие между нашей волей и действиями, которые она, кажется нам, производит во внешнем мире. По этому пути пошли окказионалисты — Гейлинкс и Мальбранш. У Спинозы, который во многих отношениях является продолжателем этой школы, доктрина окказионализма принимает более разумную форму, в виде утверждения, что соответствие между духом и материей есть соответствие двух атрибутов, содержащихся в самом боге. Но Спиноза лишен динамического склада мышления и обращает мало внимания на механизм этого соответствия.
Из этого положения исходит Лейбниц, но мышление Лейбница динамично, в отличие от геометрического мышления Спинозы. Он заменяет пару соответствующих друг другу элементов — дух и материю — континуумом соответствующих друг другу элементов — монадами. Хотя они созданы по образу души, во многих случаях они не поднимаются до степени самосознания [c.95] совершенных душ и образуют часть того мира, который Декарт считал материей. Каждая из них живет в своем замкнутом мире, в котором имеет место совершенная причинная цепь от сотворения или от минус бесконечности во времени до неограниченно отдаленного будущего, но хотя они и замкнуты, они соответствуют друг другу благодаря предустановленной гармонии бога. Лейбниц сравнивает их с часами, которые были заведены так, что с сотворения они будут идти в такт в течение всей вечности. В отличие от часов, сделанных людьми, они не впадают в асинхронизм. Но это обусловлено чудесным и совершенным мастерством творца.
Итак, Лейбниц рассматривает мир автоматов, который, как и полагается ученику Гюйгенса, он строит по образцу часового механизма. Хотя монады и отображают одна другую, это отображение не есть перенос причинной связи от одной монады к другой. По существу, они столь же самодовлеющие или даже более самодовлеющие, чем пассивно танцующие фигурки на крышке музыкального ящика. Они не оказывают реального влияния на внешний мир и, по существу, не испытывают его влияния. Как говорит Лейбниц, монады «не имеют окон». Наблюдаемая нами организация мира представляет собой нечто среднее между вымыслом и чудом. Монада — это ньютонова Солнечная система в миниатюре.
В XIX в. автоматы, построенные человеком, и другие, естественные автоматы — животные и растения в представлении материалистов — изучаются в совершенно другом разрезе. Руководящие принципы этого века — сохранение и вырождение энергии. Живой организм — это прежде всего тепловой двигатель, сжигающий глюкозу, гликоген или крахмал, жиры и белки, которые превращаются в двуокись углерода, воду и мочевину. Внимание сосредоточено на метаболическом балансе, и если обращали внимание на низкие рабочие температуры мышц животного в противоположность высоким рабочим температурам теплового двигателя с таким же коэффициентом полезного действия, то от этого факта отмахивались и объясняли его тем, что в живом организме действует химическая энергия, а в машине — тепловая энергия. Все основные понятия приводились в связь с энергией, и основным из них было [c.96] понятие потенциала. Изучение механизма тела представляло собой ветвь энергетики. Такова до настоящего времени господствующая точка зрения классически мыслящих, консервативных физиологов. Общее направление мыслей таких биофизиков, как Рашевский и представители его школы, свидетельствует о живучести этих взглядов.
В настоящее время мы начинаем понимать, что тело — далеко не консервативная система и что его составные части действуют в окружении, имеющем не такую ограниченную мощность, как это считалось. Электронная лампа показала нам, что система с внешним источником энергии, которая почти вся тратится впустую, может быть очень эффективным средством выполнения нужных операций, особенно если она работает на низком энергетическом уровне. Мы начинаем понимать, что такие важные элементы, как нейроны — атомы нервной системы нашего тела — совершают свою работу примерно при таких же условиях, как электронные лампы, получая свою сравнительно небольшую энергию извне от кровообращения, и что энергия не является основным фактором при учете их работы. Короче говоря, в наше время исследование автоматов — из металла или из плоти — представляет собой отрасль техники связи, и фундаментальными понятиями являются понятия сообщения, количества помех, или «шума» (термин, перенятый у инженера-телефониста), количества информации, методов кодирования и т. д.
При таком исследовании мы рассматриваем автоматы, эффективно связанные с внешним миром не только потоком энергии или метаболизмом, но также потоком впечатлений — приходящих сообщений — и действий — исходящих сообщений. Органы, воспринимающие впечатления, эквивалентны органам чувств человека и животных. Таковы фотоэлектрические элементы и другие световые приемники; радиолокационные системы, принимающие свои собственные короткие электромагнитные волны; приборы для регистрации потенциала водородных ионов, подобные органам осязания; термометры, манометры, различного рода микрофоны и т. д. Исполнительными органами могут быть электрические двигатели, соленоиды, нагревательные катушки и другие самые разнообразные приборы. Между [c.97] воспринимающими, или чувствительными, органами и исполнительными органами находится промежуточная группа элементов. Их функция — объединять приходящие впечатления таким образом, чтобы вызвать желательную реакцию в исполнительных органах. Это — центральная система управления. Информация, поступающая в эту центральную управляющую систему, очень часто содержит информацию о работе самих исполнительных органов. Дающие эту информацию элементы соответствуют, между прочим, кинестетическим органам и другим проприоцепторам нервной системы человека, ибо человек также имеет органы, регистрирующие положение сустава или степень сокращения мышцы и т. д. Кроме того, информация, принимаемая автоматом, не обязательно должна использоваться немедленно, но может быть задержана или запасена, чтобы ее можно было использовать когда-нибудь в будущем. Это свойство аналогично памяти. Наконец, пока автомат работает, правила его действия могут изменяться на основании данных, прошедших раньше через его воспринимающие органы. Это напоминает процесс обучения.
Машины, о которых мы сейчас говорим, — отнюдь не мечта сенсуалиста и не предположение об отдаленном будущем. Они уже существуют в виде термостатов, автоматических гирокомпасных систем управления кораблем, самолетов-снарядов, особенно самонаводящихся, систем управления артиллерийским зенитным огнем, автоматических крекинговых установок, сверхбыстрых вычислительных машин и т. п. Такие машины стали применяться задолго до войны — по существу регулятор старинной паровой машины также относится к ним, — но широкая механизация во время II мировой войны привела к их полному развитию, а необходимость управления необыкновенно разрушительной энергией атома вызовет, вероятно, еще большее их усовершенствование. Почти каждый месяц появляется новая книга об этих так называемых следящих системах, или сервомеханизмах. Наше столетие является в такой же мере веком следящих систем, как XIX столетие было веком паровой машины, а XVIII столетие — веком часов.
Итак, многие нынешние автоматы имеют связь с внешним миром, выражающуюся как в восприятии [c.98] впечатлений, так и в выполнении действий. Они содержат органы чувств, исполнительные органы и какой-то эквивалент нервной системы, объединяющий передачу информации от первых ко вторым. Их вполне можно описывать при помощи физиологических терминов. Неудивительно, что автоматы и физиологические системы можно охватить одной теорией.
Отношение этих механизмов ко времени требует тщательного изучения. Понятно, что зависимость между входом и выходом является последовательной во времени и предполагает определенный порядок перехода от прошлого к будущему. Но, пожалуй, не столь очевидно, что теория чувствующих автоматов является статистической. Нас вряд ли может интересовать работа устройства связи с одним-единственным входным сигналом. Чтобы соответствовать своему назначению, такое устройство должно работать удовлетворительно для целого класса входных сигналов, прием которых статистически возможен. Поэтому его нужно изучать на основе статистической механики Гиббса, а не классической механики Ньютона. Мы рассмотрим этот вопрос подробнее в главе, посвященной теории связи.
Итак, современный автомат существует в таком же бергсоновом времени, как и живой организм. Поэтому соображения Бергсона о том, что деятельность живого организма по существу отлична от деятельности автомата этого типа, необоснованны. Витализм выиграл спор до такой степени, что даже механизмы оказались соответствующими виталистической структуре времени, но, как было сказано выше, эта победа равносильна полному поражению, ибо со всех точек зрения, имеющих какое-либо отношение к нравственности и религии, новая механика столь же механистична, как и старая. Назвать ли новую точку зрения материалистической — это в общем спор о словах. Господство материи характеризует определенную стадию физики XIX века в гораздо большей степени, чем современность. Сейчас «материализм» — это лишь что-то вроде вольного синонима «механицизма». По существу, весь спор между механицистами и виталистами можно отложить в архив плохо сформулированных вопросов. [c.99]
К началу этого столетия двое ученых, один в Соединенных Штатах, другой во Франции, работали в областях, которые показались бы им совершенно не связанными, если бы один из них узнал о существовании другого. Уиллард Гиббс в Нью-Хейвене разрабатывал свой новый подход к статистической механике. Анри Лебег в Париже соперничал славой со своим учителем Эмилем Борелем, создав новую, более мощную теорию интегрирования, которая должна была использоваться при изучении тригонометрических рядов. Эти два исследователя походили друг на друга тем, что оба были кабинетными, а не лабораторными работниками, но они подходили к науке с диаметрально противоположных позиций.
Гиббс, хотя и был математиком, всегда считал математику наукой, подчиненной физике. Лебег был чистейший аналитик, выдающийся представитель современных, крайне суровых требований к математической строгости, и его работы, насколько мне известно, не содержат ни одного примера задач или методов, вытекающих непосредственно из физики. Тем не менее работы этих ученых составляют единое целое, и на вопросы, которые ставит Гиббс, мы находим ответ не в его собственных работах, а в работах Лебега.
Главная мысль Гиббса такова. В ньютоновой динамике в ее первоначальном виде рассматривается индивидуальная система с заданными начальными скоростями и импульсами[125], подвергающаяся изменениям под [c.100] действием некоторой системы сил согласно законам Ньютона, которые устанавливают связь между силой и ускорением. Однако в громадном большинстве практических случаев нам известны далеко не все начальные скорости и импульсы. Если принять некоторое начальное распределение не вполне известных положений и импульсов системы, то тем самым будет определено в строго ньютоновском смысле распределение положений и импульсов в любой момент будущего. Тогда можно высказать ряд предложений об этих распределениях, и часть из них — в форме утверждений, что система будет иметь некоторые характеристики с вероятностью 1 и некоторые другие — с вероятностью 0.
Вероятности, равные единице и нулю, суть понятия, включающие полную достоверность и полную невозможность, но их значение гораздо шире. Если я стреляю по цели нулей точечного размера, то вероятность моего попадания в определенную точку цели равна нулю, хотя не исключена возможность, что я попаду в нее; и, действительно, в каждом отдельном случае я обязательно попаду в некоторую точку, что является событием нулевой вероятности. Таким образом, событие вероятности 1, а именно попадание в какую-либо точку, может состоять из совокупности событий, каждое из которых имеет вероятность 0.
Тем не менее в гиббсовой статистической механике применяется, хотя и неявно (Гиббс нигде не отдает себе в этом ясного отчета), разложение сложного события в бесконечную последовательность частных событий — первого, второго, третьего и т. д., — каждое из которых имеет известную вероятность; вероятность этого более широкого события находится затем как сумма вероятностей частных событий, образующих бесконечную последовательность. Таким образом, вероятности нельзя складывать во всех мыслимых случаях для получения полной вероятности, ибо сумма любого числа нулей равна нулю; но их можно складывать, коль скоро существует первый, второй, третий член и т. д., образующие последовательность событий, в которой каждый член имеет определенное место, задаваемое положительным целым числом.
Чтобы провести различие между этими двумя случаями, необходимы довольно тонкие изыскания о природе [c.101] множеств событий, а Гиббс был хотя и очень сильный, но не очень тонкий математик. Может ли класс быть бесконечным и в то же время существенно отличным по мощности от другого класса, например от класса натуральных чисел? Эту задачу решил в конце прошлого столетия Георг Кантор, и ответ был «да». Если мы рассмотрим все десятичные дроби, конечные и бесконечные, лежащие между нулем и единицей, то, как известно, их нельзя расположить в порядке «один, два, три…», хотя — удивительно — мы можем расположить так все конечные десятичные дроби. Поэтому проведение различия, требуемого в статистической механике Гиббса, не является само по себе невозможным. Услуга, оказанная Лебегом теории Гиббса, заключалась в доказательстве того, что неявные требования статистической механики относительно событий нулевой вероятности и сложения вероятностей событий действительно могут быть удовлетворены и что теория Гиббса не содержит противоречий.
Однако работа Лебега была непосредственно связана не с требованиями статистической механики, а с другой, как будто весьма далекой от нее, теорией — теорией тригонометрических рядов. Последняя восходит к физике XVIII в., изучавшей волны и колебания, и к спорному тогда вопросу об общности возможных движений линейной системы, полученных сложением ее простых колебаний, — колебаний, при которых течение времени лишь умножает отклонения системы от равновесия на положительный или отрицательный множитель, зависящий только от времени, но не от положения. Таким образом, одна функция выражается в виде суммы ряда. Коэффициенты этих рядов выражаются как средние произведения представляемой функции на данную весовую функцию. Вся теория основана на соотношениях между средним значением ряда и средними значениями отдельных членов. Заметим, что среднее значение величины, равной единице на интервале от нуля до А и нулю на интервале от А до 1, равно А и что его можно рассматривать как вероятность для случайной точки находиться в интервале от 0 до А, если известно, что она находится между 0 и 1. Иными словами, теория, необходимая для определения среднего значения ряда, очень близка к той, которая необходима для [c.102] адекватной трактовки вероятностей, выводимых из бесконечной последовательности случаев. Вот почему Лебег, решая свою задачу, решил также задачу Гиббса.
Распределения, исследуемые Гиббсом, сами допускают динамическую интерпретацию. Если мы рассматриваем консервативную динамическую систему весьма общего вида с N степенями свободы, то координаты положений и скоростей такой системы можно привести к особой системе 2N координат, из которых N называются обобщенными координатами положения и N — обобщенными импульсами. Эти координаты определяют 2N-мерное пространство[126] и в нем 2N-мерный объем. Возьмем произвольную область этого пространства и заставим точки перемещаться с течением времени. Каждый набор 2N координат перейдет тогда в новый набор, зависящий от истекшего времени, но непрерывное изменение границ области не изменит ее 2N-мерного объема. В общем случае для множеств, не столь простых, понятие объема порождает систему меры лебегова типа. В этой системе меры и в консервативных динамических системах, преобразуемых так, что мера сохраняется постоянной, сохраняет постоянство и другая скалярная величина — энергия. Если все тела системы действуют только друг на друга и в системе нет сил, связанных с фиксированным положениями и фиксированными направлениями в пространстве, то остаются постоянными еще два выражения, оба векторные: количество движения и момент количества движения системы в целом. Их нетрудно исключить и тем самым заменить данную систему системой с меньшим числом степеней свободы.
В сугубо частных системах могут быть и другие величины, не определяемые энергией, количеством движения и моментом количества движения, также не меняющиеся с эволюцией системы. Известно, однако, что системы с другими инвариантными величинами, зависящими от начальных координат и импульсов динамической системы и достаточно регулярными, чтобы [c.103] допускать интегрирование на основе меры Лебега, в действительности очень редки, в некотором вполне точном смысле[127]. В системах, не имеющих других инвариантных величин, можно фиксировать координаты, соответствующие энергии, количеству движения и общему моменту количества движения, и тогда в пространстве остальных координат мера, определяемая координатами положений и импульсов, определит сама некоторую подмеру, подобно тому, как мера в трехмерном пространстве определит площадь на двумерной поверхности для заданного семейства двумерных поверхностей. Например, пусть мы имеем семейство концентрических сфер; объем между двумя сближаемыми концентрическими сферами (если его нормировать, приняв за единицу полный объем области между двумя сферами) в пределе даст меру площади на поверхности сферы.
Применим теперь эту новую меру к одной из областей фазового пространства, для которой определена энергия, общее количество движения и общий момент количества движения, и предположим, что в системе нет других измеримых инвариантных величин. Пусть полная мера этой ограниченной области постоянна; изменяя масштаб, ее можно приравнять единице. Поскольку наша мера была получена из меры, инвариантной во времени, способом, инвариантным во времени, она и сама инвариантна. Мы назовем эту меру фазовой мерой, а средние по этой мере — фазовыми средними.
Но всякая величина, изменяющаяся во времени, может иметь также среднее значение по времени — временно́е среднее. Например, если f(t) зависит от t, то временно́е среднее для прошлого равно
, (2.01)
а временно́е среднее для будущего
(2.02)
[c.104]
В гиббсовой статистической механике встречаются как временные, так и пространственные средние. Блестящей идеей Гиббса была попытка доказать, что эти средние в некотором смысле тождественны. Догадка Гиббса о связи двух типов средних совершенно правильна, но метод, которым он пытался доказать эту связь, был совершенно и безнадежно неверным. В этом его вряд ли можно винить. Интеграл Лебега стал известен в Америке лишь к моменту смерти Гиббса. В течение еще пятнадцати лет он был музейной редкостью и применялся только, чтобы продемонстрировать молодым математикам, до какой степени могут быть доведены требования математической строгости. Такой выдающийся математик, как У.Ф. Осгуд, не хотел его признать до конца своей жизни[128]. Лишь около 1930 г. группа математиков — Купмен, фон Нейман, Биркгофф[129] — установила наконец прочные основы статистической механики Гиббса. Каковы были эти основы, мы увидим дальше, когда познакомимся с эргодической теорией.
Сам Гиббс думал, что в системе, из которой удалены все инварианты — лишние координаты, почти все пути точек в фазовом пространстве проходят через все координаты такого пространства. Эту гипотезу он назвал эргодической, от греческих слов εργον — «работа» и οδόσ — «путь». Но как показал Планшерель и другие, ни в одном реальном случае эта гипотеза не оправдывается. Никакая дифференцируемая траектория, даже бесконечной длины, не может покрыть целиком область на плоскости. Последователи Гиббса и, по-видимому, в конце концов сам Гиббс смутно поняли это и заменили свою гипотезу другой, квазиэргодической гипотезой, которая утверждает лишь, что с течением времени система в общем случае проходит неограниченно близко к каждой точке в области фазового пространства определенной известными интервалами. Логически такая гипотеза вполне приемлема, но она совершенно недостаточна для тех выводов, которые Гиббс основывает на ней. Она ничего не говорит об относительном времени пребывания системы в окрестности каждой точки. [c.105]
Помимо понятии среднего и меры (иначе говоря, среднего по всему пространству от функции, равной 1 на измеряемом множестве и 0 вне его), необходимых в первую очередь для разбора идей Гиббса, мы нуждаемся при оценке действительного значения эргодической теории в более точном анализе понятия инварианта, как и понятия группы преобразований. Эти понятия, несомненно, были известны Гиббсу, как показывают его работы по векторному анализу. Тем не менее можно утверждать, что он не оценил в полной мере их философского значения. Подобно своему современнику Хевисайду, Гиббс принадлежал к типу ученых, у которых физико-математическая проницательность часто опережает их логику и которые обыкновенно бывают правы, но часто не в состоянии объяснить, почему и как.
Для существования любой науки необходимо, чтобы существовали явления, которые не оставались бы изолированными. Если бы мир управлялся серией чудес, совершаемых иррациональным богом с его внезапными прихотями, то мы были бы вынуждены ждать каждой новой катастрофы в состоянии пассивного недоумения. Подобную картину мира встречаем мы в крокетной игре, описанной в «Алисе в стране чудес»[130]. В этой игре молотки — фламинго, шары — ежи, которые спокойно разворачиваются и идут по своим делам, ворота — карточные солдаты, точно так же способные совершать движения по собственной инициативе, а правила игры определяются декретами вспыльчивой королевы червей[131], поведение которой невозможно предугадать.
Существо эффективного правила игры или полезного закона физики состоит в том, что правило можно установить заранее и применять во многих случаях. В идеале закон должен описывать свойство рассматриваемой системы, остающееся всегда тем же самым в потоке частных событий. В простейшем случае берется свойство, инвариантное относительно множества преобразований, которым подвергается система. Так мы приходим к [c.106] понятиям преобразования, группы преобразований и инварианта.
Преобразование системы есть изменение, при котором каждый элемент переходит в другой элемент. Изменение Солнечной системы в промежуток между моментами времени t1 и t2 есть преобразование координат планет. Аналогичное изменение их координат при перемещении нами начала координат или повороте наших геометрических осей также есть преобразование. Изменение масштаба, происходящее, когда мы наблюдаем препарат в микроскоп, — еще один пример преобразования.
Если за преобразованием А следует преобразование В, то в результате получается преобразование, называемое произведением, или результирующим преобразованием ВА. Заметим, что произведение, вообще говоря, зависит от порядка преобразований A и В. Например, если А — преобразование, переводящее координату х в координату y, а у — в х, оставляя z без изменений, и если В переводит х в z, а z — в х, оставляя y без изменений, то ВА будет переводить х в у, у — в z и z — в х, а АВ будет переводить х в z, у — в х и z — в у. Если АВ и ВА совпадают, то говорят, что А и В перестановочны.
Иногда, но не всегда, преобразование А не только переводит каждый элемент системы в элемент, но обладает еще тем свойством, что каждый элемент оказывается результатом преобразования одного из элементов. В этом случае существует такое единственное преобразование А—1, что каждое из произведений АА—1 и А—1A представляет собой особое, вырожденное преобразование, которое называется тождественным преобразованием I и преобразует каждый элемент в самого себя. В этом случае мы называем преобразование А—1 обратным к преобразованию А. Очевидно, что А обратно к А—1, что I обратно к самому себе и что обратное преобразование к АВ есть B—1A—1.
Существуют множества преобразований, в которых: 1) каждое преобразование, принадлежащее к данному множеству, имеет обратное преобразование, также принадлежащее к этому множеству, и 2) произведение любых двух преобразований, принадлежащих к данному множеству, само принадлежит к этому множеству. Такие множества носят название групп преобразований. [c.107] Множество всех сдвигов или по прямой, или в плоскости, или в трехмерном пространстве есть группа преобразований; более того, оно принадлежит к группам преобразований особого рода, называемым абелевыми группами[132], где любые два преобразования перестановочны. Напротив, множество поворотов около точки и множество всех перемещений твердого тела в пространстве суть неабелевы группы.
Предположим теперь, что имеется какая-то величина, связанная со всеми элементами, преобразуемыми данной группой преобразований. Если эта величина не изменяется, когда каждый элемент изменяется одним и тем же преобразованием группы, каково бы ни было это преобразование, то она называется инвариантом группы. Существует много разновидностей таких инвариантов. Из них для наших целей особенно важны две.
Первая разновидность — так называемые линейные инварианты. Обозначим через х элементы, преобразуемые абелевой группой, и пусть f(x) — комплексная функция этих элементов, обладающая надлежащими свойствами непрерывности или интегрируемости. Тогда, если Тх — элемент, получаемый из х при преобразовании Т, a f(x) — функция с абсолютным значением 1, такая, что
f (Tx) = α(T) f(x), (2.03)
где α(T) — число с абсолютным значением 1, зависящее только от Т, то f(x) мы будем называть характером группы.
Это инвариант группы в несколько обобщенном смысле. Ясно, что если f(x) и g(x) — характеры группы, то f(x)g(x) также есть характер группы, как и [f(x)] —1. Если какая-либо функция h(x), определенная на группе, представима линейной комбинацией характеров группы, скажем в виде
, (2.04)
где fk(x) — характер группы, и если αk(T) находится в таком же отношении к fk(x), как α(T) — к f(x) в (2.03), то [c.108]
(2.05)
Таким образом, коль скоро h(x) допускает разложение по некоторому множеству характеров группы, то и h(Tx) при всех Т допускает такое разложение.
Мы видели, что характеры группы порождают другие характеры при умножении и обращении; нетрудно видеть также, что константа 1 есть характер. Следовательно, умножение на характер порождает группу преобразований самих характеров; последняя называется группой характеров исходной группы.
Если исходная группа есть группа сдвигов по бесконечной прямой, то оператор Т изменяет х в х+Т и соотношение (2.03) переходит в соотношение
, (2.06)
которое выполняется при f(x)=eiλx, α(T)= eiλT. Характерами будут функции eiλx, а группой характеров будет группа сдвигов, изменяющая λ в λ+τ и, следовательно, имеющая такое же строение, как и исходная группа. Но дело будет обстоять иначе, если исходная группа состоит из поворотов по окружности. В этом случае оператор Т изменяет х в число, лежащее между 0 и 2π и отличающееся от х+Т на целочисленное кратное 2π. Соотношение (2.06) еще справедливо, но у нас появляется добавочное условие
. (2.07)
Положив вновь f(x) = eiλx, получим
. (2.08)
Это значит, что λ должно быть целым действительным числом — положительным, отрицательным или нулем. Следовательно, группа характеров здесь соответствует сдвигам целых действительных чисел. С другой стороны, если исходная группа есть группа сдвигов целых чисел, то х и Т в (2.06) могут принимать только целочисленные значения и функция eiλx задается полностью числом, лежащим между 0 и 2π и отличающимся от λ на целочисленное кратное 2π. Следовательно, группа характеров в этом случае по существу представляет собой группу поворотов по окружности.
В любой группе характеров числа α(T), соответствующие данному характеру f, распределены таким образом, [c.109] что это распределение не нарушается при умножении их всех на α(S), каков бы ни был элемент S исходной группы. Иначе говоря, если есть какое-то разумное основание взять среднее от этих чисел, не затрагиваемое, когда группа преобразуется умножением каждого ее преобразования на одно фиксированное, то либо α(Т) тождественно равно 1, либо наше среднее инвариантно относительно умножения на числа, отличные от 1, и потому должно равняться 0. Отсюда можно заключить, что среднее произведение характера на величину, с ним сопряженную (которая также является характером), будет равно 1, а среднее произведение характера на величину, сопряженную с другим характером, будет равно 0. Другими словами, если h(x) представлено как в (2.04), то
(2.09)
Для группы поворотов по окружности это дает нам сразу, что если
(2.10)
то
(2.11)
Для сдвигов же по бесконечной прямой результат тесно связан с тем обстоятельством, что если в некотором подходящем смысле
(2.12)
то в определенном смысле
(2.13)
Эти результаты изложены здесь очень грубо, без точной формулировки условий их справедливости. Более строгое изложение теории читатель может найти в работе, указанной в примечании[133]. [c.110]
Наряду с теорией линейных инвариантов группы, существует также общая теория ее метрических инвариантов. Последние представляют собой системы меры Лебега, не претерпевающие изменений, когда объекты, преобразуемые группой, переставляются операторами группы. В этой связи следует упомянуть интересную теорию групповой меры, которую дал Гаар[134]. Как мы видели, всякая группа сама есть собрание объектов, которые переставляются между собой при умножении на операторы данной группы. Поэтому она может иметь инвариантную меру. Гаар доказал, что некоторый довольно широкий класс групп имеет однозначно определенную инвариантную меру, задаваемую строением самой группы.
Наиболее важное применение теории метрических инвариантов группы преобразований состоит в обосновании взаимной заменимости фазовых и временных средних, которую, как мы видели выше, Гиббс тщетно пытался доказать. Это доказательство было выполнено на основе так называемой эргодической теории.
В обычных эргодических теоремах рассматривается ансамбль Е, меру которого можно принять за единицу, и этот ансамбль преобразуется в себя сохраняющим меру преобразованием Т или группой сохраняющих меру преобразований Тλ, где —∞<λ<∞ и
(2.14)
Эргодическая теория имеет дело с комплексным функциями f(х) элементов х из Е. Во всех случаях f(х) считается измеримой по х, а если мы рассматриваем непрерывную группу преобразований, то f(Тλх) считается измеримой по х и λ вместе.
В эргодической теореме Купмена — фон Неймана о сходимости в среднем функция f(х) считается принадлежащей к классу L2; это значит, что
(2.15)
Теорема утверждает, что [c.111]
(2.16)
или соответственно
(2.17)
сходится в среднем к пределу f*(х) при N→∞ или соответственно при А→∞ в том смысле, что
(2.18)
(2.19)
В эргодической теореме Биркгоффа о сходимости «почти всюду» функция f(х) считается принадлежащей к классу L; это значит, что
(2.20)
Функции fN(х) и fA(х) определяются, как в (2.16) и (2.17). Теорема утверждает[135], что для всех значений х, за исключением множества нулевой меры, существуют пределы
(2.21)
и
(2.22)
Особенно интересен так называемый эргодический, или метрически транзитивный, случай, когда преобразование Т или множество преобразований Тλ не оставляет инвариантным ни одно множество точек х с мерой, отличной от 1 и 0. В таком случае множество значений (для обеих эргодических теорем), на которых f*(х) пробегает заданный интервал, почти всегда есть 1 или 0. Это возможно только при том условии, что [c.112] f*(х) почти всегда постоянна. Тогда f*(х) почти всегда равна
(2.23)
Таким образом, в теореме Купмена мы получаем предел в среднем[136]
(2.24)
а в теореме Биркгоффа
(2.25)
за исключением множества значений х меры (или вероятности) 0. Аналогичные результаты имеют место в непрерывном случае. Это служит достаточным обоснованием производимой Гиббсом замены фазовых и временных средних.
Для случая, когда преобразование Т или группа преобразований Тλ не являются эргодическими, фон Нейман показал, что при очень общих условиях они могут быть сведены к эргодическим составляющим. Это значит, что, отбросив множество значений х нулевой меры, Е можно разбить на конечное или счетное множество классов Еn и континуум классов Е(y), таких, что на каждом Еn и Е(y) устанавливается мера, инвариантная при Т и Тλ. Все эти преобразования эргодические, и если S(y) — пересечение множества S с Е(y), Sn — пересечение множества S с Еn, то
(2.26)
Другими словами, вся теория сохраняющих меру преобразований может быть сведена к теории эргодических преобразований.
Заметим мимоходом, что вся эргодическая теория применима и к более общим группам преобразований, [c.113] чем те, которые изоморфны с группой сдвигов по прямой. В частности, ее можно применить к группе сдвигов в n измерениях. Для физики важен случай трех измерений. Пространственным аналогом равновесия во времени служит пространственная однородность, и такие теории, как теория однородного газа, жидкости или твердого тела, основаны на применении трехмерной эргодической теории. Между прочим, примером неэргодической группы преобразований сдвига в трех изменениях может служить множество сдвигов смеси раздельных состояний, таких, что в данный момент существует то или другое состояние, но не их смесь.
Одним из кардинальных понятий статистической механики, получившим также применение в классической термодинамике, является понятие энтропии. Энтропия — это прежде всего свойство областей фазового пространства; она выражается логарифмом от их меры вероятности. Например, рассмотрим динамику n частиц, находящихся в сосуде, который разделен на две части: А и В. Если m частиц находится в А и n—m в В, то это характеризует некоторую область в фазовом пространстве, имеющую определенную меру вероятности. Логарифм этой меры есть энтропия распределения «m частиц в А, n—m в В». Большую часть времени система будет пребывать в состоянии, близком к состоянию наибольшей энтропии, в том смысле, что если комбинация «m1 в А, n—m1 в В» имеет наибольшую вероятность, то большую часть времени примерно m1 частиц будет в А и примерно n— m1 в В. Для систем с большим числом частиц и состояниями, еще остающимися в пределах практической различимости, это значит, что если взять состояние с энтропией ниже максимальной и наблюдать, что произойдет, то энтропия почти всегда возрастает.
В обычных термодинамических задачах о тепловом двигателе мы имеем дело с условиями, когда в больших областях, скажем в цилиндре двигателя, существует грубое тепловое равновесие. Состояния, для которых мы исследуем энтропию, уже являются состояниями максимальной энтропии для данной температуры и объема, где речь идет о немногих областях фиксированных объемов и температуры. Даже при более тонких рассмотрениях тепловых двигателей, в частности двигателей [c.114] типа турбины, где газ расширяется гораздо более сложным образом, чем в цилиндре, эти условия не изменяются очень сильно. Мы все еще может говорить с весьма хорошим приближением о местных температурах, хотя температура определима точно лишь в состоянии равновесия и методами, предполагающими такое равновесие. Но в живом веществе мы уже не можем предполагать даже этой грубой однородности. В строении белковой ткани, которое показывает электронный микроскоп, наблюдается чрезвычайная определенность и тонкость организации, и физиология такой ткани должна обладать соответственно тонкой организацией. Эта тонкость гораздо больше, чем у пространственно-временной шкалы обычного термометра, и потому температуры, измеряемые обычными термометрами в живых тканях, представляют грубые средние величины, а не истинные термодинамические температуры. Гиббсова статистическая механика может оказаться довольно адекватной моделью того, что происходит в живом теле; картина, подсказанная обычным тепловым двигателем, — заведомо нет. Тепловой коэффициент полезного действия мышц почти ничего не значит и, уж конечно, он не значит того, что он, казалось бы, должен значить.
Очень важное значение в статистической механике имеет идея максвеллова демона. Представим себе газ, в котором частицы движутся с распределением скоростей, остающимся в статистическом равновесии при данной температуре. Для идеального газа это будет распределение Максвелла. Пусть наш газ заключен в твердый сосуд с поперечной стенкой, снабженной небольшим отверстием; отверстие закрывается дверцей, приводимой в действие привратником — человекоподобным демоном или миниатюрным механизмом. Когда частица со скоростью выше средней подходит к дверце из отделения А или частица со скоростью ниже средней подходит к дверце из отделения В, привратник открывает дверцу и частица проходит через отверстие; когда же частица со скоростью ниже средней подходит из отделения А или частица со скоростью выше средней подходит из отделения В, дверца закрывается. Таким образом, частицы большей скорости сосредоточиваются в отделении В, а в отделении А их концентрация уменьшается. Это вызывает очевидное уменьшение энтропии, [c.115] и если соединить оба отделения тепловым двигателем, мы, как будто, получим вечный двигатель второго рода[137].
Легче отвергнуть вопрос, поставленный Максвеллом, чем ответить на него. Самое простое — отрицать возможность подобных существ или устройств. При строгом исследовании мы действительно найдем, что демоны Максвелла не могут существовать в равновесной системе, но если мы примем с самого начала эту невозможность и не будем пытаться доказать ее, то упустим прекрасный случай узнать кое-что об энтропии и о возможных физических, химических и биологических системах.
Чтобы демон Максвелла мог действовать, он должен получать от приближающихся частиц информацию об их скорости и точке удара о стенку. Независимо от того, связаны ли эти импульсы с переносом энергии или нет, они предполагают связь между демоном и газом. Но закон возрастания энтропии справедлив для полностью изолированной системы и неприменим к неизолированной части такой системы. Поэтому мы должны рассматривать энтропию системы газ — демон, а не энтропию одного газа. Энтропия газа есть лишь компонент общей энтропии более широкой системы. Можно ли найти другие, связанные с демоном компоненты, входящие в общую энтропию?
Без малейшего сомнения, можно. Демон способен действовать лишь на основании принимаемой информации, а эта информация, как мы увидим в следующей главе, представляет собой отрицательную энтропию. Информация должна переноситься каким-то физическим процессом, например какой-то формой излучения. Можно вполне допустить, что эта информация переносится на очень низком энергетическом уровне и что перенос энергии от частицы к демону в течение продолжительного времени имеет гораздо меньшее значение, чем перенос информации. Но по законам квантовой механики [c.116] нельзя получить информацию о положении или импульсе частицы, а тем более о том и другом без воздействия на энергию исследуемой частицы, причем это воздействие должно превышать некоторый минимум, зависящий от частоты света, применяемого для исследования. Поэтому во всякой связи необходимо участвует энергия, и система, находящаяся в статистическом равновесии, должна находиться в равновесии как по отношению к энтропии, так и по отношению к энергии. В конечном счете максвеллов демон будет подвержен случайному движению, соответствующему температуре окружающей среды, и, как говорит Лейбниц о некоторых монадах, будет получать большое число малых впечатлений, пока не впадет в «головокружение» и не потеряет способность к ясным восприятиям. По существу, он перестанет действовать как максвеллов демон.
Тем не менее до того как демон собьется с толку, может пройти немалое время, и оно может оказаться столь продолжительным, что мы вправе называть активную фазу демона метастабильной. Нет оснований полагать, что метастабильные демоны в действительности не существуют; напротив, вполне возможно, что энзимы являются метастабильными максвелловыми демонами, которые уменьшают энтропию, пусть не разделением быстрых и медленных частиц, а каким-нибудь другим эквивалентным процессом. Мы вполне можем рассматривать живые организмы, как и самого Человека, в этом свете. Без сомнения, энзим и живой организм одинаково метастабильны: стабильное состояние энзима наступает, когда он перестает действовать, а стабильное состояние живого организма наступает с его смертью. Все катализаторы в конце концов отравляются, ибо они изменяют лишь скорости реакций, но не меняют истинного равновесия. Тем не менее и катализаторы, и человек имеют настолько определенные состояния метастабильности, что эти состояния можно считать относительно постоянными.
Я не хотел бы кончить эту главу, не сказав, что эргодическая теория — гораздо более обширный предмет, нежели здесь изложено. В некоторых новейших направлениях эргодической теории мера, остающаяся инвариантной при группе преобразований, определяется непосредственно самой группой, а не задается заранее. [c.117] В особенности я должен упомянуть работы Крылова и Боголюбова и некоторые работы Гуревича и японской школы.
Следующая глава посвящена статистической механике временных рядов. В этой области условия также очень далеки от условий, принимаемых статистической механикой для тепловых двигателей, и поэтому они весьма хорошо могут служить моделью того, что происходит в живых организмах. [c.118]
Существует широкий класс явлений, в которых объектом наблюдения служит какая-либо числовая величина или последовательность числовых величин, распределенные во времени. Температура, непрерывно записываемая самопишущим термометром; курс акций на бирже в конце каждого дня; сводка метеорологических данных, ежедневно публикуемая бюро погоды, — все это временные ряды, непрерывные или дискретные, одномерные или многомерные. Эти временные ряды меняются сравнительно медленно, и их вполне можно обрабатывать посредством вычислений вручную или при помощи обыкновенных вычислительных приборов, таких, как счетные линейки и арифмометры. Их изучение относится к обычным разделам статистической науки.
Но не все отдают себе отчет в том, что быстро меняющиеся последовательности напряжений в телефонной линии, телевизионной схеме или радиолокаторе точно так же относятся к области статистики и временных рядов, хотя приборы, которые их комбинируют и преобразуют, должны, вообще говоря, обладать большим быстродействием и, более того, должны выдавать результаты одновременно с очень быстрыми изменениями входного сигнала. Эти приборы: телефонные аппараты, волновые фильтры, автоматические звукокодирующие устройства типа вокодера[138] Белловских телефонных лабораторий, схемы частотной модуляции и соответствующие им приемники — по существу [c.119] представляют собой быстродействующие арифметические устройства, соответствующие всему собранию вычислительных машин и программ статистического бюро, вместе со штатом вычислителей. Необходимый для их применения разум был вложен в них заранее, так же как и в автоматические дальномеры и системы управления артиллерийским зенитным огнем и по той же причине: цепочка операций должна выполняться настолько быстро, что ни в одном звене нельзя допустить участия человека.
Все эти временные ряды и все устройства, работающие с ними, будь то в вычислительном бюро или в телефонной схеме, связаны с записью, хранением, передачей и использованием информации. Что же представляет собой эта информация и как она измеряется? Одной из простейших, наиболее элементарных форм информации является запись выбора между двумя равновероятными простыми альтернативами, например между гербом и решеткой при бросании монеты. Мы будем называть решением однократный выбор такого рода. Чтобы оценить теперь количество информации, получаемое при совершенно точном измерении величины, которая заключена между известными пределами А и В и может находиться с равномерной априорной вероятностью где угодно в этом интервале, положим А=0, В=1 и представим нашу величину в двоичной системе бесконечной двоичной дробью 0, а1 а2 а3 … an …, где каждое а1, а2, … имеет значение 0 или 1. Здесь
(3.01)
Мы видим, что число сделанных выборов и вытекающее отсюда количество информации бесконечны.
Однако в действительности никакое измерение не производится совершенно точно. Если измерение имеет равномерно распределенную ошибку, лежащую в интервале длины 0, b1 b2 … bn …, где bk — первый разряд, отличный от 0, то, очевидно, все решения от а1 до аk—1 и, возможно, до ak будут значащими, а все последующие — нет. Число принятых решений, очевидно, близко к
(3.02)
[c.120]
и это выражение мы примем за точную формулу количества информации и за его определение.
Это выражение можно понимать следующим образом: мы знаем априори, что некоторая переменная лежит между нулем и единицей, и знаем апостериори, что она лежит в интервале (а, b) внутри интервала (0, 1). Тогда количество информации, извлекаемой нами из апостериорного знания, равно
(3.03)
Рассмотрим теперь случай, когда мы знаем априори, что вероятность нахождения некоторой величины между х и x+dx равна f1(x)dx, а апостериорная вероятность этого равна f2(x)dx. Сколько новой информации дает нам наша апостериорная вероятность?
Эта задача по существу состоит в определении ширины областей, расположенных под кривыми y=f1(x) и y=f2(x). Заметим, что, по нашему допущению, переменная х имеет основное равномерное распределение, т. е. наши результаты, вообще говоря, будут другими, если мы заменим х на х3 или на какую-либо другую функцию от х. Так как f1(x) есть плотность вероятности, то
(3.04)
Поэтому средний логарифм ширины области, расположенной под кривой f1(x), можно принять за некоторое среднее значение высоты логарифма обратной величины функции f1(x). Таким образом, разумной мерой[139] количества информации, связанного с кривой f1(x), может служить[140] [c.121]
(3.05)
Величина, которую мы здесь определяем как количество информации, противоположна по знаку величине, которую в аналогичных ситуациях обычно определяют как энтропию. Данное здесь определение не совпадает с определением Р.А. Фишера для статистических задач, хотя оно также является статистическим определением и может применяться в методах статистики вместо определения Фишера.
В частности, если f1(x) постоянна на интервале (а, b) и равна нулю вне этого интервала, то
(3.06)
Используя это выражение для сравнения информации о том, что некоторая точка находится в интервале (0, 1), с информацией о том, что она находится в интервале (а, b), получим как меру разности
(3.07)
Определение, данное нами для количества информации, пригодно также в том случае, когда вместо переменной х берется переменная, изменяющаяся в двух или более измерениях. В двумерном случае f1 (x, y) есть такая функция, что
(3.08)
и количество информации равно
(3.081)
Заметим, что если f1(x, y) имеет вид φ(х)ψ(y) и
, (3.082)
[c.122]
то
(3.083)
и
(3.084)
т. е. количество информации от независимых источников есть величина аддитивная.
Интересной задачей является определение информации, получаемой при фиксации одной или нескольких переменных в какой-либо задаче. Например, положим, что переменная u заключена между х и x+dx с вероятностью
,
а переменная v заключена между теми же двумя пределами с вероятностью
Сколько мы приобретаем информации об u, если знаем, что u+v=w? В этом случае очевидно, что u=w—v, где w фиксировано. Мы полагаем, что априорные распределения переменных u и v независимы, тогда апостериорное распределение переменной u пропорционально величине
, (3.09)
где c1 и c2 — константы. Обе они исчезают в окончательной формуле.
Приращение информации об u, когда мы знаем, что w таково, каким мы его задали заранее, равно
[c.123]
(3.091)
Заметим, что выражение (3.091) положительно и не зависит от w. Оно равно половине логарифма от отношения суммы средних квадратов переменных u и v к среднему квадрату переменной v. Если v имеет лишь малую область изменения, то количество информации об u, которое дается знанием суммы u+v, велико и становится бесконечным, когда b приближается к нулю.
Мы можем истолковать этот результат следующим образом. Будем рассматривать u как сообщение, а v — как помеху. Тогда информация, переносимая точным сообщением в отсутствие помехи, бесконечна. Напротив, при наличии помехи это количество информации конечно и быстро приближается к нулю по мере увеличения силы помехи.
Мы сказали, что количество информации, будучи отрицательным логарифмом величины, которую можно рассматривать как вероятность, по существу есть некоторая отрицательная энтропия. Интересно отметить, что эта величина в среднем имеет свойства, которые мы приписываем энтропии.
Пусть φ(х) и ψ(x) — две плотности вероятностей, тогда
также есть плотность вероятности и
(3.10)
Это вытекает из того, что
(3.11)
Другими словами, перекрытие областей под φ(х) и ψ(x) уменьшает максимальную информацию, заключенную в сумме φ(х)+ψ(x). Если же φ(х) есть плотность [c.124] вероятности, обращающаяся в нуль вне (а, b), то интеграл
(3.12)
имеет наименьшее значение, когда на интервале (а, b) и φ(х)=0 вне этого интервала. Это вытекает из того, что логарифмическая кривая выпукла вверх.
Как и следовало ожидать, процессы, ведущие к потере информации, весьма сходны с процессами, ведущими к росту энтропии. Они состоят в слиянии областей вероятностей, первоначально различных. Например, если мы заменяем распределение некоторой переменной распределением функции от нее, принимающей одинаковые значения при разных значениях аргумента, или в случае функции нескольких переменных позволяем некоторым из них свободно пробегать их естественную область изменения, мы теряем информацию. Никакая операция над сообщением не может в среднем увеличить информацию. Здесь мы имеем точное применение второго закона термодинамики к технике связи. Обратно, уточнение в среднем неопределенной ситуации приводит, как мы видели, большей частью к увеличению информации и никогда — к ее потере.
Интересен случай, когда мы имеем распределение вероятностей с n-мерной плотностью f(х1, …, xn) по переменным (х1, …, xn) и m зависимых переменных y1, …, ym. Сколько информации мы приобретаем при фиксации таких т переменных? Пусть они сперва фиксируются между пределами y1*, y1*+dy1*; …; ym*, ym*+dym*. Примем х1, x2, …, xn—m, y1, y2, …, ут за новую систему переменных. Тогда для новой системы переменных наша функция распределения будет пропорциональна f1(х1, …, xn) над областью R, определенной условиями
и равна нулю вне ее. Следовательно, количество информации, полученной при наложении условий на значения y, будет равно[141] [c.125]
(3.13)
С этой задачей тесно связано обобщение задачи, о которой говорилось по поводу уравнения (3.091). Сколько информации в рассматриваемом случае приобретается нами об одних только переменных х1, …, xn—m? Здесь априорная плотность вероятности этих переменных равна
, (3.14)
а ненормированная плотность вероятности после фиксации величин у* будет
(3.141)
где Σ берется по всем множествам значений (xn—m+1, …, xn), соответствующим данному множеству значений y*. Основываясь на этом, нетрудно записать решение нашей задачи, хотя оно и будет несколько громоздким. Если мы примем множество (x1, …, xn—m) за обобщенное сообщение, множество (xn—m+1, …, xn) — за [c.126] обобщенный шум. а величины y* — за обобщенное искаженное сообщение, то получим, очевидно, решение обобщенной задачи выражения (3.091).
Таким образом, мы имеем по крайней мере формальное решение обобщения упомянутой уже задачи о сигнале и шуме. Некоторое множество наблюдений зависит произвольным образом от некоторого множества сообщений и шумов с известным совместным распределением. Мы хотим установить, сколько информации об одних только сообщениях дают эти наблюдения. Это центральная проблема техники связи. Решение ее позволит нам оценивать различные системы связи, например системы с амплитудной, частотной или фазовой модуляцией, в отношении их эффективности в передаче информации. Это техническая задача, не подлежащая здесь подробному обсуждению; уместно, однако, сделать некоторые замечания.
Во-первых, можно показать, что если пользоваться данным здесь определением информации, то при случайных помехах в эфире с равномерно распределенной по частоте мощностью и для сообщения, ограниченного определенным диапазоном частот и определенной отдачей мощности на этом диапазоне, не существует более эффективного способа передачи информации, чем амплитудная модуляция, хотя другие способы могут быть столь же эффективны. Во-вторых, переданная этим способом информация не обязательно имеет такую форму, которая наиболее приемлема для слуха или для другого данного рецептора. В этом случае специфические свойства уха и других рецепторов должны быть учтены при помощи теории, весьма сходной с только что изложенной. Вообще эффективное использование амплитудной модуляции или какого-либо другого вида модуляции должно быть дополнено применением соответствующих декодирующих устройств для преобразования принятой информации в такую форму, которая может быть хорошо воспринята рецепторами человека или же механическими рецепторами. Первоначальное сообщение тоже должно кодироваться, чтобы оно занимало возможно меньше места при передаче. Эта задача была разрешена, по крайней мере частично, когда Белловские телефонные лаборатории разработали систему «вокодер», а д-р К. Шеннон из этих лабораторий [c.127] представил в весьма удовлетворительном виде соответствующую общую теорию. Так обстоит дело с определением и методикой измерения информации. Теперь рассмотрим, каким способом информация может быть представлена в однородной во времени форме. Заметим, что большинство телефонных устройств и других приборов связи в действительности не предполагает определенного начала отсчета во времени. В самом деле, только одна операция как будто противоречит этому, но и здесь противоречие лишь кажущееся. Мы имеем в виду модуляцию. В ее наиболее простом виде она состоит в преобразовании сообщения f(t) в сообщение вида f(t)sin(at+b). Однако, если мы будет рассматривать множитель sin(at+b) как добавочное сообщение, вводимое в аппаратуру, то, очевидно, случай модуляции подойдет под наше общее утверждение. Добавочное сообщение, которое мы называем переносчиком, ничего не прибавляет к скорости передачи информации системой. Вся содержащаяся в нем информация посылается в произвольно короткий промежуток времени, и затем больше ничего нового не передается.
Итак, сообщение, однородное во времени, или, как выражаются профессионалы-статистики, временной ряд, находящийся в статистическом равновесии, есть функция или множество функций времени, входящее в ансамбль таких множеств с правильным распределением вероятностей, не изменяющимся, если всюду заменить t на t+τ. Иначе говоря, вероятность ансамбля инвариантна относительно группы преобразований, состоящей из операторов Tλ которые изменяют f(t) в f(t+λ). Группа удовлетворяет условию
(3.15)
Следовательно, если Ф[f(t)] — «функционал» от f(t), т. е. число, зависящее от всей истории функции f(t), и среднее значение f(t) по всему ансамблю конечно, то мы вправе применить эргодическую теорему Биркгоффа из предыдущей главы и заключить, что всюду, исключая множество значений f(t) нулевой вероятности, существует временно́е среднее от Ф[f(t)], или в символах
(3.16)
[c.128]
Но это еще не все. В предыдущей главе проводилась другая теорема эргодического характера, доказанная фон Нейманом: коль скоро некоторая система переходит в себя при данной группе сохраняющих меру преобразований, как в случае нашего уравнения (3.15), то, за исключением множества элементов нулевой вероятности, каждый элемент системы входит в подмножество (быть может, равное всему множеству), которое: 1) переходит в себя при тех же преобразованиях; 2) имеет меру, определенную на нем самом и также инвариантную при этих преобразованиях; 3) замечательно тем, что любая часть этого подмножества с мерой, сохраняемой данной группой преобразований, имеет либо максимальную меру всего подмножества, либо меру 0. Отбросив все элементы, не принадлежащие к такому подмножеству, и используя для него надлежащую меру, мы найдем, что временно́е среднее (3.16) почти во всех случаях равно среднему значению функционала Ф[f(t)] по всему пространству функций f(t), т. е. так называемому фазовому среднему. Стало быть, в случае такого ансамбля функции f(t), за исключением множества случаев нулевой вероятности, мы можем найти среднее значение любого статистического параметра ансамбля по записи любого временного ряда ансамбля, применяя временно́е среднее вместо фазового. Более того, этим путем можно найти одновременно любое счетное множество таких параметров ансамбля, и нам нужно знать лишь прошлое одного, почти какого угодно временного ряда ансамбля. Другими словами, если дана вся прошлая история — вплоть до настоящего момента — временного ряда, принадлежащего к ансамблю в статистическом равновесии, то мы можем вычислить с вероятной ошибкой, равной нулю, все множество статистических параметров ансамбля, к которому принадлежит ряд. До сих пор мы установили это для отдельного временного ряда, но сказанное справедливо также для многомерных временных рядов, где вместо одной изменяющейся величины мы имеем несколько одновременно изменяющихся величин.
Теперь мы можем рассмотреть различные задачи, относящиеся к временным рядам. Ограничимся случаями, в которых все прошлое временного ряда может быть задано счетным множеством величин. Например, для [c.129] довольно широкого класса функций f(t) (—∞ < t < ∞) функция f(t) полностью определена, если известно множество величин
,
(n=0, 1, 2, …) (3.17)
Пусть теперь А — некоторая функция от будущих значений t, т. е. от значений аргумента, больших нуля. Тогда мы можем определить совместное распределение величин (a0, a1, …, аn, A) из прошлого одного, почти любого временного ряда, если множество функций f берется в самом узком возможном смысле. В частности, если даны все a0, …, аn, то мы можем найти распределение функции А. Здесь мы прибегаем к известной теореме Никодима об условных вероятностях. Та же теорема гарантирует нам, что это распределение при весьма общих условиях стремится к пределу, когда n→∞, и этот предел даст нам полные сведения относительно распределения любой будущей величины. Мы можем таким же образом определить по известному прошлому совместное распределение значений любого множества будущих величин или любого множества величин, зависящих от прошлого и от будущего. Если теперь нам дана некоторая подходящая интерпретация «наилучшего значения» статистического параметра или множества статистических параметров — например, в смысле математического ожидания, или медианы, или моды, — то мы можем вычислить это значение из известного распределения и получить предсказание, удовлетворяющее любому желательному критерию надежности предсказания. Мы можем численно оценить качество предсказания, применяя какой угодно статистический показатель качества: среднеквадратическую ошибку, максимальную ошибку, среднюю абсолютную ошибку и т. д. Мы можем вычислить количество информации о любом статистическом параметре или множестве статистических параметров, которое дает нам фиксация прошлого. Можно даже вычислить количество информации о всем будущем после определенного момента, даваемое нам знанием прошлого. Правда, если этот момент — настоящее, то, вообще говоря, мы будем знать о нем из прошлого, и наше знание настоящего будет содержать бесконечно много информации. [c.130]
Другой интересной проблемой является проблема многомерных временных рядов, в которых мы точно знаем лишь прошлое нескольких составляющих. Распределение величины, зависящей от более богатого прошлого, может изучаться методами, весьма близкими к уже рассмотренным. В частности, нам может понадобиться узнать распределение значений другой составляющей или множества значений других составляющих в некоторый момент прошлого, настоящего или будущего. К этому классу относится и общая задача о волновом фильтре. Даны сообщение и шум, скомбинированные некоторым образом в искаженное сообщение, прошлое которого нам известно. Нам известно также статистическое совместное распределение сообщения и шума как временных рядов. Мы ищем распределение значений сообщения в данный момент прошлого, настоящего или будущего. Затем мы разыскиваем оператор, который, будучи применен к прошлому искаженного сообщения, восстановит истинное сообщение наилучшим образом, в данном статистическом смысле. Мы можем также искать статистическую оценку какой-либо меры ошибок в нашем знании сообщения. Наконец, мы можем искать количество информации, которым располагаем в сообщении.
Особенно простым и важным является ансамбль временных рядов, связанный с броуновым движением. Броуновым движением называется движение частицы газа, толкаемой случайными ударами других частиц под действием теплового возбуждения. Теория его была разработана многими исследователями, в частности Эйнштейном, Смолуховским, Перреном и автором[142]. Если только мы не спускаемся по шкале времени до столь малых промежутков, что становятся различимыми отдельные удары частиц по данной частице, броуново движение обнаруживает любопытное явление недифференцируемости. Средний квадрат перемещения частицы в данном направлении за данный промежуток времени пропорционален длине этого промежутка, а перемещения за [c.131] последовательные промежутки времени совершенно не коррелируются между собой. Это вполне согласуется с физическими наблюдениями. Если мы нормируем шкалу броунова движения соответственно шкале времени и будем рассматривать только одну координату х, положив x(t)=0 для t=0, то вероятность того, что при 0≤t1≤t2…≤tn частицы находятся между х1 и x1+dx1 в момент t1, между х2 и x2+dx2 в момент t2, …, между xn и xn+dхn в момент tn, равна
. (3.18)
Исходя из создаваемой этим системы вероятностей, вполне однозначной, мы можем ввести на множестве путей, соответствующих различным возможным броуновым перемещениям, такой параметр α, лежащий между 0 и 1, что: 1) каждый путь будет функцией x(t,α), где х зависит от времени t и параметра распределения α и 2) вероятность данному пути находиться в данном множестве S будет равна мере множества значений α, соответствующих путях, находящимся в S. Поэтому почти все пути будут непрерывными и недифференцируемыми.
Весьма интересен вопрос об определении среднего значения произведения x(t1, α) … x(tn, α) относительно α. Это среднее равно
(3.19)
при условии 0 ≤t1 ≤…≤ tn. Положим
(3.20)
[c.132]
где λk,1+λk,2+…+λk,n=n.Тогда выражение (3.19) примет значение
. (3.21)
Здесь первая сумма берется по j; вторая — по всем способам разбиения n элементов на пары в группах, включающих соответственно λk,1, …, λk,n элементов; произведение — по парам значений k и q, где λk,1 элементов среди выбранных tk и tq равны t1, λk,2 элементов равны t2 и т. д. Отсюда сразу же следует
(3.22)
[c.133]
где сумма берется по всем разбиениям величин t1, …, tn на различные пары, произведение — по всем парам в каждом разбиении. Другими словами, если нам известны средние значения попарных произведений величин x(tj, α), то нам известны и средние значения всех многочленов от этих величин и, следовательно, их полное статистическое распределение.
До сих пор мы рассматривали броуновы перемещения x (tj,α), в которых t положительно. Положив
, (3.23)
где α и β имеют независимые равномерные распределения в интервале (0, 1), получим распределение для ξ(t, α, β), где t пробегает всю бесконечную действительную ось. Существует хорошо известный математический прием отобразить квадрат на прямолинейный отрезок таким образом, что площадь преобразуется в длину. Надо лишь записать координаты квадрата в десятичной форме
(3.24)
и положить
,
и мы получим искомое отображение, являющееся взаимно однозначным почти для всех точек как прямолинейного отрезка, так и квадрата. Используя эту подстановку, введем
. (3.25)
Теперь мы хотим определить в некотором подходящем смысле
(3.26)
Сразу приходит мысль определить указанное выражение как интеграл Стильтьеса[143], но это встречает [c.134] препятствие в том, что ξ представляет собой весьма нерегулярную функцию от t. Однако если К приближается достаточно быстро к нулю при t→± ∞ и является достаточно гладкой функцией, то разумно положить
(3.27)
При этих условиях мы формально получим
(3.28)
Если теперь t и s имеют противоположные знаки, то
(3.29)
а если они одного знака и |s|<|t|, то
(3.30)
[c.135]
Отсюда
(3.31)
В частности,
(3.32)
Более того,
(3.33)
[c.136]
где сумма берется по всем разбиениям величин τ1, …, τn на пары, а произведение — по парам в каждом разбиении. Выражение
(3.34)
изображает очень важный ансамбль временных рядов по переменной t, зависящих от некоторого параметра распределения γ. Доказанное нами равносильно утверждению, что все моменты и, следовательно, все статистические параметры этого распределения зависят от функции
(3.35)
представляющей собой известную в статистике автокорреляционную функцию со сдвигом τ. Таким образом, распределение функции f(t, γ) имеет те же статистики, что и функция f(t+t1, γ); и действительно, можно доказать, что если
, (3.36)
то преобразование параметра γ в Г сохраняет меру. Другими словами, наш временной ряд f(t, γ) находится в статистическом равновесии.
Далее, если мы рассмотрим среднее значение для
(3.37)
то оно состоит в точности из членов выражения
(3.38)
[c.137]
и из конечного числа членов, имеющих множителями степени выражения
, (3.39)
если последнее стремится к нулю при σ→∞, то (3.38) будет пределом выражения (3.37). Другими словами, распределения функций f(t, γ) и f(t+σ, γ) становятся асимптотически независимыми, когда σ→∞. Более общим, но совершенно аналогичным рассуждением можно показать, что одновременное распределение функций f(t1, γ), …, f(tn, γ) и функций f(σ+s1, γ), …, f(σ+sm, γ) стремится к совместному распределению первого и второго множества, когда σ→∞. Другими словами, если F[f (t, γ)] — любой ограниченный измеримый функционал, т. е. величина, зависящая от всего распределения значений функции f(t, γ) от t, то для него должно выполняться условие
. (3.40)
Если F[f (t, γ)] инвариантен при сдвиге по t и принимает только значения 0 или 1, то
, (3.41)
т. е. группа преобразований f(t, γ) в f(t+σ, γ) метрически транзитивна. Отсюда следует, что если F[f (t, γ)] — любой интегрируемый функционал от f как функции от t, то по эргодической теореме
(3.42)
[c.138]
для всех значений γ, исключая множество нулевой меры. Таким образом, мы почти всегда можем определить любой статистический параметр такого временного ряда (и даже любого счетного множества статистических параметров) из прошлой истории одного только параметра. В самом деле, если для такого временного ряда мы знаем
(3.43)
то мы знаем Ф(t) почти во всех случаях и располагаем полным статистическим знанием о временном ряде.
Некоторые величины, зависящие от временного ряда такого рода, обладают интересными свойствами. В частности, интересно знать среднее значение величины
(3.44)
Формально мы можем записать его в виде
. (3.45)
Весьма интересная задача — попытаться построить возможно более общий временной ряд из простых рядов броунова движения. При таких построениях, как подсказывает пример рядов Фурье, разложения типа (3.44) составляют удобные строительные блоки. В частности, исследуем временные ряды специального вида:
(3.46)
[c.139]
Предположим, что нам известна функция ξ(τ, γ), а также выражение (3.46). Тогда при t1>t2 находим, как в (3.45),
(3.47)
Умножив на
и положив s(t2—t1)=iσ, получим при t2→t1
(3.48)
Примем K(t1, λ) за новую независимую переменную μ и, решая относительно λ, получим
(3.49)
Тогда выражение (3.48) будет иметь вид
(3.50)
Отсюда преобразованием Фурье можно найти
(3.51)
как функцию от μ, коль скоро μ лежит между K(t1, a) и K(t1, b). Интегрируя эту функцию по μ, найдем
(3.52)
[c.140]
как функцию от K(t1, λ) и t1. Иначе говоря, существует известная функция F (u, v), такая, что
(3.53)
Поскольку левая часть этого равенства не зависит от t1, мы можем обозначить ее через G(λ) и положить
(3.54)
Здесь F — известная функция, и ее можно обратить относительно первого аргумента, положив
, (3.55)
где H — также известная функция. Отсюда
(3.56)
Тогда выражение
(3.57)
будет известной функцией и
(3.58)
откуда
, (3.59)
или
. (3.60)
Входящую в это выражение константу можно определить из соотношения
, (3.61)
или
. (3.62)
Очевидно, что если а конечно, то безразлично, какое значение мы ему дадим; в самом деле, наш оператор не [c.141] изменится от прибавления одной и той же величины ко всем значениям λ. Поэтому можно взять а=0. Таким образом, мы определили λ как функцию от G и, следовательно, G — как функцию от λ. Из (3.55) следует, что мы тем самым определили K(t, λ). Для завершения расчетов нам нужно только найти b. Это число можно определить сравнением выражений
(3.63)
и
. (3.64)
Таким образом, если при некоторых условиях, которые еще остается точно сформулировать, временной ряд допускает запись в виде (3.46) и известна функция ξ(t, γ) то мы можем определить функцию K(t, λ) в (3.46) и числа а и b с точностью до неопределенной константы, прибавляемой к а, λ и b. Не возникает особых трудностей при b→+∞, также не слишком сложно распространить эти рассуждения на случай а→ —∞. Конечно, предстоит проделать еще немалую работу, рассматривая задачу обращения функций в случае, когда результаты не однозначны, и общие условия справедливости соответствующих разложений. Тем не менее мы по крайней мере сделали первый шаг к решению задачи приведения обширного класса временных рядов к каноническому виду, что чрезвычайно важно для конкретного формального применения теорий предсказания и измерения информации, намеченных выше в этой главе.
Имеется, однако, одно очевидное ограничение, которое мы должны устранить из этого наброска теории временных рядов, а именно необходимость знать ξ(t, γ), и временной ряд, который мы разлагаем в виде (3.46). Вопрос ставится так: при каких условиях временной ряд с известными статистическими параметрами можно представить как ряд, определяемый броуновым движением, или по крайней мере как предел (в том или ином смысле) временных рядов, определяемых броуновым движением? Мы ограничимся временными рядами, [c.142] обладающими свойством метрической транзитивности и даже следующим более сильным свойством: если брать интервалы времени фиксированной длины, но отдаленные друг от друга, то распределения любых функционалов от отрезков временного ряда в этих интервалах приближаются к независимости по мере того, как интервалы отдаляются друг от друга[144]. Соответствующая теория уже излагалась автором.
Если K(t) — достаточно непрерывная функция, то можно показать, что нули величины
(3.65)
по теореме М. Каца, почти всегда имеют определенную плотность и что эта плотность при подходящем выборе К может быть сделана сколь угодно большой. Пусть выбрано такое КD, что плотность равна D. Последовательность нулей величины
,
от —∞ до ∞ обозначим через Zn(D, γ), —∞<n<∞. Конечно, при нумерации этих нулей индекс n определяется лишь с точностью до аддитивной целочисленной константы.
Пусть теперь T(t, μ) — произвольный временной ряд от непрерывной переменной t, а μ — параметр распределения временных рядов, изменяющийся равномерно в интервале (0, 1). Пусть далее
, (3.66)
где Zn — нуль, непосредственно предшествующий моменту t. Можно показать, что, каково бы почти ни было μ, для любого конечного множества значений t1, t2, …, tv переменной х одновременное распределение величин TD(tk, μ, γ) (k=1, 2, …, v) при D→∞ будет приближаться к одновременному распределению величин T(tk, μ) для тех же tk при D→∞. Но TD(tk, μ, γ) полностью определяется величинами tk, μ, D. Поэтому вполне уместно попытаться выразить TD(tk, μ, γ) [c.143] для данного D и данного μ, либо прямо в виде (3.46), либо некоторым образом в виде временного ряда, распределение которого является пределом (в указанном свободном смысле) распределении этого типа.
Следует признать, что все это изображает скорее программу на будущее, чем уже выполненную работу. Тем не менее эта программа, по мнению автора, дает наилучшую основу для рационального, последовательного рассмотрения многих задач в области нелинейного предсказания, нелинейной фильтрации, оценки передачи информации в нелинейных системах и теории плотного газа и турбулентности. К ним принадлежат, быть может, самые острые задачи, стоящие перед техникой связи.
Перейдем теперь к задаче предсказания для временных рядов вида (3.34). Мы замечаем, что единственным независимым статистическим параметром такого временного ряда является функция Ф(t), определенная формулой (3.35). Это значит, что единственной значащей величиной, связанной с K(t), является
(3.67)
Конечно, здесь К — величина действительная.
Применяя преобразование Фурье, положим
. (3.68)
Если известно K(s), то известно k(ω), и обратно. Тогда
(3.69)
Таким образом, знание Ф(t) равносильно знанию k(ω)k(—ω). Но поскольку K(s) действительно, то
, (3.70)
откуда . Следовательно, |k(ω)|2 есть известная функция, а потому действительная часть log|k(ω)| также есть известная функция. [c.144]
Если записать[145]
(3.71)
то нахождение функции K(s) эквивалентно нахождению мнимой части log k(ω). Это задача неопределенная, если не наложить дальнейшего ограничения на k(ω). Налагаемое ограничение будет состоять в том, что log k(ω) должен быть аналитической функцией и иметь достаточно малую скорость роста относительно ω в верхней полуплоскости. Для выполнения этого условия предположим, что k(ω) и [k(ω)]—1 возрастают вдоль действительной оси алгебраически. Тогда [F(ω)]2 будет четной и не более, чем логарифмически бесконечной функцией, и будет существовать главное значение Коши[146] для
(3.72)
Преобразование, определяемое выражением (3.72), называется преобразованием Гильберта; оно изменяет cos λω в sin λω и sin λω в —cos λω. Следовательно,
F(ω)+iG(ω)
есть функция вида
(3.73)
и удовлетворяет требуемым условиям для log |k(ω)| в нижней полуплоскости.
Если теперь положить
, (3.74)
то можно показать, что при весьма общих условиях функция K(s), определяемая формулой (3.68), будет обращаться в нуль для всех отрицательных аргументов. Таким образом,
(3.75)
[c.145]
С другой стороны, можно показать, что 1/k(ω) записывается в виде
, (3.76)
где значения Nn определены подходящим образом, и что при этом можно получить
(3.77)
Здесь значения Qn должны удовлетворять формальному условию
(3.78)
В общем случае будем иметь
, (3.79)
а если ввести по образцу соотношения (3.68)
, (3.80)
то
. (3.81)
Следовательно,
. (3.82)
Этот вывод мы используем для того, чтобы получить оператор предсказания в форме, связанной не со временем, а с частотой. [c.146]
Таким образом, прошлое и настоящее функции ξ(t, γ), или точнее «дифференциала» dξ(t, γ), определяют прошлое и настоящее функции f(t, γ), и обратно.
Если теперь А >0, то
(3.83)
Здесь первый член последнего выражения зависит от области изменения dξ(τ, γ), в которой, зная лишь f(σ, γ) для σ≤t, сказать ничего нельзя, и совершенно не зависит от второго члена. Его среднеквадратическое значение равно
, (3.84)
и эта формула дает все статистическое знание о нем. Можно показать, что первый член имеет гауссово распределение с этим среднеквадратическим значением. Последнее равно ошибке наилучшего возможного предсказания функции f(t+A, γ).
Само же наилучшее возможное предсказание выражается вторым членом в (3.83):
. (3.85)
Если теперь положим
(3.86)
[c.147]
и применим оператор (3.85) к eiωt, получив
, (3.87)
то найдем, подобно (3.81), что
(3.88)
Это и есть частотная форма наилучшего оператора предсказания.
Задача фильтрации в случае временных рядов типа (3.34) тесно связана с задачей предсказания. Пусть сумма сообщения и шума имеет вид
, (3.89)
а сообщение имеет вид
, (3.90)
где γ и δ распределены независимо в интервале (0, 1). Тогда предсказуемая часть функции m(t+a), очевидно, равна
, (3.901)
а среднеквадратическая ошибка предсказания равна
. (3.902)
Допустим, кроме того, что нам известны следующие величины:
[c.148]
(3.903)
(3.904)
(3.905)
[c.149]
Преобразование Фурье для этих величин соответственно равно
(3.906)
где
(3.907)
то есть
(3.908)
и
, (3.909)
где для симметрии пишем
.
Теперь мы можем определить k(ω) из (3.908), как прежде определили k(ω) из (3.74). Здесь мы принимаем
В результате
(3.910)
и
. (3.911)
Таким образом, наилучшее определение функции m(t) с наименьшей среднеквадратической ошибкой есть
. (3.912)
[c.150]
Сравнивая это с уравнением (3.89) и пользуясь рассуждениями, подобными тем, посредством которых было получено (3.88), заключаем, что оператор для m(t)+n(t), дающий «наилучшее» представление функции m(t+a), имеет при записи в частотной шкале следующий вид:
. (3.913)
Этот оператор служит характеристическим оператором устройства, которое в электротехнике называют волновым фильтром. Величина а есть фазовое отставание фильтра. Она может быть положительной или отрицательной; если она отрицательна, то а называется фазовым опережением. Прибор, соответствующий формуле (3.913), может быть построен с какой угодно точностью. Подробности его конструкции нужны более для инженера-электрика, чем для читателя этой книги. Их можно найти в соответствующей литературе[147].
Среднеквадратическая ошибка фильтрации (3.902) может быть представлена как сумма среднеквадратической ошибки фильтрации для бесконечного фазового отставания
(3.914)
[c.151]
и другого члена
, (3.915)
зависящего от фазового отставания. Мы видим, что среднеквадратическая ошибка фильтрации есть монотонно убывающая функция фазового отставания.
Другим интересным вопросом в случае сообщений и шумов, порождаемых броуновым движением, является скорость передачи информации. Рассмотрим для простоты случай, когда сообщение и шум независимы, т. е. когда
. (3.916)
Рассмотрим в этом случае функции
, (3.917)
где γ и σ распределены независимо. Пусть нам известна сумма m(t)+n(t) в интервале (—А, А). Сколько у нас тогда информации об m(t)? Заметим, что, по эвристическому суждению, это количество информации не должно слишком отличаться от количества информации о функции
(3.918)
которым мы располагаем, когда нам известны все значения выражения
, (3.919)
где γ и σ имеют независимые распределения. Можно, однако, показать, что n-й коэффициент Фурье для выражения (3.918) имеет гауссово распределение, независимое от всех других коэффициентов Фурье, и что его [c.152] среднеквадратическое значение пропорционально величине
(3.920)
Следовательно, в силу (3.09) полное количество информации об М равно
, (3.921)
а временная плотность передачи энергии равна этой величине, деленной на 2А. Если А→∞, то выражение (3.921) стремится к
. (3.922)
Именно этот результат и был получен автором и Шенноном для скорости передачи информации в рассматриваемом случае. Как видим, эта величина зависит не только от ширины полосы частот, которой мы располагаем для передачи сообщения, но и от уровня шума. В действительности она обнаруживает прямую связь с аудиограммами, применяемыми для измерения величины слуха и потери его у данного индивидуума. В аудиограмме абсциссой служит частота, ординатой нижней границы — логарифм порога слышимой силы звука (мы можем назвать его логарифмом внутреннего шума принимающей системы), а ординатой верхней границы — логарифм наибольшей силы звука, которую система может пропустить. Площадь между ними, представляющая величину такой же размерности, как выражение (3.922), принимается за меру скорости передачи информации, с которой ухо способно справиться. [c.153]
Теория сообщений, линейно зависящих от броунова движения, имеет много важных вариантов. Основными являются формулы (3.88), (3.914) и (3.922), разумеется, вместе с определениями, необходимыми для их понимания. Существует ряд вариантов этой теории. Прежде всего она дает нам наилучший возможный синтез предсказывающих устройств и волновых фильтров в случае, когда сообщения и шумы представляют собой реакции линейных резонаторов на броуновы движения, однако и в значительно более общих случаях она обеспечивает некоторый возможный синтез предсказывающих устройств и фильтров. Последние, правда, не будут иметь абсолютно наилучшей конструкции, но, во всяком случае, позволят свести к минимуму среднеквадратическую ошибку предсказания при использовании линейных устройств. Однако, вообще говоря, найдутся такие нелинейные устройства, которые будут работать лучше, чем любые линейные устройства.
Кроме того, выше мы рассматривали простые временные ряды, в которых от времени зависит лишь одна числовая переменная. Существуют также многомерные временные ряды, где несколько таких переменных зависят все вместе от времени; именно многомерные ряды имеют наибольшее значение в экономических науках, метеорологии и т. п. Полная карта погоды Соединенных Штатов, составляемая ежедневно, есть такой временной ряд. В этом случае нам нужно одновременно выразить несколько функций через частоту, причем квадратические величины, такие, как выражение (3.35) или |k(ω)|2 в рассуждениях после формулы (3.70), заменяются множествами пар величин, т. е. матрицами. Задача определения функции k(ω) через |k(ω)|2 с выполнением некоторых добавочных условий в комплексной плоскости становится теперь гораздо труднее, особенно ввиду того, что умножение матриц не является перестановочной операцией. Тем не менее задачи, относящиеся к этой многомерной теории, были решены, по крайней мере частично, Крейном и автором.
Многомерная теория представляет собой усложнение предыдущей теории. Существует, кроме того, другая близкая теория, которая является ее упрощением. Эта теория предсказания, фильтрации и количества информации в дискретных временных рядах. Такой ряд [c.154] представляет собой последовательность функций fn(α) параметра α, где n пробегает все целочисленные значения от —∞ до ∞. Величина α, как и раньше, служит параметром распределения, и можно по-прежнему считать, что этот параметр изменяется равномерно в интервале (0, 1). Говорят, что временной ряд находится в статистическом равновесии, если замена n на n+v (v — целое число) равносильна сохраняющему меру преобразованию в себя интервала (0, 1), пробегаемого параметром α.
Теория дискретных временных рядов во многих отношениях проще теории непрерывных рядов. Гораздо легче, например, свести их к последовательности независимых выборов. Каждый член (в случае перемешивания) можно представить как комбинацию предшествующих членов с некоторой величиной, не зависящей от всех предшествующих членов и равномерно распределенной в интервале (0, 1), и последовательность этих независимых коэффициентов взять вместо броунова движения, столь важного для непрерывных рядов.
Если fn(α) — временной ряд, находящийся в статистическом равновесии и метрически транзитивный, то его коэффициент автокорреляции будет равен
. (3.923)
и мы будем иметь
(3.924)
почти для всех α. Положим
, (3.925)
или
(3.926)
[c.155]
Пусть
, (3.927)
(3.928)
и
. (3.929)
Тогда при очень общих условиях k(ω) будет граничным значением на единичном круге для функции без нулей и особых точек внутри единичного круга; ω является здесь углом. Отсюда
(3.930)
Если теперь за наилучшее линейное предсказание функции fn(α) с опережением v принимается
, (3.931)
то
. (3.932)
Это выражение аналогично выражению (3.88). Заметим, что если положить
, (3.933)
то
(3.934)
[c.156]
Из нашего способа образования k(ω) видно, что для весьма широкого класса случаев мы вправе положить
. (3.935)
Тогда уравнение (3.934) принимает вид
. (3.936)
В частности, при v=1
, (3.937)
или
(3.938)
Таким образом, при предсказании на один шаг вперед наилучшим значением для fn+1(α) будет
; (3.939)
последовательным же предсказанием по шагам мы можем решить всю задачу линейного предсказания для дискретных временных рядов. Как и в непрерывном случае, это будет наилучшим возможным предсказанием относительно любых методов, если
. (3.940)
Переход от непрерывного случая к дискретному в задаче фильтрации совершается примерно таким же путем. Формула (3.913) для частотной характеристики наилучшего фильтра принимает вид
, (3.941)
где все члены имеют тот же смысл, что и в непрерывном случае, за исключением того, что все интегралы по ω и u [c.157] имеют пределы от —π до π, а не от —∞ до ∞ и вместо интегралов по t берутся дискретные суммы по v. Фильтры для дискретных временных рядов представляют собой обычно не столько физически осуществимые устройства для применения в электрической схеме, сколько математические процедуры, позволяющие статистикам получать наилучшие результаты со статистически несовершенными данными.
Наконец, скорость передачи информации дискретным временным рядом вида
, (3.942)
при наличии шума
, (3.943)
где γ и δ независимы, будет точным аналогом выражения (3.922), а именно:
, (3.944)
где на интервале (—π, π) выражение
(3.945)
изображает распределение мощности сообщения по частоте, а выражение
(3.946)
изображает распределение мощности шума.
Изложенные здесь статистические теории предполагают полное знание прошлого наблюдаемых нами временных рядов. Во всех реальных случаях мы должны довольствоваться меньшим, поскольку наши наблюдения не распространяются в прошлое до бесконечности. Разработка нашей теории за пределы этого [c.158] ограничения требует расширения существующих методов выборки. Автор и другие исследователи сделали первые шаги в этом направлении. Это связано со всеми сложностями применения закона Бейеса либо тех терминологических ухищрений теории правдоподобия[148], которые на первый взгляд устраняют необходимость в применении закона Бейеса, но в действительности лишь перелагают ответственность за его применение на статистика-практика или на лицо, использующее в конце концов результаты, полученные статистиком-практиком. Тем временем статистик-теоретик может вполне честно утверждать, что все сказанное им является совершенно строгим и безупречным.
В заключение этой главы мы коснемся современной квантовой механики, на которой сильнее всего сказалось вторжение теории временных рядов в современную физику. В ньютоновой физике последовательность физических явлений полностью определяется своим прошлым, и в частности, указанием всех положений и импульсов в какой-либо один момент. В полной гиббсовской теории, при точном определении многомерного временного ряда всей Вселенной, знание всех положений и импульсов в какой-либо один момент также определило бы все будущее. И только вследствие того, что существуют неизвестные, ненаблюдаемые координаты и импульсы, только по этой причине временные ряды, с которыми мы фактически работаем, приобретают своего рода смесительное свойство, с которым мы познакомились в этой главе для случая временных рядов броунова движения. Большим вкладом Гейзенберга в физику была замена этого все еще квазиньютонова мира Гиббса миром, в котором временные ряды совершенно не могут быть сведены к набору детерминированных нитей развития во времени. В квантовой механике все прошлое индивидуальной системы не создает никакого абсолютного определения будущего этой системы, но дает лишь распределение возможных будущих состояний. Величины, которые требуются классической физике для знания всего поведения системы, можно наблюдать одновременно лишь приближенным и нестрогим образом, хотя эти наблюдения и достаточно точны для нужд классической физики в том диапазоне [c.159] точности, в котором экспериментально доказана ее применимость. Условия наблюдения импульса и соответствующего ему положения несовместимы. Для наблюдения положения системы с наибольшей возможной точностью мы должны наблюдать его с помощью световых или электронных волн или аналогичных средств с высокой разрешающей способностью или короткой длиной волны. Однако свет обладает корпускулярным действием, зависящим только от его частоты, и при освещении тела светом высокой частоты количество движения тела изменяется тем больше, чем выше частота. С другой стороны, свет низкой частоты дает минимальное изменение импульса освещаемых частиц, но не имеет достаточной разрешающей способности, чтобы дать резкий отсчет положений. Промежуточные частоты света дают размытый отсчет как положений, так и импульсов. Вообще нельзя придумать системы наблюдений, которая могла бы дать нам достаточно информации о прошлом системы, чтобы получить полную информацию о ее будущем.
Тем не менее, как и в случае всех ансамблей временных рядов, изложенная здесь теория количества информации, а следовательно, и теория энтропии сохраняют силу. Но так как мы теперь имеем дело с временными рядами, обладающими свойством перемешивания даже в случае, когда наши данные настолько полны, насколько это возможно, то наша система, очевидно, лишена абсолютных потенциальных барьеров, и с течением времени любое состояние системы может и будет переходить в любое другое состояние. Однако вероятность такого перехода зависит в конечном счете от относительной вероятности или меры данных двух состояний. Последняя оказывается особенно большой для состояний, которые могут быть преобразованы сами в себя большим числом преобразований, т. е. для состояний, которые, на языке квантовой теории, имеют большой внутренний резонанс, или большое квантовое вырождение. Примером может служить бензоловое кольцо, так как здесь оба состояния эквивалентны:
[c.160]
Это наводит на следующую мысль. Пусть дана система, в которой составные части могут различными способами близко соединяться друг с другом, как в случае смеси аминокислот, организующейся в белковые цепи, тогда ситуация, при которой многие из этих цепей одинаковы и проходят через стадию тесной связи между собой, может оказаться более устойчивой, чем ситуация, при которой они различны. Холдэйн предположил, что именно таким путем воспроизводят себя гены и вирусы, и хотя он не подтвердил своего предположения окончательными доказательствами, я не вижу причин, почему не принять его как пробную гипотезу. Как указал сам Холдэйн, поскольку в квантовой теории ни одна частица не имеет совершенно четкой индивидуальности, можно сказать лишь приблизительно, какой из двух экземпляров гена, воспроизведшего себя таким образом, является оригиналом и какой — копией.
Это явление резонанса, как известно, очень часто встречается в живом веществе. Сент-Дьёрдьи указал на его значение в конструкции мышц. Вещества с большим резонансом обычно обладают ненормально большой способностью запасать энергию и информацию, а такое ненормально большое запасание, бесспорно, имеет место при мышечном сокращении.
Эти же явления, участвующие в воспроизведении, имеют, вероятно, отношение и к чрезвычайной специфичности химических веществ, обнаруживаемых в живых организмах, не только по отношению к разным видам, но даже по отношению к особям одного вида. Соображения такого рода могут иметь большое значение в иммунологии. [c.161]
В неврологическую клинику приходит больной. Он не парализован и, получив приказание, может двигать ногами. Тем не менее он страдает тяжелым недугом. Он идет странной, неуверенной походкой и все время смотрит вниз, на землю и на свои ноги. Каждый шаг он начинает с рывка, выбрасывая вперед сначала одну, потом другую ногу. Если ему завязать глаза, он не сможет стоять, он шатается и падает. Что с ним?
Приходит другой больной. Пока он неподвижно сидит на стуле, кажется, что у него все в порядке. Но если предложить ему папиросу, то при попытке взять ее рукой он промахнется. Затем он столь же тщетно качнет руку в обратном направлении, потом опять вперед, и, наконец, его рука станет совершать лишь быстрые и бесцельные колебания. Дайте ему стакан воды, и он выплеснет всю воду, прежде чем сумеет поднести стакан ко рту. Что с ним?
Оба больные страдают разными формами так называемой атаксии. Их мышцы достаточно сильны и здоровы, но они не могут управлять своими движениями. Первый больной страдает спинной сухоткой. Часть спинного мозга, обычно воспринимающего ощущения, повреждена или разрушена поздними осложнениями от сифилиса. Поступающие сигналы притуплены или даже полностью пропадают. Рецепторы в суставах, сухожилиях, мышцах и подошвах его ног, обычно сообщавшие ему о положении и движении ног, не посылают сигналов, которые центральная нервная система могла бы принять и передать, и чтобы получить информацию о положении своего тела, больной должен полагаться на глаза и органы равновесия внутреннего уха. Физиолог на своем языке скажет, что больной потерял значительную часть проприоцептивных и кинестетических [c.162] ощущений. Второй больной не потерял проприоцептивных ощущений — у него повреждение мозжечка, и он болен так называемым мозжечковым, или интенционным, тремором. По-видимому, функция мозжечка — соразмерять мышечную реакцию с проприоцептивными сигналами, и если эта соразмерность нарушена, одним из следствий может явиться тремор.
Мы видим, таким образом, что для эффективного воздействия на внешний мир не только необходимо иметь хорошие эффекторы, но действие этих эффекторов должно находиться под надлежащим контролем центральной нервной системы; показания же контрольных органов должны сочетаться надлежащим образом с другими сведениями, поступающими из органов чувств, образуя правильно соразмеренные выходные сигналы к эффекторам. Нечто подобное наблюдается и в механических системах. Рассмотрим центральный пост сигнализации на железной дороге. Оператор управляет рядом рычагов, которые открывают или закрывают семафоры и переводят стрелки. Однако он не может слепо верить, что семафор и стрелки подчинились его приказаниям. Стрелки могли замерзнуть или снег мог согнуть крылья семафоров, и действительное положение стрелок и сигналов семафоров — эффекторов оператора — может не соответствовать его приказаниям. Во избежание опасностей, неизбежно связанных с такой возможностью, каждый эффектор — стрелка или сигнал семафора — соединяется с контрольными приборами на сигнальном посту, которые сообщают оператору о действительном состоянии и работе эффектора. Это представляет собой механическую аналогию повторению приказов в военно-морском флоте, где по уставу каждый подчиненный по получении приказа повторяет его своему начальнику, чтобы показать, что он расслышал и понял. На основании таких повторенных приказов и действует оператор.
Заметим, что в этой системе человек участвует в цепи прямой и обратной передачи информации, в цепи, которую мы далее будем называть цепью обратной связи. Правда, оператор не может действовать полностью по своему произволу; стрелки и сигналы связаны блокировкой, механической или электрической, и не в его воле выбрать гибельные комбинации. Но имеются цепи [c.163] обратной связи, в которых человек совершенно не участвует. Одна из таких цепей — обычный термостат, регулирующий отопление жилища. Термостат устанавливают на желательную температуру помещения, и если действительная температура ниже, то срабатывает устройство, которое открывает заслонку печи для усиления тяги или увеличивает поступление горючего и тем самым доводит температуру помещения до желательного уровня. Если же температура помещения превышает желательный уровень, то выключается тяга, либо уменьшается или прекращается поступление горючего. Таким образом, температура помещения удерживается приблизительно на постоянном уровне. Заметим, что постоянство этого уровня зависит от качества конструкции термостата и что плохо спроектированный термостат может вызвать сильные колебания температуры, подобные движениям человека, страдающего мозжечковым тремором.
Другой пример чисто механической системы обратной связи — это изученный впервые Кларком Максвеллом регулятор паровой машины, служащий для регулировки ее скорости при переменных режимах нагрузки. Регулятор в своем первоначальном виде, как его сконструировал Уатт, состоит из двух шаров, укрепленных на маятниковых стрежнях на противоположных сторонах вращающегося вала. Собственный вес или пружина тянет шары вниз, а центробежная сила, зависящая от угловой скорости вала, стремится подбросить их вверх. Поэтому они принимают некоторое промежуточное положение, которое также зависит от угловой скорости. Шары через другие стержни управляют положением муфты, сидящей на валу, которая приводит в движение золотник, открывающий впускные клапаны цилиндра, когда скорость машины уменьшается и шары опускаются, и закрывающий их, когда скорость машины увеличивается и шары поднимаются. Заметим, что обратная связь стремится противодействовать тому, что делает система; следовательно, эта обратная связь является отрицательной.
Итак, мы рассмотрели примеры отрицательной обратной связи для стабилизации температуры и отрицательной обратной связи для стабилизации скорости. Возможна также отрицательная обратная связь для [c.164] стабилизации положения, как в рулевых машинах корабля, которые приходят в действие при наличии угловой разности между положением штурвала и положением руля и действуют всегда таким образом, чтобы привести положение руля в соответствие с положением штурвала. Обратная связь при произвольных действиях человека имеет такой же характер. Мы не хотим специально приводить в движение определенные мышцы и даже вообще не знаем, какие мышцы нужно привести в движение, чтобы выполнить данную задачу, мы просто хотим взять папиросу. Наше движение регулируется степенью того, насколько задача еще не выполнена.
Информация, поступающая обратно в управляющий центр, стремится противодействовать отклонению управляемой величины от управляющей, но она может зависеть от этого отклонения весьма различным образом. Простейшие управляющие системы — линейные системы: выходной сигнал исполнительного органа зависит линейно от входного сигнала, и при сложении входных сигналов складываются и выходные сигналы. Выходной сигнал отсчитывается каким-нибудь прибором, также линейным. Этот отсчет просто вычитается из входного сигнала. Мы хотим дать точную теорию работы такой системы и, в частности, исследовать ее неисправное поведение и возникновение в ней колебаний при неправильном обращении или перегрузке.
В этой книге мы по возможности избегали математической символики и математических методов, хотя в ряде мест, включая предыдущую главу, вынуждены были примириться с ними. Сейчас речь опять пойдет о вопросах, где математическая символика — самый надежный язык; избежать ее можно только ценой длинных перифраз, которые вряд ли будут понятны профану и которые поймет лишь читатель, знакомый с математической символикой, поскольку в его власти перевести их в символы. Наилучший компромисс, который мы можем выбрать, — это дополнять символику пространными словесными пояснениями.
Пусть f(t) — функция времени t, где t изменяется от —∞ до ∞; иначе говоря, f(t) — величина, принимающая определенное числовое значение для каждого момента t. В любой момент t нам доступны величины f(s), где s меньше или равно t, но отнюдь не больше t. [c.165] Мы располагаем устройствами, электрическими или механическими, которые задерживают входной сигнал на фиксированное время и выдают нам при входном сигнале f(t) выходной сигнал f(t—τ), где τ — фиксированная задержка.
Мы можем включить одновременно несколько таких устройств, получив на выходах сигналы f(t—τ1), f(t—τ2),…, f(t—τn). Каждый из этих выходных сигналов мы можем умножить на фиксированные величины, положительные или отрицательные. Так, при помощи потенциометра можно умножить напряжение на фиксированное положительное число, меньшее единицы, и не очень трудно изобрести автоматические компенсационные устройства и усилители, чтобы умножать напряжение на отрицательные величины или на величины, бо́льшие единицы. Нетрудно также составить простую электрическую схему для непрерывного сложения напряжений, при помощи которой мы получим выход
. (4.01)
Увеличивая число задержек τk и выбирая подходящим образом коэффициенты ak, мы можем сколь угодно приблизиться к выходному сигналу вида
. (4.02)
Обратим внимание на то существенное обстоятельство, что в этом выражении интегрирование производится от 0 до ∞, а не от —∞ до ∞. В противном случае мы могли бы с помощью различных практических устройств преобразовать наш сигнал в f(t+σ), где σ положительно. Но это предполагает знание будущего функции f(t), a f(t) может быть величиной, которая не определяется однозначно своим прошлым; пример — координаты трамвая, который может повернуть на стрелке в ту или другую сторону. Если физический процесс по видимости дает нам оператор, преобразующий f(t) в
(4.03)
[c.166]
где а(τ) не исчезает при отрицательных τ, это значит, что мы не имеем больше истинного оператора для f(t), определяемого однозначно прошлым этой функции. Такое может встретиться в реальных физических ситуациях. Например, динамическая система без входа может прийти в постоянные колебания или даже в колебания, нарастающие до бесконечности, с неопределенной амплитудой. В этом случае будущее системы не определяется ее прошлым, и мы, наверное, можем найти формализм, в котором бы использовался оператор, зависящий от будущего.
Операция, посредством которой получено выражение (4.02) из f(t), имеет еще два существенных свойства: 1) она не зависит от сдвига начального момента и 2) она линейна. Первое свойство выражается утверждением, что если
, (4.04)
то
. (4.05)
Второе выражается утверждением, что если
, (4.06)
то
. (4.07)
Можно показать, что в некотором подходящем смысле всякий оператор для прошлого функции f(t), линейный и инвариантный относительно сдвига начального момента, имеет вид (4.02) или является пределом последовательности операторов этого вида. Например, f’(t) есть результат применения оператора с такими свойствами к f(t), и потому [c.167]
, (4.08)
где
(4.09)
Как мы уже видели, функции еzt составляют особенно интересное семейство с точки зрения оператора (4.02), поскольку
, (4.10)
и оператор задержки становится просто множителем, зависящим от z. Оператор (4.02) переходит тогда в
. (4.11)
и также оказывается оператором умножения, зависящим только от z. Выражение
(4.12)
называется представлением оператора (4.02) в виде функции частоты. Если z — комплексная величина х+iy, где х и y — действительные числа, то (4.12) переходит в
(4.13)
Отсюда следует ввиду известного неравенства Шварца для интегралов, что если y>0 и
, (4.14)
то [c.168]
. (4.15)
Это значит, что А(х+iу) — ограниченная голоморфная функция комплексной переменной в каждой полуплоскости x≥ε>0, а функция A(iy) представляет в некотором весьма определенном смысле граничные значения этой функции.
Положим
, (4.16)
где u и v — действительные числа. Тогда x+iy определится как функция (не обязательно однозначная) от u+iv. Это функция аналитическая, хотя и мероморфная, за исключением точек u+iv, соответствующих точкам z=x+-iy, где ∂А(z)/∂z=0. Граница х=0 перейдет в кривую с параметрическим уравнением
(y действительное). (4.17)
Эта новая кривая может пересекать саму себя любое число раз, но в общем случае она будет делить плоскость на две области. Рассмотрим кривую (4.17), вычерченную в направлении возрастания y от —∞ до +∞. Если идти от нее вправо по непрерывной линии, не пересекающей снова кривую (4.17), можно попасть в те или иные точки плоскости. Точки, не входящие в это множество и не лежащие на кривой (4.17), мы будем называть внешними точками. Часть кривой (4.17), содержащую предельные точки внешних точек, назовем эффективной границей. Все остальные точки будут именоваться внутренними точками. На нашем чертеже с границами, проведенными в направлении стрелок (рис. 1), внутренние точки заштрихованы, а эффективная граница выделена жирной линией.
Рис. 1
[c.169]
Условие ограниченности функции А в любой правой полуплоскости указывает на то, что бесконечно удаленная точка не может быть внутренней точкой. Она может быть граничной точкой, хотя существуют весьма определенные ограничения на тип граничной точки, которой может быть бесконечно удаленная точка. Эти ограничения касаются «толщины» множества внутренних точек, простирающихся к бесконечности.
Мы переходим теперь к математической формулировке задачи о линейной обратной связи. Пусть структурная (не электрическая!) схема нашей системы имеет вид, как на рис. 2.
Рис. 2
Здесь входной сигнал двигателя, обозначенный через Y, равен разности между первоначальным входным сигналом Х и выходным сигналом умножителя, умножающего выходную мощность AY двигателя на коэффициент λ. Тогда
(4.18)
и
, (4.19)
откуда выходной сигнал двигателя
. (4.20)
Следовательно, оператор, создаваемый всем механизмом обратной связи, равен A/(1+ λA). Он будет бесконечно большим тогда и только тогда, когда А= —1/λ. Кривая (4.17) для этого нового оператора будет иметь вид [c.170]
, (4.21)
и ∞ будет внутренней точкой этой кривой тогда и только тогда, когда —1/λ является внутренней точкой первоначальной кривой (4.17)[149].
В этом случае обратная связь с коэффициентом λ, несомненно, произведет нечто катастрофическое, и эта катастрофа практически выразится в том, что система придет в неограниченные, нарастающие колебания. Если же точка —1/λ внешняя, то можно показать, что никаких неприятностей не будет, и обратная связь будет устойчивой. Случай, когда точка —1/λ лежит на эффективной границе, требует особого исследования. В большинстве случаев система может прийти при этом в колебание с амплитудой, которая не будет увеличиваться.
Пожалуй, полезно рассмотреть несколько операторов А и допустимые для них диапазоны обратной связи. Мы будем рассматривать не только операции (4.02), но и их пределы, предполагая, что к последним применимы те же рассуждения.
Если оператор А соответствует дифференциальному оператору, то A(z)=z; тогда при изменении y от —∞ до ∞ точно так же изменяется и А (y), и внутренние точки являются внутренними точками правой полуплоскости. Точка —1/λ всегда является внешней, и любая степень обратной связи возможна.
Если
, (4.22)
то кривая (4.17) принимает следующий вид:
, (4.23)
или
, , (4.24)
что можно также записать в виде
(4.25)
[c.171]
Таким образом, наша кривая есть окружность с радиусом 1/2 и центром в точке (1/2, 0). Обход ее совершается по часовой стрелке, и внутренними будут те точки, которые обычно считаются внутренними. В этом случае обратная связь также неограниченна, ибо точка —1/λ всегда находится вне круга. Оператор a(t), соответствующий этому оператору А, будет равен
. (4.26)
Положим теперь
, (4.27)
тогда (4.17) принимает вид
(4.28)
Или
, (4.29)
что дает
(4.30)
или
(4.31)
Тогда
(4.32)
В полярных координатах при u = ρ соs φ, v = ρ sin φ получим
(4.33)
или
(4.34)
Иными словами, [c.172]
(4.35)
Можно показать, что оба эти уравнения изображают одну кривую — кардиоиду с вершиной в начале координат и острием, направленным вправо. Внутренняя область этой кривой не содержит точек отрицательной действительной оси; как и в предыдущем случае, допустимое усиление неограниченно. Оператор а(t) для этого случая имеет следующий вид:
(4.36)
Положим еще
(4.37)
Определим ρ и φ, как в предыдущем случае. Тогда
(4.38)
Как в первом случае, отсюда получим
(4.39)
т. е.
(4.40)
Эта кривая имеет форму, показанную на рис. 3[150]. Заштрихованная область изображает внутренние точки. Коэффициент обратной связи не может быть больше 1/8. Соответствующий оператор a(t) равен
(4.41)
Рис. 3
Наконец, пусть наш оператор, соответствующий A, представляет собой простую задержку на Т единиц [c.173] времени. Тогда
(4.42)
и
(4.43)
Кривая (4.17) в этом случае представляет собой единичную окружность с центром в начале координат, проходимую в направлении часовой стрелки со скоростью, равной единице. Внутренней областью кривой будет внутренняя область в обычном смысле, и предельная обратная связь равна 1.
Отсюда можно вывести одно весьма интересное заключение. Оператор 1/(1+kz) можно компенсировать произвольно сильной обратной связью, что заставляет A/(1+λA) приближаться сколь угодно близко к единице в сколь угодно широком диапазоне частот. Таким образом, три последовательных оператора этого типа можно компенсировать тремя — или даже двумя — обратными связями. Но оператор 1/(1+kz)3, получаемый при последовательном соединении трех операторов 1/(1+kz), нельзя сколь угодно точно компенсировать одной обратной связью. Оператор 1/(1+kz)3 можно также записать в виде
(4.44)
и рассматривать как предел аддитивного соединения трех операторов со знаменателями первой степени. Итак, оказывается, что сумму различных операторов, каждый из которых допускает сколь угодно точную компенсацию одной обратной связью, нельзя компенсировать таким же образом.
В ценной книге Макколла приведен пример сложной системы, которая может быть стабилизирована двумя обратными связями, но не одной. Речь идет о системе управления кораблем при помощи гирокомпаса. Наличие угла между курсом, который задал рулевой, и тем, который показывает компас, приводит к перекладке руля, создающей вследствие поступательного движения корабля вращающий момент, который изменяет курс корабля таким образом, чтобы уменьшить расхождение между заданным и действительным курсом. Если это [c.174] осуществляется путем непосредственного открывания клапанов одной рулевой машины и закрывания клапанов другой с таким расчетом, что скорость перекладывания руля пропорциональна отклонению корабля от курса, то угловое положение руля будет примерно пропорционально моменту вращения корабля и, следовательно, его угловому ускорению. Поэтому поворот корабля пропорционален с отрицательным коэффициентом третьей производной отклонения от курса, а операция, которую нужно стабилизировать обратной связью от гирокомпаса, имеет вид kz3, где k положительно. Таким образом, мы получаем для кривой (4.17) уравнение
(4.45)
и поскольку внутренней областью служит левая полуплоскость, никакой следящий механизм не сможет стабилизировать эту систему.
В этом описании мы несколько упростили задачу управления. В действительности здесь присутствует какое-то трение, и сила, поворачивающая корабль, не определяет ускорения. Если θ — угловое положение корабля, а φ — угловое положение руля по отношению к кораблю, то
(4.46)
и
(4.47)
Эту кривую можно записать как
(4.48)
и систему по-прежнему нельзя стабилизировать никакой обратной связью. Когда y изменяется от —∞ до ∞, v изменяется от ∞ до —∞, так что внутренняя область кривой расположена слева.
Если, с другой стороны, положение руля пропорционально отклонению от курса, то оператор, который мы хотим стабилизировать обратной связью, имеет вид k1z2+k2z, и кривая (4.17) будет задаваться уравнением
(4.49)
Эту кривую можно записать как
(4.50)
[c.175]
но на этот раз при изменении y от —∞ до ∞ u также изменяется от —∞ до ∞, а кривая наша обходится в направлении от у=—∞ до у=∞. Внешняя область кривой находится слева от нее, и возможно неограниченное усиление.
Для достижения этого результата можно применить вторую ступень обратной связи. Если положение клапанов рулевой машины регулируется не расхождением между действительным и желательным курсом, а разностью между этой величиной и угловым положением руля, то при достаточно большой обратной связи (т. е. когда клапаны открыты достаточно широко) будет поддерживаться с любой точностью пропорциональность между угловым положением руля и отклонением корабля от истинного курса. Система управления с двойной обратной связью обычно и применяется для автоматического управления кораблем при помощи гирокомпаса.
В человеческом теле движение руки или пальца связано с большим числом суставов. Выходное усилие равно векторной комбинации выходных усилий всех этих суставов. Мы видели, что, вообще говоря, сложную аддитивную систему такого рода нельзя стабилизировать одной обратной связью. Поэтому обратная связь произвольного движения, при помощи которой мы регулируем выполнение задачи, наблюдая, насколько та еще не выполнена, должна быть поддержана другими обратными связями. Последние называются обратными связями позы и служат общему поддержанию тонуса мышечной системы. Именно обратная связь произвольного движения и подвержена нарушениям и расстройствам при повреждении мозжечка, ибо следующий за этим тремор появляется только тогда, когда больной пытается выполнить произвольное действие. Этот интенционный тремор, при котором больной не может взять стакан воды, не опрокинув его, весьма отличен по природе от тремора при паркинсоновской болезни, или дрожательном параличе. Тремор при паркинсоновской болезни проявляется наиболее типично, когда больной неподвижен, и часто, по-видимому, значительно ослабляется, когда больной пытается выполнить сознательно контролируемые действия. Встречаются хирурги с паркинсоновской болезнью, которые неплохо [c.176] справляются с операциями. Паркинсоновская болезнь, как известно, имеет причину не в болезненном состоянии мозжечка, а связана с патологическим очагом где-то в стволе мозга. Это лишь одна из болезней обратных связей позы, и многие из таких болезней происходят от повреждений частей нервной системы, расположенных весьма разнообразно. Одна из важных задач физиологической кибернетики — распутать и локализировать различные части этого комплекса обратных связей произвольных действий и поз. Примерами составных рефлексов такого рода служат чесальный рефлекс и рефлекс ходьбы.
Когда обратная связь возможна и устойчива, то, как мы уже говорили, она даст ту выгоду, что делает поведение системы менее зависимым от нагрузки. Допустим, что нагрузка изменяет характеристику А на dА. Относительное изменение равно dA/A. Если оператор после обратной связи имеет вид
(4.51)
то мы получим[151]
(4.52)
Таким образом, обратная связь позволяет уменьшить зависимость системы от характеристики двигателя и стабилизировать ее для всех частот, для которых
(4.53)
То есть вся граница между внутренними и внешними точками должна лежать внутри круга с радиусом С и центром в точке — С. Это не будет выполняться даже в первом из рассмотренных нами случаев. Эффект сильной отрицательной обратной связи, если она устойчива, состоит в увеличении устойчивости системы при низких частотах, однако большей частью за счет ее устойчивости при тех или иных высоких частотах. Тем не менее [c.177] во многих случаях оказывается выгодной даже такая степень стабилизации.
Рассмотрение колебаний, вызванных чрезмерной обратной связью, поднимает весьма важный вопрос о частоте начинающегося колебания. Последняя определяется значением y в iy, соответствующим той точке границы между внутренней и внешней областями кривой (4.17), которая будет самой левой на отрицательной оси u. Величина y, очевидно, имеет размерность частоты.
Мы пришли к концу нашего элементарного исследования линейных колебаний с точки зрения обратной связи. Линейная колебательная система обладает весьма специальными свойствами, характеризующими ее колебания. Одно из них заключается в том, что такая система всегда может и большей частью — при отсутствии независимых одновременных колебаний — будет совершать колебания вида
(4.54)
Существование периодического несинусоидального колебания всегда указывает по меньшей мере на то, что система нелинейна относительно наблюдаемой переменной. В некоторых, хотя и весьма немногих, случаях систему можно сделать линейной, выбрав другую независимую переменную.
Другое весьма значительное различие между линейными и нелинейными колебаниями заключается в том, что в первом случае амплитуда совершенно не зависит от частоты, а во втором обычно существует лишь одна амплитуда или самое большее дискретное множество амплитуд, с которыми система будет колебаться на данной частоте, как и дискретное множество частот, на которых возможны колебания. Это хорошо иллюстрируется изучением процессов, которые имеют место в органной трубе. Существует две теории органной трубы: приближенная линейная и более точная нелинейная. В первой органная труба трактуется как консервативная система. Вопрос о том, как труба приходит в колебание, не ставится, и уровень колебания остается совершенно неопределенным. Во второй теории считают, что колебания органной трубы рассеивают энергию, которая создается воздушным потоком, проходящим через [c.178] отверстие трубы. Теоретически возможен стационарный воздушный поток через отверстие трубы, не обменивающийся энергией ни с одной из форм колебания трубы, но при определенных скоростях воздушного потока стационарное состояние является неустойчивым. Малейшее случайное отклонение приводит к переходу энергии от воздушного потока к одному или нескольким собственным линейным колебаниям трубы, причем до известного момента это отклонение усиливает связь собственных колебаний трубы с источником энергии. Приток энергии и ее утечка вследствие теплового рассеяния и других причин происходят по разным законам, но при устойчивом режиме колебаний обе величины должны совпадать. Этим определяется как амплитуда, так и частота нелинейного колебания.
Рассмотренный случай служит примером так называемых релаксационных колебаний, когда система уравнений, инвариантных относительно сдвига во времени, дает решение, периодическое во времени или соответствующее некоторому обобщенному понятию периодичности и обладающее определенной амплитудой и частотой, но неопределенной фазой. В данном случае частота колебания системы близка к частоте некоторой слабо связанной, приблизительно линейной части системы. Б. ван дер Поль, один из главных авторитетов по релаксационным колебаниям, нашел, что это не всегда так и что возможны релаксационные колебания, у которых преобладающая частота далека от частоты линейных колебаний любой части системы. Можно привести следующий пример. Струя газа течет в камеру, сообщающуюся с наружным воздухом. В камере горит сигнальный огонь. Когда концентрация газа в воздухе достигает некоторой критической величины, в системе может произойти взрыв вследствие возгорания смеси от сигнального огня. Время, которое пройдет до того, как это случится, зависит лишь от скорости течения светильного газа, от скорости всасывания воздуха и удаления продуктов сгорания и от процентного состава взрывчатой смеси светильного газа и воздуха.
Вообще говоря, нелинейные системы уравнений трудно решать. Существует, однако, случай, легко поддающийся исследованию, когда система лишь немного отличается от линейной, и члены, составляющие [c.179] различие, изменяются так медленно, что их можно считать, по существу, постоянными за период колебания. В этом случае нелинейная система может исследоваться так, как если бы это была линейная система с медленно изменяющимися параметрами. Системы, допускающие подобный подход, носят название систем с вековыми возмущениями; теория систем с вековыми возмущениями играет важнейшую роль в гравитационной астрономии.
Кажется вероятным, что некоторые виды физиологических треморов можно рассматривать приближенно как линейные системы с вековыми возмущениями. На такой системе легко понять, почему амплитуда стационарного колебания может оказаться столь же определенной, как и частота. Пусть одним из элементов такой системы будет усилитель, коэффициент усиления которого уменьшается по мере того, как увеличивается некоторое долговременное среднее входного сигнала. Тогда с ростом колебаний системы коэффициент усиления может упасть, пока не будет достигнуто состояние равновесия.
Нелинейные системы релаксационных колебаний исследовались в ряде случаев методами, которые разработали Хилл и Пуанкаре[152]. Классическими примерами являются случаи, когда системы описываются уравнениями дифференциального характера, особенно если эти дифференциальные уравнения низшего порядка. Насколько мне известно, не существует какого-либо сравнимого исследования соответствующих интегральных уравнений, когда будущее системы зависит от всего ее прошлого. Однако нетрудно представить себе, какой вид должна иметь такая теория, особенно если мы ищем лишь периодические решения. В этом случае небольшое изменение коэффициентов уравнения должно вызывать небольшое и, следовательно, приблизительно линейное изменение уравнений движения.
Например, пусть Op[f(t)] — функция от f, полученная нелинейной операцией из f(t) и подвергаемая сдвигу. Тогда вариация δOp[f(t)] функции Op[f(t)], соответствующая вариационному изменению δf(t) функции f(t) и известному изменению динамики системы, [c.180] является линейной, но неоднородной относительно δf(t), хотя она нелинейна относительно f(t). Если теперь мы знаем некоторое решение f(t) уравнения
Op [f (t)] = 0 (4.55)
и изменим динамику системы, то получим линейное неоднородное уравнение для δf(t). Если
(4.56)
и сумма f(t)+δf(t) также периодическая, имея вид
, (4.57)
то
. (4.58)
Все коэффициенты в линейных уравнениях для δf(n) разлагаются в ряд по еiλnt, поскольку f(t) сама разложима в такой ряд. В результате получим бесконечную систему линейных неоднородных уравнений относительно δan+an, δλ и λ, и она может оказаться разрешимой методами Хилла. В этом случае можно, по крайней мере, представить, что, отправляясь от линейного (неоднородного) уравнения и понемногу снимая ограничения, мы можем прийти к решению весьма общей нелинейной задачи о релаксационных колебаниях. Однако это дело будущего.
Системы управления с обратной связью, рассмотренные в этой главе, и компенсационные системы, рассмотренные в предыдущей, до некоторой степени конкурируют между собой. Те и другие служат для приведения сложных отношений между входом и выходом эффектов к виду, близкому к простой пропорциональности. Как мы видели, система обратной связи дает большее: ее поведение сравнительно независимо от характеристики применяемого эффектора и изменений этой характеристики. Какой из двух методов управления лучше, зависит, следовательно, от того, насколько постоянна характеристика эффектора. Естественно предположить, [c.181] что могут быть случаи, когда выгодно сочетать оба метода. Для этого существуют разные способы.
Один из простейших показан на рис. 4. В этом случае всю систему обратной связи можно рассматривать как расширенный эффектор, и здесь не возникает ничего нового, исключая то, что компенсатор должен компенсировать величину, которая в некотором смысле является средней характеристикой системы обратной связи.
Рис. 4
Другая схема изображена на рис. 5. Здесь компенсатор и эффектор соединены в один расширенный эффектор. Это, вообще говоря, приводит к изменению максимально допустимой обратной связи, и нелегко сказать, насколько значительно можно повысить этот уровень таким путем. С другой стороны, при том же уровне обратной связи работа системы совершенно явно улучшится. Если, например, эффектор имеет существенно запаздывающую характеристику, то компенсатор должен быть упреждающим, или предсказывающим, устройством, рассчитанным на статистический ансамбль входного сигнала. Обратная связь, которую [c.182] можно назвать упреждающей, будет стремиться ускорить действие эффектора.
Рис. 5
Обратные связи подобного рода, несомненно, присутствуют в рефлексах человека и животных. При охоте на уток мы стремимся свести к минимуму не ошибку направления ствола относительно действительного положения цели, а ошибку направления ствола относительно предугадываемого положения цели. Всякая система управления зенитным огнем должна решать такую же задачу. Условия устойчивости и эффективности упреждающих обратных связей нуждаются в гораздо более тщательном исследовании, чем до сего времени.
Другой интересный вариант систем обратной связи — управление автомобилем на обледенелой дороге. Поведение водителя полностью определяется его знанием, что дорога скользкая, т. е. знанием рабочих характеристик системы автомобиль — дорога. Если он будет ждать, пока найдет эти характеристики, ведя автомобиль обычным способом, то машину занесет, прежде чем водитель опомнится. Поэтому он дает рулю последовательные быстрые толчки — не такие сильные, чтобы вызвать большое скольжение, но достаточные, чтобы его кинестетические ощущения дали ему знать, не грозит ли автомобилю забрасывание, соответственно этому он и регулирует свое вождение.
Этот метод управления, который можно назвать управлением с помощью информирующей обратной связи, нетрудно воплотить в форму механизма, и он может оказаться полезным на практике. Мы располагаем компенсатором для нашего эффектора, и этот компенсатор имеет характеристику, которая изменима извне. На приходящее сообщение накладывается слабый высокочастотный сигнал, и от выходного сигнала эффектора при помощи соответствующего фильтра отбирается некоторая часть той же высокой частоты. Исследуется амплитудно-фазовая зависимость между высокочастотным выходом и входом, чтобы найти рабочие характеристики эффектора. На основании этого изменяют соответствующим образом характеристики компенсатора. Структурная схема системы будет выглядеть примерно так, как на рис. 6.
Рис. 6.
Этот вид обратной связи выгоден тем, что компенсатор можно отрегулировать так, чтобы обеспечить [c.183] устойчивость при постоянной нагрузке любого рода, и если характеристика нагрузки изменяется достаточно медленно, вековым, как мы сказали, образом, по сравнению с изменениями первоначального входного сигнала, а нагрузка замеряется точно, то система не будет склонна к колебаниям. Имеется много случаев, когда изменение нагрузки является вековым в этом смысле. Например, трение орудийной башни зависит от вязкости смазки, которая, в свою очередь, зависит от температуры, но вязкость не изменится заметным образом в течение нескольких поворотов башни.
Конечно, такая информирующая обратная связь будет работать хорошо только в том случае, когда характеристики нагрузки на высоких частотах такие же, как на низких, или дают верное отражение последних. Это часто имеет место, когда нагрузка, а значит, и эффектор зависят от сравнительно небольшого числа переменных параметров.
Информирующая обратная связь и приведенные выше примеры обратной связи с компенсаторами представляют лишь частные случаи весьма сложной теории, пока еще недостаточно разработанной. Вся эта область развивается чрезвычайно быстро и заслуживает того, [c.184] чтобы в ближайшем будущем на нее обратили гораздо больше внимания.
Прежде чем закончить главу, мы должны напомнить другое очень важное физиологическое применение принципа обратной связи. В многочисленных примерах так называемого гомеостаза мы встречаемся с тем фактом, что обратная связь не только участвует в физиологических явлениях, но и оказывается совершенно необходимой для продолжения жизни. Условия, при которых у высших животных возможна жизнь, особенно нормальная жизнь, довольно ограниченны. Изменение температуры тела на полградуса по Цельсию обычно есть признак болезни, а при длительном изменении температуры на пять градусов жизнь вряд ли возможна. Осмотическое давление крови и концентрация в ней водородных ионов должны поддерживаться в узких границах. Отбросы организма должны извергаться, прежде чем они достигнут токсической концентрации. Кроме того, у нас должно быть надлежащее количество лейкоцитов и химических агентов защиты от инфекции; скорость сердечных сокращений и кровяное давление должны быть не слишком высокими и не слишком низкими; цикл половой деятельности должен соответствовать потребностям воспроизведения рода; обмен кальция должен быть таким, чтобы кости не размягчались и ткани не кальцинировались и т. д. Одним словом, наше внутреннее хозяйство должно включать в себя целую батарею термостатов, автоматических регуляторов давления и тому подобных приборов — батарею, которой хватило бы на большой химический завод. Все это вместе и составляет наш гомеостатический механизм.
Гомеостатические обратные связи имеют одно общее отличие от обратных связей произвольных движений и обратных связей поз: они действуют медленнее. Изменения физиологического гомеостаза, вызывающие серьезное или постоянное нарушение в долю секунды, очень немногочисленны, и даже анемия головного мозга действует не столь стремительно. Поэтому нервные волокна предназначенные для гомеостатических связей, т. е. волокна симпатической и парасимпатической систем, часто лишены миэлиновой оболочки и, как известно, имеют значительно меньшую скорость передачи, чем волокна с миэлиновой оболочкой. Типичные [c.185] гомеостатические эффекторы — гладкие мышцы и железы — также действуют медленно по сравнению с поперечнополосатыми мышцами — типичными эффекторами произвольной деятельности и деятельности, связанной с положением тела. Многие сообщения гомеостатической системы передаются не по нервам, а по иным каналам, таким, как непосредственный анастомоз мышечных волокон сердца или химические вестники: гормоны, содержание углекислоты в крови и т. д. За исключением сердечной мышцы, эти каналы передают сообщения значительно медленнее, чем миэлинизированные нервные волокна.
Любой полный курс кибернетики должен включать в себя тщательный и подробный обзор гомеостатических процессов, которые во многих частных случаях обсуждались в литературе довольно подробно[153]. Но данная книга представляет собой более введение в предмет, нежели систематический трактат; теория же гомеостатических процессов требует слишком детального знакомства с общей физиологией, чтобы быть здесь к месту. [c.186]
Вычислительные машины — это, коротко говоря, машины для записи чисел, производства действий над ними и выдачи результата в числовой форме. На простую задачу ясной и точной записи чисел приходится значительная доля стоимости вычислительной машины как в денежном выражении, так и с точки зрения затрат конструкторского труда. Простейшим решением будет, по-видимому, равномерная шкала с каким-либо указателем, движущимся вдоль нее. Если мы хотим записать число с точностью до 1/n, мы должны обеспечить возможность установки указателя с этой точностью в любой части шкалы. Другими словами, при количестве информации, равном log2n, каждое отдельное перемещение указателя должно заканчиваться с этой степенью точности, и стоимость записи будет выражаться как An, где A близко к константе. Вернее, поскольку после точного выделения n—1 частей точно определится и оставшаяся часть, стоимость записи количества информации I будет приблизительно равна
(5.01)
Разделим теперь эту информацию между двумя шкалами, градуированными каждая менее точно. Стоимость записи такой информации будет приблизительно равна
(5.02)
Если информация разделена между N шкалами, то стоимость будет близка к
(5.03)
Минимум достигается при
, (5.04)
[c.187]
а если положить
, (5.05)
то при
(5.06)
Последнее равенство выполняется тогда и только тогда, когда x=0, т. е. N=∞. Следовательно, чтобы стоимость хранения информации была наименьшей, N должно быть как можно больше.
Вспомним, однако, что 2I/N обязано быть целым числом и что оно не может равняться единице; ведь в случае 2I/N=1 мы имели бы бесконечно много шкал, каждая из которых не содержала бы информации. Наименьшее допустимое значение для 2I/N равно 2; в этом случае число записывается на нескольких независимых шкалах, разделенных каждая на две равные части. Другими словами, мы представляем числа в двоичной системе на ряде шкал, где требуется лишь знать, что некоторая величина находится на одной из двух равных частей шкалы, и где вероятность неточного наблюдения шкалы сделана ничтожно малой. Другими словами, мы представляем v в виде
(5.07)
где каждое vn равно единице или нулю.
В настоящее время существует два основных типа вычислительных машин: 1) машины, подобные дифференциальному анализатору Буша[154], которые принято называть аналоговыми машинами; 2) машины, подобные обычному арифмометру, которые мы называем цифровыми машинами. В первых — данные изображаются посредством измерений на какой-либо непрерывной шкале, вследствие чего точность машины определяется точностью градуировки шкалы; во вторых — данные изображаются серией выборов из нескольких возможностей, а точность определяется четкостью различения [c.188] отдельных возможностей, числом альтернатив при каждом выборе и числом сделанных выборов. Понятно, что, во всяком случае для точных вычислений, цифровые машины лучше, а из них лучше всего машины с двоичной шкалой, в которых при каждом выборе возникает лишь две альтернативы. Наше предпочтение машинам с десятичной шкалой обусловлено просто той исторической случайностью, что десятичная шкала, основанная на числе пальцев, уже была в употреблении, когда индусы сделали свое великое открытие роли нуля и преимуществ позиционной нотации. Сохранение десятичной системы оправдано лишь тогда, когда значительная часть выполняемой с помощью машины работы состоит в передаче ей чисел, записанных в традиционной десятичной форме, и в получении от нее чисел, которые должны записываться в той же традиционной форме.
Так в действительности и используется обычный арифмометр в банках, деловых конторах и различных статистических бюро. Но это не наилучший способ эксплуатации более крупных и более автоматических машин; ведь всякая вычислительная машина применяется именно потому, что машинные методы быстрее ручных. При любом комбинированном использовании вычислительных средств, как и при любой комбинации химических реакций, порядок постоянной времени всей системы определяется самым медленным звеном. Поэтому желательно по возможности исключить непосредственное участие людей из всякой сложной цепочки вычислений, оставив его только там, где оно совершенно неизбежно — в самом начале и в самом конце. При таком подходе выгодно иметь устройство для изменения системы счисления и применять его в начале и в конце цепочки, а все промежуточные операции производить по двоичной шкале.
В идеальную вычислительную машину все данные надо вводить сразу же в начале работы, и затем до самого конца она должна по возможности быть свободна от человеческого вмешательства. Это значит, что машина должна получить в начале работы не только все числовые данные, но и все правила их соединения, в виде инструкций на любую ситуацию, которая может возникнуть в ходе вычислений. Следовательно, вычислительной машине надо быть не только арифметической, [c.189] но и логической машиной и комбинировать возможности согласно систематическому алгорифму. Существует много алгорифмов, которые могли бы использоваться для комбинирования возможностей, но простейший из них известен как алгебра логики par excellence[155], или булева алгебра. Этот алгорифм, подобно двоичной арифметике, основан на дихотомии, т. е. на выборе между «да» и «нет», между пребыванием в классе и вне класса. Причины его превосходства над другими системами те же, что и причины превосходства двоичной арифметики над другими арифметиками.
Таким образом, все данные, числовые или логические, введенные в машину, имеют вид некоторого множества выборов между двумя альтернативами, а все операции над данными имеют вид приведения того или иного множества новых выборов в зависимость от того или иного множества прежних выборов. Когда я складываю два однозначных числа А и В, я получаю двузначное число, начинающееся с единицы, если А и В оба равны единице, а в остальных случаях начинающееся с нуля. Второй разряд есть единица, если А≠В, и нуль, если А=В. Сложение чисел, имеющих более одного разряда, происходит по аналогичным, но более сложным правилам. Умножение в двоичной системе, как и в десятичной, можно свести к таблице умножения и к сложению чисел; правила умножения двоичных чисел изображаются очень простой таблицей:
(5.08)
Следовательно, умножение есть просто способ определения множества новых цифр по данным исходным цифрам.
С логической стороны, если О — отрицательное, а I — положительное решение, то всякий оператор может быть получен из трех операторов: отрицания, переводящего I в О и О в I; логического сложения, описываемого таблицей: [c.190]
(5.09)
и логического умножения, описываемого такой же таблицей, что и умножение чисел в системе (1, 0), а именно:
(5.10)
Таким образом, любая ситуация, возникающая при работе машины, требует лишь новых выборов между альтернативами I и О согласно фиксированной системе правил, связывающих их с ранее принятыми решениями. Иными словами, машина строится как комплект реле, имеющих каждое два состояния, скажем: «включено» и «выключено», причем на каждом этапе работы каждое реле принимает положение, определяемое положениями некоторых или всех реле данного комплекта на предыдущем этапе. Эти этапы работы можно «синхронизировать» с помощью центрального импульсного устройства или нескольких импульсных устройств; или же действие каждого реле может быть задержано, пока все реле, которым нужно было действовать раньше, не совершат все необходимые операции.
В вычислительной машине могут применяться весьма разнообразные реле. Они могут быть чисто механическими или могут быть электромеханическими, как в случае соленоидного реле, где якорь остается в одном из двух возможных положений равновесия, пока соответствующий импульс не перебросит его в другое положение. Они могут быть чисто электрическими системами с двумя противоположными положениями равновесия; таковы газонаполненные и вакуумные лампы (последние являются гораздо более быстродействующими). Оба возможных состояния релейной системы могут быть устойчивы при отсутствии внешнего возмущения, или же одно может быть устойчивое, а другое — переходное. Во втором случае всегда, а в первом случае большей частью желательно иметь специальное устройство для хранения импульсов, которые должны [c.191] действовать через некоторое время в будущем, и избегать застопоривания системы, наступающего, когда одно из реле повторяет свои импульсы бесконечно. Но о проблеме памяти мы еще будем говорить дальше.
Достойно внимания, что нервные системы человека и животных, способные, как известно, совершать такие же действия, как и вычислительная система, содержат элементы, идеально приспособленные для работы в качестве реле. Речь идет о так называемых нейронах, или нервных клетках. Хотя под влиянием электрических токов они обнаруживают довольно сложные свойства, обычное их физиологическое действие очень близко к принципу «все или ничего», т. е. они либо находятся в покое, либо, будучи возбуждены, проходят через ряд изменений, природа и интенсивность которых почти не зависят от раздражителя. Сначала наступает активная фаза, передаваемая от данного конца нейрона до другого с определенной скоростью; затем следует рефракторный период, когда нейрон не способен приходить в возбуждение, по крайней мере под действием нормального физиологического процесса. По окончании этого эффективного рефракторного периода нерв остается бездеятельным, но может быть снова приведен в возбуждение.
Таким образом, нерв можно уподобить реле с двумя существенными состояниями активности: возбуждением и покоем. За исключением тех нейронов, к которым сообщения поступают от свободных нервных окончаний или чувствительных концевых органов, каждый нейрон получает сообщения от других нейронов через точки контакта, называемые синапсами. Число синапсов у отдельных нейронов может изменяться от нескольких единиц до нескольких сотен. Состояние входных импульсов в различных синапсах в сочетании с предшествующим состоянием самого нейрона определяет, будет ли он возбуждаться или нет. Если он не находится в состоянии возбуждения или рефрактерности и число входных синапсов, пришедших в возбуждение в течение определенного, весьма короткого промежутка времени, превосходит определенный порог, то нейрон придет в возбуждение после некоторой, почти постоянной синаптической задержки.
Это, пожалуй, слишком упрощенная картина: «порог» [c.192] может зависеть не только от числа синапсов, но также от их «веса» и от их геометрической конфигурации относительно нейрона, для которого они служат входами; с другой стороны, мы располагаем весьма убедительными доказательствами существования синапсов другой природы — так называемых «тормозящих синапсов», которые совершенно не допускают возбуждения нейрона или, во всяком случае, повышают порог его возбуждения по сравнению с обычными синапсами. Ясно одно: некоторые комбинации импульсов от нейронов, синаптически соединенных с данным нейроном, будут вызывать его возбуждение, а другие — нет. Отсюда, конечно, не следует, что не может быть других, не нейронных, влияний, например гуморальной природы, порождающих медленные, вековые изменения в комбинациях входных импульсов, способных вызывать возбуждение.
Чрезвычайно важной функцией нервной системы и, как мы уже отмечали, столь же необходимой функцией вычислительных машин является память, т. е. способность сохранять результаты прежних действий для использования в будущем. Понятно, что память используется весьма разнообразно, и потому кажется маловероятным, чтобы какой-либо один механизм мог удовлетворить всем требованиям. Существует, с одной стороны, память, необходимая для выполнения текущего процесса, скажем умножения; в этом случае промежуточные результаты не имеют ценности после того, как процесс завершен, и рабочий аппарат должен освобождаться для дальнейшего использования. Такая память должна допускать быструю запись, быстрое считывание и быстрое стирание. С другой стороны, существует память, предназначенная служить архивом, или постоянными записями, машины или мозга и составлять основу всего будущего поведения, но крайней мере при выполнении данной программы.
Заметим, между прочим, что между способами применения мозга и машины имеется существенное различие: машина предназначена для многих последовательных программ, не связанных одна с другой или имеющих минимальную, ограниченную связь, и может быть очищена при переходе от одной программы к другой, тогда как мозг при естественном ходе вещей никогда не [c.193] очищается от своих прошлых записей. Поэтому мозг при нормальных условиях не является полным подобием вычислительной машины. Его деятельность можно скорее сравнить с выполнением вычислительной машиной одной заданной программы. Мы увидим дальше, что это обстоятельство имеет глубокое значение для психопатологии и психиатрии.
Возвращаясь к проблеме памяти, заметим, что хороший способ построить кратковременную память — это заставить последовательность импульсов циркулировать по замкнутой цепи до тех пор. пока последняя не будет очищена вмешательством извне. Весьма правдоподобно, что это и происходит в нашем мозгу при удержании импульсов, относящихся к так называемому «кажущемуся настоящему»[156]. Подобный метод осуществлен в некоторых вычислительных машинах или, по крайней мере, предложен для них. Желательно, чтобы такое запоминающее устройство удовлетворяло двум условиям: 1) импульс должен передаваться в среде, в которой не слишком трудно достичь значительного запаздывания; 2) импульс должен восстанавливаться возможно точнее, прежде чем присущие устройству погрешности размоют его слишком сильно. Первое условие исключает применение световой передачи или даже во многих случаях электрических цепей и благоприятствует той или иной форме упругих колебаний; такие колебания действительно использовались для создания задержек в вычислительных машинах. Если же применять электрические цепи, то на каждой ступени возможна лишь сравнительно короткая задержка; иначе, как всегда в линейной аппаратуре, искажения накапливаются и очень скоро становятся недопустимыми. Бороться с искажениями помогает другой прием: включаем где-нибудь в цикл реле, служащее не для повторения формы приходящего сообщения, а для передачи нового сообщения заданной формы. Это очень легко достигается в нервной системе, где, по существу, всякая передача связана в большей или меньшей степени с триггерным механизмом. В электротехнике давно известны приборы для этой цели, [c.194] применяемые в телеграфных схемах. Они получили название телеграфных повторителей. Применение их в качестве долговременной памяти весьма затрудняется тем, что они должны действовать безошибочно в течение огромного числа последовательных рабочих циклов. Тем замечательнее их успешное применение в приборе, сконструированном г-ном Вильямсом в Манчестерском университете. В этом приборе устройство такого рода с единичной задержкой порядка одной сотой доли секунды продолжало успешно работать в течение нескольких часов. Еще более замечательно то, что этот прибор предназначен для хранения не одного-единственного решения «да — нет», а сразу тысяч таких решений.
Подобно другим устройствам, предназначенным для хранения большого числа решений, прибор работает по принципу развертки. Одним из простейших способов запасания информации в течение относительно короткого времени является использование заряда конденсатора. В сочетании с телеграфным повторителем это дает вполне удовлетворительный способ запоминания. Для полного раскрытия схемных возможностей, связанных с такой системой запасания, нужно переключать повторитель от одного конденсатора к другому последовательно и очень быстро. Обычные приспособления для таких переключении обладают механической инерцией и потому несовместимы с высокими скоростями. Гораздо лучше применять большое число конденсаторов, в которых одной пластиной служит небольшое количество металла, напыленное на диэлектрик, или же не идеально изолирующая поверхность самого диэлектрика, а подводкой к этим конденсаторам — пучок электронных лучей, который системой развертки перемещается по траектории, напоминающей траекторию плуга на вспахиваемом поле. Существуют различные реализации этого метода. В несколько ином виде он применялся фирмой «Радио Корпорейшен оф Америка» еще до его использования г-ном Вильямсом.
Названные методы запасания информации позволяют хранить сообщение довольно значительное время, хотя и не сравнимое со сроком человеческой жизни. Для более долговечной записи имеется широкий выбор возможностей. Помимо таких громоздких и медленных методов нестираемой записи, как перфорированные карты [c.195] и перфорированная лента, мы располагаем магнитной лентой с ее последними усовершенствованиями, в значительной мере устраняющими свойственное ей расплывание сообщений; мы располагаем фосфоресцирующими веществами; наконец, мы располагаем фотографией. Фотография действительно идеальна в отношении постоянства, а также кратковременности экспозиции, необходимой для записи наблюдения. Но она страдает двумя серьезными недостатками: 1) время проявления, хотя и уменьшенное до нескольких секунд, все же не настолько мало, чтобы фотографию можно было применять в качестве кратковременной памяти; 2) фотографическая запись не позволяет (в настоящее время [1947 г.][157]) быстро стирать и быстро наносить новую запись. Фирма «Истмен» работает над этими проблемами, которые, по-видимому, не являются неразрешимыми и, возможно, уже решены в настоящее время.
Очень многие из упомянутых методов запасания информации обнаруживают одну и ту же важную физическую черту. Они, по-видимому, зависят от систем с высокой степенью квантового вырождения, или, иными словами, со многими видами собственных колебаний одной и той же частоты. Это заведомо справедливо в случае ферромагнетизма и справедливо также в случае материалов с чрезвычайно большой диэлектрической постоянной, особенно пригодных для конденсаторов. Фосфоресценция также представляет собой явление, связанное с большим квантовым вырождением, и подобный эффект наблюдается в фотографическом процессе, где многие вещества, используемые в качестве проявителей, обладают большим внутренним резонансом. Квантовое вырождение, по всей вероятности, связано с возможностью заставить малые причины вызывать значительные и постоянные следствия. Как мы уже видели в гл. II, многие проблемы метаболизма и воспроизведения имеют прямое отношение к веществам, обладающим большим квантовым вырождением. Вероятно, совсем не случайно, что здесь, в неживой среде, эти вещества оказываются связанными с третьим основным свойством живого вещества — способностью принимать и организовывать импульсы и заставлять их действовать на внешний мир.
Как мы видели, в фотографии и аналогичных процессах [c.196] сообщение может запасаться в форме постоянного изменения некоторых запасающих элементов. Чтобы запасенная информация вводилась обратно в систему, эти изменения должны воздействовать каким-то образом на сообщения, проходящие через систему. Один из простейших способов добиться этого — применить для постоянного запасания элементы, которые нормально участвуют в передаче сообщений и в которых запасание информации изменяет способ передачи ими сообщений на все будущее время. В нервной системе нейроны и синапсы являются как раз такими элементами, и вполне правдоподобно, что информация сохраняется в мозгу долгое время благодаря изменениям порогов нейронов, или, другими словами, благодаря изменениям проницаемости каждого синапса для сообщений. Многие из нас полагают, за неимением лучшего объяснения, что запасание информации в мозгу действительно может происходить таким образом. Легко представить себе такое запасание в форме открытия новых путей или разрыва старых. Кажется вполне установленным, что после рождения в мозгу не образуется новых нейронов. Возможно, хотя и не доказано, что не образуется также новых синапсов, и правдоподобна догадка, что основные изменения порогов в процессе запоминания суть их повышения. Если это так, то вся наша жизнь построена по принципу «Шагреневой кожи» Бальзака, и самый процесс обучения и запоминания истощает наши способности обучения и запоминания, пока жизнь не расточит наш основной капитал жизнеспособности. Очень может быть, что так оно и есть. Этим, возможно, объясняются некоторые явления старения. Впрочем, в целом старение — явление слишком сложное, чтобы его можно было объяснить только этим.
Мы уже говорили о вычислительной машине — и тем самым о мозге — как о логической машине. Полезно посмотреть, какой свет проливают на логику такие машины, естественные и искусственные. Здесь основной является работа Тьюринга[158]. Мы уже сказали раньше, [c.197] что machina rationatrix[159] есть не что иное, как calculus ratiocinator[160] Лейбница, снабженное двигателем; и как исчисление это явилось началом современной математической логики, так и технические разработки наших дней неизбежно должны пролить новый свет на логику. Современная наука является операциональной, т. е. она считает всякое утверждение по существу связанным с возможными экспериментами или наблюдаемыми процессами[161]. С этих позиций изучение логики должно свестись к изучению логической машины, нервной или механической, со всеми ее неустранимыми ограничениями и несовершенствами.
Некоторые читатели могут возразить, что тем самым логика сводится к психологии, а это науки явно разные. Последнее верно в том смысле, что многие психологические состояния и движения мысли не согласуются с канонами логики. В психологии многое чуждо логике, но — и это очень важно — всякая логика, имеющая для нас смысл, не может содержать ничего такого, чего человеческий разум, а следовательно, и человеческая нервная система не были бы способны объять. Всякая логика ограничена в силу ограничений человеческого ума, которым он подвержен в деятельности, именуемой логическим мышлением.
Например, в математике мы посвящаем много времени рассуждениям о бесконечности, но эти рассуждения и сопровождающие их доказательства в действительности не бесконечны. Всякое допустимое доказательство содержит лишь конечное число шагов. Правда, доказательство посредством математической индукции кажется содержащим бесконечное число шагов; это лишь видимость. На самом деле оно содержит лишь следующие шаги:
1) Рn есть предложение, связанное с числом n;
2) Рn доказано для n=1;
3) если Рn справедливо, то справедливо и Рn+1;
4) поэтому Рn справедливо для всякого положительного целого n. [c.198]
Конечно, где-то в наших логических посылках должна быть такая, которая бы оправдывала подобный вывод. Тем не менее математическая индукция, о которой мы говорим, весьма отлична от полной индукции по бесконечному множеству. Это относится и к более утонченным видам математической индукции, таким, как трансфинитная индукция, встречающаяся в некоторых математических дисциплинах.
В результате возникают весьма любопытные ситуации, когда мы можем, при достаточном времени и достаточных вычислительных средствах, доказать каждый отдельный случай теоремы Рn, но, не располагая систематическим способом объяснения этих доказательств в одном выводе, не зависящем от n, как это было в математической индукции, не можем доказать Рn для всех n. Возможность такого исхода признана в математике — дисциплине, столь блестяще развитой Гёделем и его школой.
Доказательство есть логический процесс, который должен привести к определенному заключению через конечное число шагов. Напротив, логическая машина, действующая по определенным правилам, не обязательно должна прийти когда-либо к заключению. Она может продолжать свою работу шаг за шагом, никогда не останавливаясь; при этом она будет либо совершать последовательность действий все увеличивающейся сложности, либо повторять один и тот же процесс, подобно вечному шаху в шахматах. Это действительно происходит в случае некоторых парадоксов Кантора и Рассела. Рассмотрим, например, класс всех классов, не являющихся членами самих себя. Будет ли этот класс членом самого себя? Если да, то он определенно не является членом самого себя; а если нет, он столь же определенно обязан быть членом самого себя. Машина для решения этого вопроса будет попеременно давать ответы «да», «нет», «да», «нет» и т. д. и никогда не придет к равновесию.
Решение, некогда предложенное Бертраном Расселом для его парадоксов, состоит в том, что каждому утверждению приписывается особая величина, так называемый «тип», позволяющая нам различать утверждения, на первый взгляд формально одинаковые сообразно природе предметов, к которым они относятся: являются [c.199] ли эти предметы «вещами» в простейшем смысле, классами «вещей», классами классов «вещей» и т. д. Наш метод решения парадоксов также состоит в присвоении некоторого параметра каждому утверждению: этим параметром служит момент времени, в который оно высказано. В обоих случаях мы вводим параметр, который можно назвать параметром униформизации, и с его помощью устраняем двусмысленность, которая была обусловлена лишь пренебрежением этим параметром.
Мы видим, таким образом, что логика машины похожа на человеческую логику и, следуя Тьюрингу, можем использовать логику машины для освещения человеческой логики. Имеет ли машина другое, еще более яркое человеческое свойство — способность к обучению? Чтобы убедиться, что она может иметь даже и это свойство, рассмотрим два тесно связанных понятия: ассоциацию идей и условный рефлекс.
В английской эмпирической философской школе, от Локка до Юма, считалось, что содержание ума состоит из определенных элементов, которые Локк называл идеями, а позднейшие авторы — представлениями и впечатлениями. Предполагалось, что простые представления или впечатления находятся в чисто пассивном уме, не влияющем на содержащиеся в нем идеи, так же как чистая грифельная доска не влияет на символы, которые могут быть на ней начертаны. Предполагалось, что благодаря некоторой внутренней деятельности, не заслуживающей, впрочем, названия силы, эти идеи соединяются в группы по принципам сходства, смежности и причинной связи. Из этих принципов наиболее важным признавался принцип смежности. Предполагалось, что представления и впечатления, часто появлявшиеся вместе во времени или в пространстве, приобретают способность вызывать друг друга, так что появление одного вызывает появление всей группы.
Во всем этом налицо признание некоторой динамики, но идея динамики еще не проникла тогда из физики в биологические и психологические науки. Типичным биологом XVIII столетия был Линней, собиратель и классификатор, точка зрения которого прямо противоположна точке зрения современных эволюционистов, физиологов, генетиков и представителей экспериментальной [c.200] эмбриологии. По существу, при таком обилии материала, подлежащего исследованию, образ мыслей биологов того времени вряд ли мог быть иным. Точно так же в психологии понятие психического содержания преобладало над понятием психического процесса. Это вполне могло быть пережитком схоластического упора на различные субстанции в мире, где существительное было гипостазировано, а на глагол обращалось мало внимания. Тем не менее переход от этого статического образа мыслей к более динамической точке зрения современности, примером которой явилась работа Павлова, совершенно ясен.
Павлов работал гораздо больше с животными, чем с людьми, и занимался больше видимыми действиями, чем интроспективными состояниями ума. Он открыл, что наличие пищи вызывает у собак увеличенное выделение слюны и желудочного сока. Если собаке показывать какой-нибудь предмет вместе с пищей и только вместе с пищей, то вид этого предмета приобретает способность вызывать выделение слюны или желудочного сока даже в отсутствие пищи. Соединение по смежности, которое Локк интроспективно наблюдал для идей, здесь соответствует аналогичному соединению типов поведения.
Однако есть существенное различие между точками зрения Павлова и Локка, обусловленное тем, что Локк рассматривает представления, а Павлов — типы поведения. Реакции, которые наблюдал Павлов, направлены к тому, чтобы довести процесс до успешного завершения или предотвратить катастрофу. Выделение слюны важно для глотания и переваривания пищи, а избегание болезненного раздражения предохраняет животное от телесного повреждения. Таким образом, в условном рефлексе участвует элемент, который можно назвать аффективным тонусом. Этот тонус не обязательно связан с ощущениями удовольствия и боли, и, вообще, он не обязательно должен быть связан с выгодой для животного. Существенно следующее: аффективный тонус пробегает некоторую шкалу от отрицательного значения — «боли» — до положительного значения — «удовольствия», и повышение аффективного тонуса, постоянное или в течение значительного времени, благоприятствует всем процессам, которые в это время совершаются в [c.201] нервной системе, и дает им вторичную способность повышать еще больше аффективный тонус, а понижение аффективного тонуса стремится препятствовать всем процессам, происходящим в это время, и дает им вторичную способность понижать еще ниже аффективный тонус.
С биологической точки зрения, высокий аффективный тонус, естественно, должен иметь место в ситуациях, благоприятных для продолжения рода, хотя, быть может, и не для сохранения индивидуума, а низкий аффективный тонус — в ситуациях, неблагоприятных для продолжения рода, хотя, быть может, и не губительных для индивидуума. Всякая раса, не сообразующаяся с этим требованием, разделит участь Сдобной Бабки[162] Льюиса Кэрролла и неизбежно вымрет. Тем не менее даже у обреченной расы может функционировать действенный механизм, пока раса еще продолжается. Другими словами, даже самое самоубийственное распределение аффективного тонуса будет вызывать определенный тип поведения.
Заметим, что механизм аффективного тонуса сам является механизмом обратной связи. Его можно даже изобразить схемой, как показано на рис. 7.
Рис. 7
Здесь сумматор аффективного тонуса комбинирует аффективные тонусы от отдельных механизмов аффективного тонуса за короткий промежуток прошлого, действуя по определенным правилам, которые мы не будем указывать. Обратные провода от сумматора к отдельным механизмам аффективного тонуса служат для изменения внутреннего аффективного тонуса каждого процесса сообразно выходному сигналу сумматора, и эти изменения сохраняются до тех пор, пока они не будут изменены последующими сообщениями от сумматора. Обратные провода от сумматора к механизмам процессов служат для понижения порогов при повышении общего аффективного тонуса и для повышения их [c.202] при понижении общего аффективного тонуса. Они опять-таки производят долговременное воздействие, которое продолжается до тех пор, пока не будет изменено другим импульсом от сумматора. Однако это продолжающееся воздействие ограничено теми процессами, которые имеют место в момент прихода обратного сообщения, и точно так же ограничены воздействия на отдельные механизмы аффективного тонуса.
Этим, подчеркиваю, я не хочу сказать, что условно-рефлекторный процесс осуществляется согласно указанному здесь механизму; я лишь говорю, что он мог бы так осуществляться. Если, однако, принять этот или аналогичный механизм, то о нем можно сказать многое. Во-первых, этот механизм способен к обучению. Уже признано, что условный рефлекс является механизмом, способным к обучению, и этот вывод используется при исследовании поведения крыс в лабиринте. Для обучения нужно лишь, чтобы примененные поощрения и наказания имели соответственно положительный и отрицательный аффективный тонус. Так, наверное, и обстоит дело, и экспериментатор узнает характер этого аффективного тонуса на опыте, а не посредством лишь априорных соображений.
Значительный интерес представляет также то, что такой механизм посылает определенную группу сообщений [c.203] в нервную систему ко всем элементам, которые могут принять их. Мы имеем в виду обратные сообщения от сумматора аффективного тонуса и до некоторой степени также сообщения от механизмов аффективного тонуса к сумматорам. В действительности сумматор не обязательно должен быть отдельным элементом; он может представлять собой просто некоторый естественный комбинаторный эффект сообщений, приходящих от отдельных механизмов аффективного тонуса. Но такие сообщения «тем, кого это может касаться», могут посылаться наиболее эффективно и с наименьшей стоимостью аппаратуры другими каналами, чем нервы. Подобно этому, обычная система связи на руднике может состоять из телефонной станции с соответствующей проводкой и аппаратами; но когда необходимо спешно вывести людей из рудника, мы не полагаемся на эту систему, а разбиваем трубку с меркаптаном[163] в вентиляционном ходе. Химические вестники, подобные меркаптану или, скажем, гормонам, проще всего и наиболее эффективно передают сообщение, не адресованное определенному получателю. А теперь я на минуту загляну в область, которая, я знаю, выглядит как чистая фантазия. Высоко эмоциональный и, следовательно, аффективный характер деятельности гормонов способен производить весьма сильные внушения. Отсюда не следует, что чисто нервный механизм сам по себе не способен к аффективному тонусу и обучению; но сказанное означает, что при исследовании этой стороны нашей психической деятельности мы не можем не замечать возможностей гормонной передачи сообщений. Было бы, пожалуй, слишком смело связывать эту мысль с тем, что в теориях Фрейда участвует как память — функция запасания нервной системы, — так и половая деятельность. Пол, с одной стороны, и все аффективные тонусы, с другой, весьма тесно связаны с гормонами. Это указание на значение пола и гормонов сделали мне д-р Дж. Леттвин и г-н Оливер Селфридж. Хотя в настоящее время нет достаточных доказательств в пользу такого предположения, в принципе его нельзя считать явно нелепым. [c.204]
В природе вычислительной машины нет ничего несовместимого с наличием в ней условных рефлексов. Вспомним, что действующая вычислительная машина не есть только набор реле и запоминающих устройств, поставленных конструктором. Действующая вычислительная машина несет в себе также содержание своих запоминающих устройств, а это содержание никогда полностью не очищается в ходе выполнения одной программы. Мы уже видели, что жизни индивидуума соответствует выполнение одной программы, а не все существование механической структуры вычислительной машины. Мы видели вероятность того, что в нервной вычислительной машине информация хранится в значительной мере через изменения проницаемости синапсов. Но вполне возможно построить искусственные машины, в которых информация будет запасаться таким же образом. Например, вполне возможно сделать так, чтобы сообщение, приходящее в запасающую систему, изменяло навсегда или на время сеточное смещение одной или нескольких электронных ламп и тем самым изменяло численное значение суммы импульсов, отпирающей лампу или несколько ламп.
Более подробное исследование обучающих устройств в вычислительных и управляющих машинах и их возможных применений — дело скорее инженера, чем такой предварительной книги, как эта. Остальную часть главы лучше, по-видимому, посвятить более разработанным и привычным применениям современных вычислительных машин. Одно из главных среди них — решение дифференциального уравнения в частных производных. Даже линейные дифференциальные уравнения в частных производных требуют для своей записи огромной массы данных, поскольку приходится давать точное описание функций двух и более переменных. Для уравнений гиперболического типа, таких, как волновое уравнение, обычно ставится задача решения уравнения при заданных начальных условиях. В этом случае можно идти постепенно, шаг за шагом, от начальных значений к результатам в любой позднейший момент. Сказанное применимо в основном и к уравнениям параболического типа. Для уравнений эллиптического типа, где обычно задаются граничные, а не начальные условия, естественные методы решения включают итеративный [c.205] процесс последовательного приближения. Этот процесс повторяется очень много раз подряд, и здесь почти не обойтись без очень быстрых методов, какие возможны в современной вычислительной технике.
Для нелинейных дифференциальных уравнений в частных производных мы лишены того, что имеем для линейных уравнений, — достаточно строгой, чисто математической теории. Здесь вычислительные методы важны не только для исследования частных случаев, но, как отмечал фон Нейман, должны помочь нашему ознакомлению с большим числом частных случаев, без чего мы вряд ли сможем сформулировать общую теорию. До некоторой степени такое ознакомление производилось с помощью весьма дорогого экспериментального оборудования, например с помощью аэродинамических труб. Именно этим способом мы познакомились со сложными свойствами таких явлений, как ударные волны, поверхности скольжения, турбулентность и т. п., для которых мы вряд ли можем дать надлежащую математическую теорию. Мы не знаем, сколько еще может быть неоткрытых явлений подобного характера. Аналоговые машины имеют несколько меньшую точность по сравнению с цифровыми и во многих случаях действуют настолько медленнее, что цифровые машины следует считать значительно более перспективными.
При применении этих новых машин становится все более очевидным, что они требуют специальных математических методов, совершенно отличных от тех, к которым прибегали в ручных расчетах или на малых машинах. Так, даже применение машин для вычисления определителей не очень высокого порядка или для решения системы 20- или 30-линейных уравнений связано с трудностями, не возникающими при изучении аналогичных задач более низкого порядка. Если не проявить особой тщательности при постановке задачи, эти трудности могут привести к тому, что в решении совершенно не будет значащих цифр. Излишне даже говорить, что тонкие, эффективные средства, подобные сверхбыстрой вычислительной машине, теряют силу, попадая в руки лиц, не имеющих достаточной технической квалификации для полного их использования. Сверхбыстрые вычислительные машины, конечно, не уменьшат [c.206] потребности в математиках, обладающих глубокими знаниями и надлежащими техническими навыками.
И при механическом, и при электрическом конструировании вычислительной машины следует иметь в виду несколько правил. Во-первых, сравнительно часто используемые механизмы, как, например, множительные или суммирующие устройства, должны представлять собой относительно стандартизированные узлы, приспособленные для одного частного применения, а механизмы, используемые реже, должны формироваться на время из элементов, пригодных также и для других целей. С этим тесно связано следующее соображение: в этих более общих механизмах компоненты должны использоваться в соответствии с их общими свойствами и их не должны назначать в какую-либо постоянную комбинацию с другими частями машины. Должно иметься какое-то устройство, подобное автоматической телефонной станции, которое будет искать свободные компоненты и соединители разного рода и включать их по мере необходимости. Это значительно снизит весьма высокие издержки, обусловленные наличием большого количества неиспользуемых элементов, которые не могут применяться, если не применяется весь узел. Мы увидим большую важность этого принципа при рассмотрении проблем нагрузки и перегрузки в нервной системе.
Наконец, я хотел бы указать, что большая вычислительная машина, будь то механическая или электрическая система или мозг, потребляет большое количество энергии, которая расходуется и рассеивается в виде тепла. Кровь, оттекающая от мозга, на долю градуса теплее, чем кровь, притекающая к нему. Никакая другая вычислительная машина не приближается по экономии энергии к мозгу. В большой установке, подобной машинам ЭНИАК или ЭДВАК, нити накала ламп потребляют количество энергии, измеряемое киловаттами, и, если не предусмотреть надлежащих вентилирующих и охлаждающих приспособлений, система может пострадать от перегрева, который в конце концов совершенно изменит параметры машины и нарушит ее работу. Однако энергия, расходуемая на отдельную операцию, ничтожно мала и не может никоим образом служить надлежащей мерой работы аппаратуры. Механический [c.207] мозг не выделяет мысль, «как печень выделяет желчь», что утверждали прежние материалисты, и не выделяет ее в виде энергии, подобно мышцам. Информация есть информация, а не материя и не энергия. Тот материализм, который не признает этого, не может быть жизнеспособным в настоящее время. [c.208]
В предыдущей главе, в числе прочего, мы обсуждали, можно ли связать какой-либо нервный механизм с локковской теорией ассоциации идей. Согласно Локку, ассоциация идей основана на трех принципах: принципе смежности, принципе сходства и принципе причины и следствия. Третий принцип Локк и еще решительнее Юм сводят просто к постоянному сосуществованию, и, таким образом, он подпадает под первый принцип — смежности. Второй принцип — принцип сходства — заслуживает более детального рассмотрения.
Как мы узнаем индивидуальные черты человеческого лица в разных его положениях: в профиль, в три четверти или в анфас? Как мы узнаем в круге круг, большой ли он или маленький, далекий или близкий, расположен ли он перпендикулярно лучу зрения к своему центру и кажется нам действительно кругом или ориентирован иначе, выглядя эллипсом? Как мы видим лица животных и географические карты в облаках или в кляксах тестов Роршаха[165]? Все эти примеры относятся к зрению, но аналогичные вопросы можно поставить и для других чувств; некоторые из них касаются связей между различными чувствами. Как мы перекладываем в слова крик птицы или стрекотание насекомого? Как узнаем осязанием, что монета круглая?
Ограничимся пока чувством зрения. Существенным фактором при сравнении форм различных предметов является, конечно, взаимодействие глаза и мышц: мышц, находящихся внутри глазного яблока; мышц, [c.209] двигающих глазное яблоко; мышц, двигающих голову; мышц, двигающих все тело в целом. И эта система зрительно-мышечной обратной связи существует в какой-то форме уже на такой низкой ступени животного царства, как плоские черви. У плоских червей отрицательный фототропизм — стремление избегать свет — регулируется, как полагают, балансом импульсов от двух глазных пятен. Соотношение этих импульсов действует на мышцы туловища, поворачивающие тело прочь от света, и в сочетании с общим импульсом поступательного движения приводит животное в наиболее темную область, ему доступную. Любопытно отметить, что пара фотоэлементов с соответствующими усилителями, мостик Уитстона для сравнения их выходных напряжений и еще одна пара усилителей, управляющих питанием двух электродвигателей двухвинтового механизма, обеспечивают нам весьма приличное отрицательное фототропическое управление для небольшой лодки. Было бы трудно или даже невозможно вместить этот механизм в такие габариты, чтобы его мог нести плоский червь; но здесь мы встречаем еще один пример истины, уже известной читателю: живые механизмы, как правило, имеют значительно меньшие размеры, чем механизмы, наиболее удобные для изготовления человеком, хотя, с другой стороны, применение электричества дает искусственному механизму громадное преимущество перед живым организмом в отношении скорости.
Пропуская все промежуточные стадии, переходим сразу к обратным связям между зрением и мышцами у человека. Некоторые из этих обратных связей имеют чисто гомеостатическую природу; так, зрачок расширяется в темноте и сокращается на свету, стремясь держать проникающий в глаз световой поток в более узких границах, чем было бы возможно без этого. Другие обусловлены тем, что человеческий глаз экономично ограничил свою способность наилучшего различения формы и цвета сравнительно небольшим желтым пятном сетчатки. Когда периферическим зрением уловлен какой-нибудь предмет, заметный своей яркостью, или световым контрастом, или цветом, или — и прежде всего — движением, рефлекторная обратная связь переводит его на желтое пятно. Эта обратная связь сопровождается сложной системой взаимозависимых [c.210] подчиненных обратных связей, которые стремятся свести направления обоих глаз в одну точку, чтобы предмет, привлекший внимание, находился в одной и той же части поля зрения того и другого глаза, и фокусировать хрусталики, чтобы очертания предмета были возможно более четкими. Эти действия дополняются движениями тела и головы, при помощи которых мы переводим предмет в центр поля зрения, если этого трудно достичь движениями одних глаз, или переводим в поле зрения предмет, лежащий вне его и воспринятый другим чувством. Если перед нами предметы, которые мы привыкли наблюдать в определенной угловой ориентации, — письмо, человеческие лица, пейзажи и т. п., — то посредством особого механизма мы стремимся также привести их в надлежащую ориентацию.
Все эти процессы можно резюмировать одной фразой: мы стремимся привести привлекший наше внимание предмет в нормальное положение и в нормальную ориентацию, чтобы создаваемый нами зрительный образ предмета менялся в возможно меньшем диапазоне. Это не исчерпывает процессов, связанных с восприятием формы и значения предмета, но, бесспорно, облегчает все дальнейшие процессы, служащие названной цели. Эти последние развертываются в глазу и в зрительной области коры головного мозга. Имеется немало данных, свидетельствующих о том, что на многих стадиях число нейронных каналов, участвующих в передаче зрительной информации, падает с каждым шагом процесса, а информация становится на один шаг ближе к той форме, в которой она используется и хранится в памяти.
Первый шаг в концентрации зрительной информации совершается при переходе от сетчатки к зрительному нерву. Заметим, что в желтом пятне сетчатки существует почти взаимно однозначное соответствие между палочками и колбочками, с одной стороны, и волокнами зрительного нерва, с другой, тогда как на периферии одно волокно зрительного нерва соответствует десяти и более концевым органам. Это вполне понятно, поскольку основное назначение периферических волокон состоит не столько в самом зрительном восприятии, сколько в уловлении предмета для центрирующего, фокусирующего и направляющего механизма глаза. [c.211]
Одним из самых замечательных явлений в зрении следует считать нашу способность узнавать контурный рисунок. Несомненно, контур человеческого лица имеет очень малое сходство с самим лицом в отношении цвета и распределения светотени, и тем не менее в нем очень легко узнать портрет данного человека. Наиболее правдоподобно объясняется это тем, что где-то в зрительном процессе подчеркиваются контуры, а значение других сторон образа уменьшается. Указанные процессы начинаются в самом глазу. Подобно всем органам чувств, сетчатка подвержена аккомодации; иначе говоря, действие постоянного раздражения уменьшает ее способность воспринимать и передавать раздражение. Аккомодация заметнее всего для рецепторов, воспринимающих внутреннюю часть большого скопления образов постоянного цвета и постоянной освещенности, так как даже неизбежные небольшие флюктуации фокуса и точки фиксации не меняют характера воспринимаемого изображения. Совершенно иначе обстоит дело на границе двух контрастирующих областей. В этом случае флюктуации вызывают смену одного раздражения другим, и эта смена, как мы видим в явлении остаточных образов, не только не приводит к истощению зрительного механизма из-за аккомодации, но вызывает повышение его чувствительности. Сказанное относится к контрасту между двумя соседними областями как по освещенности, так и по цвету. В объяснение этих фактов заметим, что три четверти волокон зрительного нерва реагируют только на «вспышку» освещения. Мы видим, таким образом, что глаз воспринимает наиболее сильные впечатления на границах и что всякий зрительный образ в некоторой мере является контурным.
Вероятно, этот эффект обусловлен не только периферическим восприятием. Известно, что в фотографии некоторые способы обработки пластинки увеличивают ее контрастность, и, конечно, такие явления, по существу нелинейные, могут иметь место и в нервной системе. Они сходны с процессами в телеграфном повторителе, о которых мы уже говорили. Как и там, впечатление — если оно не слишком размыто, вызывает новое впечатление стандартной четкости. Во всяком случае, эти явления уменьшают общее количество неиспользуемой информации, переносимой образом, и, вероятно, объясняют [c.212] собой частично то уменьшение количества передающих волокон, которое наблюдается на различных участках зрительной области коры.
Мы наметили, таким образом, ряд действительных или возможных этапов схематизации наших зрительных впечатлений. Мы центрируем изображения относительно фокуса внимания и сводим их более или менее к контурам. Затем их надо сравнить между собой или, во всяком случае, со стандартным изображением, хранимым в памяти, например с «кругом» или с «квадратом». Это может быть сделано различными способами. Выше мы дали грубый набросок возможного механизма для локковского принципа ассоциации по смежности. Заметим, что принцип смежности в значительной степени покрывает также локковский принцип сходства. Мы часто наблюдаем различные стороны одного и того же предмета, когда приводим его к фокусу внимания, а также при других движениях, позволяющих нам видеть его то на одном, то на другом расстоянии, то под одним, то под другим углом. Это общий принцип, применимый не только к какому-то одному чувству и, несомненно, играющий важную роль при сравнении наших более сложных переживаний. Но, вероятно, ассоциация по смежности — не единственный процесс, формирующий наши специфически зрительные общие представления, или, как их называет Локк, «сложные идеи». Зрительная область коры имеет настолько высоко организованное и специфическое строение, что трудно предположить, чтобы она действовала как подобный, крайне обобщенный механизм. Создается впечатление, что мы имеем здесь дело со специальным механизмом, представляющим собой не кратковременное соединение универсальных элементов, где части допускают взаимную замену, а постоянный субблок, подобный суммирующим и множительным устройствам вычислительной машины. Целесообразно поэтому рассмотреть, как может работать такой субблок и как нужно подойти к его проектированию.
Возможные перспективные преобразования предмета составляют группу в том смысле, как она определена в гл. II. Эта группа включает несколько подгрупп преобразований: аффинную группу, состоящую только из таких преобразований, которые не затрагивают [c.213] бесконечно удаленной области; однородные растяжения относительно данной точки, в которых сохраняется одна точка, направления осей и равенство масштабов во всех направлениях; преобразования, сохраняющие длину; вращения в двух или трех измерениях вокруг заданной точки; множество всех сдвигов и т. д. Упомянутые группы являются непрерывными группами, т. е. относящиеся к ним операции определяются значениями нескольких непрерывно изменяющихся параметров в соответствующем пространстве. Они образуют, таким образом, многомерные конфигурации в n-мерном пространстве и содержат подмножества преобразований, составляющие области в этом пространстве.
И как область на обычной двумерной плоскости покрывается в телевидении процессом развертки, позволяющим представить целое множество выборочных точек, распределенных более или менее равномерно по области, точно так же и любую область в групповом пространстве, включая само пространство, можно представить с помощью процесса групповой развертки. При таком процессе (он, конечно, применим к пространству не только трех измерений) сетка точек в пространстве оббегается в одномерной последовательности, а точки этой сетки распределены так, что в некотором, соответственно определенном, смысле они подходят к каждой точке области. Таким образом, сетка будет содержать точки, сколь угодно близкие к любой выбранной точке. Если эти «точки» (или системы параметров) действительно используются для выбора соответствующих преобразований, то нетрудно видеть, что в результате применения этих преобразований к данной фигуре мы сколь угодно приблизимся к любому преобразованию этой фигуры, осуществимому в данной групповой области. Если наша развертка достаточно мелка и преобразуемая область имеет максимальное протяжение среди всех областей, преобразуемых группой, то обегаемые при развертке преобразования дадут в результате область, покрывающую сколь угодно большую часть площади любого преобразования исходной области[166]. [c.214]
Пусть теперь мы сравниваем некоторую область с другой фиксированной областью, взятой за эталон. Если на каком-либо этапе развертки группы образ сравниваемой области, полученный с помощью одного из развертываемых преобразований, совпадает с фиксированным эталоном в пределах допустимого расхождения, то это совпадение регистрируется, и обе области считаются подобными. Если такого совпадения не происходит ни на каком этапе развертки, области считаются неподобными. Этот процесс легко поддастся механизации и может быть использован для распознания формы фигуры, независимо от ее размеров и ориентации и от тех преобразований, которые могут быть в развертываемой групповой области.
Если эта область не составляет всей группы, то может оказаться, что область А будет подобна области В, область В будет подобна области С, но область А не будет подобна области С. Так бывает и в действительности. Фигура может не иметь сходства с такой же фигурой, но перевернутой, по крайней мере, не иметь его при первом впечатлении, в котором не участвуют процессы более высокого порядка. Однако на каждом этапе переворачивания может найтись достаточно соседних положений, представляющихся подобными. Образованные таким путем общие «представления» не являются совершенно различными, но незаметно переходят друг в друга.
Существуют и более тонкие способы использования групповой развертки при абстрагировании универсалий из группы преобразований. Рассматриваемые нами группы имеют «групповую меру» — плотность вероятности, которая зависит от самой группы и не меняется с умножением всех преобразований группы справа или слева на любое данное преобразование группы. Можно развертывать группу так, что для достаточно обширного класса групповых областей плотность развертки области (т. е. время, в течение которого переменный развертывающий элемент находится внутри области при полном развертывании группы) будет почти пропорциональна ее групповой мере. Пусть теперь, при такой равномерной развертке, мы встречаемся с величиной, зависящей от некоторого множества элементов S, преобразуемого группой, и пусть это множество S [c.215] преобразуется всеми преобразованиями группы. Обозначим через Q(S) величину, зависящую от S, и обозначим через TS образ множества S при преобразовании Т из нашей группы. Тогда при замене S на TS величина Q(S) примет значение Q(TS). Усредняя или интегрируя эту величину относительно групповой меры для группы преобразований Т, получим величину примерно такого вида:
(6.01)
где интегрирование производится по групповой мере. Величина (6.01) будет тождественна для всех множеств S, переходящих друг в друга при преобразованиях группы, т. е. для всех множеств S, имеющих в некотором смысле одну и ту же форму, один гештальт. Можно сравнивать формы приближенно, если интеграл в формуле (6.01) брать не по всей группе и если подынтегральная функция Q(TS) мала в отбрасываемой области. На этом мы простимся с групповой мерой.
В последние годы обратили внимание на проблему протезирования одного потерянного чувства с помощью другого. Наибольшей решительностью отличалась попытка создать читающие аппараты для слепых, снабженные фотоэлементами. Мы будем предполагать, что эти усилия ограничиваются печатным текстом, и даже одним шрифтом или немногими шрифтами. Будем также считать, что выравнивание страниц, центрирование строк, переход от одной строки к другой уже обеспечиваются вручную или, что вполне возможно, как-либо автоматически. Эти процессы, очевидно, соответствуют стадиям распознания зрительного образа, основанным на мышечных обратных связях и использовании нашего нормального центрирующего, ориентирующего, фокусирующего и конвергирующего аппарата. Далее встает проблема определения форм отдельных букв, над которыми последовательно проходит развертывающее устройство. Здесь предлагалось использовать фотоэлементы, расположенные в ряд по вертикали и соединенные каждый со звучащим прибором особого тона. Черный цвет букв может отмечаться либо отсутствием звука, либо звуком. Предположим, что выбрано второе, и вообразим себе три фотоэлектрических рецептора, один над другим. Пусть они изображают буквы в виде трех [c.216] нот гаммы, причем самая высокая нота соответствует верхнему фотоэлементу, а самая низкая — нижнему.
Тогда, например, заглавная буква F будет передана
звуком:
Заглавная буква Z будет передана звуком:
Заглавная буква О — звуком:
и т. д. С обычной нашей способностью к интерпретации читать такой слуховой код нетрудно — не труднее, чем, скажем, читать шрифт Брайля.
Но все зависит от одного условия — от надлежащего соотношения фотоэлементов с высотой букв. Даже при стандартном шрифте неизбежны значительные колебания в размерах букв. Поэтому желательно найти возможность растягивать или сжимать вертикальный масштаб развертки, чтобы привести образ данной буквы к стандарту. Мы должны иметь в своем распоряжении, в ручной или в автоматической форме, хотя бы некоторые преобразования из группы вертикальных растяжений.
Это можно сделать несколькими способами. Можно предусмотреть механическую вертикальную регулировку фотоэлементов. С другой стороны, можно взять достаточно большой вертикальный ряд фотоэлементов и менять распределение нот соответственно размеру шрифта, оставляя фотоэлементы, расположенные выше и ниже шрифта, немыми. Для этого можно, например, воспользоваться схемой с двумя комплектами соединительных линий. В этой схеме входные линии отходят от фотоэлементов и ведут к цепочке переключателей, все более и более расходясь в стороны, а выходами [c.217] служат вертикальные линия, как на рис. 8. Здесь одиночные линии — провода от фотоэлементов, двойные линии — провода к генераторам звука, кружки на пунктирных линиях — точки соединения входных и выходных, проводов, а сами пунктирные линии — провода, управляющие включением того или иного генератора. Это и есть упомянутое во введении устройство, которое спроектировал Мак-Каллох для регулировки своего аппарата по высоте шрифта. В первом варианте выбор пунктирных линий производился вручную.
Рис. 8
Именно эта схема, показанная д-ру фон Бонину, заставила его подумать о четвертом слое зрительной коры. Соединительные кружки напоминают собой тела нейронов этого слоя, расположенные подслоями с равномерно меняющейся горизонтальной плотностью и с протяженностью, меняющейся в противоположном направлении к плотности. Горизонтальные проводники возбуждаются, вероятно, в каком-то циклическом порядке. Весь механизм кажется вполне приспособленным для групповой развертки. Конечно, должен существовать какой-то процесс перераспределения во времени верхних выходов.
Итак, Мак-Каллох навел нас на мысль, что подобное устройство действительно используется в мозгу для обнаружения зрительных образов. В сущности, оно годится для групповой развертки любого рода. Нечто подобное происходит и в других органах чувств. Для уха переложение музыки с одного основного тона на другой есть не что иное, как сдвиг логарифма частоты, и, следовательно, может быть осуществлено посредством устройства групповой развертки. [c.218]
Устройство групповой развертки имеет, таким образом, вполне определенную, адекватную анатомическую структуру. Необходимое переключение может осуществляться через независимые горизонтальные проводники, по которым подаются импульсы, смещающие пороги каждого уровня как раз настолько, чтобы соответствующие клетки возбуждались при раздражении их входов. Хотя мы не знаем всех подробностей действия этого хозяйства, нетрудно вообразить возможный механизм, соответствующий такому анатомическому строению. Короче говоря, устройство групповой развертки вполне способно образовать своего рода постоянный субблок мозга, соответствующий суммирующим или множительным устройствам цифровой вычислительной машины.
Наконец, развертывающее устройство должно иметь собственный рабочий период, выделимый в общей работе мозга. Длительность этого периода должна соответствовать минимальному времени, необходимому для прямого сравнения форм у предметов разных размеров. Такое прямое сравнение возможно только между двумя предметами, не слишком отличающимися друг от друга по величине; в других случаях сравнение — продолжительный процесс, что свидетельствует о действии неспециализированного соединения универсальных элементов. Там, где прямое сравнение кажется возможным, оно как будто занимает время порядка одной десятой секунды. Таков же, видимо, порядок времени, необходимого для возбуждения всех слоев поперечных проводников в циклической последовательности.
Хотя этот циклический процесс может иметь местное происхождение, некоторые данные свидетельствуют о том, что существует значительный синхронизм между разными участками коры головного мозга, а это показывает, что процесс обусловлен каким-то синхронизирующим центром. Порядок частоты процесса соответствует ритму альфа-колебаний мозга, как видно из электроэнцефалограмм. Можно подозревать, что этот альфа-ритм связан с восприятием формы и носит характер ритма развертки, подобно ритму телевизионной аппаратуры. Он исчезает при глубоком сне; с другой стороны, он, как и следовало бы ожидать, маскируется и перекрывается другими ритмами, когда мы смотрим на [c.219] какой-либо предмет и наш ритм развертки действует подобно несущему колебанию для других ритмов и процессов. Альфа-ритм делается наиболее заметен, если бодрствовать с закрытыми глазами или же, не обращая взгляда ни на что в отдельности, пристально смотреть перед собой в пространство, как йог в состоянии отрешенности от внешнего мира[167], когда альфа-ритм обнаруживает почти совершенную периодичность.
Мы видели, что задача протезирования органов чувств — задача замены информации, нормально поступающей от потерянного органа чувств, информацией от уцелевших органов чувств — имеет важное значение и не является заведомо неразрешимой. Особенно обнадеживающим является то обстоятельство, что память и ассоциативные зоны, нормально возбуждаемые одним внешним чувством, не являются замками с единственным ключом, но могут хранить впечатления, поступающие и от других чувств. Ослепший человек, в отличие от слепорожденного, не только сохраняет зрительные воспоминания, предшествующие потере зрения, но способен даже запасать осязательные и слуховые впечатления в виде зрительных образов. Ощупывая свой путь при движении по комнате, он может представлять себе, как она должна выглядеть.
Следовательно, часть его нормального зрительного механизма продолжает ему служить. С другой стороны, он потерял не только свои глаза, он потерял также возможность пользоваться той частью зрительной области коры, которую можно рассматривать как фиксированный блок, организующий зрительные впечатления. Его нужно снабдить не только искусственными зрительными рецепторами, но и искусственной зрительной корой, которая будет переводить световые впечатления, поступающие в его новые рецепторы, в форму, настолько близкую к нормальным выходным сигналам его зрительной коры, что предметы, обычно выглядящие одинаково, будут иметь теперь одинаковое звучание.
Отсюда ясно, что критерием возможности такой замены зрения слухом служит, по крайней мере частично, отношение между числом различимых зрительных образов и числом различимых слуховых образов на уровне [c.220] коры. Это — отношение количеств информации. Ввиду довольно сходной организации различных участков сенсорной коры оно не будет, вероятно, сильно отличаться от отношения площадей зрительной и слуховой областей коры, которое составляет 100:1. Если всю слуховую область коры использовать для зрения, то можно надеяться, что количество получаемой информации будет равно примерно одному проценту информации, поступающей через зрительные органы. С другой стороны, зрение обычно оценивается по относительному расстоянию, при котором получают определенную степень разрешения образов, и по такой оценке 10/100 зрения означает поток информации, равный примерно одному проценту нормального потока. Это очень плохое зрение, но, конечно, не слепота; люди с таким зрением могут не считать себя слепыми.
В другом направлении картина гораздо благоприятнее. Глаз может распознавать все звуковые оттенки, используя лишь один процент своих способностей, и сохранность зрения при этом будет составлять около 95/100, т. е. по существу оно будет совершенным. Итак, протезирование внешних чувств представляет собой весьма перспективную область работы. [c.221]
Начиная эту главу, я должен сделать оговорку. С одной стороны, я не психопатолог и не психиатр и имею мало опыта в этой области, где опыт — единственный верный руководитель. С другой стороны, наши знания о нормальной работе мозга и нервной системы и тем более наши знания об отклонениях от нормы далеко еще не достигли такого совершенства, чтобы можно было полагаться на ту или иную априорную теорию. Поэтому я заранее отказываюсь от утверждений, что какие-либо конкретные психопатологические явления, например болезненные состояния, описанные Крепелином и его последователями, вызываются дефектами определенного рода в организации мозга как вычислительной машины. Те, кто пожелает сделать подобные выводы из изложенного здесь, будут действовать на свой страх и риск.
Однако понимание того, что мозг и вычислительная машина имеют много общего, может привести к новым ценным методам в психопатологии и даже в психиатрии. Эти сопоставления начинаются уже с самого, быть может, простого вопроса: каким образом мозг избегает грубых ошибок и неверно направленных действий при неисправности отдельных своих компонентов? Подобные вопросы в случае вычислительной машины имеют большое практическое значение, потому что здесь цепочка операций, занимающих каждая лишь долю миллисекунды, может длиться часы и дни. Цепочка вычислительных операций вполне может содержать 109 отдельных шагов. В этих условиях нельзя пренебрегать вероятностью того, что по меньшей мере одна операция будет идти неправильно, хотя надежность современной электронной аппаратуры далеко превзошла самые смелые ожидания. [c.222]
В обычных вычислениях, проводимых вручную или при помощи арифмометров, принято проверять каждый шаг, и когда обнаруживается ошибка, она локализируется обратным процессом, начинаемым с точки, где она замечена. Для того чтобы быстродействующей машине работать аналогичным образом, необходимо, чтобы проверка шла с такой же скоростью, как и само вычисление; в противном случае эффективная скорость машины снижается более медленным процессом проверки. К тому же, если заставить машину сохранять все промежуточные результаты вычислений, то ее сложность и размер возрастут недопустимо — вероятно, значительно больше, чем в два или три раза.
Гораздо лучший способ проверки, который обычно и применяется на практике, состоит в том, чтобы поручать проверку каждой операции одновременно двум или трем отдельным механизмам. В случае применения двух таких механизмов выдаваемые ими результаты автоматически сопоставляются между собой, и если есть расхождение, то все данные передаются долговременной памяти, машина останавливается, и оператор получает сигнал, что что-то не в порядке. Тогда оператор сравнивает результаты и, руководствуясь ими, находит неисправный элемент, например перегоревшую лампу, требующую замены. Если для каждого шага применяются три отдельных механизма, то, поскольку вероятность неисправности каждого отдельного механизма очень мала, практически всегда будет согласие между двумя из трех механизмов, которые и дадут искомый результат. В этом случае сопоставляющее устройство выдает в качестве правильного результат большинства, так что машину можно не останавливать; но вместе с тем дается сигнал, указывающий, где и каким образом результат меньшинства отличается от результата большинства. Если это произойдет в самом начале расхождения, то местоположение ошибки может быть указано очень точно. В хорошо спроектированной машине элементы не закрепляются за определенными шагами последовательности операций, а на каждом шаге производится поиск, подобно тому, как на автоматических телефонных станциях, и находится первый свободный элемент данного вида, который и включается в последовательность операций. Тогда устранение и [c.223] замена неисправных элементов не вызывают большой задержки.
Позволительно предположить, что, по меньшей мере, два элемента этого процесса представлены также в нервной системе. Вряд ли можно думать, что передача важного сообщения поручается одному нейронному механизму. Подобно вычислительной машине, мозг, по всей вероятности, действует согласно одному из вариантов знаменитого принципа, изложенного Льюисом Кэрроллом в «Охоте на снарка»[168]: «Что три раза скажу, тому верь». Невероятно также, чтобы различные каналы, передающие информацию, проходили от одного своего конца до другого без всяких перекрестов. Гораздо вероятнее, что, когда сообщение достигает определенного уровня нервной системы, оно может оставить эту точку и направиться к следующей по одному или нескольким альтернативным членам так называемого «промежуточного комплекса»[169]. В некоторых частях нервной системы эта взаимозаменяемость может быть сильно ограничена или даже совершенно отсутствовать, и к ним, по-видимому, принадлежат такие высокоспециализированные участки коры головного мозга, как те, что служат внутренним продолжением органов чувств. Тем не менее принцип сохраняет силу и, вероятно, более всего в сравнительно неспециализированных областях коры, служащих для ассоциации и так называемых высших видов умственной деятельности.
До сих пор мы разбирали ошибки в работе мозга, которые являются нормальными и которые можно считать патологическими лишь в самом широком смысле слова. Обратимся теперь к ошибкам, носящим более очевидный патологический характер. Психопатология принесла разочарование инстинктивному материализму врачей, принимавших ту точку зрения, что всякое расстройство должно сопровождаться материальными повреждениями соответствующей ткани. Правда, такие специфические повреждения мозга, как травмы, [c.224] опухоли, тромбозы, и т. п., могут сопровождаться психическими симптомами, и некоторые психические болезни, как парез, представляют собой последствия общего соматического заболевания и связаны с патологическим состоянием мозговой ткани; но не существует способа опознания мозга шизофреника, принадлежащего строго к одному из типов, описанных Крепелином, или мозга больного маниакально-депрессивным психозом, или мозга параноика. Такие расстройства называются функциональными. Различие между функциональными и органическими расстройствами, по-видимому, противоречит догмату современного материализма, что всякое нарушение функции имеет какую-то физиологическую или анатомическую основу в соответствующих тканях.
Это различие между функциональными и органическими расстройствами находит себе в значительной мере объяснение в теории вычислительных машин. Как мы уже видели, мозгу, по крайней мере мозгу взрослого, соответствует не голая физическая структура вычислительной машины, но сочетание этой структуры с инструкциями, заданными в начале цепи операций, и со всей дополнительной информацией, запасаемой и приобретаемой извне во время выполнения этой цепи. Указанная информация хранится в какой-то физической форме — в форме памяти, но часть — в форме циркулирующих записей памяти, физическая основа которых исчезает, когда машина выключается или мозг умирает, а часть — в форме долговременных следов, сохраняемых способом, о котором можно только строить догадки, но, вероятно, также с физической основой, исчезающей после смерти. Мы еще не умеем распознавать по трупу, каким был порог данного синапса при жизни; и если бы даже умели, то у нас нет никакой возможности проследить цепь нейронов и синапсов, связанных с данным синапсом, и определить, какое мысленное содержание было записано в этой цепи.
Стало быть, нет ничего странного в том, чтобы рассматривать функциональные психические расстройства по существу как болезни памяти: циркулирующей информации, сохраняемой мозгом в активном состоянии, и долговременной проницаемости синапсов. Даже при более серьезных расстройствах, как парез, большинство [c.225] симптомов может быть вызвано не столько разрушением ткани и изменением синаптических порогов, сколько вторичными нарушениями связи, сопровождающими первичные повреждения: перегрузкой остающейся части нервной системы и посылкой сигналов по другим путям.
В системе, состоящей из большого числа нейронов, круговые процессы вряд ли могут быть устойчивыми в течение длительных промежутков времени. Либо они, как в случае памяти «кажущегося настоящего», заканчивают свое течение, рассеиваются и угасают, либо они вовлекают в свою систему все больше и больше нейронов, пока не захватят чрезмерную долю всего нейронного материала. Это, по-видимому, и происходит в случае навязчивой тревоги, сопровождающей неврозы страха. В этом случае, возможно, у больного просто нет места, нет достаточного запаса нейронов для выполнения нормальных процессов мышления. При таких условиях деятельность мозга ослабевает, вследствие чего уменьшается загрузка еще не затронутых нейронов, и они тем скорее вовлекаются в этот распространяющийся процесс. Затем эти явления все глубже и глубже захватывают постоянную память, и патологический процесс, начавшийся на уровне циркулирующих записей, может повториться в более тяжелой форме на уровне постоянных записей. Так относительно тривиальное и случайное отклонение от устойчивого состояния способно вырасти в процесс, совершенно нарушающий нормальную психическую деятельность.
Патологические процессы относительно сходной природы известны и для вычислительных машин, механических и электрических. Зуб шестерни может соскользнуть таким образом, что сцепляющиеся с ним зубья не смогут переместить его вновь в нормальное положение, или быстродействующая электрическая вычислительная машина начнет повторять без конца один и тот же цикл операций. Эти случайности могут зависеть от какой-нибудь маловероятной мгновенной конфигурации системы и, будучи устранены, наверное, никогда не повторятся или повторятся очень нескоро. Тем не менее они на время выводят машину из строя.
Как мы поступаем в таких случаях с машиной? Прежде всего, пробуем очистить ее от всей информации в расчете на то, что, когда она начнет работать с [c.226] другими данными, нарушение не повторится. Если это не помогает и неисправность скрыта в таком месте, которое вообще или временно недоступно для очищающего механизма, мы встряхиваем машину или, если она электрическая, подаем на нее ненормально большой электрический импульс, надеясь в результате добраться до недоступной части и перебросить ее в такое состояние, при котором неправильная работа прекратится. Если и это не помогло, то мы можем отсоединить неправильно работающую часть, так как не исключено, что оставшаяся часть будет достаточна для наших целей.
Но, кроме смерти, нет ни одного нормального процесса, который бы полностью очищал мозг от всех прошлых впечатлений, а после смерти мозг нельзя заставить действовать снова. Из всех нормальных процессов всего ближе к непатологическому очищению сон. Как часто бывает, что наилучший способ избавиться от тяжелого беспокойства или умственной путаницы — это переспать их! Однако сон не очищает памяти от более глубоких воспоминаний, да сильная тревога и не даст заснуть по-настоящему. Поэтому мы часто бываем вынуждены прибегать к более сильным вмешательствам в работу памяти. Сильнейшее из них — хирургическое воздействие на мозг, после которого остается постоянное повреждение, увечье и ограничение способностей пострадавшего, поскольку центральная нервная система млекопитающих, по всей вероятности, совсем не обладает способностью регенерации. Основное хирургическое вмешательство, практиковавшееся до сих пор, — это префронтальная лоботомия, т. е. удаление или изоляция части лобной доли коры[170]. Недавно лоботомия была довольно модной, вероятно, по той причине, что она облегчает содержание психических больных под надзором сторожей. Да позволено мне будет заметить мимоходом, что умерщвление больных еще больше облегчило бы надзор за ними! Однако префронтальная лоботомия, по-видимому, действует на навязчивое состояние не тем, что помогает больному разрешить мучащие его вопросы, а тем, что повреждает [c.227] или уничтожает способность к продолжительной тревоге, называемую, по терминологии другой профессии, совестью. В общем случае лоботомия, насколько можно судить, ограничивает все виды циркулирующей памяти и связанную с ними способность сохранять в уме ситуацию, уже не присутствующую в настоящем.
Различные виды лечения шоком — электрический ток, инсулин, метрозол — представляют собой не столь сильные средства, но оказывают весьма сходное действие. Они не разрушают мозговой ткани или, по крайней мере, по идее не должны разрушать ее, но они оказывают определенно вредное влияние на память. Поскольку дело касается циркулирующих записей и поскольку последние бывают особенно повреждены в случаях недавнего расстройства и вряд ли заслуживают сохранения, лечение шоком следует определенно предпочесть лоботомии; но оно не всегда свободно от вредных влияний на постоянную память и на личность. При настоящем положении вещей лечение шоком представляет собой второй насильственный, не вполне изученный, не вполне контролируемый способ прервать душевный порочный круг. Тем не менее следует признать, что во многих случаях лечение шоком — лучшее, что мы можем в настоящее время сделать.
Лоботомия и лечение шоком — это такие методы, которые по своей природе более пригодны для действия на порочные циркулирующие записи и навязчивые состояния, чем на глубже расположенные постоянные записи, хотя не исключено, что они могут оказывать некоторое действие и на последние. Как было сказано выше, при душевных расстройствах давнего происхождения постоянная память нарушается столь же сильно, как и циркулирующая. Мы, по-видимому, не располагаем никаким чисто фармацевтическим или хирургическим средством для дифференцированного воздействия на постоянную память. Вот тут-то и выступает на сцену психоанализ и подобные ему психотерапевтические меры. Идет ли речь о психоанализе в ортодоксальном понимании Фрейда, или в измененном понимании Юнга и Адлера, или о психотерапии, совсем не основанной на психоанализе, лечение всегда основывается на том представлении, что: 1) хранимая в уме информация расположена на нескольких уровнях доступности и [c.228] гораздо богаче и разнообразнее, нежели информация, доступная непосредственному самонаблюдению — интроспекции — без помощи специальных методов; 2) она существенно зависит от аффективных переживаний, которые мы не всегда можем обнаружить таким самонаблюдением, — либо потому, что они никогда не были явно выражены на языке взрослых, либо потому, что они были подавлены определенным психическим механизмом, аффективным, но, вообще говоря, непроизвольным; 3) содержание этих сохраненных переживаний, а также их аффективный тонус обусловливают во многом нашу последующую психическую деятельность, иногда патологическим образом.
Метод психоанализа состоит в последовательном применении ряда средств для обнаружения и истолкования этих скрытых воспоминаний; больного заставляют осознать их истинное значение и благодаря этому осознанию изменяют если не содержание воспоминаний, то, по крайней мере, сопровождающий их аффективный тонус, уменьшая тем самым их вредное действие. Все это вполне согласуется с точкой зрения, принятой в настоящей книге. Это, возможно, объясняет также, почему в некоторых случаях рекомендуется совместное применение лечения шоком и психотерапии, куда входит физическая или фармакологическая терапия для устранения реверберации в нервной системе и психологическая терапия для долговременной памяти, которая без такого вмешательства могла бы восстановить изнутри порочный круг, разорванный шоком.
Мы уже упоминали о проблеме нагрузки нервной системы. Многие авторы, и в частности Д'Арси Томпсон[171], отмечали, что для всякой формы организации существует верхняя граница ее размера, выше которой она не будет действовать. Так, размер организма насекомого ограничен длиной трахеи, при которой воздух может попадать через дыхальца путем непосредственной диффузии к дышащим тканям; сухопутное животное не может иметь больший вес, чем позволяют его ноги и другие органы, соприкасающиеся с землей; размер дерева ограничен механизмом переноса воды и [c.229] солей от корней к листьям и продуктов фотосинтеза от листьев к корням и т. д. То же самое наблюдается в технических сооружениях. Высота небоскребов ограничена тем, что если она превысит некоторый предел, то для верхних этажей потребуется шахта лифта, которая займет слишком большую часть поперечного сечения нижних этажей. Наилучший подвесной мост, который можно построить из материалов данной упругости, рухнет от собственного веса, если его пролет превысит некоторый предел, а при еще большем пролете рухнет от собственного веса любая конструкция, построенная из данного материала или материалов. Размер телефонной станции, построенной по жесткому, не допускающему расширения плану, также ограничен, и инженеры-телефонисты исследовали это ограничение весьма подробно.
В телефонной системе существенным ограничивающим фактором служит относительное время, в течение которого абонент не может получить нужного ему соединения. 99-процептная вероятность успешного вызова, конечно, удовлетворит самых требовательных; 90 процентов успешных вызовов, вероятно, достаточно для того, чтобы вести свои дела довольно удовлетворительно, 75-процентная вероятность уже вызывает досаду, но все же позволяет кое-как вести дела; если же половина вызовов неудачна, то абоненты начнут требовать снятия своих телефонов. Но это лишь общие цифры. Если вызовы проходят через n отдельных ступеней коммутации, и вероятности отказа независимы и одинаковы на всех ступенях, то для того, чтобы получить общую вероятность успешного вызова, равную р, вероятность успешного соединения на каждой ступени должна составлять р1/n. Следовательно, чтобы получить 75-процентную вероятность соединения после пяти ступеней, мы должны иметь приблизительно 95-процентную вероятность успеха на ступень. Чтобы получить 90 процентов успешных вызовов, мы должны иметь 98 процентов успешных соединений на каждой ступени. Чтобы получить 50-процентную вероятность, нужно иметь вероятность успеха на каждой ступени в 87 процентов. Мы видим, что чем больше ступеней, тем быстрее обслуживание становится очень плохим после того, как превышен некоторый критический уровень вероятности неуспеха отдельного [c.230] вызова, и тем быстрее оно становится очень хорошим после того, как вероятность неуспеха опустилась ниже этого критического уровня. Таким образом, система автоматической коммутации, состоящая из многих ступеней и рассчитанная на определенную вероятность отказа, не обнаруживает явных признаков неблагополучия, пока нагрузка не дойдет до критической точки, после чего эта система совершенно распадается и образуется катастрофический затор.
Человек имеет наиболее развитую нервную систему из всех живых существ, и его поведение, вероятно, определяется наиболее длинными из эффективно действующих нейтронных цепей. Если он надламывается глубоко и катастрофически, то это должно означать, что он выполнял сложные действия очень уж близко к грани перегрузки. Перегрузка может возникать различным образом: вследствие избытка передаваемых сообщений, физической потери каналов связи или чрезмерного занятия каналов такой нежелательной нагрузкой, как циркулирующие записи памяти, усиливающиеся до превращения в навязчивые идеи. Во всех подобных случаях внезапно наступает момент, когда для нормальных видов нагрузки не будет хватать каналов, и тогда перед нами психическое расстройство, доходящее нередко до помешательства.
Указанное расстройство действует сперва на способности или операции, в которых участвуют наиболее длинные цепи нейронов. Есть серьезное основание для отождествления этих процессов с теми, которые мы обычно называем высшими. Известно, что повышение температуры почти до физиологических границ облегчает выполнение большей части, если не всех, нейронных процессов; эффект тем заметнее, чем выше процесс, приблизительно соответствуя нашей обычной оценке «ранга» процессов. Но любое облегчение процессов в единичной системе нейрон — синапс становится кумулятивным, когда нейрон соединен последовательно с другими нейронами. Поэтому степень усиления процесса при повышении температуры может служить грубой мерой длины участвующей в нем нейронной цепи.
Мы видим, таким образом, что большая длина нейронных цепей человеческого мозга по сравнению с мозгом животных объясняет, почему психические расстройства [c.231] у человека наиболее заметны и, вероятно, наиболее распространены. Вопрос допускает и другой, более специфический подход. Рассмотрим сначала два геометрически подобных мозга с одним и тем же отношением весов серого и белого вещества и с линейными размерами, относящимися как А:В. Пусть объем клеток серого вещества и поперечное сечение волокон белого вещества у первого и второго мозга одни и те же[172]. Тогда отношение числа клеток в обоих случаях равно А3:В3, а отношение числа длинных соединительных линий равно А2:В2. Это значит, что при одинаковой плотности процессов в клетках плотность процессов, протекающих в волокнах, будет для большого мозга в А:В раз больше, чем для малого мозга.
Сравнивая человеческий мозг с мозгом других млекопитающих, мы видим, что первый отличается гораздо большей рельефностью поверхности. Относительная толщина серого вещества примерно одинакова в обоих случаях, но человеческий мозг имеет гораздо более развитую систему извилин и борозд. Это равносильно увеличению количества серого вещества за счет белого вещества. Внутри извилин белое вещество уменьшается главным образом из-за уменьшения длины волокон, а не их числа, поскольку противоположные склоны извилины ближе между собой, чем на мозге того же размера, но — с гладкой поверхностью. С другой стороны, для соединительных линий между разными извилинами расстояние, которое они должны пройти, только увеличивается вследствие рельефности мозга. Можно думать, что человеческий мозг оказывается достаточно эффективным, когда дело касается коротких соединительных линий, но не слишком надежным, когда затронуты длинные магистральные пути. Это значит, что в случае перегрузок первыми будут нарушены процессы, в которых участвуют удаленные друг от друга части мозга. Таким образом, при помешательстве наименее устойчивыми оказываются процессы, захватывающие несколько центров, т. е. ряд различных двигательных процессов и значительное число ассоциативных процессов. Именно [c.232] эти процессы обычно относятся к высшим. Таким образом, мы получаем еще одно подтверждение нашей как будто оправдываемой опытом уверенности, что при помешательство прежде всего страдают высшие процессы.
Существуют некоторые указания на то, что длинные пути в мозгу обнаруживают тенденцию пролегать совершенно вне полушарий головного мозга и идти через низшие центры. На это указывает тот факт, что при перерезке некоторых длинных петель белого вещества в полушариях головного мозга наблюдаются совершенно незначительные повреждения, как будто эти поверхностные соединения настолько недостаточны, что обеспечивают лишь небольшую часть необходимых связей.
В свете этого интересно рассмотреть явления право- и леворукости и преобладания (доминирования) полушарий. Подобная асимметрия функций, по-видимому, встречается и у других млекопитающих, хотя у них она менее заметна, отчасти, вероятно, потому, что для выполнения задач им не требуется такая организация и умение. Однако разница в ловкости мышц правой и левой стороны даже у других приматов, по-видимому, меньше, чем у человека. Праворукость нормального человека, как хорошо известно, обычно сочетается с преобладанием левой стороны мозга, а леворукость меньшинства людей — с преобладанием правой стороны мозга. Иначе говоря, функции головного мозга распределены неравномерно между двумя полушариями, и одно из них — преобладающее — сосредоточивает львиную долю высших функций. Правда, многие существенно двусторонние функции, например связанные с полями зрения, представлены каждая в своем полушарии, хотя это справедливо отнюдь не для всех двусторонних функций. Однако большинство «высших» областей находится исключительно в преобладающем полушарии. Например, у взрослого серьезное повреждение второстепенного полушария оказывает значительно меньшее действие, чем аналогичное повреждение преобладающего полушария. У Пастера на сравнительно раннем этапе его карьеры случилось кровоизлияние в правой стороне мозга, после чего у него остался небольшой левосторонний паралич — гемиплегия. После смерти мозг его был исследован, и обнаружилось, что у Пастера было [c.233] настолько серьезное повреждение правой стороны мозга, что, как говорили, после этого повреждения «у него оставалась лишь половина мозга». У него были серьезные поражения теменной и височной области. Тем не менее после этого повреждения Пастер сделал некоторые из своих самых значительных открытий. У взрослого правши подобное повреждение левой стороны, почти наверно, было бы роковым и привело бы пострадавшего к животному состоянию, к состоянию умственной и нервной инвалидности.
Было замечено, что в раннем детстве такое повреждение мозга производит гораздо меньшее действие; тяжелое поражение преобладающего полушария впервые шесть месяцев жизни может привести к тому, что его место займет другое полушарие, и пострадавший будет отклоняться от нормы гораздо меньше, чем если бы повреждение произошло в более позднем возрасте. Это вполне согласуется с тем, что нервная система в первые недели жизни вообще очень гибка, но позже быстро становится жесткой. Возможно, что при отсутствии таких серьезных повреждений преобладание правой или левой стороны в очень раннем детстве может довольно легко меняться. Но задолго до школьного возраста природная асимметрия рук и преобладание одного полушария устанавливаются на всю жизнь. Раньше считали, что леворукость является серьезной помехой для жизни в обществе. Поскольку большинство инструментов, школьных парт и спортивных принадлежностей рассчитано, главным образом, на праворуких, леворукость действительно представляет некоторое неудобство. Кроме того, в прежние времена на нее смотрели с той суеверной неприязнью, которую вызывали всякие мелкие отклонения от общечеловеческой нормы, как, скажем, родимые пятна или рыжие волосы. Многие по различным побуждениям пытались — и даже успешно — изменять леворукость своих детей воспитанием, хотя, конечно, не могли изменить физиологическую основу — преобладание правого полушария. Во многих случаях люди с искусственно развитым левым полушарием страдали заиканием и другими дефектами речи, чтения и письма в такой степени, что это преграждало им путь к нормальной деятельности.
Мы видим, по крайней мере, одно возможное [c.234] объяснение явления. Развивая вторую руку, частично развивали ту часть второго полушария, которая заведует выученными движениями, например письмом. Но поскольку выполнение этих движений находится в очень тесной связи с чтением, речью и другими видами деятельности, локализированными в преобладающем полушарии, нейтронные цепи, участвующие в подобных процессах, должны переходить из одного полушария в другое и обратно, а в более сложных процессах они должны совершать этот переход по нескольку раз. Но число прямых соединений между полушариями — комиссур — в таком большом мозгу, как человеческий, настолько мало, что прямые соединения приносят немного пользы, и связь между полушариями должна осуществляться по путям, проходящим через мозговой ствол. Эти окольные пути мало изучены, но, бесспорно, они очень длинные, редкие и могут прерываться. Поэтому процессы, связанные с речью и письмом, легко могут быть нарушены при заторе в нервной системе и тогда заикание — совершенно естественная вещь.
Таким образом, человеческий мозг, вероятно, уже слишком велик, чтобы он мог эффективно использовать все средства, которые кажутся наличными анатомически. У кошки разрушение преобладающего полушария, по-видимому, производит меньший ущерб, чем у человека, а разрушение второстепенного полушария — больший. Во всяком случае, у кошки распределение функций между полушариями гораздо равномернее. Выигрыш, достигнутый человеком благодаря большему размеру и большей сложности мозга, частично сводится на нет тем обстоятельством, что за один раз можно эффективно использовать лишь часть мозга. Возникает любопытная мысль, что, быть может, мы стоим перед одним из тех природных ограничений, когда высококвалифицированные органы достигают уровня нисходящей эффективности и в конце концов приводят к угасанию вида. Быть может, человеческий мозг продвинулся так же далеко по пути к этой губительной специализации, как большие носовые рога последних титанотериев. [c.235]
Идея организации, элементы которой сами суть малые организации, не является чем-то новым и необычным. Свободные федерации древней Греции, Священная Римская империя и современные ей аналогичные феодальные государства, Швейцарская Конфедерация, Королевство Нидерландов, Соединенные Штаты Америки и другие Соединенные Штаты, расположенные южнее, Союз Советских Социалистических Республик — все это примеры иерархий организаций в политической сфере. Левиафан Гоббса, Человек-Государство, составленный из меньших людей, есть иллюстрация той же идеи ступенью масштаба ниже, а воззрение Лейбница на живой организм как на некое сложное целое, где другие живые организмы (например, кровяные тельца) ведут собственную жизнь, представляет дальнейший шаг в этом направлении.
По существу, это лишь философское предвосхищение клеточной теории, согласно которой большинство животных и растений небольшого размера и все животные и растения больших размеров состоят из единиц — клеток, которые обладают многими, если не всеми свойствами независимых живых организмов. Многоклеточные организмы могут быть сами составными элементами организмов более высокой ступени. Так, физалия («португальский кораблик») представляет собой сложную структуру дифференцированных кишечнополостных полипов, в которой отдельные особи претерпели различные видоизменения, чтобы служить целям питания, опоры, передвижения, выделения и воспроизведения колонии как целого. [c.236]
Строго говоря, такая физически объединенная колония не ставит перед нами более глубоких философских проблем организации, чем те, какие возникают на низших уровнях индивидуальности. Совсем иначе обстоит дело с человеком и другими общественными животными — стадами павианов или скота, колониями бобров, пчелиными ульями, осиными гнездами, муравейниками. По степени целостности жизнь сообщества может вполне приближаться к уровню, характерному для поведения отдельной особи; но особь обычно наделена фиксированной нервной системой, с постоянными топографическими отношениями между элементами и постоянными соединениями, а сообщество состоит из особей, находящихся между собой в изменяющихся пространственно-временных отношениях и не имеющих постоянных, неразрывных физических соединений. Нервная ткань пчелиного улья — это лишь нервная ткань отдельных пчел. Как же пчелиный улей может действовать согласованно и организованно, приспособляясь к весьма изменчивым условиям? Очевидно, секрет состоит во взаимном общении членов улья.
Сложность и содержание этого взаимного общения могут быть весьма различными. У человека оно охватывает все дебри языка и литературы и еще очень многое. У муравьев оно, вероятно, сводится почти полностью к нескольким запахам. Весьма маловероятно, что муравей может отличить одного муравья от другого. Он, конечно, может отличить муравья из своего муравейника от муравья из чужого муравейника и будет сотрудничать с первым и стремиться уничтожить второго. В рамках нескольких внешних реакций подобного рода ум муравья, по-видимому, почти такой же шаблонный, жесткий, как его скованное хитином тело. Этого и следовало ожидать заранее от животного, у которого стадия роста и в значительной степени стадия обучения строго отделены от стадии зрелости. Единственное средство связи между муравьями, которое можно проследить, является столь же общим и ненаправленным, как гормонная система связи внутри организма. Действительно, обоняние, представляющее собой одно из химических внешних чувств, общее и ненаправленное, можно уподобить воздействиям гормонов внутри организма.
Заметим мимоходом, что мускус, цибет, бобровая [c.237] струя и другие сексуально возбуждающие вещества можно рассматривать как общественные, внешние гормоны, необходимые (особенно у животных, ведущих одинокую жизнь) для соединения полов в соответствующие периоды и служащие для продолжения рода. Этим я не хочу сказать, что действие названных веществ в организме, после того как они попали в орган обоняния, является только гормонным, а не действием на нервную систему. Трудно представить, как оно может быть чисто гормонным при тех малых количествах, какие уже могут быть восприняты животными; с другой стороны, мы слишком мало знаем о действии гормонов, чтобы отрицать возможность гормонного действия ничтожно малых количеств таких веществ. Кроме того, длинные скрученные кольца атомов углерода, обнаруженные в мусконе и цибетоне, не требуют большой перестройки, чтобы превратиться в группы сросшихся колец, характерные для половых гормонов, некоторых витаминов и некоторых канцерогенных веществ. Я не стремлюсь высказать определенное мнение по этому вопросу и оставляю приведенные выше замечания как интересную спекуляцию.
Запахи, которые воспринимает муравей, по-видимому, вызывают у него весьма стандартное поведение, но ценность, которую может иметь для переноса информации такой простой раздражитель, как запах, зависит не только от информации, непосредственно переносимой раздражителем, но и от всей нервной конструкции передатчика и приемника раздражителя. Допустим, я нахожусь в лесах вдвоем со смышленым дикарем, который не может говорить на моем языке и на языке которого я тоже не могу говорить. Даже без какого-либо условного языка знаков, известного нам обоим, я могу многое узнать от него. Мне нужно лишь быть особенно внимательным в те моменты, когда он обнаруживает признаки волнения или интереса. Тогда я должен посмотреть вокруг, особенно в направлении его взгляда, и запомнить все, что увижу или услышу. Не пройдет много времени, как я открою, какие предметы представляются важными для него, — не потому, что он сообщил мне о них словами, но потому, что я сам их заметил. Иначе говоря, сигнал, лишенный внутреннего содержания, может приобрести для моего спутника смысл по тому, что [c.238] наблюдает он в данный момент, и может приобрести для меня смысл по тому, что наблюдаю я в данный момент. Способность дикаря замечать моменты моего особенно активного внимания сама по себе образует язык, возможности которого столь же разнообразны, так и диапазон впечатлений, доступных нам обоим. Таким образом, общественные животные могут иметь активные, разумные, гибкие средства связи задолго до появления языка.
Какие бы средства ни имела раса или биологический вид, всегда можно определить и измерить количество информации, которое может получить эта раса, и отличить его от количества информации, доступной для особи. Конечно, никакая информация, доступная для особи, не может быть также доступной для расы, если она не видоизменяет поведения особи по отношению к другой особи, а это поведение не имеет значения для расы, если другие особи не могут отличить его из других форм поведения. Итак, является ли некоторая информация расовой или исключительно индивидуальной, зависит от того, приводит ли она к такой форме деятельности особи, которую другие члены расы могут распознать как отличающуюся от других форм деятельности, в том смысле, что она в свою очередь изменяет их деятельность, и т. д.
Я говорил о расе. Это в действительности слишком широкий термин для сферы действия большинства типов общественной информации. Собственно говоря, сообщество простирается лишь до того предела, до которого простирается действительная передача информации. Можно дать некоторую меру сообщества, сравнивая число решений, поступающих в группу извне, с числом решений, принимаемых в группе. Мы измеряем тем самым автономию группы. Мера эффективной величины группы — это тот размер, который она должна иметь, чтобы достичь определенной установленной степени автономии.
Группа может иметь больше или меньше групповой информации, чем ее члены. Группа необщественных животных, временно соединенных, имеет очень мало информации, если даже ее члены как индивидуумы имеют много информации. Это происходит потому, что лишь [c.239] очень немногое из того, что делает отдельный член группы, бывает замечено другими членами группы и оказывает на них влияние, которое распространялось бы и дальше по группе. С другой стороны, человеческий организм содержит, по всей вероятности, намного больше информации, чем какие-либо из его клеток. Таким образом, между количеством информации, имеющейся у расы, племени или сообщества, и количеством информации, имеющейся у особи, не обязательно должно быть прямое или обратное соотношение.
Как и в случае особи, доступ к информации, которая имеется у расы в данный момент, может потребовать специальных усилий. Известно, что при слишком большом объеме библиотек их работа затрудняется, что науки доходят до такой специализации, при которой специалист часто ничего не знает вне своей узкой специальности. Д-р Ванневар Буш предложил применять механические устройства для поисков нужного материала в больших массивах материалов. Такие устройства, вероятно, приносят пользу, но их применение ограничено невозможностью подвести ту или иную книгу под какую-либо необычную рубрику без того, чтобы кто-нибудь предварительно не установил применимость этой рубрики к данной книге. В том случае, когда темы, рассматриваемые в двух книгах, близки по методике и основным идеям, но относятся к совершенно различным областям, рубрикация потребует человека с почти лейбницианской универсальностью.
В связи с вопросом об эффективном количестве общественной информации следует отметить как один из самых поразительных фактов в жизни государства, что в ней крайне мало действенных гомеостатических процессов. Во многих странах распространено мнение, признанное в Соединенных Штатах официальным догматом, что свободная конкуренция сама является гомеостатическим процессом, т. е. что на вольном рынке эгоизм торговцев, каждый из которых стремится продать как можно дороже и купить как можно дешевле, в конце концов приведет к устойчивой динамике цен и будет способствовать наибольшему общему благу.
Это мнение связано с очень «утешительным» [c.240] воззрением, что частный предприниматель, стремясь обеспечить свою собственную выгоду, является в некотором роде общественным благодетелем и поэтому заслуживает больших наград, которыми общество его осыпает. К сожалению, факты говорят против этой простодушной теории. Рынок — игра, находящая свое подобие в семейной игре, известной под названием «монополия»[173]. Она строго подчинена общей теории игр, которую разработали фон Нейман и Моргенштерн. Эта теория основана на допущении, что на любой стадии игры каждый игрок, исходя из доступной ему информации, играет согласно вполне разумной стратегии, которая в конце концов должна обеспечить ему наибольшее математическое ожидание выигрыша. Это — рыночная игра, в которую играют вполне разумные и совершенно беззастенчивые дельцы. Даже при двух игроках теория сложна, хотя она приводит часто к выбору определенного направления игры. Но при трех игроках во многих случаях, а при многих игроках в подавляющем большинстве случаев результат игры характеризуется крайней неопределенностью и неустойчивостью. Побуждаемые своей собственной алчностью, отдельные игроки образуют коалиции; но эти коалиции обычно не устанавливаются каким-нибудь одним определенным образом и обычно кончаются столпотворением измен, ренегатства и обманов. Это точная картина высшей деловой жизни и тесно связанной с ней политической, дипломатической и военной жизни. В конце концов даже самого блестящего и беспринципного маклера ждет разорение. Но допустим, что маклерам это надоело и они согласились жить в мире между собой. Тогда награда достанется тому, кто, выбрав удачный момент, нарушит соглашение и предаст своих партнеров. Здесь нет никакого гомеостаза. Мы должны проходить циклы бумов и спадов в деловой жизни, последовательную смену диктатуры и революции, войны, в которых все теряют и которые столь характерны для современности.
Конечно, рисуемый фон Нейманом образ игрока как [c.241] вполне разумной и совершенно беззастенчивой личности представляет абстракцию и искажение действительности. Редко можно встретить, чтобы большое число вполне разумных и беспринципных людей играло вместе. Там, где собираются мошенники, всегда есть дураки; а если имеется достаточное количество дураков, они представляют собой более выгодный объект эксплуатации для мошенников. Психология дурака стала вопросом, вполне достойным серьезного внимания мошенников. Вместо того, чтобы добиваться своей конечной выгоды, подобно игрокам фон Неймана, дурак действует так, что его образ действий в общем можно предсказать в такой же степени, как попытки крысы найти путь в лабиринте. Одна политика обмана — или, точнее, заявлений, безразличных к истине, — заставит его покупать определенную марку папирос, другая побудит его, как надеется партия, голосовать за определенного кандидата — любого кандидата — или принять участие в политической охоте за ведьмами. Иллюстрированная газета будет продаваться благодаря некоторой точно установленной смеси религии, порнографии и псевдонауки. Комбинация заискивания, подкупа и устрашения заставит молодого ученого работать над управляемыми снарядами или атомной бомбой. Для определения рецептов этих смесей имеется механизм радиоопросов, предварительных голосований, выборочных обследований общественного мнения и других психологических исследований, объектом которых является простой человек; и всегда находятся статистики, социологи и экономисты, готовые продать свои услуги для этих предприятий.
К счастью для нас, эти торговцы ложью, наживающиеся на людском легковерии, еще не дошли до такого совершенства, чтобы все происходило по их желанию, потому что люди не бывают только дураками или мошенниками. Средний человек достаточно разумен по отношению к вещам, представляющимся его непосредственному вниманию, и достаточно альтруистичен там, где дело касается общественного блага или индивидуальных страданий, которые он видит собственными глазами. В небольшой сельской общине, существующей достаточно долго, чтобы в ней сложились более или менее одинаковые уровни понимания и поведения, существуют вполне достойные уважения нормы [c.242] попечения об обездоленных, управления дорогами и другими общественными средствами, терпимости к тем, кто лишь один-два раза нарушил общественные законы. Как бы то ни было, нарушители находятся здесь, и остальная община должна жить с ними и впредь. С другой стороны, в такой общине человеку не годится быть выше своих соседей. Всегда есть средства заставить его почувствовать силу общественного мнения. С течением времени он обнаружит, что оно является столь вездесущим, столь непререкаемым, столь ограничивающим и подавляющим, что он вынужден будет оставить общину, чтобы защитить себя.
Таким образом, небольшие, тесно спаянные сообщества обладают высокой степенью гомеостаза, будут ли это культурные сообщества в цивилизованной стране или селения первобытных дикарей. Какими бы странными и даже отталкивающими не казались нам обычаи многих варварских племен, эти обычаи, как правило, имеют вполне определенную гомеостатическую ценность, объяснение которой является одной из задач антропологов. Лишь в большом сообществе, где Господа Действительного Положения Вещей предохраняют себя от голода своим богатством, от общественного мнения — тайной и анонимностью, от частной критики — законами против клеветы и тем, что средства связи находятся в их распоряжении, — лишь в таком сообществе беззастенчивость может достигнуть высшего уровня. Из всех этих антигомеостатических общественных факторов управление средствами связи является наиболее действенным и важным.
Один из выводов настоящей книги состоит в том, что всякий организм скрепляется наличием средств приобретения, использования, хранения и передачи информации. В обществе, слишком большом для прямого контакта между его членами, эти средства суть пресса (книги и газеты), радио, телефонная связь, телеграф, почта, театр, кино, школы и церковь. Помимо своего непосредственного значения как средств связи все они служат другим, вторичным целям. Газета — средство рекламы и средство наживы для ее владельца, так же, как кино и радио. Школа и церковь не только убежище ученого и святого, но также жилище воспитателя и [c.243] епископа. Книга, не приносящая прибыли ее издатели, вероятно, не будет издана и, конечно, не будет переиздана.
В таком обществе, как наше, открыто основанном на купле и продаже, в котором все природные и человеческие ресурсы рассматриваются как полная собственность первого встречного дельца, достаточно предприимчивого, чтобы их использовать, эти вторичные стороны средств связи все более вытесняют их основное назначение. Этому способствует само развитие и распространение средств связи. Сельская газета может по-прежнему использовать собственных корреспондентов для сбора сплетен по деревням, но она покупает свои общенациональные известия, своя синдицированные сенсации, свои политические мнения в виде готового «котельного железа»[174]. Доход радио зависит от рекламодателей, и, как и везде, кто платит, тот и распоряжается. Большие информационные агентства стоят слишком дорого для издателя с небольшими средствами. Книгоиздатели издают в основном книги в расчете на какой-нибудь книжный клуб[175], который может закупить целиком огромный тираж. Президент колледжа и епископ, даже если они лишены личного честолюбия, управляют дорогостоящими учреждениями и должны искать деньги там, где они имеются.
Итак, повсюду на средства связи налагается тройное ограничение: исключение менее выгодных средств в пользу более выгодных; то обстоятельство, что средства связи находятся в руках очень ограниченного класса богатых людей и потому, естественно, выражают мнения этого класса; и, наконец, то обстоятельство, что средства связи, как один из основных путей к политической и личной власти, привлекают прежде всего всех тех, кто стремится к такой власти. Та система, которая больше всех других должна способствовать [c.244] общественному гомеостазу, попадает прямо в руки тех, кто больше всего заинтересован в игре за власть и деньги, в игре которая, как мы видели, является одним из основных антигомеостатических факторов в обществе. Неудивительно поэтому, что большие сообщества, подверженные этому подрывному влиянию, имеют гораздо меньше общественно доступной информации, чем малые сообщества, не говоря уже об отдельных людях, из которых состоят все сообщества. Подобно волчьей стае — будем надеяться, все же в меньшей степени — государство глупее, чем большинство его членов.
Это противоречит мнению, весьма распространенному среди руководителей предприятий, руководителей больших лабораторий и тому подобных лиц, которое гласит, что поскольку сообщество больше индивидуума, то оно и умнее. Отчасти это мнение вызвано лишь детским восхищением перед тем, что велико и обильно. В некоторой мере оно вызвано пониманием возможностей большой организации для свершения благих дел. Однако в значительной мере оно поддерживается лишь корыстными побуждениями и жаждой богатства.
Имеется другая группа — тех, кто не видит ничего хорошего в анархии современного общества и под влиянием оптимистического ощущения, что ведь должен же быть какой-нибудь выход, слишком высоко оценивает возможные гомеостатические факторы в обществе. Как бы мы ни симпатизировали этим людям и как бы глубоко ни чувствовали эмоциональную дилемму, перед которой они находятся, мы не можем придавать слишком большого значения этому направлению мыслей, подсказанному желанием. Их мысли — это мысли мышей из басни, захотевших повесить колокол на шею кошке, чтобы знать о ее приближении. Без сомнения, было бы очень приятно для нас, мышей, если бы хищные кошки мира сего носили такие колокола; но кто возьмется это сделать? Кто гарантирует нам, что вся власть не попадает снова в руки тех, кто больше всего жаждет ее?
Я упоминаю этот вопрос ввиду значительных и, как я думаю, напрасных надежд, которые возлагали некоторые из моих друзей на общественную действенность новых направлений мысли, связанных с содержанием этой книги. Они убеждены, что наша способность управлять [c.245] окружающей нас материальной средой намного обогнала нашу способность управлять окружающей нас общественной средой и понимать ее. Поэтому они считают, что основная задача ближайшего будущего — распространить на области антропологии, социологии и экономики методы естественных наук с целью достижения таких же успехов в социальных областях. От убеждения в том, что это необходимо, они переходят к убеждению в том, что это возможно. Я утверждаю, что в этом отношении они обнаруживают чрезмерный оптимизм и непонимание существа всякого научного достижения.
Все большие успехи точных наук связаны с такими областями, где явление отделено достаточно резко от наблюдателя. Мы видели на примере астрономии, что такое отделение может быть следствием огромного масштаба наблюдаемых явлений по сравнению с человеком, когда самые большие человеческие усилия, не говоря о простом созерцании, не могут произвести сколько-нибудь заметного впечатления на мир небесных светил. Правда, в современной атомной физике, науке о невыразимо малом, все, что мы делаем, будет оказывать влияние на многие отдельные частицы и это влияние будет достаточно велико с точки зрения такой частицы. Но мы не живем в масштабе изучаемых частиц ни во времени, ни в пространстве, и события, которые могут иметь величайшее значение с точки зрения наблюдателя, соответствующего масштабу существования частиц, представляются нам — хотя и с некоторыми исключениями, как, например, при опытах в камере Вильсона, — лишь как средние массовые эффекты, в которых участвуют огромные совокупности частиц. При исследовании этих эффектов те промежутки времени, с которыми мы имеем дело, весьма велики с точки зрения отдельной частицы и ее достижений, и наши статистические теории имеют более чем достаточную основу. Итак, мы слишком малы, чтобы влиять на движение звезд, и настолько велики, что можем интересоваться лишь массовыми действиями молекул, атомов и электронов. В обоих случаях наша связь с изучаемыми явлениями настолько слаба, что мы можем учитывать се лишь в общих чертах, хотя эта связь может быть и не столь слабой, чтобы ею совсем пренебрегать. [c.246]
В общественных науках связь между наблюдаемым явлением и наблюдателем очень трудно свести к минимуму. С одной стороны, наблюдатель может оказывать значительное влияние на явление, привлекшее его внимание. При всем уважении к разуму, умению и честности намерений моих друзей-антропологов, я не могу поверить, что любое исследованное ими сообщество останется тем же самым после этого исследования. Не один миссионер, приводя первобытные языки к письменной форме, закреплял в качестве вечных законов таких языков плоды своего собственного непонимания. В общественных обычаях народа много такого, что рассеивается и искажается при первом же обследовании. В несколько другом смысле, чем обычно принято, можно сказать: traduttore traditore[176].
С другой стороны, ученый-социолог не может взирать на свои объекты с холодных высот вечности и вездесущности. Возможно, существует массовая социология человеческих инфузорий, наблюдаемых подобно популяциям дрозофил в сосуде; но в этой социологии мы, эти самые человеческие инфузории, не особенно заинтересованы. Мы не очень интересуемся подъемами и падениями, радостями и страданиями человечества sub specie aeternitatis[177]. Антрополог описывает обычаи, относящиеся к жизни, воспитанию, деятельности и смерти людей, имеющих в общем такой же масштаб жизни, как и его собственный. Экономиста, главным образом, интересует предсказание таких экономических циклов, которые протекают менее чем за одно поколение или, по крайней мере, отражаются на человеке различным образом в различные периоды его жизни. Теперь мало таких политических философов, которые старались бы ограничить свои исследования миром платоновских идей. Другими словами, в общественных науках мы имеем дело с короткими статистическими рядами и не можем быть уверены, что значительная часть наблюдаемого нами не создана нами самими. Исследование фондовой биржи, вероятно, перевернет всю фондовую биржу. Мы слишком хорошо настроены на объекты нашего [c.247] исследования, чтобы представлять из себя хорошие зонды. Короче говоря, будут ли наши исследования в общественных науках статистическими или динамическими — а они должны быть и теми и другими, — они могут иметь точность лишь до очень небольшого числа десятичных знаков и в итоге никогда не доставят нам такого количества проверяемой, значащей информации, которое было бы сравнимо с тем, что мы привыкли ожидать в естественных науках. Мы не можем позволить себе пренебрегать социальными науками, но не должны строить преувеличенных надежд на их возможности. Нравится ли это нам или нет, но многое мы должны предоставить «ненаучному», повествовательному методу профессионального историка.
Существует один вопрос, относящийся собственно к этой главе, хотя он никоим образом не является ее кульминационным пунктом. Это вопрос о том, можно ли построить машину, играющую в шахматы, и являются ли способности такого рода существенным отличием человеческого разума от машины. Заметим, что мы не поднимаем вопроса о том, можно ли построить шахматную машину, которая будет вести оптимальную игру в смысле фон Неймана. Даже наилучший человеческий мозг не может приблизиться к решению этой задачи. С другой стороны, не вызывает сомнения возможность построения машины, которая будет играть в шахматы в том смысле, что она будет следовать правилам игры безотносительно к ценности ходов. Построить такую машину по существу не труднее, чем построить систему блокировки сигналов для железнодорожного сигнального поста. Реальная задача является промежуточной — построить машину, которая будет служить интересным противником для игрока какого-нибудь одного из многих уровней, по которым располагаются шахматисты. [c.248]
Я думаю, что можно построить сравнительно грубое, но не совсем тривиальное устройство такого назначения. Машина должна перебирать — по возможности с большой скоростью — все свои допустимые ходы и все допустимые ответы противника на два или три хода вперед. Каждой последовательности ходов она должна приписывать определенную условную оценку. Мат противнику получает на каждой стадии наивысшую оценку, получение мата — самую низшую; потеря фигур, взятие фигур противника, шахование и другие характерные ситуации должны получить оценки, не слишком отличающиеся от тех, какие дали бы им хорошие шахматисты. Первый из всей последовательности ходов должен получать оценку, сходную с той, которая была бы ему дана по теории фон Неймана. Когда у машины есть один ход и у противника один ход, машина оценивает каждый вариант своего хода по минимальной оценке ситуации, получаемой после перебора всех возможных ответов противника. Когда машина и противник имеют по два хода, машина оценивает каждый вариант своего первого хода по минимальной оценке относительно вариантов первого хода противника, оцениваемых, в свою очередь, по максимальной оценке следующих за ними вариантов второго хода машины, а эта максимальная оценка подсчитывается для вариантов второго хода машины в предположении, что у противника есть лишь один ход и у машины лишь один. Этот процесс можно распространить на тот случай, когда каждый игрок делает три хода, и т. д. Затем машина выбирает любой из вариантов своего хода, дающих максимальную оценку для n ходов вперед, где n имеет значение, установленное конструктором машины. Этот ход она выбирает как окончательный.
Такая машина будет играть в шахматы не только правильно, но даже и не столь плохо, чтобы это было смешно. Если на какой-либо стадии игры будет возможен мат в два или три хода, то машина сделает этот мат; а если можно избежать мата в два или три хода, то машина избежит его. Она, вероятно, будет выигрывать у бестолкового и невнимательного шахматиста и почти наверное будет проигрывать внимательному и достаточно умелому игроку. Другими словами, машина, [c.249] вполне возможно, будет играть не хуже, чем огромное большинство человечества. Это не значит, что она дойдет до такой же степени совершенства, как мошенническая машина Мельцеля[178], но тем не менее она может достичь вполне удовлетворительного уровня. [c.250]