Оборотная сторона зеркала - читать бесплатно онлайн полную версию книги автора Конрад Лоренц (Глава 6 ОБРАТНОЕ СООБЩЕНИЕ ОБ УСПЕХЕ И ДРЕССИРОВКА ВОЗНАГРАЖДЕНИЕМ) #9

Глава 6 ОБРАТНОЕ СООБЩЕНИЕ ОБ УСПЕХЕ И ДРЕССИРОВКА ВОЗНАГРАЖДЕНИЕМ

(conditioning by reinforcement)

1. НОВАЯ ОБРАТНАЯ СВЯЗЬ

Все животные, у которых центральная нервная система достигла определенного уровня дифференциации, т. е. головоногие, ракообразные, паукообразные, насекомые и позвоночные, включая человека, обладают способностью к приобретению знаний, превосходящей своей эффективностью все до сих пор рассмотренные когнитивные механизмы, а именно способностью к обучению в более узком смысле слова. У психологов, далеких от биологии и ничего не знавших о конвергентном[79] приспособлении, наличие этой способности у столь многих различных организмов вызвало ошибочное представление, что здесь идет речь о первичном феномене, об основной форме любого приобретения знаний или даже о единственном элементе поведения вообще. В действительности же пять указанных групп животных развили свой нервный аппарат, лежащий в основе рассматриваемой функции, столь же независимо друг от друга, посредством конвергентного приспособления, как они выработали свои глаза и конечности, также независимо возникшие в каждой из этих групп.

Обучение посредством проб и ошибок возникло как типичная фульгурация в смысле, объясненном на с. 270, посредством установления новой связи между уже существовавшими механизмами, способными действовать независимо друг от друга. Мы уже познакомились с функцией каждого из этих составляющих механизмов.

Комплекс поведения, который Гейнрот назвал свойственным виду импульсивным поведением (arteiegene Triebhandlung), состоит, как мы уже знаем, из аппетентного поведения срабатывания врожденного механизма запуска и выполнения генетически запрограммированной последовательности поведения с достижением в конце ее завершающей ситуации, удовлетворяющей побуждение. Эта цепь из трех отдельных процессов представляет основу, из которой возникло все обучение посредством проб и ошибок (conditioning). Линейная последовательность процессов приобретает новые неожиданные системные свойства вследствие поистине эпохального «изобретения»: конечный успех последовательности начинает производить обратное модифицирующее воздействие на ведущие к нему формы поведения.

Формы поиска, более или менее случайно входившие в аппетентное поведение, усиливаются этим обратным воздействием, если выполнение всей последовательности достигает успеха, способствующего сохранению вида, а в противном случае ослабляются. Иными словами: успех действует, как то, что обычно называется «вознаграждением», а неудача — как то, что называется «наказанием». В литературе на английском языке все ведущее таким образом к усилению или к "положительной дрессировке" предыдущего поведения называется reinforcement,[80] и, к сожалению, это слово употребляется также пишущими по-немецки психологами; напрашивающиеся немецкие термины отвергаются ими как «субъективистские». Поскольку это понятие восходит к Ивану Петровичу Павлову, я попросил одну из моих сотрудниц, хорошо говорящую по-русски найти у этого автора, где он впервые употребил соответствующий термин и как он звучал по-русски. Оказалось, что великий физиолог написал свои ранние работы, где он ввел это понятие, по-немецки, использовав слова "Verstärkung"[81] u "verstärken".[82] Этот выбор немецкого выражения кажется мне не вполне удовлетворительным. То, что достигается рассматриваемым процессом обучения, можно лучше всего выразить, сказав, что успех подкрепляет[83] поведение животного, ведущее к нему.

Вместе с новой обратной связью возникает когнитивный процесс, доставляющий индивиду за один раз больше прочного знания, чем метод генома мог бы доставить, в самом благоприятном случае, в течение целого поколения, — по меньшей мере вдвое больше, поскольку этот процесс может извлекать информацию не только из успеха, как геном, но также и из неудачи. Кроме того, рассматриваемый процесс действует не так, как геном, «пробующий» наудачу всевозможные существенные и несущественные факторы, а опирается на надежно испытанные врожденные рабочие гипотезы, а именно на те, которые прочно встроены в систему поведения всех высших животных в виде механизмов приобретения текущей информации, описанных в главе 4. Тем самым поведение, модифицируемое методом проб и ошибок, заранее направляется в сторону большей вероятности успеха. Не случайно «заранее» по-латыни звучит "a priori".[84] Мы узнаем об этом больше в разделах, посвященных пониманию и обучению.

Ввиду большой эффективности возникающего таким образом нового когнитивного аппарата понятно, что из быстро движущихся высших животных способны к конкуренции лишь те, которые им обладают.

2. МИНИМАЛЬНАЯ СЛОЖНОСТЬ СИСТЕМЫ

С другой стороны, из сказанного понятно, почему обучение посредством успеха не могло возникнуть у одноклеточных и низших многоклеточных животных, лишенных центральной нервной системы. Система, способная оценить как источник знания успех или неудачу некоторой предыдущей формы поведения и применить результат такой оценки для обратного модифицирующего действия на механизм этой формы поведения, имеет, разумеется, своей предпосылкой существование нескольких не слишком простых, весьма эффективно действующих подсистем. Эти подсистемы и их образ действия мы рассмотрели при обсуждении свойственного виду импульсивного поведения.

Легче всего представить себе механизм, подкрепляющий животное в тех формах поведения, которые ведут к простому удовлетворению потребностей тканей. В этом случае достаточен был бы единственный "датчик",[85] регистрирующий наличие или отсутствие некоторого необходимого для жизни вещества и посылающий свое сообщение в аппарат предыдущего поведения. Такая простейшая возможность подлинной условной реакции и в самом деле осуществляется в отдельных случаях, например, по наблюдениям Детье, при добывании пищи у многих мух. Но, вообще говоря, для большинства систем поведения, адаптивно модифицируемых подлинным обучением, должны быть выполнены следующие три предпосылки.

Во-первых. Форма поведения, с которой начинается все действие, должна быть "широко открытой", т. е. иметь программу, предоставляющую возможность разнообразных адаптивных модификаций; как мы уже знаем, такая программа предполагает особенно большой запас генетической информации.

Во-вторых. Должна каким-то образом "заноситься в протокол" или «запоминаться» форма, какую имели вводные звенья цепи действий при ее последнем выполнении, и эта запись должна связываться с обратным сообщением об успехе.

В-третьих. Это обратное сообщение должно быть достаточно надежным. Завершающее действие, которое удовлетворяет побуждение, т. е. "consummatory act"[86] в смысле Уоллеса Крейга или, в случае аппетенции по состояниям покоя в смысле Мейер-Гольцапфель, целевая стимулирующая ситуация должны быть столь однозначно определены внутренними и внешними рецепторными процессами, чтобы с достаточной вероятностью исключить ошибочное сообщение об успехе или неудаче. Иными словами: рецепторный аппарат, передающий обратные сообщения, должен выполнять функции, аналогичные функциям врожденного механизма запуска (с. 290). Нельзя представить себе более простую мысленную модель физиологического аппарата, осуществляющего обучение посредством успеха (conditioning by reinforcement).

Система поведения, способная к такой функции, тем самым никак не может быть простым «рефлексом», как это подсказывает терминология И. П. Павлова. Конечно, существуют простые «рефлекторные» реакции избегания, подобные рассмотренным в 5.6, которые возникают путем простой ассоциации между реакцией бегства и приобретенным запускающим действием некоторой стимулирующей ситуации; они имеют внешнее сходство с рассматриваемыми здесь процессами обучения. Но нам не известен ни один случай, когда бы удалось адаптивно модифицировать некоторую систему поведения посредством дрессирующих, т. е. положительно действующих, «вознаграждающих» стимулов без участия аппетентного поведения. На это обстоятельство давно уже указал Э. Ч. Толмен.

Даже в классическом случае слюнных условных «рефлексов», исследованном И. П. Павловым, указанный рефлекторный процесс никоим образом не является единственным процессом, подкрепляемым дрессировкой; более того, слюноотделение составляет лишь малую часть гораздо более сложной последовательности форм поведения, большая часть которых, однако, в классическом лабораторном опыте выключается той простой мерой, что собака привязывается тщательно продуманной кожаной сбруей, едва ли позволяющей ей сделать какое-нибудь движение. Мой покойный друг Говард Лиделл, работавший в качестве приглашенного сотрудника в одной из павловских лабораторий, вызвал там некоторое неприятное удивление, произведя неортодоксальный опыт. Сначала он выдрессировал собаку на условный стимул, состоявший в ускорении звуков метронома. Когда собака научилась надежно выделять слюну на этот стимул, Лиделл освободил ее от уз. Тогда собака сразу же подбежала к метроному, продолжавшему равномерно тикать, подпрыгнула к нему, приветствовала его, виляя хвостом и подвывая, иначе говоря, продемонстрировала все поведение собаки, выпрашивающей еду у хозяина или старшего товарища по своре. При этом она интенсивно выделяла слюну, хотя метроном не ускорил своего хода, так что условный стимул вовсе не предлагался. У общественных псовых (Canidae) выпрашивание корма и взаимное кормление широко распространены. Согласно Крайслеру, волки уже в возрасте одного года кормят чужих более молодых детенышей, у гиеновых собак (Lycaon pictus L.) удачливый охотник кормит всех членов своры. У обоих этих видов врожденные координации выпрашивания те же, что у домашней собаки. Эти координации — а вовсе не одно только отделение слюны — воплощают ту реакцию, которая в классическом опыте выступает в качестве условной!

Я никоим образом не хочу преуменьшить значение опытов Павлова. Вполне законно искусственно изолировать некоторую отдельную реакцию, особенно если это доставляет такие хорошие возможности количественного исследования, как слюноотделение собаки. Но при этом не следует упускать из виду, что в таком случае мы вырезаем кусок из системы. Ни в коем случае не следует впадать в ошибку мышления, присущую некоторым людям с несомненными аналитическими способностями, которые полагают, что система состоит теперь из одной только изолированной части и что одной этой части уже достаточно, чтобы понять все свойства системы в целом.

Если мы теперь бросим взгляд с точки зрения биологического системного анализа на важнейшие известные в настоящее время факты о возникновении условных реакций при подкреплении (reinforcement), то мы увидим, что они полностью подкрепляют изложенное здесь мнение: положительная дрессировка посредством вознаграждения есть важный критерий «подлинной» условной реакции. В перечень «обусловливаемых» реакций, которые приводит в своей книге К. Фоппа, вкралось несколько случаев, где реакция избегания, основанная на простой ассоциации, принимается за подлинное "conditioning".[87]

3. ПОИСК ЭНГРАММЫ

Прежде чем обратиться к вопросу, на какие части всей модифицируемой обучением системы воздействует адаптивная модификация и откуда происходит новая информация, воздействующая на них, я хотел бы высказать некоторые общие соображения о физиологической природе обучения и памяти.

Поиск энграммы,[88] знака в памяти,[89] оставляемого обучением, до сих пор остался удручающе бесплодным. Для своего остроумного доклада "In Search of the Engram"[90] К. С. Лешли избрал подзаголовок: "Thirty years of frustration".[91] В действительности же терпеливые исследования Лешли обнаружили, наряду с другими очень важными результатами, тот факт, что энграмма не локализована в каком-либо определенном месте мозга, а заключается в организации, связывающей всевозможные части мозга. Впрочем, даже сегодня мы не можем сказать, какие физиологические процессы лежат в ее основе. Отсюда понятно, почему многие серьезные исследователи сразу же после открытия генетического кодирования информации в цепных молекулах выдвинули гипотезу, что знание, приобретенное в индивидуальном опыте и хранимое в памяти, удерживается таким же способом. Между тем эта гипотеза вызывает большие сомнения. Если бы она была верна, то должно было бы существовать два механизма, функционирующих независимо друг от друга, один из которых тотчас же "записывает на пленку" все поступающие нервные импульсы, т. е. превращает их временную последовательность в пространственную конфигурацию соответствующей цепной молекулы, заключающей в своем коде воспринятые факты. Второй механизм должен быть в состоянии считывать записанные этим химическим кодом сообщения и переводить их обратно в нервные импульсы, координированные во времени и пространстве. Эта гипотеза, независимо от ее общей невероятности, не может объяснить, почему у всех известных живых существ способность к обучению находится в прямом отношении к числу ганглионарных клеток и вообще к величине и дифференцированное™ центральной нервной системы. В последнее время биохимики показали, что химическое кодирование индивидуально приобретенной информации в цепных молекулах невозможно по временным причинам. Поскольку, кроме того, большая часть результатов, как будто доказывавших химическую передачу индивидуально приобретенной информации, при критическом повторении не смогла быть воспроизведена, я твердо придерживаюсь предположения, что все функции обучения, во всяком случае в той мере, в какой они обусловливают более сложные адаптивные модификации поведения, разыгрываются в синапсах, т. е. в соединениях, связывающих отдельные нервные элементы, и что эти изменения, как уже было сказано (с. 302 и далее), ближе всего родственны эмбриогенетическим процессам индукции. Этим не исключается, что в таких локальных явлениях могут играть роль изменения в кодировании цепных молекул.

4. ВРОЖДЕННЫЕ НАСТАВНИКИ

Открытая программа тех механизмов поведения, которыми каждый индивид благодаря эволюционному развитию его предков снабжается в начале жизненного пути, всегда сконструирована надежно испытанным способом, так, что оставленные открытыми переменные части ее относятся к условиям окружающей среды, не предсказуемым в их особенностях, в их временном и пространственном осуществлении, но достаточно постоянным в жизни индивида, чтобы оправдать хранение соответствующей информации. Только что вылупившийся серый гусь никоим образом не может знать, как выглядят индивиды, которые являются его родителями и за которыми ему придется следовать в течение месяцев; молодая пчела не может иметь врожденной информации о географическом строении окрестностей ее улья. Способность узнавать отдельных собратьев по виду и способность приобретать посредством дрессировки навыки отыскания пути представляют собой хорошие примеры установок обучения, доставляющих такую существенную информацию, которая не может быть получена ни от генома, ни от механизмов приобретения текущей информации.

С другой стороны, как мы знаем, именно открытая программа имеет своей предпосылкой большую массу филогенетически приобретенной, связанной с геномом информации. Эта информация превращается в целесообразное поведение животного не посредством морфогенетического[92] развития, а иным путем. Конечно, сначала морфогенез создает на основе этой информации вполне определенные нейтральные устройства, как, например, описанную на с. 312 врожденную установку обучения, позволяющую мгновенно ассоциировать очень сильный стимул к бегству со всей сопровождающей его стимулирующей ситуацией. Далее, вся описанная в 6.2 структура аппарата подкрепления успехом построена, разумеется, на основе информации, заключенной в геноме. И если мы хотим остаться в пределах естественнонаучного объяснения, то нельзя себе представить, чтобы заключенная в геноме информация могла превращаться в способствующее сохранению вида поведение каким-нибудь иным способом, чем посредством построения реальных структур нервной системы и органов чувств.

Именно это структурирование направляет обучение на целесообразные пути. Из него вырастают «наставники», заботящиеся о том, чтобы открытые места различных программ всегда заполнялись способом, содействующим сохранению вида. Как уже не раз говорилось, сами эти структуры должны быть как можно меньше подвержены изменению вследствие модификации, чтобы ничего не потерять из содержащейся в них врожденной информации. Если в некоторой системе форм поведения имеется подсистема, способная сильно модифицироваться обучением, это неизбежно предполагает, что другие подсистемы достаточно резистентны по отношению к модификациям, чтобы обеспечить выполнение учебной программы модифицируемых частей.

Если не допускать сверхъестественных факторов, например предустановленной гармонии между организмом и окружающим миром, то необходимо постулировать существование врожденных механизмов обучения, чтобы объяснить функции большинства процессов обучения, очевидным образом способствующие сохранению вида. К числу условий возможного опыта принадлежат и те наставники, которые соответствуют Кантову определению априорного: эти врожденные наставники — то, что предшествует любому обучению и должно ему предшествовать, чтобы сделать обучение возможным.

Для естествоиспытателя в высшей степени захватывающее предприятие — разыскивать в некоторой комплексной системе форм поведения, способной к функционированию лишь при адаптивной модификации посредством обучения, те места, где содержится генетически закрепленная открытая программа процессов обучения. Лежащая в основе всего этого информация, связанная с геномом, может быть заложена в самые различные механизмы органов чувств и нервной системы. Например, она может быть сосредоточена в чисто рецепторных механизмах. При типе поведения, который Уоллес Крейг назвал аверсией и который я, вместе с Моникой Мейер-Гольцапфель, предпочитаю называть аппетенцией по состояниям покоя, это филогенетически запрограммированные рецепторные процессы, говорящие организму, что во внешнем мире что-то "не в порядке". Может быть слишком сухо, слишком влажно, слишком тепло, слишком холодно, слишком светло, слишком темно, соленость воды может быть слишком высокой или слишком низкой, биотоп может доставлять слишком мало укрытий или содержать слишком много препятствий для обзора и т. д. и т. п. Моторное возбуждение, владеющее животным, пока продолжается "вызывающая аверсию" стимулирующая ситуация, может принимать самые разнообразные формы и происходить на самых разных уровнях организации, от простейшего кинезиса до сложных, целенаправленных способов поведения, включающих обучение и понимание. Во всех случаях, когда имеется адаптивная модификация, она затрагивает формы поведения, связанные с поиском пути. Как подлинные условные реакции, возникают путевые дрессировки, быстрейшим образом удаляющие организм от мешающего стимула.

Другой вид возникновения условных реакций, столь же широко распространенный и имеющий столь же простую врожденную программу, выполняет важную функцию — сохраняет посредством внешнего поведения постоянные условия внутри организма, т. е. обеспечивает с помощью целесообразных реакций гомеостазы. Мы знаем о самих себе, что получаем достоверные сообщения, когда в каком-либо из различных регулирующих контуров нашего тела что-нибудь не в порядке. Сообщение «датчика» может быть специфического рода, как, например, при недостатке в тканях определенных веществ. Самые обычные примеры — голод и жажда. Первые бихевиористы, как, например, Торндайк, полагали, что удовлетворение потребностей тканей (tissue needs) является важнейшим подкреплением (Bekräftigung), производящим самодрессировки. При этом даже не ставился вопрос, каким образом организм в целом, и прежде всего его центральная нервная система, «узнает», чего недостает и какими формами поведения он может устранить этот недостаток.

Еще один пример механизма, сообщающего о неблагополучии уже в несколько ином смысле, — чувство боли. Его особая функция — локализация помехи: мы сразу узнаем, где непорядок, и нам уже не дозволяется о нем забыть. Но особенно интересны наименее поддающиеся локализации сообщения, которыми наше тело дает знать о нарушении его гомеостазов. В таких случаях мы можем лишь сказать, что нам плохо. Например, при небольшой инфекции мы никак не в состоянии указать, в каком месте происходит нарушение, даже если чувствуем себя «отвратительно». Но если человека «тошнит», это доставляет уже более точную информацию о месте неблагополучия, а часто можно даже сказать, почему этому человеку так плохо. Как раз в этом и состоит, конечно, ценность такого сообщения для сохранения вида. Если, например, неприятность произошла от употребления испорченной еды, то большей частью мы наталкиваемся посредством "свободных ассоциаций", как выражаются психоаналитики, на какое-нибудь блюдо с душком, съеденное накануне, и тогда причинная связь становится для нас субъективно очевидной. Условные реакции избегания, возникающие вследствие таких переживаний, могут сохраняться надолго, часто на всю жизнь.

Врожденный механизм обучения, производящий эти условные реакции, используя неприятные самочувствия как «наказания» и приятные — как подкрепления, может программироваться очень общим образом. Такому механизму достаточно иметь датчики, в смысле техники управления, в различных регулирующих контурах организма, наказывая за любое изменение, отклоняющееся от желательного номинального значения, и вознаграждая за любое изменение, приближающееся к нему. На этом принципе и в самом деле основывается механизм, определяющий выбор пищи у многих «всеядных», т. е. животных, потребляющих очень разнообразные питательные вещества. Курт Рихтер давно уже установил, что крысы, которым предлагали различные необходимые для их питания вещества порознь, во множестве отдельных сосудов — так что белки были даже разложены на отдельные аминокислоты, — брали из каждой мисочки ровно столько, сколько требовал хорошо рассчитанный рацион. Поскольку крыса никак не может иметь филогенетически приобретенной информации о том, из каких аминокислот синтезируются обычные для нее белковые вещества и в каких отношениях они туда входят, это знание должно приходить к животным другим путем. Исследования X. Гарсиа и Ф. Р. Эрвина привели к весьма важным результатам о программе врожденного механизма обучения, доставляющего крысе такую информацию. Ее можно приучить или отучить от употребления некоторого вида пищи только посредством переживаний, исходящих из ее кишечника. Указанные авторы использовали в качестве наказывающих стимулов инъекции апоморфина, вызывающие тошноту и рвоту, или определенную дозу рентгеновского излучения, производящую то же действие в виде так называемого "рентгеновского похмелья". Все попытки отучить крыс от приема некоторых питательных веществ посредством болевых стимулов и других сильнейших наказаний не приводили к цели. С другой стороны, с помощью указанных способов раздражения кишечника столь же невозможно было отучить крыс от иных форм поведения, кроме приема определенной пищи.

Как в адаптивных модификациях аппетентного поведения, стремящегося к состояниям покоя, так и в только что описанных самодрессировках на определенные виды пищи на передний план выступают условные реакции избегания. Поэтому в некоторой степени оправданно говорить об аверсиях в более общем смысле, как это и делал Крейг. Но когда, например, животное переползает из более холодной среды в более теплую, то никак нельзя объективно установить, избегает ли оно холода или ищет тепла; именно поэтому я предпочитаю термин Мейер-Гольцапфель. Однако несомненно, что в обоих случаях организм находится в состоянии возбуждения и что именно снятие возбуждения действует в качестве дрессирующего подкрепления. Это и есть тот тип подкрепления посредством снижения напряжения — relief of tension, — особую важность которого выяснил Ч. Л. Халл.

Существуют также модифицируемые системы поведения, в которых врожденная информация содержится не только в рецепторных механизмах запуска, анализирующих стимулирующую ситуацию, но и в самих запускаемых наследственных координациях. Хороший пример этого составляет постройка гнезда у галок (Coloeus monedula L.), а также у других врановых (Corvidae). Стоя в центре будущего гнезда, птица выполняет с материалом в клюве толкательное движение со своеобразным дрожанием, направленное по широкой окружности в сторону и немного вниз, которым она прижимает материал к основанию гнезда или к уже построенным его частям и втыкает его в эти места. Если материал наталкивается при этом на сопротивление, то дрожательное движение усиливается и непрерывное во времени толкание превращается в ряд сильных ударов в одном направлении, механическое действие которых несколько напоминает действия человека, чистящего трубку, когда введение чистителя в отверстие трубки наталкивается на сопротивление. И если птица держит ветку или что-нибудь в этом роде, то она продвигает этот предмет до тех пор, пока наконец после ее длительных усилий он не пристает таким образом, что его нельзя уже передвинуть ни вперед, ни назад. Когда это происходит, движения "дрожательного толкания" достигают своего оргиастического максимума и внезапно прекращаются. Птица теряет теперь всякий интерес к объекту, а на какое-то время и вообще к постройке гнезда. Дрожательное толкание с его внезапным, удовлетворяющим побуждение концом — это типичный пример завершающего действия, "consummatory act" в смысле Уоллеса Крейга.

В отличие от многих других певчих птиц, галки и другие врановые явно не имеют локализованной в механизме запуска информации о том, что подходит для постройки гнезда. Когда у них впервые пробуждается стремление к этому, они приносят самые невероятные предметы и пытаются прикрепить их дрожательным толканием к месту, подходящему для постройки гнезда. Знание такого места является, однако, врожденным. Я видел галок и воронов, заталкивающих этим движением осколки стекла, патроны для электрических ламп, даже кусочки льда. Конечно, эти вещи не пристают, так что удовлетворяющее завершающее действие не запускается. И в очень короткое время птица научается использовать лишь такие предметы, которые при дрожательном толкании доставляют обратные сообщения, или «реафференции», запрограммированные в качестве подкреплений во врожденном механизме обучения. Этих сообщений достаточно, чтобы выдрессировать у птицы выбор таких материалов, которые могут быть сплетены инстинктивным движением в очень прочное строение. Иногда у этого врожденного наставника случаются ошибки, что легко объясняется экономностью врожденной информации: конечно, проволока или полосы жести дают особенно подкрепляющие реафференции, и может случиться, что птица выдрессируется на такой материал, биологически неприемлемый из-за своей теплопроводности. Поблизости от промышленных предприятий не так уж редко встречаются металлические гнезда. Описанный процесс представляет пример действия так называемого сверхнормального объекта; реакция на такой объект, как мы еще увидим дальше, напоминает по своему характеру порок.

Сложнее те процессы обучения, которые интегрируют в единую функцию различные инстинктивные движения при постройке крысиного гнезда. Как показал И. Эйбль-Эйбесфельдт, каждая отдельная наследственная координация, входящая в этот процесс, является полностью врожденной. В единственном случае врожденной является также их последовательность: крыса «знает» от рождения, что постройку гнезда надо начинать со сбора материала далеко от места будущего гнезда и доставки его на это место. Крысы, которых Эйбль-Эйбесфельдт вырастил в клетках, не содержавших никаких свободно переместимых предметов, использовали в качестве замещающего объекта собственный хвост, который они брали в зубы далеко от привычного места сна, несли его туда и добросовестно укладывали в надлежащем месте. Поскольку желательно было провести эксперимент с особями без всякого опыта, пришлось повторить его с другими особями, которым в ранней молодости, задолго до проявления побуждений к постройке гнезда, ампутировали хвост. Когда они выросли, им впервые предложили мягкие полоски бумаги, и они сразу же принялись строить. Те из них, которые уже выбрали себе в нерасчлененном помещении определенное место для сна, сразу же стали складывать там принесенные бумажные полоски. У тех, которые до эксперимента спали то в одном месте, то в другом, прошло несколько минут, прежде чем они решились выбрать место для гнезда. Когда отделили угол помещения куском жести площадью в несколько квадратных сантиметров, все подопытные животные стали строить гнезда в этом укрытии.

Строительная деятельность лишенных опыта крыс выразительным образом отличалась от поведения нормальных контрольных животных. Вначале она была намного более интенсивной. Подопытные животные с жадностью набросились на строительный материал, что объяснялось накоплением ни разу не отреагированных инстинктивных движений и чего, конечно, следовало ожидать. Но важное различие состояло в том, что у них отсутствовал порядок наследственных координации, характерный для постройки гнезд опытными крысами. Опытная крыса в начале постройки гнезда ограничивается доставкой материала, пока он не наберется в значительном количестве. Затем она подтягивает этот материал к себе концентрически, вращаясь вокруг вертикальной оси, так что образуется кольцеобразный вал с центром в середине гнезда. Лишь когда этот вал достигает достаточной высоты, опытное животное переходит к так называемому "движению обойщика", заключающемуся в том, что крыса уплотняет и приглаживает внутреннюю стенку вала передними лапами. Подопытное животные Эйбля сразу же выполняли каждую из этих форм движения в законченной координации, так что даже при анализе с помощью замедленной киносъемки не обнаружилось никаких отличий по сравнению с их опытными собратьями по виду. Но указанная выше последовательность полностью отсутствовала: крысы поспешно прибегали с полоской бумаги, клали ее на пол, а затем выполняли в пустом воздухе движения укладки и сглаживания одно за другим, без всякого порядка.

У крыс вся модифицируемая система сложнее, чем у галок, но каждый из множества имеющихся врожденных механизмов обучения действует по тому же принципу. Дрессировка и подкрепление определенной последовательности движений в обоих случаях осуществляются посредством двух процессов. Первый процесс состоит в том, что данная форма наследственной координации может выдать вознаграждающее обратное сообщение лишь при вполне определенной, предусмотренной программой ситуации окружающей среды. Второй же процесс осуществляется обратным сообщением об успехе или неудаче, доставляемым экстероцепторными[93] и, вероятно, также проприоцепторными[94] механизмами.

Если инстинктивное движение, так сказать, тратится впустую, не вызывая никаких реаффрекций, то и это действует, вероятно, так же, как прямая отрицательная дрессировка. Во всяком случае, при непосредственном наблюдении рассматриваемых процессов обучения складывается впечатление, что движение укладки доставляет крысам гораздо больше удовлетворения и выполняется с большим изяществом, если материал для укладывания уже собран, а "движение обойщика" вполне удовлетворяет их лишь в том случае, если вал из строительного материала уже сооружен.

Для читателя, интересующегося теорией обучения, замечу, что процессы обучения, при которых большая часть врожденной информации сосредоточена не в рецепторном секторе, а в самой наследственно координированной форме движения, могут быть включены в понятие "оперантного обучения" (opérant conditioning). Но в этом случае «оперант» состоит не в простом, многократно применимом движении, как, например, царапание или сгребание передней лапой, которое может иногда по чистой случайности иметь подкрепляющий успех, как при нажатии рычажка в ящике Скиннера или в более старомодном "ящике с секретом". Он заключается в высокодифференцированном инстинктивном движении, пригодном лишь для единственной специфической функции, и именно той, ради которой оно выработано эволюцией соответствующего вида.

В случае простого, многократно применимого способа поведения справедливы закономерности, сформулированные Б. Ф. Скиннером для процесса обучения, который он назвал кондиционированием типа R. Первый из этих законов гласит, что сила операнта возрастает, если за ним следует подкрепляющая стимулирующая ситуация. Согласно второму закону, сила уже подкрепленного кондиционированием операнта убывает, если за ним не следует подкрепляющий стимул. Эти законы справедливы, если оперантом является так называемая инструментальная реакция, такая, как пространственное перемещение или другие простые формы движения, служащие различным побуждениям. Они справедливы лишь отчасти, если оперант есть инстинктивное движение, аппетенция которого мотивирует животное. В таком случае предшествующее движение в длительной перспективе, возможно, и подкрепляется успехом, но на ближайшее время оно может даже совсем угаснуть. Пока что побуждение удовлетворено, и действие дрессировки станет заметным, лишь когда оно снова проснется. Но отсутствие подкрепления никоим образом не приводит к тому, что животное отказывается от операнта. Поскольку он является наследственной координацией с автономным побуждением, отсутствие удовлетворения приводит лишь к тому, что животное стремится удовлетворить свою потребность в этой форме движения в других ситуациях и на других объектах, но со все возрастающей аппетенцией.

Важно подчеркнуть эти различия, потому что способ проб и ошибок, описанный уже в случае галок и крыс и наблюдаемый, по существу, в том же виде у очень многих животных, можно спутать с так называемым исследовательским поведением, или поведением любопытства, о котором будет речь в дальнейшем.

В описанных выше процессах инстинктивное движение подвержено собственному автохтонному[95] мотивационному давлению, и эта одна и та же форма движения без изменений испытывается на самых разнообразных объектах. Но при подлинном поведении любопытства организм находится под действием совсем иной мотивации, не зависящей от давления, побуждающего к отдельному инстинктивному движению; это убедительно доказала Моника Мейер-Гольцапфель. При таком поведении животное не испытывает одно инстинктивное движение на различных объектах, а, напротив, испытывает на одном объекте множество инстинктивных движений, часто весь свой рабочий репертуар, выполняя эти движения одно за другим. Оба процесса обучения отличаются от классического "opérant conditioning" в том отношении, что при этом последнем «оперантом» является универсально применимая инструментальная реакция, которая может быть запущена под давлением самых различных мотиваций.

Особенно интересную и неожиданную локализацию врожденной информации открыл М. Кониси в своих исследованиях развития способности к пению у молодых певчих птиц. О многих видах этой группы известно, что неопытный птенец должен услышать пение взрослого собрата по виду, чтобы у него развилось свойственное виду, нормальное во всех подробностях пение. Как известно, исследования И. Николаи обнаружили тот поразительный факт, что некоторые птицы, например снегири, учатся только у вполне определенных особей, с которыми они состоят в столь же определенных, очень тесных социальных отношениях. Известно было также, что птенцы многих видов, которым приходится учиться путем подражания, выбирают в качестве образца пение своего вида даже в том случае, когда слышат много других птичьих голосов и когда голоса их собратьев по виду вовсе не самые заметные и громкие из всех. Кроме того. Оскар Гейнрот заметил, что воспитанные в изоляции птенцы тех видов, которым необходим образец пения своих собратьев, после длинного ряда попыток производят в конце концов песню, приблизительно напоминающую свойственную их виду. Гейнрот предположил, что это "самоподражание".

Все эти явления находят объяснение благодаря открытиям Кониси. Птицы, у которых он разрушал в самом раннем возрасте орган слуха, взрослыми производили пение, состоявшее скорее из шумов, чем из музыкальных звуков, и лишенное всякой структуры. Это наблюдалось и у таких видов, индивиды которых, выросшие в звукоизолированных камерах, вырабатывали вполне отчетливое видовое пение. Отсюда вытекает удивительный, но неизбежный вывод, что лишенные опыта птицы имеют рецепторный прообраз своего видового пения; Кониси называет его "auditory template".[96] Птица играет своим голосом, тихо напевает подобно лепечущему ребенку, испытывая самые разнообразные комбинации звуков, и сохраняет те из них, которые лучше всего соответствуют свойственному виду акустическому шаблону, предстоящему перед ее «воображением». Тихие напевы, которые наши любители птиц так мило называют "сочинением",[97] носят, таким образом, характер исследовательской игры.

Рассмотренных примеров филогенетически запрограммированных механизмов обучения достаточно, чтобы продемонстрировать три факта, важных в контексте этой книги.

Во-первых. В принципе всегда можно показать соответствующим экспериментальным анализом, в какой подсистеме комплексной модифицируемой системы поведения находится врожденная информация, обеспечивающая возможность выдрессировать у животного целесообразные для сохранения вида формы поведения.

Во-вторых. Ни один процесс обучения не может быть понят, если не известна вся система, адаптивную модификацию которой он осуществляет.

В-третьих. Невозможно сформулировать общие, справедливые для всякого обучения утверждения о том, что именно действует в качестве подкрепления ("reinforcement"). Теория Торндайка, по которой сущностью подкрепления является удовлетворение потребностей тканей, или теория Халла, видящего существенный дрессирующий фактор в снятии нервного напряжения ("relief of tension"), обе подходят лишь к специальным случаям. Физиологическая природа процесса подкрепления должна отдельно исследоваться в каждом случае обучения.

5. МОДИФИЦИРУЕМЫЕ ПОДСИСТЕМЫ И ИХ АДАПТИВНАЯ ИЗМЕНЧИВОСТЬ

В предыдущем изложении и более подробно в моей книге "Эволюция и модификация поведения" (Harvard University Press, 1965) я пытался показать, что невозможно допустить адаптивную модифицируемость всех вообще существующих частных процессов поведения, не прибегая к виталистическому допущению предустановленной гармонии между организмом и внешним миром. Само собой разумеется, что любая модифицируемость, служащая сохранению вида, имеет своей предпосылкой возникшую в ходе эволюции открытую программу и сверх того точно так же филогенетически запрограммированный механизм обучения описанного в предыдущем разделе вида. Всеобщая и неограниченная пластичность всех форм поведения предполагала бы бесконечное множество такой информации и таких аппаратов обучения, что, очевидно, бессмысленно.

6. УСЛОВНАЯ РЕАКЦИЯ,ПРИЧИННОСТЬ И ПРЕОБРАЗОВАНИЕ СИЛЫ

Как уже было сказано вначале (с. 254), часто случается, что когнитивные аппараты различных уровней интеграции очевидным образом возникают в ходе приспособления к одной и той же внесубъективной обстановке. Нередко такие аппараты встречаются у животных разного уровня развития; нередко обнаруживается, что они функционируют одновременно, но независимо друг от друга у одного и того же вида. Это справедливо и в рассматриваемых дальше случаях.

Как подчеркнул Э. Ч. Толмен в своей книге "Целенаправленное поведение животных и человека", важнейшая функция способности к образованию условных реакций состоит в том, что она дает организму возможность оценить некоторую комбинацию стимулов, которая сама по себе не имеет биологического значения, как предзнаменование скорого наступления другой, жизненно важной ситуации, и позволяет сделать к ней приготовления.

Наблюдая полудиких коз армянского нагорья, я заметил однажды, как уже при первых отдаленных раскатах грома они отыскивали в скалах подходящие пещеры, целесообразно готовясь к возможному ливню. То же они делали, когда поблизости раздавался грохот взрывов. Я вполне отчетливо помню, что при этом наблюдении я внезапно впервые осознал: в естественных условиях образование условных реакций лишь тогда способствует сохранению вида, когда условный стимул находится в причинной связи с безусловным.

Надежное, регулярное "post hoc",[98] служащее предпосылкой того, что некоторая условная реакция выполняет функцию, способствующую сохранению вида, никогда не встречается в естественных условиях без причинных связей, которые в таком случае легко обнаружить. В принципе они присутствуют и тогда, когда экспериментатор перед кормлением павловской собаки регулярно заставляет звучать "сигнал еды". Правда, причинная детерминированность в поведении самого исследователя пока ускользает от нашего анализа.

Как я полагаю, доказательство телеономности условной реакции бросает важный свет на некоторую ошибку Юмова эмпиризма, которую критикует также Карл Р. Поппер в своей книге "Объективное знание". Как показывает Юм, с точки зрения чистой логики ни из какого числа прецедентов нельзя заключить, что та же последовательность событий должна повториться; нельзя даже заключить, что вероятность такого допущения возрастает с числом повторений. В связи с этим логическим тезисом Юм ставит психологический вопрос, как же это получается, что каждый разумный человек с большой уверенностью ожидает, что завтра снова взойдет солнце, что отпущенный камень упадет на землю и, вообще, что все на свете будет дальше происходить, как до сих пор. Великий эмпирист отвечает на этот вопрос, говоря, что это следствие привычки — "custom of habit", — иными словами, это происходит потому, что многократное повторение приводит в действие некоторый механизм ассоциации идей, без которого мы, по словам Юма, были бы вовсе не способны к жизни.

Противоречие между логикой и человеческим здравым смыслом — "common sense", — как показал Поппер, не только привело многих мыслителей к глубокому сомнению в возможности объективного знания, но заставило и самого Юма принять некоторую нерациональную теорию познания. Поппер говорит о нем: "Его открытие, что из повторения невозможно вывести никакую доказательную аргументацию, хотя оно и господствует в нашей когнитивной жизни и в нашем «понимании», привело его к заключению, что рассудочные основания и разум играют в нашем понимании лишь подчиненную роль. Наше «знание» разоблачается как нечто, чему подобает лишь природа веры, более того, веры, не поддающейся защите с точки зрения разума, — то есть нерационального убеждения" (His result that repetition has no power whatever as an argument, al though it dominates our cognitive life or our «understanding» led him to the conclusion that argument or reason plays only a minor role in our understanding. Our knowledge is unmasked as being not only of the nature of belief, but of rationally indefensible belief — of an irrational faith).[99]

Карл Поппер указывает выход из этой апории[100] ясным рассуждением, из которого я хочу привести лишь два предложения, свидетельствующих, даже вне их контекста, о фундаментальном совпадении между результатами логики и исследования поведения. Поппер пишет: "Я считаю чрезвычайно важным различение между логической и психологической проблемой, вытекающее из трактовки Юмом той и другой. Но я полагаю, что его точка зрения неудовлетворительна в отношении того, что я назвал бы логикой. Он описывает, причем достаточно ясно, процессы правильных заключений; но он рассматривает их как «рациональные» сознательные процессы" (I regard the distinction, implicit in Hume's treatment, between a logical and a psychological problem as of the utmost importance. But I do not think that Hume's view of what I am inclined to call «logic» is satisfactory. He describes, clearly enough, processes of valid inference, but he looks upon these as «rational» mental process).

К методическим принципам Поппера принадлежит перевод всей субъективной терминологии в объективирующую во всех тех случаях, когда входят в рассмотрение логические проблемы. Он говорит попросту следующее: "Что верно в логике, то верно и в психологии" (what is true in logic, is true in psychology). Этот принцип переводимости ("principle of transference"), связывающий субъективное с объективным, в точности соответствует нашему высказанному уже в пролегоменах убеждению в фундаментальной тождественности всех процессов переживания с физиологическими процессами.

Логическое мышление, точно так же как образование условных реакций и бесчисленные иные «психологические» процессы, есть функция человеческого аппарата отображения мира, в целом находящегося в соответствии с условиями внесубъективной действительности, о чем уже неоднократно говорилось выше (с. 249). Горестное заключение Юмова эмпиризма, что все наше знание в действительности есть лишь совершенно неосновательная вера, было бы справедливо лишь в том случае, если бы было верно утверждение: "Nihil est in intellectu quod non antefuerat in sensu" (В нашем разуме нет ничего, чего не было раньше в нашем чувственном восприятии).

Но мы знаем уже, насколько ложно это утверждение, мы знаем, что любое явление приспособления есть когнитивный процесс и что данный нам a priori аппарат, с помощью которого только и возможно индивидуальное приобретение опыта, имеет уже своей предпосылкой огромную массу полученной в ходе эволюции и хранящейся в геноме информации. Этого Юм еще не знал, а бихевиористы не хотят этого знать.

В каждом из нас заложена установка, вынуждающая нас после повторного наступления некоторого события предполагать некоторую непонятную, трудно определимую связь между его отдельными появлениями. Я хорошо помню, как, будучи школьником, долго не мог поверить моему учителю математики, что если шарик рулетки очень много раз остановился на красном, то с увеличением числа таких повторений не возрастает вероятность того, что в следующий раз выпадет черный цвет. Учитель в конце концов убедил меня, сказав: "Подумай, ведь колесо не помнит, что было раньше, каждый следующий запуск в точности таков, как первый, с одинаковой вероятностью красного и черного". Я говорил с очень многими людьми, заметившими у себя этот логически необъяснимый принудительный ход мыслей. Возникает нелегкий, но интересный вопрос, какой же реальный механизм приписывается в этих ожиданиях колесу рулетки. От него как будто ожидают, как от живого существа, что после столь многих повторений оно устанет вести себя одинаково и захочет перейти к чему-то другому.

Гораздо легче ответить на вопрос, почему после многократного переживания некоторой последовательности событий мы склонны рассматривать уже происшедшие как верное предзнаменование дальнейших. Такое принудительное мышление и поведение было бы бессмысленно, если бы внесубъективная действительность была чем-то вроде колеса рулетки и явления в ней столь же случайно следовали бы одно за другим.

Но чисто случайные события, последовательность которых напоминала бы то, что происходит с колесом рулетки, в естественных условиях крайне редки. Напротив, цепи явлений, в которых эффект преобразования силы причинно обусловливает регулярный порядок, не только часто встречаются, но поистине вездесущи. Когда за молнией следует гром или за отдаленным громом следует дождь и когда эти явления хотя бы несколько раз следуют друг за другом в том же порядке, то с подавляющей вероятностью можно предположить, что все три явления связаны между собой причинной зависимостью. Но если одно явление есть причина другого, это всегда предполагает какую-то форму преобразования силы. Точно так же вероятность допущения, что некоторая цепь явлений связана причинной зависимостью, действительно возрастает вместе с числом наблюдаемых случаев. Внесубъективная действительность, которую физик считает удовлетворяющей закону сохранения энергии, — это несомненно та же действительность, которая отражается в форме приспособления по меньшей мере двух различных когнитивных аппаратов: во-первых, в рассматриваемой здесь способности к образованию условных реакций и вообще к образованию ассоциаций и, во-вторых, в человеческой форме мышления, выражающей причинность.

Реакция избегания у туфельки и комплексное центральное представление пространства у самых высших организмов — это приспособления к одной и той же реальной действительности, именно к непроницаемости тел и к их расположению в пространстве. Аналогичным образом образование условных реакций и причинное мышление — приспособления к одной и той же реальности, именно к сохранению и превращениям энергии.

Эмпиристы ошибаются, полагая, что причинное мышление человека возникает лишь вследствие привычки и что наше "propter hoc",[101] наше "потому что" якобы тождественно с часто переживавшимся и надежным "post hoc", "регулярно за этим". Аксиоматическая природа нашего причинного мышления вряд ли где-нибудь проявляется яснее, чем в предложениях, которыми Джеймс Прескотт Джоуль начинает свою классическую работу об эквиваленте тепла. Он говорит там, столь же наивно, как безапелляционно, что абсурдно предполагать, будто какая-нибудь форма энергии может исчезнуть, не превратившись в некоторую другую, постулируя тем самым то, что в конечном счете доказывает, а потому вовсе не имел бы надобности постулировать. Точно так же априорный характер причинного мышления проявляется у каждого умного ребенка в вечном вопросе "почему?".

Уже неоднократно говорилось, что функция более простых когнитивных аппаратов может контролироваться с точки зрения более сложных и что их сообщения при таком контроле никогда не оказываются ложными, а всегда лишь более бедными информацией, чем сообщения высших механизмов. Вполне очевидно, что такое же отношение существует между условной реакцией и причинным мышлением. Обучение посредством успеха, как и вообще любое образование ассоциаций, использует лишь одну из закономерностей превращения сил, состоящую в том, что причина предшествует во времени своему следствию. Этого достаточно, чтобы организм мог сделать жизненно важные приготовления.

7. МОТОРНОЕ ОБУЧЕНИЕ

Насколько мне известно, венский зоолог Отто Шторх первый ясно выразил тот важный факт, что адаптивная модификация поведения обнаруживается в рецепторном секторе поведения животного уже на гораздо более низком уровне развития, чем в моторном. За исключением очень простого процесса обучения, моторного прокладывания путей описанного в первом разделе предыдущей главы, все сказанное до сих пор о телеономном изменении поведения посредством обучения относится к рецепторным процессам, к тому, что Шторх называет "рецепторикой приобретения": сенситивизация, привыкание, приучение, травматическая ассоциация поведения бегства с определенными стимулирующими ситуациями, а также усиление избирательности врожденных механизмов запуска — все это процессы, основанные на изменениях рецепторных аппаратов.

В чем же состоят простейшие телеономные модификации моторных функций? Та же функция условной реакции, которая позволяет организму ответить с опережением во времени на условный стимул способствующими сохранению вида приготовлениями к ожидаемому безусловному стимулу, дает ему также возможность выучить ту последовательность, в какой он должен выполнять определенные инстинктивные движения, каждое из которых находится в его распоряжении в форме, полученной им от рождения. Мы уже познакомились с таким процессом обучения на примере постройки гнезда у крыс. Я склонен допустить, что любое моторное обучение основывается на том же принципе, если только речь идет не о простом прокладывании путей, рассмотренном в 5.2, а о подлинных условных реакциях. В самых примитивных случаях соединенные друг с другом формы движения суть целостные инстинктивные движения, легко распознаваемые как таковые, что мы видели в случае движений при постройке крысиного гнезда. Когда же элементы движения, соединенные таким образом, короче продолжительностью и проще, то складывается гораздо более отчетливое впечатление обучения некоторой новой форме движения. Относительно простой пример возникновения целостно действующей таким образом последовательности движений составляет заучивание путевых дрессировок у мышей. Если наблюдать, как мышь научается пробегать высотный лабиринт, то можно уяснить разницу между свободной последовательностью движений, управляемой текущей информацией, и выполнением жестко определенной, заученной последовательности, как это видно, например, в фильмах, заснятых О. Кёлером и В. Динглером в 1952 году. В незнакомой местности мышь продвигается вперед буквально шаг за шагом, ощупывая путь то вправо, то влево чувствительными волосками, расположенными под носом, и время от времени пробегая кусок пути в обратном направлении. Уже при третьем или четвертом повторении пути мышь нередко пробегает короткий отрезок быстрее, но затем сразу же останавливается и возвращается к прежней форме пространственной ориентировки. При дальнейших повторениях возникают новые короткие броски в других местах пути, они умножаются, становятся длиннее и наконец сливаются в общих концах. Путевая дрессировка окончена, когда в конце концов все эти "трудные стыки", сдерживающие быстрый бег, исчезают. Теперь мышь пробегает весь путь в единственной плавной последовательности движений.

Соединение отдельных, уже имеющихся отрезков движений перемещения совершается в действительности вследствие того, что каждая условная реакция сцепляется с другой, ближайшей. Каждое движение производит ожидаемую стимулирующую ситуацию, которая, с одной стороны, говорит организму, что он все еще находится на правильном пути, а с другой стороны, запускает следующий моторный импульс.

В точности этот вид обучения и именно эту форму сенсорного контроля выученного моторного процесса описал Альфред Кюн в своей ставшей классической книге "Ориентирование животных в пространстве" под именем мнемотаксиса и мнемической гомофонии; но он описал их лишь как теоретическую возможность. На это последовали возражения с разных сторон, что если бы эти допущения были верны, то животное вынуждено было бы всегда пробегать один и тот же однажды выученный путь и было бы дезориентировано, если бы хоть на шаг от него отступило. Поскольку Кюн не знал ни одного животного, удовлетворяющего этим требованиям, он опустил при переиздании своей книги главу о мнемотаксисе и мнемической гомофонии — и напрасно, потому что рассматриваемые здесь животные, как, например, водяная землеройка,[102] ведут себя в точности так, как требуется по его теории. Это производит особенно сильное впечатление, когда такое существо в самом деле сбивается с пути или когда в эксперименте нарочно нарушается гомофонное[103] совпадение между его твердо заученной последовательностью движений и обстоятельствами пути. Когда я удалял с пути моих землероек возвышавшееся препятствие, на которое они привыкли вспрыгивать и пробегать по нему дальше, то они в соответствующем месте подпрыгивали в пустой воздух, а затем, дезориентированные, сидели сначала на земле в том месте, где раньше находился исчезнувший предмет — небольшой деревянный ящичек. Потом они начинали исследовать местность волосками усиков, поворачивали назад и, как можно было заметить, узнавали уже пройденный до препятствия участок пути. Затем, с новым мужеством, они поворачивали, мчались в прежнем направлении — и снова подпрыгивали в пустоту в критическом месте! Они напоминали мне детей, которые, застряв при чтении наизусть стихотворения, начинают снова с какого-нибудь предыдущего места, чтобы пройти трудное место "с налету".

Можно с уверенностью допустить, что обучение более сложным целесообразным формам движения также происходит по только что описанным принципам. Хотя в случае путевых дрессировок речь идет почти исключительно о линейном сочленении отдельных элементов движения, происходящих от наследственных координации перемещения, не видно причин, почему бы интеграция одновременно протекающих частичных движений не могла осуществляться посредством подобных же процессов.

Многие авторы называли "знание наизусть" выученных последовательностей поведения «кинестетическим» знанием. Конечно, обратные сообщения проприоцепторов[104] играют важную роль в усвоении «заученного» движения (англ. "motor skill"), как показывает уже само греческое слово, составленное из κίυησις (движение) и ασθάνομαι (чувствую). Это выражение удачно также с феноменологической стороны, так как хорошо «заученная» форма движения в самом деле «чувствуется». Но, с другой стороны, этот термин вызывает представление, будто именно проприоцепторные образы наших воспоминаний дают нам возможность точно повторять такую последовательность движений, а это допущение вероятно, неверно. Как давно уже показал Эрих фон Гольст, произвольно составленные координации движений также подчиняются законам магнитного эффекта и центральной координации, что было в последнее время многократно подтверждено. Мы знаем из исследований Дж. Экклса, что орган, где осуществляется координация заученных движений, есть мозжечок.

Как мы еще покажем подробнее в разделе о произвольном движении, обучение движениям даже на самом высоком уровне в принципе не отличается от путевого обучения низших млекопитающих. В распоряжении животного всегда имеются врожденные формы движений с готовыми программами и центральной координацией, посредством обучения лишь интегрируемые в некоторое новое целое. По мере более высокого филетического[105] развития способности животных к обучению движения эти моторные элементы становятся все меньше. Но даже при подлинных произвольных движениях они все еще намного выше уровня интеграции фибриллярных[106] сокращений; более того, они, несомненно, охватывают в большинстве случаев еще сокращения нескольких синергических, т. е. действующих в одном направлении, мышц; но они все же достаточно малы, чтобы связываться в почти любые "мелодии движения" как при одновременном действии, так и во временной последовательности.

Об элементах движения, составляющих перемещения, мы знаем довольно достоверно, что в основе их лежат эндогенная[107] стимуляция и центральная координация. Я полагаю, что физиологические явления этого рода вообще не могут быть адаптивно изменены обучением или другими влияниями; меняться может лишь многообразие тех процессов, которые мы назвали выше (с. 295) мантией рефлексов, составляющих, налегая друг на друга, слой между этими явлениями и требованиями внешней среды. В пользу этого допущения говорит также то уже известное нам обстоятельство, что в случаях, когда посредническая функция мантии рефлексов оказывается недостаточной, лежащая в основе наследственная координация не просто «размягчается» и подчиняется таксисам, а распадается на малые куски, сами по себе столь же «твердые», как прыжок доброго коня, скачущего галопом, но как раз благодаря своей краткости более пригодные к легкому и многостороннему использованию в соответствии с пониманием пространства.

Несомненно, особое значение отработанного, «заученного» движения для сохранения вида состоит прежде всего в том, что оно может быть выполнено без промедления, происходящего от задержки реакций. Когда пытаются поймать таких территориальных животных, как ящерицы или коралловые рыбы, на их свободно проложенных путях, то можно заметить, насколько заученная наизусть последовательность движений отличается своей целеустремленностью и быстротой от последовательности, управляемой шаг за шагом механизмами ориентации. Пока животное движется в согласии с заученной путевой дрессировкой, оно перемещается так быстро и целеустремленно, что вряд ли можно рассчитывать захватить его внезапным рывком или наброшенной сетью. Но если удается внезапной атакой вызвать у намеченной жертвы столь сильную панику, чтобы заставить ее покинуть область, охваченную путевыми дрессировками, то большей частью ее можно поймать. Я полагаю, что преимущества, доставляемые таким образом путевыми дрессировками, составили главную часть селекционного давления, выработавшего у видов указанного экологического типа территориальное поведение.

Никто еще не пытался применить к заученным, отработанным последовательностям движений животных те методы исследования, которые Эрих фон Гольст использовал в свое время, чтобы показать, что центрально координированные движения независимы от афферентных процессов. Конечно, предпринятая Эрихом фон Гольстом операция «дезафференции», выключение всех подводящих нервов, означает тяжелое общее повреждение организма, так что, если бы дезафференцированное животное не владело больше некоторым выученным до операции движением, это бы мало что доказало. У людей, болеющих Tabes dorsalis,[108] у которых вследствие болезни не функционируют окончания нервов, сообщающих о положении наших членов — так называемые проприоцепторы положения, — как известно, существенно нарушается координация движений. Но надо принять во внимание, что человек, в некотором роде, чемпион мира по усвоенным, сознательно управляемым произвольным движениям, и потому у него вполне могут афферентно контролироваться формы движения, эквиваленты которых у животных такого контроля не допускают.

Я не решаю вопроса, все ли выученные движения у животных и людей имеют одинаковую физиологическую природу; я говорю здесь лишь о том типе выработанных, отшлифованных тысячекратным повторением движений, о которых наш обиходный язык создал в своем естественном развитии такие выражения, как "знать что-нибудь наизусть", "вошло в плоть и кровь", "стало второй натурой" или, наконец, "совершенно автоматически". В отношении таких последовательностей движений я все же склонен допустить, что их физиологические механизмы те же, на которых основываются уже описанные путевые дрессировки мелких млекопитающих. Вопрос об этих механизмах представляет интерес по той причине, что соответствующие последовательности движений в ряде отношений поразительно напоминают наследственные координации, то есть инстинктивные движения.

Во-первых, координация выработанных движений, как показал уже Эрих фон Гольст, подчиняется ряду законов, совпадающих с законами центральной координации врожденных форм движения. Например, в обоих случаях ритмы различных включенных в общую координацию элементарных движений влияют друг на друга одинаковым образом. Явления "относительной координации" и "магнитного эффекта", по поводу которых я отсылаю к работам фон Гольста, осуществляют в буквальном смысле гармоническое созвучие отдельных ритмов, стремясь привести их в фазовое отношение, выражающееся в небольших целых числах. Чем совершеннее это получается, тем устойчивее координация ритмов. Формы движения, сопротивляющиеся описанным тенденциям процесса центральной координации, остаются неустойчивыми, т. е. их трудно сохранить, как знает каждый пианист, которому приходится играть одной рукой триоли, а другой — восьмые. Именно эти функции относительной координации и магнитного эффекта сообщают каждому хорошо усвоенному заученному движению, так же как независимому от процессов обучения инстинктивному движению, ту экономную и изящную форму, которая столь соответствует нашему чувству прекрасного.

Второе свойство заученного движения, которым оно напоминает врожденные наследственные координации, состоит в сильной резистентности по отношению к попыткам его изменить. Как имел обыкновение говорить Карл Бюлер, характерное свойство выученного состоит в том, что оно может быть снова забыто. Конечно, это утверждение было высказано как афоризм, но оно имеет более глубокий смысл, потому что, как я полагаю, оно справедливо лишь в отношении «настоящего» обучения, но не того процесса, из которого возникают заученные координации движений. По моим впечатлениям, эти координации вообще никогда не забываются до конца, так что изменения и приспособления внешнего выполнения движения достигаются скорее наложением на него вновь приобретенных добавочных движений, чем исчезновением давно вошедшего в привычку. В пользу этого мнения говорят, например, наблюдения за водителями автомобилей в каждом случае, когда они меняют тип машины. Если какие-нибудь движения заслуживают таких оценок, как «отработанные», "выученные наизусть", то это движения подлинно хорошего водителя. Если такой водитель долгое время ездит на одной и той же машине, а затем вынужден переменить ее, то жесткость этих движений проявляется весьма отчетливо. Когда моя жена перешла от машины с рычажным переключением к другой, с переключателем на рулевой колонке, она долго еще хватала рукой пустоту в поиске отсутствующего рычага и лишь затем переводила руку вверх, к рукоятке на руле. Это обходное движение постепенно превратилось в колебательное, дугообразное движение руки, производившее впечатление аффектации на всякого не посвященного в его историю, и оно еще не совсем исчезло, когда машина с рулевой рукояткой пришла в негодность и была заменена новой, опять с рычажным переключением. Моя жена, более пяти лет все время ругавшая переключение с руля и сожалевшая о рычажном, оказалась неспособной просто устранить координацию движений, связанную с рулевым переключением. Предоставляю читателю сообразить, по какому пути ее рука отклонялась теперь к рукоятке; как можно понять из всего сказанного, дама делала это весьма элегантно. Упорство, с которым заученные движения сопротивляются всякой попытке их устранить, хорошо известно преподавателям спорта. Им вовсе не нравится, когда ученик, желающий выучиться, например, игре в теннис или спортивному плаванию, перед этим уже приобрел самоучкой некоторый навык в соответствующем виде спорта: как можно понять из сказанного выше, это не помогает, а составляет труднопреодолимое препятствие в усвоении оптимальных координации, необходимых для участия в соревнованиях.

Третье и самое замечательное совпадение между отработанным движением и наследственной координацией состоит в том, что после длительного неупотребления в обоих случаях заметно отчетливое аппетентное поведение, направленное на выполнение движения. Один из сильнейших мотивов, побуждающих человека танцевать, бегать на коньках или заниматься другими видами спорта, — это аппетенция, направленная на вполне определенное, хорошо отработанное движение, интенсивность которой возрастает со степенью усвоения движения и с его трудностью.

Такую же аппетенцию к выполнению трудных заученных движений продемонстрировал Г. Харлоу на макаках, повторяющих выученные манипуляции снова и снова без дальнейшего вознаграждения, "для собственного удовольствия", "функциональное удовольствие", как удачно назвал это явление Карл Бюлер, очевидным образом играет важную роль в возникновении хорошо выработанных заученных последовательностей поведения. Мы знаем о самих себе, что каждое усовершенствование, каждое сглаживание еще имеющейся «неловкости» доставляет человеку отчетливо заметное удовольствие. Усовершенствование движения само себя вознаграждает, и в моей книге "Эволюция и модификация поведения" я говорил о "perfection-reinforcing mechanism".[109]

С феноменологической стороны усвоение хорошо выработанных движений имеет еще несколько замечательных свойств, по крайней мере одно из которых весьма существенно для роли произвольного движения в исследовательском поведении, о котором будет речь в следующей главе. Эти свойства своеобразно противоречивы. С одной стороны, знание усвоенного движения столь определенно и столь исключительно сосредоточено в подсознательных и даже бессознательных слоях нашей личности, что мы лишь мешаем его выполнению, если пытаемся сознательно следить за ним и контролировать его. В самом деле, часто мы даже не знаем в доступных сознанию слоях, что мы делаем и как мы это делаем. Если человек очень долго не выполнял заученное движение, например, если после более чем десятилетнего перерыва он впервые становится на лыжи, то вначале, стоя над крутым спуском, он думает, что вообще не сможет ехать, но как только начинает спуск, то, к его собственному удивлению, движение происходит так же беспрепятственно, как раньше.

С другой стороны, при хорошо усвоенных формах движения нередко удается вызвать столь живое представление о кинестезии[110] его выполнения, что можно путем самонаблюдения выяснить подробности процесса, которых мы уже не знаем на уровне сознания. Когда недавно мой внук спросил меня, которая из двух больших педалей моей машины включает сцепление и которая торможение, то я, к собственному удивлению, обнаружил, что просто не знал этого, и прежде, чем дать ответ, должен был прибегнуть к только что описанному способу.

Я полагаю, что возникновение подобных мысленных образов собственных движений играет важную, даже решающую роль в специфически человеческой дифференциации центрального представления пространственных данных, а тем самым и для нашего понятийного мышления. В высшей степени вероятно, что управляемое соображением хватание, сущность которого состоит в ощупывании кончиками пальцев, в особенности кончиком указательного пальца правой руки, было одной из предпосылок понимания.[111] В пользу этого говорит также огромная величина области коры большого мозга, представляющей руки и пальцы в их сенсорном и моторном аспекте, и отношение моторных полей к пирамидальным путям, важнейшим нервным путям произвольных движений.

Усвоение координации движений уже в самой примитивной форме, как оно проявляется, например, в описанном выше «заучивании» последовательности перемещений у землеройки, есть когнитивный акт, и притом чрезвычайно эффективный. Естественно, наследственная координация может быть приспособлена лишь к тем условиям окружающей среды, какие должны предсказуемым образом встретиться любому индивиду данного вида животных.

"Заученная" форма движения обладает многими функциональными свойствами, характерными также для наследственных координации: ее выполнение не замедляется задержками реакций; она имеет собственное аппетентное поведение и тем самым становится мотивацией. Подобно инстинктивному движению, она "скроена по мерке" потребностей — не только общих потребностей вида, но также и особых условий индивидуальной жизни. Легко понять важное значение этой комбинации свойств для сохранения вида. Она полезнее всего для животных, которым приходится иметь дело со сложно структурированной, изменчивой средой. У животных, живущих на деревьях и передвигающихся с помощью хватающих рук, которые вместе с тем должны уверенно перемещаться по привычному пути в ветвях с помощью усвоенных, заученных движений, буквально каждый шаг и каждый захват в этой выученной последовательности движений должен быть предварен внутренним представлением. Этим животным, передвигающимся с помощью хватающих рук, особенно необходима большая точность приспособления, поскольку их клещеобразная рука, чтобы обеспечить себе опору, должна сжиматься вокруг ветки в надлежащий момент и в нужном месте. Среди них лишь медлительные ночные полуобезьяны, такие, как лори и потто, могут позволить себе доверить свою ориентацию в пространстве механизмам, доставляющим текущую информацию. Все быстро движущиеся и особенно прыгающие полуобезьяны и обезьяны, напротив, в совершенстве владеют заученными движениями. В этом заключается одна из причин, по которым человек произошел из такой группы животных.

Поскольку я не вижу какой-либо принципиальной разницы между процессами, участвующими в простом приобретении путевых дрессировок и в обучении самым сложным заученным движениям, мне не представляется необходимым постулировать принципиально различные процессы в центральной нервной системе для объяснения рецепторного и моторного обучения. То новое, что возникает в процессе обучения как в рецепторной области, так и в моторной, состоит в образовании новых связей. Иными словами: адаптивная модификация, вероятно, всегда относится к синапсам и всегда ближайшим образом родственна индукции в смысле Шпемана.

8. ПРИСПОСОБЛЕНИЕ МЕХАНИЗМОВ ОБУЧЕНИЯ ПОД СЕЛЕКЦИОННЫМ ДАВЛЕНИЕМ ИХ ФУНКЦИЙ

Великая фульгурация образования нового регулирующего контура, создавшая обучение посредством успеха, придала новую функцию крайним членам цепи явлений, которая до этого была линейной. До великого изобретения условной реакции завершающее действие имело лишь весьма простую задачу — выполнить по жесткой «замкнутой» программе определенную последовательность движений, дать обратное сообщение, что это исполнено, и тем самым выключить аппетентное поведение. Что такое обратное сообщение в самом деле происходит, можно заключить уже из внезапного резкого спада возбуждения после завершающего действия; это доказано опытами Ф. Бича, оперативно выключавшего у самца шимпанзе обратное сообщение об опорожнении семенного пузыря в ходе оплодотворения.

Как мы уже знаем (с. 295), все наследственные координации имеют тенденцию протекать непрерывно. Первая функция, ради которой в центральной нервной системе возникли высшие и централизованные инстанции, состоит в торможении центрально координированных движений. Наряду с этой функцией торможения такие «центры» должны обладать способностью снимать торможение каждой соответствующей формы движения в биологически правильный момент; иными словами, они должны быть в состоянии получать текущую информацию о том, когда наступает этот благоприятный момент. Наследственная координация, стоящий над нею центр торможения и механизм запуска образуют с самого начала некоторое функциональное целое. Гейнрот увидел это своим гениальным прозрением, создав понятие свойственного виду импульсивного поведения.

Сообщение, поступающее от наследственной координации в «центр», вначале имеет лишь содержание "программа выполнена"; в ответ на это высшая инстанция вновь пускает в ход ранее снятое торможение. Лишь в исключительных случаях завершающее действие, удовлетворяющее инстинктивное побуждение, прекращается от «разгрузки», т. е. от исчерпания его специфического возбуждения, как это происходит, например, с пением многих птиц, которое медленно угасает.

Весьма вероятно, что механизм рассмотренной простой системы предоставил селекционному давлению отправные точки, давшие ему возможность сделать из механизма сообщения о выполнении механизм сообщения об успехе. В этой новой функции от завершающего действия требуется значительно больше; это все равно как если бы честный солдат, до сих пор умевший лишь докладывать: "Приказ исполнен", теперь должен был бы вдруг развить в себе способность дать высшему командованию рассудительный отчет, к какому успеху привело его действие, и даже указать, что в приказах командования было ошибочным. Для этой новой функции требуется много разнообразной экстероцепторной и проприоцепторной информации, и сверх того нужны еще механизмы, обладающие достаточным филогенетическим «знанием», чтобы уверенно различать успех и неудачу.

Таким образом, с изобретением условной реакции к механизму завершающего действия предъявляются новые требования; не только должен возникнуть аппарат, доставляющий богатое информацией сообщение о своем успехе, но возникают также требования к количеству нервной энергии, необходимой для того, чтобы достаточно впечатляющее сообщение могло дойти до многих различных инстанций центральной нервной системы, функции которых должны быть адаптивно изменены. Под селекционным давлением этих новых функций механизмы завершающего действия приобрели особые структуры и физиологические свойства, которые прежние этологи долгое время понимали неверно: некондиционируемая система поведения, такая, как свойственное виду импульсивное поведение, выполняется обычно без видимой подчеркнутости завершающего действия. Это особенно характерно для цепей поведения, выполняемых лишь один раз в жизни индивида, например спаривания у многих членистоногих. В таких случаях у животного при выполнении завершающего действия не наблюдается никакого особенного повышения общего возбуждения. После возбужденного танца, с помощью которого, например, самец паука-скакуна ухаживает за своей самкой, ход спаривания, завершающего цепь поведения, кажется чуть ли не вялым.

Даже у весьма способных к обучению цихлид, высокоразвитых рыб, ухаживающих за потомством, метание икры и оплодотворение происходит без какого бы то ни было заметного повышения возбуждения; напротив, вступительные церемонии образования пар, с их танцевальными движениями и роскошным предъявлением ярких красок, свидегельствуют о гораздо большем общем возбуждении, чем завершающее действие. При этом многое выучивается; научаются узнавать друг друга, и длительный брак, в котором они затем живут, предполагает такое индивидуальное знакомство. Весьма вероятно, что дрессирующее действие движений при образовании пар сильнее, чем воздействие метания икры и оплодотворения, которое самец выполняет с таким же "чувством долга", как и другие действия по уходу за потомством, что и вызвало у одной моей сотрудницы, при наблюдении оплодотворения икры у Etroplus maculatus, бессмертное восклицание: "Он это делает так вяло, что это похоже на добродетель!"

Если сравнивать поведение при оплодотворении у этого вида с поведением жеребца или вообще с целеобразующими завершающими действиями высших животных, например с умерщвлением добычи у хищников или нападением хищной птицы, то при наблюдении таких форм поведения трудно избежать впечатления, что пламя возбуждения охватывает весь организм. Конечно, это высокое общее возбуждение важно потому, что чисто количественным образом обеспечивает необходимое число и силу нервных имульсов для воздействия на весьма многочисленные места центральной нервной системы, где обратное сообщение о завершающем действии должно индуцировать модификации. Этот фейерверк общего возбуждения и — с субъективной стороны — жгучее чувственное наслаждение никоим образом не являются лишенными функций эпифеноменами,[112] побочными продуктами, а составляют неотъемлемые части физиологического механизма, способного извлекать информацию из успеха и неудачи.

Во всех системах поведения рассмотренного типа за сообщением о выполнении сразу же следует резкий спад возбуждения. Но при виде описанного "фейерверка общего возбуждения" мне кажется слишком искусственным считать один только этот спад возбуждения причиной дрессировки, развертывающей выполнение завершающего действия. Точка зрения Халла, по которой "relief of tension", ослабление возбуждения, является главным дрессирующим фактором, справедлива в весьма многих других случаях, но в отношении целеобразующего действия она, безусловно, неверна, как видно из простейшего самонаблюдения.

Когда механизм запуска приобретает в рамках кондиционируемой системы поведения иные и новые частичные функции по сравнению с теми, которые он выполнял в неспособной к обучению линейной системе, он также подвергается сильно измененному селекционному давлению. Это новое селекционное давление предъявляет к нему требования, во многих отношениях противоположные бывшим прежде, когда нужна была возможно большая избирательность. В немодифицируемой, линейной цепи поведения некоторого инстинктивного действия врожденный механизм запуска является единственной инстанцией, «знающей», когда и как следует выполнить все действие. Необходимая при этом избирательность становится не просто ненужной, но прямо вредной, когда начинает играть свою учительскую роль второй процесс получения информации. С тех пор, как лишь обратное сообщение удовлетворяющего побуждение завершающего действия уведомляет организм, какой момент, какое место и какой объект наиболее благоприятны для выполнения всей формы поведения, для организма становится преимуществом, чтобы механизм запуска был менее избирателен. Соответственно этому мы часто находим у близко родственных животных весьма различную избирательность аналогичных, может быть, даже гомологичных[113] врожденных механизмов запуска. Мы уже встретились с неизбирательностью врожденных механизмов запуска, определяющих выбор материала для гнезда у способных к обучению врановых птиц. У гораздо менее способных к обучению ткачиковых (Estrildini и Ploceini)[114] знание материала, единственно пригодного у этих птиц с высокодифференцированными движениями для постройки гнезда, является полностью врожденным, так что многие из них вообще приходят в настроение размножения лишь в том случае, если получают надлежащие ключевые стимулы со стороны строительного материала.

Процесс условной реакции, при котором информация об объекте получается из вида врожденной формы движения, дает важное преимущество: с его помощью отбираются те свойства объекта, которые существенны для успешного выполнения кондиционируемой формы поведения. Этот процесс, осуществляющий путем проб и ошибок дрессировку на какой-либо наиболее благоприятный доступный объект, применяется очень многими высшими животными. Понятно, что чем больше его роль, тем меньшим может быть заложенное во врожденном механизме запуска знание объекта; более того, для сохранения вида может оказаться выгодным, чтобы врожденный механизм запуска как можно более упростился, предоставив процессу обучения самый широкий простор. На его долю остается лишь дать молодому животному «намек», в каком

направлении его поиски имеют наибольшие шансы на успех. Эта форма поведения по способу проб и ошибок принципиально отличается от исследовательского, или любознательного поведения, как уже было подчеркнуто· на с. 328, и как мы еще подробнее объясним на с. 373 и далее.