В 50-х и 60-х годах XX в. классическая теория научения получила существенное развитие в результате экспериментов на животных; согласно этой теории, прочность реакции, то есть вероятность ее повторения, должна быть прямо пропорциональна силе подкрепления и его близости к сигналу и обратно пропорциональна тем усилиям, которые требуются, чтобы получить вознаграждение. Однако в некоторых случаях этого не наблюдается.
«За последнее время было собрано значительное число экспериментальных данных, говорящих о том, что эти общие предположения, лежащие в основе теории научения, не получили адекватного подтверждения в изменениях интенсивности ответа. В действительности оказалось, что в соответствующих условиях изменение вознаграждения, времени его отставления и усилий, требующихся для получения вознаграждения, может дать даже противоположные результаты по сравнению с теми, которые ожидаются на основании этих предположений…» (Lawrence, Festinger, 1962, p. 6.)
С этим парадоксом часто сталкиваются те, кто работает в области физиологии. Поражение вентромедиальной зоны гипоталамуса, приводящее к повышенной реактивности, не стимулирует животное «длительно работать за пищу», напротив, такие животные дают меньше реакций, чем контрольные в тех же самых условиях опыта (лишение пищи). После всестороннего изучения условий, которые вызывают такое расхождение результатов, эти факты получили рациональное объяснение при различении двух систем: систем «запуска» и «остановки», мотивации и эмоций.
Изучение условий, приводящих к угашению поведенческих реакций, в этих случаях уменьшает трудности, с которыми сталкивается теория научения. Согласно этой теории, выполнение действия должно отражать «усилие», затрачиваемое организмом, когда он чему-то обучается. Скорость научения как мера «усилия» прямо пропорциональна легкости задания и числу и временной близости подкреплений. Поэтому интенсивность ответа – как показатель скорости научения – должна прямо отражаться на скорости угашения данной реакции в новой ситуации. В действительности же происходит обратное. Чем скорее вырабатывается навык, тем быстрее наступает угашение: скорость научения обратно пропорциональна стойкости к угашению.
Эксперименты показывают, что стойкость к угашению не просто связана с неспособностью обучаться новому, неспособностью вырабатывать новые дифференцировки, неэффективностью усвоения информации или образованием конфликтующих ответов. Разные авторы по-разному интерпретировали эти факты. Например, Д. Лоуренс и Л. Фестингер (1962) предполагали, что информация, необходимая для осуществления «конфликтных», «рассогласованных», или «диссоциированных», ответов, вызывает более стойкий навык, чем это можно было ожидать. А. Эмзель (1958) подчеркнул состояние фрустрации, которое переживает организм в подобных «рассогласованных» ситуациях. Большинство экспериментов и споров было связано с изучением состояния, которое возникает в подобных ситуациях, вызывающих рассогласование и фрустрацию. Так, было установлено, что рассогласование и фрустрация возникают в том случае, когда результат действия не приводит к таким последствиям, которые в достаточной мере его «оправдывают». Однако если вся информация, предшествующая действию, была бы налицо и был бы свободный выбор, действие вообще не осуществилось бы. Иначе говоря, рассогласование и фрустрация возникают только тогда, когда результаты поведения не совпадают с ожидаемыми, то есть когда организм не может регулировать свое поведение. Таким образом, поведение становится выражением эмоционального процесса, а не регулируется – через мотивационные каналы – его результатами. Но исчерпали ли мы тем самым полностью проблему?
Хорошо известно, что у морфинистов часто сила их влечения, стремления к наркотику пропорциональна величине затраты той «энергии», которая требуется для получения наркотика. Действительно, в большинстве случаев больные, у которых наблюдались симптомы отказа от наркотика, испытывают понятное отвращение к нему. В экспериментах с обезьянами-резусами обнаруживается сходная взаимосвязь между влечением и режимом подкрепления у животных (Clark and Polish, 1960; Clark, Schuster and Brady, (1961). Конечно, существенную роль играют индивидуальные различия, однако законы, регулирующие потребление морфия (например, действующие в Англии), определяются прежде всего соотношением «энергия – влечение»; в Англии наркоманы получают наркотики по медицинским показаниям и поэтому проявляют мало поведенческих нарушений. Вследствие этого контрабанда наркотиками не имела успеха и проблема наркомании была сведена к минимуму. (К сожалению, в последнее время картина несколько изменилась из-за появления нового типа наркотиков. Тем не менее эта проблема не приобрела таких размеров, как в США.)
Эти наблюдения приводят нас к тому же самому, до сих пор не разрешенному вопросу, а именно: может ли тот факт, что поведение находится под контролем эмоциональных процессов, быть единственным объяснением стойкости к угашению? Какие другие объяснения здесь возможны?
Обратимся к теории информации, которую подтверждают некоторые весьма интересные эксперименты, показывающие, как организм привыкает к наркотикам или как у него вырабатывается влечение к ним. В большинстве случаев организм способен осуществить ряд альтернативных ответных реакций. Когда поступающая информация уменьшает число таких ответов, говорят, что информация исчерпана. Именно объем информации определяет сокращение числа известных альтернатив, количество неопределенности, которое организм может освоить в процессе выбора. Как мы уже отмечали в гл. XI, теория информации связывает, таким образом, количество информации с количеством неопределенности. Термин «информация» имеет отношение к будущему (какое количество информации может быть получено?), тогда как термин «неопределенность» имеет отношение к прошлому (насколько уменьшилась неопределенность в результате действий?). Когда организм решает уже знакомую «му задачу, его действия не уменьшают эту неопределенность. Тем не менее регуляция поведения каким-то образом продолжается. Подобная ситуация наблюдается тогда, когда поведение контролируется центральным гомеостатическим механизмом. Так, у животных, испытавших когда-то голод, жажду или сексуальное влечение, действия, направленные на удовлетворение этих потребностей, имеют тенденцию к продолжению. Влечения и аффекты этих животных обнаруживают повторный и циклический характер. Каким же образом эти гомеостатические механизмы осуществляют контроль над поведением?
Ответ предполагает, что действия регулируются тем значением, которое эти действия имеют для организма. Изменение значения тех факторов, которые управляют поведением – в обычном смысле этого слова, – конечно же, обеспечивается информацией. Однако, согласно более узкому пониманию теории информации, этот процесс аналогичен процессу настройки сервомеханизма, поскольку он устанавливает ценность поведенческого акта, который стабилизирует этот процесс. Точный смысл слова «ценность» идентичен тому смыслу, который обычно придается «тому слову в социальных науках (см., например, Zimbardos, 1969). На различии между «информацией» и «ценностью» мы остановимся несколько позднее.
Р. Уолен (1961) провел следующий эксперимент с крысами, продемонстрировавший разницу между информацией и ценностью. Он показал, что у самца выбор между двумя коридорами лабиринта зависит от завершения его контактов с сексуально доступной самкой, но скорость бега в лабиринте продолжает варьировать в прямой зависимости от числа подобных контактов, несмотря на то, что животное не получает никакой новой информации о местонахождении самки после первых нескольких проб. Спепс (1956) получил сходные результаты, используя в качестве подкрепления кусочки пищи.
Результаты Уолена и Спенса показывают, что, как только начинается действие, подкрепляющие агенты обнаруживают интересные свойства: увеличение числа подкреплений в определенных пределах ведет к равномерному увеличению скорости выполнения задания. Таким образом, ценность поведения определяют подкрепляющие агенты, благодаря им корригируется поведение. Следовательно, результаты поведения могут совпадать с установкой организма, с его влечениями или же расходиться с ними. Это означает, что поведение регулируется, скорее, опережающим процессом, а не процессом обратной связи (рис. XVI-1).
Рис. XVI-1. Схема научения как процесса обратной связи и выполнения как опережающего процесса. Концепция Т – О – Т – Е.
Тот фактор, который определяет, контролируется ли поведение процессами обратной связи или опережающими процессами, прямо вытекает из анализа отношения «средства – цель» и их парадоксального изменения. Дж. Мейс (1962) указывал на те факторы, которые вызывают такое изменение отношений.
«Что происходит, когда у человека или у животного нет необходимости работать, чтобы поддерживать свою жизнь?… Простейший случай – жизнь домашнего кота – является ярким примером изобильной жизни, более обеспеченной, чем жизнь лошади или коровы. Все основные жизненные потребности домашнего кота полностью удовлетворяются прежде, чем они проявятся. Он защищен от опасностей и непогоды. Пища и питье даются ему прежде, чем он проголодается или захочет пить. Что же ему остается делать? Чем заполнить свое время?
Мы могли бы ожидать, что получив пищу, не приложив к этому ни малейшего труда, кот свернется в клубок на своей подушке и будет спать до тех пор, пока неотчетливые внутренние ощущения не дадут ему информацию о потребности в следующей порции даровой пищи. Однако он вовсе не спит. Он бродит по саду и лесу, ловит птенцов и мышей. Он наслаждается жизнью на свой собственный лад. Тот факт, что жизнь может доставлять удовольствие – и даже большое – многим живым существам при наличии в изобилии домашней пищи, указывает на радикальные изменения, происходящие в работе аппаратов жизнедеятельности на определенной стадии эволюционного процесса. Это и есть изменение отношений между средствами и целями в поведении. В природных условиях кот должен охотиться, чтобы жить. В состоянии изобилия он живет для того, чтобы охотиться. То же происходит и с людьми. Когда у людей нет необходимости работать, чтобы жить, у них в общем остается только два дела. Они могут «играть» и они могут заниматься искусством. Таковы два способа получать удовольствие от жизни. Правда, многие люди работают потому, что они очень любят работать, однако в этом случае слово «работа» меняет свое значение. Работа становится формой «игры». «Игра» – это деятельность, в которой доставляет удовольствие сам процесс – безотносительно к пользе или какому-либо результату. «Работа» же – это деятельность, при которой усилия направлены на производство чего-то полезного самым простым и легким способом. Отсюда и вытекает значение эргономики и изучения труда с целью уменьшения затрат и сбережения времени. В игре деятельность часто направлена на достижение бессмысленной цели трудным путем. Так, например, игрок в гольф, используя особые приспособления, направляет маленький мяч в небольшое отверстие с далекого расстояния, преодолевая умышленно созданные препятствия для того, чтобы как можно больше усложнить операцию. Это и создает обратные отношения в системе «средства – цели». «Цель» – загнать мяч в отверстие – является средством для новой цели, реальной цели – получения удовольствия от самого процесса преодоления трудностей» (Масе, 1962, р. 10, 11).
Некоторые условия, при которых происходит перестановка в системе «средства – цели», уже известны. Д. Примак (1959) провел эксперименты с выработкой оперантных условных рефлексов. Он измерял частоту ответов в значимой для организма ситуации (например, частоту актов еды), затем сравнивал эту величину с другой независимой величиной (например, частотой нажатия на рычаг). Полученные им результаты говорят о том, что подкрепление возникает всякий раз, когда ответы с низкой независимой частотой (нажатия на рычаг) совпадают – в определенных границах – со стимулами, которые управляли осуществлением ответов с высокой независимой частотой (еда).
Остроумная постановка эксперимента подтвердила эту точку зрения; один из этих опытов особенно показателен.
«Были созданы такие условия для крыс, которые вызывали в одном случае большую вероятность питья, чем бега, а в другом – большую вероятность бега, чем питья. У тех же самых животных бег служил подкреплением для питья, а питье – подкреплением для бега. Такие отношения означали, что «вознаграждался» попросту любой ответ, который сам по себе более вероятным, чем другой» (Premack, 1962, р 255; рис. XVI-2).
Отключение наказания
Рис. XVI-2. Опыты с оперантными условными рефлексами (крысы). Рисунок показывает, что число лизаний, необходимых для поворота колеса, зависит от 1) среднего числа нажатий на рычаг в серии; 2) средней продолжительности лизания; 3) средней продолжительности побежек. Треугольник в левой части верхнего рисунка означает исходную продолжительность лизания (Premack, 1965).
Очень интересен эксперимент, посвященный изучению активности животного в приспособлении с колесом, которое было снабжено тормозом и механизмом, прекращающим поступление жидкости.
«Преобладание питья над бегом обеспечивалось путем отключения этого механизма, освобождением колеса и предоставлением возможности чаще пить, чем бегать. Обратное достигалось остановкой колеса включением механизма, прекращающего поступление жидкости, и предоставлением возможности крутить колесо, то есть бегать чаще, чем пить» (Premack, 1962, р 255)
К сожалению, Примак рассматривает только связь между ответами. Ему не удалось полностью выявить те непосредственные операции, которые определяют ответ. Ответ в ситуации оперантных условных реакций указывает на то, что организм действует в зависимости от данной ситуации. Действие (как об этом говорилось в гл. XIII) подготавливается ие набором мышечных сокращений (движений) организма, а совокупностью внешних условий, вызывающих это движение. В действительности оперантный «ответ» как показатель действия является одним из компонентов этой совокупности. Следовательно, «частота ответа» – объект изучения Примака – имеет отношение не столько к быстроте движений, сколько к той скорости, с которой некоторые действительно наблюдаемые последствия этих движений могут быть зарегистрированы организмом. Например, в одних экспериментах наблюдалась обезьяна Цебус. Эта обезьяна прекрасно умела чмокать губами, кружиться в клетке и кувыркаться; все это были иррелевантпые движения, которые не должны были регистрироваться в данной ситуации как ответы, поскольку объектом изучения были манипуляции с рычагом, дверью и корзиной. Даже частные движения, включенные в эти действия, были совершенно несущественны в этих экспериментах – обезьяна могла пользоваться для выполнения действия правой или левой рукой, ногами или даже головой.
Короче говоря, оперантные условные ответы фактически представляют собой звенья какой-то последовательности, часть целого действия. Следовательно, вклад Примака в теорию научения состоит в том, что он установил, что частота осуществления последовательных действий определяет отношение «средства – цели». Таким образом, степень разнообразия действия может определяться количеством связанных с ситуацией последствий поведения, согласующихся с намерением, хотя, вероятно, частота ответа является не единственной переменной, определяющей это разнообразие. В данный момент мы можем установить по крайней мере, что при прочих равных условиях организм стремится управлять своими действиями, не просто уменьшая несоответствие между намерением и результатом поведения, а активно создавая такое соответствие. Достижение этого соответствия является не случайным: поведение строится таким образом, что последовательность звеньев действия организуется по законам иерархии – более близкие цели формируются в системе более отдаленных. По существу, эта иерархическая организация действия создает план или программу. Важность планов для организации поведения уже подробно обсуждалась в работе Миллера, Галантера и Прибрама (1965). Здесь я рассмотрю лишь один аспект этой проблемы, а именно значение планов для решения проблемы «средства – цели» и теории выполнения действия в целом.
В книге «Планы и структура поведения» (Миллер, Галантер, Прибрам, 1965) обсуждались два аспекта проблемы мотивации: планы и значимость поведения. Планы строго направляют поведение, то есть выбор программ выполнения этих планов. Значимость играет несколько иную, менее специализированную роль в запуске планов, их выполнении и завершении. Если рассматривать значимость как фактор, определяющий выполнение и завершение действия, то понятие значимости поведения становится более ясным. Таким образом, эффект действия, подкрепляющий его результаты, обнаруживает две особенности: он может обеспечивать информацию, то есть сокращать количество неопределенности в ситуации или направлять поведение организма, определяя его значимость (рис. XVI-1). Рассмотрим две эти особенности подкрепляющего эффекта действия более подробно.
Во второй части книги мы показали, что сенсорные возбуждения вызывают длительные изменения в работе центральной нервной системы. Возникшие констелляции нервных процессов могут быть описаны как процессы, происходящие в сенсорном, «входе». Если эти сенсорные потоки адресуются к одной из «компетентных» систем, они превращаются в воспринимаемую информацию. Таким образом, количество воспринимаемой информации может быть определено как величина совпадения между входом информации и компетентностью систем. Это определение следует из теории информации, согласно которой количество воспринимаемой информации соответствует количеству информации, передаваемой по каналам, пропускная способность которых соответствует нервной компетентности.
В гл. XIV, однако, было отмечено, что мобилизация компетентности организма зависит от гибкого, способного к модификациям механизма, который описан в гл. XV как процесс подкрепления, ведущий к завершению поведенческого акта. Необходимость в завершении действия возникает потому, что нервный субстрат поведения (по крайней мере у млекопитающих) не содержит локальных механизмов, работа которых автоматически ведет к выполнению акта. Вместо этого существуют механизмы, запускающие частные виды активности, связанные с различными отделами нервной системы; для выполнения акта необходима интеграция, организация этих частных видов активности. Такое распределение частных функций, очевидно, свойственно всей нервной системе, и в главах VI, VII и VIII мы рассматривали влияние этого неврологического факта на процесс переработки сенсорной информации (и необходимость таких явлений, как топографическая трансформация и т. д.). Теперь я хочу добавить к этому следующий важный вывод: переработка сенсорной информации, поскольку она является подкреплением, формирует вначение стимула. Как известно, раньше все проблемы психологии сводились к двум вопросам: какова природа сходства стимулов и какова природа подкрепления. В действительности же это вовсе не две проблемы: сходство и подкрепление представляют любой одно и то же явление, хотя в одном случае оно описывается преимущественно на языке стимулов (сходство), а в другом- главным образом на языке ответов (подкрепление). Подкрепление последовательно увеличивает способность к различению стимулов и уменьшает их генерализацию; процесс различения стимулов, то есть приобретения ими определенного значения, и есть подкрепление.
Нервные процессы, участвующие, согласно этой точке зрения, в механизме научения, будут коротко описаны ниже.
«Возможно, что эта модель является прекрасным описанием того, что представляет собой подкрепление для организма. Этот нервный механизм в силу иерархической природы его избирательного контроля над его же собственными модификациями допускает изменение Образа результата в ходе последовательных актов поведения. Всякий раз, когда поступающая информация такова, что не происходит полного совпадения этой информации с Образом результата, последний модифицируется для того, чтобы включить эту информацию, и поведение продолжается. Таким образом, организм может в относительно неизменных или мало изменяющихся внешних условиях осуществлять поиск во внешней среде той дополнительной информации, которая ему необходима для уменьшения неопределенности. Эта нервная модель могла бы быть ответственной за процесс поиска информации организмом, нуждающимся в такой информации, до тех пор, пока корригирующие изменения в Образе результата не прекратятся, то есть до тех пор, пока не будет достигнута стабильность» (Pribram, 19606, р. 8).
Акты рассматривания, принюхивания, прислушивания, ощупывания и т. п. являются, по сути дела, подкрепляющей активностью, с того момента, как организм начал выполнение задачи. Обезьяны в процессе решения задачи отказываются от пищи, которая дается им в награду за правильный ответ, потому что их защечные мешки и руки полны пищей, и все же они будут упорно продолжать решение задачи. Так, обезьяна будет засовывать в свой защечный мешок земляной орех, который она получает в награду за правильное выполнение задания, только для того, чтобы потом снова вытащить и съесть его, когда она совершит свою следующую ошибку. Главным фактором, управляющим поведением, становится не пища, а стремление получить информацию. Однако, для того чтобы информация стала фактором, регулирующим поведение, то есть чтобы информация етала значимой для организма, обезьяна должна превратить поступающую информацию в последовательные информационные звенья, связанные с ее компетентностью и стремлением к завершению задачи, подобно тому, как в пищеварительной системе заглатывание пищи предшествует ее перевариванию. Таким образом, значение стимула формируется иерархически организованным механизмом, перерабатывающим информацию.
В главах XII и XIII проводилось подробное сравнение сенсорных и моторных механизмов мозга. Чему соответствует в моторном механизме процесс формирования значения, когда информация перерабатывается с помощью сенсорного механизма? Можно предположить, что в моторном механизме происходит иерархический процесс, аналогичный тому, который характерен для сенсорных систем. Образ результата формируется не «объектами» или «интересами», а с помощью тех факторов, которые продуцируются самим действующим организмом. Эти факторы должны обусловливать то стремление к завершению действия, которое подготавливает моторные механизмы к результату. Более того, благодаря работе быстродействующего мозжечкового механизма Образ результата предвосхищает действие. Итак, известно, что: 1) нервный механизм вследствие его избирательного контроля над его же собственными модификациями допускает изменение Образа Результата в ходе последовательных актов поведения и что 2) всякий раз, когда «не происходит полного совпадения поступающей информации с Образом Результата, последний модифицируется для того, чтобы включить эту информацию, и поведение продолжается… до тех пор, пока корригирующие изменения в Образе Результата не прекратятся»; следовательно, любая последовательность предвосхищающих образов, но существу, представляет собой программу или План. Таким образом, достижение результата осуществляется в процессе выполнения действия, и, признав это, мы тем самым признаем теорию, объясняющую выполнение действия через результат. Эта теория объясняет различия в функциях подкрепляющих агентов во время научения (когда они обеспечивают информацию) и во время осуществления действия (когда они оценивают и управляют поведением). По крайней мере один класс переменных – частота ответов, – как выяснилось, играет главную роль в определении тех условий, при которых организм больше не обучается, хотя и продолжает выполнять действие по обратной схеме: вместо «средства – цель» – «цель – средства». Выполнение действия достигается благодаря иерархической природе процессов подкрепления (на языке стимулов – благодаря процессам различения): значения возникают, если информация по иерархическим законам перерабатывается в сенсорных системах, а планы и программы формируются в процессе переработки информации в предвосхищающем моторном механизме. Следующая (четвертая) часть книги содержит подробное изложение неврологии тех процессов, которые лежат в основе формирования значения и планирования, в ней описывается взаимодействие рецепторных и моторных мозговых механизмов и каждого из них с мозговыми механизмами других существ.
Прежде чем продолжить изложение, подведем итог сказанному. В первой части книги обсуждался двухпроцессный кодирующий механизм работы мозга, который имеет дело с состояниями и с тем, как протекают операции на фоне этих состояний. Состояния кодируются в виде микроструктуры медленных потенциалов, которые генерируются в соединениях нейронов. Перекодирование операций осуществляется посредством нервных импульсов, которые возникают при сдвиге этих состояний; импульсы продолжаются до тех пор, пока не будет восстановлено исходное состояние. Модификации микроструктурных синаптических процессов (память) бывают трех видов: длительные, временные и мгновенные.
Во второй части двухпроцессный механизм работы мозга рассматривался в связи с субъективным опытом. Помимо детекторов (врожденных) признаков и особого аналитического (изменчивого) механизма, нервный аппарат обладает гибкой системой распределения информации. Это свойство обеспечивается синап-тической микроструктурой медленных потенциалов и в функциональном отношении напоминает те механизмы переработки зрительной информации, которые называются голограммами.
Кроме того, во второй части было описано, каким образом с помощью билатеральной симметричной сенсорной стимуляции конструируется образ внешней «реальности», а также то, каким образом такие специфические состояния, как голод и жажда, настораживание и сонливость, активное стремление к цели и пассивность, обусловливаются работой нейронных и химических механизмов ствола мозга. Каждый механизм ствола мозга состоит из двух частей: активирующей и тормозящей; активирующая часть связана с «инстинктивными», мотивационными ощущениями, а тормозящая – с «аффективными», эмоциональными ощущениями. Однако эти инстинктивные потребности, аффекты и чувство интереса имеют более широкую неврологическую основу, чем только механизмы ствола мозга; она включает большое число контролирующих кортикальных мозговых процессов, в том числе и такие, которые контролируют аппараты ствола мозга и сенсорные системы. Здесь мы развивали «кибернетическую» теорию мотиваций и эмоций, основанную на двухпроцессном механизме функционирования мозга.
В третьей части мы анализировали нейронные механизмы регуляции поведения. Мы проводили различие между движением и действием. Движение, состоящее из мышечных сокращений, контролируется двухпроцессным механизмом, сходным с тем, который контролирует сенсорные процессы. Это сходство основано на существовании в рефлекторной организации системы эфферентных волокон, которая проводит сигналы от центрального нервного аппарата к рецепторам, расположенным в мышечной ткани. Эта система волокон организована по принципу кольцевого рефлекторного сервомеханизма Т – О – Т – Е, а не по принципу дуги «стимул – ответ». В процессе контроля за сокращением мышц должны, следовательно, включаться сигналы, идущие не только от сокращающейся мышцы, но и от этих рецепторов: если информация от них не поступает, у укороченной мышцы возникает «молчащий период» в возбуждении рецепторов, что мешает плавному выполнению движения, В действительности движение может контролироваться только посредством изменений в установках, которые воздействуют на спонтанные разряды мышечных рецепторов, подобно тому как работа отопительной системы в доме контролируется регуляцией температуры в термостате.
В данной части обсуждалось значение этого типа контроля над выполнением действий. Действия определяются как последовательности движений, обусловленные внешней средой. Озадачивающие результаты экспериментов, посвященных изучению роли двигательных отделов коры мозга, нашли свое объяснение, когда были получены данные, подтвердившие важность сенсорной коры для действия и показавшие, что моторный образ (представляющий собой статическую часть двухпроцессного механизма) связан с рядом факторов, вызывающих возбуждение мышечных рецепторов, а не с какой-то общей мозговой функцией, контролирующей специфику работы тех ияи иных мышечных волокон. Этот образ по своей природе подобен голограмме и принципиально не отличается от других сенсорных образов. Однако имеется одно важное различие, а именно: аппараты, связанные с действием, в отличие от сенсорных аппаратов характеризуются поступлением информации от мозжечка, где осуществляется мгновенная оценка предстоящего следующего звена действия, если действие уже запущено и не должно прерываться. Поэтому моторные механизмы кодируют результаты действия, а не ощущения или восприятия.
Нейронная основа модификации поведения обсуждалась с точки зрения результата. Способность к модификации поведения во времени зависит от того, что элементы, лежащие в основе моторного образа, компетентности организма для выполнения того или другого Акта, распределяются в нервном субстрате точно так же, как и элементы (биты информации) – в сенсорном образе. Эти элементы комбинируются, интегрируются в различные структуры, причем возникают подвижные комбинации. Процесс подкрепления делает эту интеграцию более длительной. Можно предположить, что подкрепление «индуцирует» непрерывные изменения в нейронных соединениях. Однако эти изменения могут приводить к устойчивым модификациям поведения только тогда, когда стимулируемое у организма стремление к завершению действия не разрушается вследствие отвлечения. Существуют два защитных мозговых механизма: один – регистратор подкрепления соответствия результатов поведения замыслу. Эта функция осуществляется с помощью механизма, который позволяет «внутреннему эху» освободиться от влияния последовательности новых событий. Другой механизм оценивает результаты, которые больше не подкрепляются. Эти нервные механизмы обеспечивают организму устойчивое состояние готовности к подкреплению, благодаря чему и происходит научение.
Вследствие этого прежнее поведение продолжается (хотя и остается способным к новым изменениям с помощью подкреплений) тогда, когда осуществление действия не дает ничего нового, никакой новой информации. Теория, объясняющая выполнение действия с помощью результатов, исходит из этого различения эффектов подкрепления во время научения и во время выполнения действия. Эта теория подтверждается данными бихевиористов относительно возможности перестановки членов в системе «средства – цель» (например, результатами экспериментов с угашением), а также наблюдениями над наркоманами и фактами, показывающими, что частота ответа влияет на взаимоотношение между типами поведения. Все эти факты прямо подводят нас к рассмотрению того, каким образом мозг формирует значение и контролирует планы; эти два процесса существенно зависят от достижения результата.
Таким образом, мы пришли к выводу, что исследование регуляции поведения должно быть сосредоточено не на изменении поведения организма в результате влияния внешних условий, а на изменении этих внешних условий посредством последовательного поведения, осуществления действий и достижения результата. Существует одно важное различие между восприятием и чувствами, с одной стороны, и действием – с другой. Восприятие без вмешательства действия имеет тенденцию к простой ассимиляции внешних условий организмом (в том смысле, в котором употреблял этот термин Пиаже); чувства же, даже если они находят внешнее выражение, имеют тенденцию быть простой проекцией организма во внешнюю среду (как это понимал Фрейд). Действие, скорее всего, представляет собой процесс достижения согласования (или аккомодации, по терминологии Пиаже) между восприятием организма и его чувствами.
Действие имеет и другие последствия. Благодаря действиям достигается согласование между организмами. Именно эта коммуникативная функция действия и является предметом обсуждения в четвертой части книги. В этой сфере особую проблему составляет проблема реализации человека в результатах его действий. Рассмотрим же теперь, каковы те нервные механизмы, которые обеспечивают коммуникативную функцию действий, а это необходимо нам, чтобы выяснить, что же делает человека Homo Sapiens.
Выполнение действия состоит из двух фаз: 1) продолжение процесса научения, изменяющего компетентность организма, и 2) продолжение действия для достижения результата. Теория, объясняющая выполнение действия через результат, основана на экспериментах с угашением актов поведения, в частности на опытах с привыканием к наркотикам и опытах, показавших, что частота ответа предопределяет взаимоотношение звеньев в системе «средства – цель» в ситуации подкрепления.