Представить язык — это представить форму жизни.
Мы построили наше описание эволюции человеческой кооперативной коммуникации вокруг возникновения трех основных задействованных в ней мотивов: просьбы (request), информирования (informing), разделения = приобщения (sharing). Мы также остановились па некоторых процессах, в результате которых от природы осмысленные и основанные на действиях жесты, использующиеся для реализации этих мотивов, в какой-то момент превратились в полноценные коммуникативные конвенции — сформированные культурой и выученные. Но на каждом этапе своего эволюционного пути, включая даже спонтанные жесты человекообразных обезьян, человек также использовал последовательности жестов и/или конвенций, чтобы общаться, и мы еще не делали их подробного описания. Нам необходимо такого рода описание, которое в итоге позволило бы объяснить возникновение не Языка (с большой буквы), а 6000 разных человеческих языков с 6000 различными наборами коммуникативных конвенций — включая грамматические конвенции, необходимые для конструирования связных сообщений из многоэлементных высказываний. Конечно, существуют универсалии (как в любой ситуации, когда представители одного вида с помощью одних и тех же когнитивных средств пытаются делать одно и то же), но имеют место и индивидуальные особенности. Более того, тот факт, что у человечества нет единого средства коммуникации, понятного всем особям данного вида, уже является эволюционным новообразованием, которое нуждается в объяснении.
Мы снова сфокусируемся главным образом на трех основных мотивах человеческой кооперативной коммуникации: просьба, информирование, мотив поделиться. Основополагающая идея заключается в следующем: цель, с которой человек осуществляет коммуникацию, определяет то, сколько и какой информации должно содержаться «внутри» коммуникативного сигнала, и тем самым, грубо говоря, какого рода грамматическое структурирование требуется. Так, поскольку типичная просьба подразумевает ситуацию типа «ты и я в момент здесь-и-сейчас и действие, которое я прошу тебя совершить», сочетания естественных жестов (и/или языковых конвенций) не требуют никакого синтаксического маркирования, а нуждаются лишь в неком «простом синтаксисе» («simple syntax») в рамках грамматики просьбы (grammar of requesting). Отметим в скобках, что с помощью языков в их современном виде мы можем формулировать весьма сложные просьбы. Но когда мы строим высказывания с просьбой о помощи, они часто могут включать упоминание событий и их участников, удаленных от актуального момента во времени и пространстве. Вследствие этого возникает функциональная потребность в маркировании ролей участников событий и функций речевых актов с помощью «серьезного» синтаксиса («serious syntax») в рамках грамматики информирования (grammar of informing). Наконец, когда мы хотим рассказать окружающим о сложной последовательности событий с большим количеством участников, играющих в этих событиях различные роли, нам требуются еще более сложные синтаксические средства для того, чтобы связать эти события друг с другом и отследить в них каждого из участников. Это ведет к конвенционализации «искусного синтаксиса» («fancy syntax») в грамматику приобщения и нарратива (grammar of sharing and narrative).
Хотя основные этапы в этой цепочке различных видов грамматического структурирования были, вероятно, пройдены до того, как люди заселили всю планету, по завершении этого распространения различные группы людей конвенционализировали различные способы выполнения функциональных требований «простого», «серьезного» и «искусного» синтаксисов. Это структурирование было воплощено в грамматических конструкциях — сложных моделях многоэлементных высказываний, — которые были конвенционализированы в различные группы посредством процесса грамматикализации и других культурно-исторических процессов. То, как эти процессы работают, ключевым образом зависит от процессов разделения намерений и кооперативной коммуникации в сочетании с другими когнитивными процессами и ограничениями. Как и в случае коммуникативных конвенций в целом, происхождение грамматических конвенций, тем самым, выдвигает на первый план непрекращающийся спор между биологической и культурной эволюцией.
Что касается модальности, эволюционная гипотеза, опять же, такова, что даже при участии грамматики все процессы в основном происходили в жестовой модальности. Это подкрепляется тем фактом, что конвенциональные жестовые языки с полноценной грамматикой, по всей видимости, в определенных социологических условиях возникают весьма быстро и без затруднений (например, при взаимодействии глухих людей в некоторых видах сообществ). Наиболее известные современные примеры этого — это никарагуанский жестовый язык (Nicaraguan Sign Language; Senghas, Kita, Òzyurek 2004) и бедуинский жестовый язык (Bedouin Sign Language; Sandler et al. 2005), сложные грамматические структуры в которых сформировались в течение всего нескольких поколений. Наш вывод таков: хотя большинство лингвистов полагает, что жестовые языки — это всего лишь нестандартные проявления человеческой способности к речи, но возможно также, что человеческая способность к языку развивалась долгое время в контексте лишь жестовой коммуникации, а голосовая модальность — это лишь позднейшее наслоение. Если предположить, что люди действительно первоначально были способны к сложной коммуникации с помощью жестов, а произвольно контролируемая расчлененная устная речь — это позднейшая эволюционная модификация, то становится значительно проще объяснить то, насколько естественна для людей сложная жестовая коммуникация.
В соответствии с описанными в главе 5 данными, через некоторое время после того, как эволюционное развитие человека пошло своим отдельным путем (этап «Homo» на рис 5.1), люди обрели способность к взаимовыгодному сотрудничеству. Это способствовало формированию структуры совместного внимания и совместных знаний (common ground), в рамках которых они могли просить окружающих о чем-либо более искусным образом, нежели, например, человекообразные обезьяны просят жестом людей; и реципиенты, вероятно, удовлетворяли эти просьбы. На этом этапе люди также владели некоторыми навыками подражания, и поэтому некоторые их телодвижения, выражающие намерение (intention-movements), также могли быть результатом социального научения. Но, в рамках нашей гипотезы, на этом этапе эволюционного развития человеческая коммуникация не была еще полностью кооперативной: люди умели просить, но не информировать другого о чем-либо; таким образом, не существовало непрямых, кооперативных просьб сделать что-то, удаленное во времени и пространстве от момента самой просьбы (что доступно существам, обладающим настоящей речью).
В этой главе нам бы хотелось исследовать то, что могло представлять собой грамматическое структурирование коммуникации на описываемом этапе. Мы будем делать это путем сравнения нескольких реальных феноменов, сравнимых с родом Homo по различным направлениям — «говорящие» обезьяны[19] (linguistic apes); глухие дети, пользующиеся системами жестовой коммуникации домашнего изобретения (home sign); люди, только начавшие изучать какой-либо язык. При этом мы будем исходить из установки, что ни один из этих случаев нельзя сравнить с Homo полностью. Наша цель здесь — дать характеристику такой разновидности грамматики, как «грамматика просьбы», обладающую простым синтаксисом, приспособленным для того, чтобы добиваться от других каких-либо действий здесь и сейчас. По максимуму, это включает в себя сочетания жестов, которые создают новые смыслы, но при этом без участия какого-либо синтаксического маркирования, поскольку оно не имеет никакой функциональной нагрузки в коммуникации, ограниченной ситуациями типа «ты и я в момент здесь-и-сейчас и то действие, которое я прошу тебя совершить». (Повторюсь, мы в данном случае говорим только о непосредственных просьбах, а не о непрямых или других, которые бо^ лее кооперативны по своей природе, и возникновение которых стало возможно лишь после того, как сформировался «сложный», синтаксический язык.) Но начнем мы с того, что очень кратко обозначим отправные точки в возникновении у человекообразных обезьян естественных жестовых последовательностей, которые не имеют вообще никакой грамматической структуры.
Шимпанзе и другие человекообразные в естественной коммуникации друг с другом часто создают последовательности жестов, будучи объединенными общими контекстом и социальными целями. В системном исследовании Либэл, Колла и Томаселло (Liebal, Call, Tomasello 2004) примерно треть рассматриваемых жестовых коммуникативных актов у шимпанзе состояла более чем из одного жеста. Эти последовательности включали в себя практически все возможные сочетания движений, выражающих намерение (intention-movements), и жестов привлечения внимания (attention-getters), относящихся к зрительной, слуховой и тактильной модальностям. (Для ознакомления с похожими результатами по другим представителям человекообразных обезьян см. Call, Tomasello 2007).
Почти 40 процентов этих жестовых последовательностей состояли из простых повторов, проигрываний одного и того же жеста по нескольку раз. Другие последовательности состояли из разных жестов, что создает возможность наличия некой грамматической структуры — в том смысле, что формирование новых значений невозможно при использовании отдельных жестов, или даже в том смысле, что разные жесты играют различные роли в коммуникативном акте. Однако системный анализ этих последовательностей не предоставил никаких данных о наличии такого рода грамматической структуры. Исходя из данных нескольких различных исследований, можно сказать, что происходило следующее: коммуникант показывал один жест, и если реципиент не реагировал на это должным/ожидаемым образом, вслед за первым сразу показывал второй — возможно, в некоторых случаях даже предвосхищая отсутствие реакции. Ни в одном из исследований не было обнаружено новых сообщений, созданных с помощью последовательности жестов, смысл которых не мог быть передан с помощью одиночных, использованных по отдельности жестов. Как было отмечено в главе 2, структурирование, основанное на манипулировании вниманием окружающих, также отсутствовало; иначе говоря, не было таких ситуаций, в которых шимпанзе отдавали предпочтение жесту привлечения внимания в качестве первого жеста, необходимого для фиксации внимания реципиента, а вслед за ним использовали какой-либо жест, выражающий намерение. То есть, у шимпанзе нет ничего напоминающего тема-рематическую структуру (topic-focus structure).
Конечно, возможно, что исследователи неправильным образом искали грамматическую структуру в последовательностях жестов у человекообразных. Но, исходя из данных всех имеющихся в этой области исследований, последовательности жестов у человекообразных обезьян не содержат, в сущности, никакого реляционного или грамматического структурирования, и данных о чем-либо, напоминающем грамматическое структурирование их голосовой коммуникации, также нет. Поэтому мы и используем понятие «последовательность» («sequence»), а не «сочетание» («combination») — последнее мы будем применять к многоэлементным сообщениям, которые обладают хотя бы какой-то структурой, порождающей новое значение.
Существует много споров касательно грамматической структуры — или отсутствия таковой — в знаковых высказываниях, которые порождают человекообразные обезьяны, обучавшиеся языку (language-trained). (Еще раз заметим, что все попытки обучить их каким-либо новым вокализациям потерпели неудачу.) Причина большей части полемики на эту тему — нехватка систематических, количественных данных. Но есть две новые работы, посвященные жестовой продукции этой особой группы животных, в которых приводятся нужные данные. Одна посвящена использованию пятью шимпанзе жестового языка, другая — использованию искусственно созданной системы жестовой речи одним бонобо по имени Канзи. И в том, и в другом исследовании использовались систематически подобранные выборки естественных коммуникативных взаимодействий, большую часть которых наблюдали два независимых исследователя, что сделало возможным количественную оценку согласованности наблюдателей между собой (interobserver reliability).
Во-первых, в своей недавней работе Э. Ривас (Rivas 2005) методично анализирует четыре корпуса наблюдений за пятью шимпанзе (знаменитые Уошо и друзья) за 7-летний период, которых обучали подобию американского жестового языка (American Sign Language, ASL) P. А. и Б. T. Гарднеры, P. Фоутс и их сотрудники. Ими было записано на видео 22 часа взаимодействия между разными шимпанзе и одним из их воспитателей; при этом в разных пробах выбирались разные значения уровня согласованности наблюдателей между собой, и во всех пробах показатели были высоки. За исключением актов спонтанного подражания и невнятных последовательностей, было выделено 2839 актов коммуникации. Обезьяны пользовались как указательным жестом (совместно с другими «естественными» жестами, выражающими, например, просьбу), так и жестами ASL, иногда совмещали их.
Первым результатом, как отмечено в главе 2, было то, что из актов, явно имеющих коммуникативную функцию (за исключением ответов на вопросы), 98 % были просьбами по получению объектов или совершению действий; оставшиеся 2 % были классифицированы как «называние», которое преимущественно появлялось в рамках игры по называнию/узнаванию объектов в книге с картинками. В подгруппе высказываний, обозначенных как «спонтанные», поскольку они инициировали взаимодействие, 100 % актов были просьбами. Поскольку почти все высказывания являлись просьбами, слова, обозначающие действие (action words), в двух- и трехчастных высказываниях почти все касались очень конкретных физических действий, которые нравились животным — таких, как есть, пить, играть в игры, подобные салкам, — а объекты почти всегда представляли из себя нечто, что люди контролировали, а обезьяны жаждали. Жест, обозначающий эти желаемые действия/объекты, как правило, стоял первым в последовательности, а за ним следовал некий произвольный жест («wild card»), или жест-просьба, или жест, указывающий на того человека, который должен выполнить просьбу. Таким образом, мы можем получить, к примеру, следующее: FLOWER there (point) ‘ЦВЕТОК там (указательный жест)’, TOOTHBRUSH gimme (beg gesture) ‘ЗУБНАЯ_ЩЕТKA дай мне (жест-просьба)’, BALL GOOD ‘МЯЧ ХОРОШО’, GUM HURRY ‘ЖВАЧКА БЫСТРО’, и так далее — все в виде просьб. Ривас (Rivas 2005: 413) делает вывод о том, что такое упорядочение лучше всего интерпретировать как «выражение мотивации присвоения» («the expression of an acquisitive motivation»): «И жесты, обозначающие объекты, и жесты, выражающие действия, ставятся в последовательностях первыми, поскольку являются наиболее важными или заметными жестами в рамках высказывания, обычно содержащего просьбу, т. к. определяют, что именно запрашивается. Маркеры просьбы THAT/THERE/YOU/GOOD/HURRY (‘ТО/ТАМ/ТЫ/ХОРОШО/ БЫСТРО’) ставятся последними, поскольку они менее важны (не определяют, каков объект просьбы) и существуют для того, чтобы выделить акценты или побудить человека к действию».
Второй из основных результатов заключался в следующем. У высказываний не было настоящей грамматической структуры, и они были в основном очень короткими: 67 процентов — одноэлементными, 20 процентов — двухэлементными, 13 — состоящими более чем из двух элементов. Поскольку в рамках исследованного периода времени анализировались все высказывания, стало очевидно, что среди них было много «несвязанных» сочетаний «unrelated combinations»), которые были бессмысленны — например, DRINK GUM ‘ПИТЬ ЖВАЧКА’ или CLOTHES EAT ‘ОДЕЖДА ЕСТЬ’ При этом были и другие последовательности, которые, по всей видимости, реализовывали семантические отношения, характерные для просьб маленьких детей, например, «действие + объект» (EAT CHEESE ‘ЕСТЬ СЫР’), «действие + место» (TICKLE there (point) ‘ЩЕКОТАТЬ там (указательный жест)’), и так далее. Возможно, в этих последовательностях шимпанзе просто обозначали две разных составляющих единой ситуации просьбы, эксплицитно не связывая их друг с другом. Но было бы разумно предположить, как в случае с маленькими детьми, что обезьяны указывают на несколько аспектов ситуации и, тем самым, способны к передаче более богатых значений, нежели те, которые могли бы быть переданы с помощью отдельного жеста. Таким образом, нам следует исходить из наличия у человекообразных хотя бы минимальных способностей к грамматическому структурированию, которые являются первыми проблесками на пути к человеческому синтаксису. Тем не менее, нигде в рамках обсуждаемых данных не было найдено высказываний, в которых порядок жестов или любое другое синтаксическое средство реально маркировали бы какое бы то ни было систематическое различие в значении или какую-либо конкретную синтаксическую роль в высказывании в целом. Это являлось бы критерием, который большинство лингвистов сочли бы достаточным для полноценной грамматической структуры. Если EAT CHEESE ‘ЕСТЬ СЫР’ ничем не отличается от CHEESE EAT ‘СЫР ЕСТЬ’, то порядок слов не используется как существенное синтаксическое средство[20].
В другом важном, основанном на количественных данных исследовании жестовых последовательностей у человекообразных, которых обучали языку (language-trained apes), Гринфилд и Сэвидж-Рум-бо (Greenfield, Savage-Rumbaugh 1990) изучили данные, собранные в результате 5 месяцев ежедневных наблюдений за бонобо по имени Канзи, которому в то время было 5 лет. Полностью корпус состоял из 13 691 высказывания, из которых 1422 (10,4 %) являлись последовательностями, включавшими в себя либо 2 лексиграммы (с панели, на которой располагался выдуманный набор лексиграмм-символов), либо лексиграмму и жест. За исключением коммуникативных актов, интерпретация которых была неясной (по причине отсутствия второго наблюдателя, который мог бы делать контекстные заметки), и ответов на тестовые вопросы, итоговый корпус последовательностей включал в себя 723 двухэлементных высказываний (более длинные высказывания были исключены из рассмотрения, поэтому их структура неизвестна). Порядка 5 % данных были проверены на уровень согласованности наблюдателей между собой, который оказался весьма высоким.
Как и в работе Риваса, количество просьб было чрезвычайно велико, порядка 96 % всех двухэлементных высказываний (функция остальных 4 % осталась невыясненной). Аналогично данным Риваса, почти все просьбы, связанные с выполнением каких-либо действий, были конкретными, состоящими из двух элементов: кусать, догонять, нести, хватать, прятаться, обнимать, шлепать, щекотать, прятать что-либо (в игре). Как и Ривас, Гринфилд и Сэвэдж-Румбо обнаружили, что почти четверть коммуникативной продукции Канзи не обладала выраженной структурой и классифицировалась как «смешанная», «бессвязная» или же как «соположенные действия, объекты или локусы» (conjoined actions, entities, or locations). Более одной трети двухэлементных последовательностей состояло из указательных жестов и называния объектов. Что более интересно, почти 50 % высказываний были классифицированы как представляющие два элемента из трехэлементных групп «агенс-действие-объект», или же как объект плюс атрибут или локус. (Отметим, что надежность этой классификации не была проверена.) Большая часть этих последних представляла собой последовательность лексиграммы и жеста (в основном, были представлены указательные жесты или родственные им жесты, указывающие направление). Порядок, который предпочитал Канзи (не являвшийся отражением поведения его воспитателей), был таков: сначала обозначить лексиграмму, а затем сделать жест — например, KEEP-AWAY that (gesture) ‘СПРЯЧЬ это (жест)’ или JUICE you (gesture) ‘СОК ты (жест)’ Такой порядок значений очень похож на высказывания Уошо и ее «семьи», в которых на первое место ставились желаемые объект или действие, а затем следовал некий побуждающий жест. В последовательностях типа «лексиграмма-лексиграмма» не было выявлено выраженных предпочтений порядка элементов. Из семи слов, обозначающих действия, которые использовались в таких последовательностях, пять использовалось с определенным предпочтительным порядком: два — перед словами, обозначающими объект внимания, три — после таких слов. Заметим при этом, что даже там, где предпочтения по порядку слов были выражены, смысл высказывания из-за изменения порядка не менялся.
Что интересно, Канзи продемонстрировал впечатляющую способность к усвоению множества типов предложений английского языка, используемых в качестве просьб (его воспитатели обычно говорили с ним по-английски параллельно с использованием жестов и лексиграмм). Это включает в себя способность понять, что различный порядок лексиграмм в высказываниях обозначает просьбы, касающиеся различных вещей (все тестирование проводилось в ключе реакций Канзи на просьбы; Savage-Rumbaugh et al. 1993). Однако, оказывается, что некоторые животные, не относящиеся к приматам, такие, как дельфины и попугаи (Herman 2005; Pepperberg 2000), также демонстрируют способность к опознанию корреляций между порядком знаков и определенными видами запрашиваемых действий; тем самым, способность придавать значимость паттернам порядка в выученных жестах свойственна не только человекообразным. Ни у одного из этих видов животных нет соответствующей способности использовать порядок жестов при порождении коммуникативных актов, и, таким образом, их возможности понимания могут быть основаны на многих других видах когнитивных и/или учебных навыков, некоторые из которых имеют мало общего с коммуникацией как таковой.
Коммуникативные способности этих «говорящих» обезьян поистине удивительны в том смысле, что они научаются новым коммуникативным жестам и знакам и эффективно используют их с представителями другого биологического вида, и являют собой наиболее чистый и поразительный пример коммуникативной гибкости из когда-либо описанных. Возможно, они даже пользуются последовательностями для более совершенной коммуникации, чем при использовании только одноэлементных коммуникативных актов — т. е., обладают очень простой разновидностью грамматики. Это может говорить о том, что эти виды обезьян, фактически, обладают способностью к синтаксическому анализу — а именно, разложению смысловой ситуации (conceptual situation) на две различные составляющие, такие, как событие и его участник, что не слишком отличается от механизма грамматического анализа у человека. Возможно, что это различение событий и их участников происходит из умения подражать, которое более наглядно проявляется у обезьян, выращенных в неволе, чем у диких обезьян, и все же при этом лучше развито у детей (см. Tomasello 1996). В рамках этой способности категории событий формируются как результат решения о том, что я хочу сделать «такое же» действие, какое я видел только что (т. е. подражание = то же действие, другой участник события). Однако, с позиции синтаксической структуры, задаваемой более строго, можно утверждать, что это отнюдь не так. Ни в одном из двух систематичных количественных исследований, описанных выше, не приводится доказательств наличия грамматической структуры в том смысле, что различные порядки знаков или других единиц в высказывании выполняют функцию маркирования ролей участников или изменения каким-либо образом смысла «сказанного»[21].
Простое объяснение того, почему «говорящие» обезьяны не пользуются синтаксическими средствами в коммуникации с людьми (несмотря на способность к пониманию высказываний с противоположным порядком знаков, когда с ними взаимодействуют путем устной или жестовой речи), состоит в том, что вся их коммуникация направлена на обеспечение функции просьбы. Направленность исключительно на просьбы в текущей ситуации «здесь-и-сейчас» означает, что у обезьян при производстве жестов или жестовых знаков практически отсутствует функциональный запрос (functional demand) на синтаксическое маркирование ролей различных участников в данном событии (syntactic marking); на более точную идентификацию этих участников (например, посредством именных групп — noun phrases); на обозначение времени события (временными показателями — tense markers); на маркирование топика (показателями топика — topic markers); на обозначение типа речевого акта (интонацией или особыми конструкциями — special constructions); наконец, на выполнение всего остального, что мы чуть позже назовем «серьезным» синтаксисом в грамматике информирования. Тем самым, они создали в этих нестандартных для биологического вида условиях разновидность грамматики просьбы, весьма хорошо адаптированной именно к их коммуникативным потребностям: обычно они показывают, чего хотят, с помощью одного знака, за которым следует некое обозначение человека, который должен это сделать, объекта, над которым должно быть произведено желаемое действие, или какого-либо произвольного маркера просьбы как стимул для человека — адресата просьбы.
Гринфилд и Сэвэдж-Румбо (1990) утверждают, что то, на что Канзи способен с помощью жестов и лексиграмм, сравнимо с тем, что делают глухие дети, растущие без представлений о какой-либо конвенционализированной языковой модели, поскольку их родители приняли решение не обучать их конвенциональному жестовому языку (Goldin-Meadow 2003b). У таких детей во взаимодействии с окружающими их взрослыми формируется способ коммуникации, основанный на сочетании указательного жеста (и других дейктических жестов) и пантомимы. Некоторым пантомимическим проявлениям дети научаются от своих родителей, но многие они изобретают сами (что, любопытным образом, не очень возможно в звучащем языке, основанном исключительно на произвольных знаках), но все они должны быть иконичными, чтобы люди вне семьи также могли их усвоить. Многожестовые высказывания (multisign utterances), которые дети наблюдают у взрослых, во многом являются редуцированными, в основном поскольку родители говорят, при этом жестикулируя, и довольно часто, для выполнения определенных функций, речь вытесняет жесты. Тем не менее, дети в итоге приходят к многожестовым высказываниям, в которых присутствует хотя бы какая-то грамматическая структура — явно в большей степени, нежели у их родителей и, как мы утверждаем здесь, в большей степени, чем у «говорящих» обезьян.
Поскольку мы начали с жестов человекообразных и их грамматики просьбы, первое, что необходимо заметить — это то, что большая часть речи этих детей состоит из комментариев к происходящему вокруг, которые информируют окружающих о том, что им, возможно, интересно и что им хочется узнать — включая повествования о том, что удалено от момента «здесь-и-сейчас». Из-за того, что никакие данные о точном процентном соотношении разных видов высказываний не публиковались, приведем результаты одной систематической записи всех высказываний выборки из 10 таких детей от 1 до 4 лет, сделанной во время их игры (продолжительностью от 30 до 60 минут). Примерно одна треть многожестовых высказываний детей, по-види-мому, представляла собой простые комментарии (не просьбы), относящиеся к действиям, связанным с перемещением объектов или людей (например, «двигать» или «приходить»), еще четверть относилась к изменению объектов (например, «крутить» или «ломать»), многие другие были связаны с перемещением объектов (например, «нести»), и только минимальное число высказываний было связано с игрой или выполнением конкретных действий (Goldin-Meadow, Mylander 1984). Этот набор заметно отличается от предпочтений обучавшихся языку человекообразных, а именно требований поиграть с ними и поучаствовать в конкретных «парных» видах деятельности, таких, как салки и объятия. Таблица 6.1 отчетливо показывает отсутствие пересечения между действиями, о которых «говорят» человекообразные и дети, пользующиеся «домашними» жестами. Из почти 100 слов, обозначающих действия, только два («есть» и «идти») используются представителями обоих видов. Правдоподобное объяснение такой разницы состоит в том, что в использовании коммуникативных средств они преследуют разные социальные цели.
Тем не менее, дело обстоит так, что высказывания этих детей сравнительно коротки. Большинство из них состоит только из одного жеста. Примерно 85 % их многоэлементных высказываний содержат только один иконический знак, обычно в сочетании с указательным жестом, со средним количеством от 1 до 1,4 жестов на высказывание у всех детей, кроме одного (включая указательный жест); этот показатель очень мало изменяется на протяжении нескольких лет наблюдения. Goldin-Meadow (2003b) приводит данные о том, что в основе этой сравнительно бедной речевой продукции лежит нечто, что она называет «предикатными рамками» (predicate frames), поскольку в отдельных случаях дети четко указывают на объекты, играющие различные роли в данном действии или событии; например, иконическим жестом, обозначающим действие «резать», один и тот же ребенок в разных ситуациях может обозначить резчика, или некий объект, который режут, или орудие, которым пользуются для разрезания. Это представляется нам особенно четким доказательством того, что в данном случае можно говорить об очень развитой способности вычленять участников событий, которая, возможно, основана на мощных возможностях человека в области имитации действий или даже имитации смены ролей (role reversal); еще раз повторю, имитация = то же действие, другой участник события).
Таблица 6.1
Жесты-действия, применяемые детьми, пользующимися «домашними» системами жестовой коммуникации (Goldin-Meadow, Mylander 1984), человекообразными обезьянами и представителями обеих этих групп (количество показавших тот или иной жест — из общего числа 6 в каждой группе — указано в круглых скобках)[22]. (Спасибо Эстебану Ривасу за помощь в составлении списка по шимпанзе.)
NB: Классификация жестов человекообразных обезьян Сделана автором и сотрудниками, а не дана по работе Rivas 2005.
Дети, пользующиеся так называемыми «домашними» системами жестовой коммуникации, способны к простому структурированию своих высказываний. Что более важно, они иногда применяют средство, весьма распространенное в конвенциональных знаковых языках, для указания «пациенса» действия: а именно, во время выполнения иконического жеста, обозначающего действие, они перемещают Руку(-и) в направлении объекта этого действия. Так они иконически отображают процесс воздействия, чтобы маркировать пациенс. Неясно, как часто это средство используется; в описании Goldin-Meadow (2003b: 111) говорится лишь, что «периодически дети ориентируют свои жесты в направлении определенных объектов в комнате». Пользователи конвенциональных жестовых языков, разумеется, делают подобные вещи в обязательном порядке, и в гораздо больших объемах, и для выполнения различных функций (Padden 1983). Что касается порядка жестов, то только у некоторых детей он устойчив и обычно состоит из жеста, указывающего на объект действия, на первом месте и иконического жеста, обозначающего само это действие. Единственный ребенок, который порождал достаточно большое для статистического анализа количество переходных действий, довольно последовательно располагал пациенсы после жестов-действий. Эта схема полностью противоположна той, которую предпочитают «говорящие» обезьяны. При этом имеется мало свидетельств в пользу того, что различные порядки знаков в высказывании выражают различные и противопоставленные значения. Есть и другое возможное проявление грамматической структуры (систематически изученное только на одном ребенке): когда данный иконический знак используется по-разному для обозначения объекта и действия. Например, объект «расческа» передается знаком в более сокращенном виде по сравнению с действием «расчесывать». Хотя такие случаи редки, тем не менее, возможно, что это шаг в сторону возникновения частей речи — существительного и глагола (Goldin-Meadow 2003b: 130).
Справедливо, что и бонобо Канзи, и маленькие дети, пользующиеся жестами домашнего изобретения, продуцируют множество одноэлементных, достаточное количество двухэлементных и совсем немного более длинных высказываний. В обоих случаях типовое многоэлементное высказывание состоит из одного знака (лексиграммного или иконического типов) и одного более или менее «естественного» жеста, как правило — указательного. Но имеется два принципиальных различия. Первое состоит в том, что Канзи и другие обезьяны высказывают почти исключительно просьбы (с небольшим процентом высказываний, которые не являются просьбами и в основном представляют собой разновидность называния или узнавания объектов), а пользователи «домашних» жестов, помимо этого, порождают множество информативных высказываний, что означает, что они способны «говорить» на множество тем, таких, как объекты и их перемещения и свойства, чего человекообразные обычно не, делают. Возможно, что это объясняет различия в предпочитаемом человекообразными и детьми порядке слов. То есть, поскольку человекообразные обезьяны просят о чем-либо, они ставят желаемые объект или действие на первое место, а за этим следует некое обозначение человека, который должен выполнить желаемое, объекта, над которым должно быть произведено желаемое, или некий маркер просьбы; пользователи «домашних» жестов же склонны сначала обозначать то, о чем они говорят (например, показывая на это), а затем утверждать об этом нечто интересное (возможно, это — свидетельство зарождения тема-рематической структуры). Второе же различие состоит в том, что поскольку жесты детей, пользующихся «домашними» системами жестовой коммуникации, пространственно ориентированны и иконичны, у этих детей есть возможность использовать пространство для систематического модулирования значений, и некоторые из них действительно начинают учиться этому. У Канзи такая возможность в его лексиграммной системе отсутствует, и представляется неясным, моделируется ли она в рамках ASL, или же ее поиски ведутся в процессе наблюдения за обезьянами-пользователями жестов, подобными жестам ASL. Но, опять же, когда единственное, что ты делаешь — это просишь, нет особой нужды в показывании ни субъекта, ни объекта действия.
Тем самым, дети-пользователи «домашних» жестов не ограничены грамматикой просьбы и действительно довольно часто пытаются информировать окружающих о положении дел с желанием им помочь. Но при этом они все равно продуцируют высказывания с очень простым синтаксисом, в большинстве случаев с «вероятностным» (probabilistic), а не нормативным. Они полноценны с когнитивной точки зрения во всем остальном, включая владение навыками и мотивами разделения намерений — так почему же они не становятся грамматически более продвинутыми носителями? Очевидно, что они не научаются полноценному конвенциональному языку, который сформировался в сообществе пользователей. А в их окружении даже нет других людей, которые также естественным образом и без использования речи овладели «домашними» жестами, и в коммуникации с которыми они могли бы конвенционализировать хоть что-то. Когда такие дети обладают подобным сообществом, они начинают порождать высказывания со значительно более совершенной грамматической структурой, как кратко будет описано ниже.
Нормально развивающиеся говорящие дети начинают пользоваться указательным жестом и другими видами жестов до того, как овладевают устной речью. Как описано в главе 4, дети, обучающиеся устной речи обычным образом, склонны к увеличению доли указательных жестов в коммуникации в процессе овладения речью и к уменьшению доли иконических и конвенциональных жестов, предположительно потому, что речь узурпирует их функции. Это означает, что большая часть самых ранних, однословных высказываний у детей, их голофраз, фактически сочетает в себе указательные жесты и речь (как и интонационное маркирование мотива). И, похоже, такие жестово-вербальные сочетания — это предшественники раннего детского синтаксиса.
В двух недавних исследованиях описано, как это происходит. Предположив, что начало использования детьми указательного жеста совместно с речью необходимо для обозначения объектов, Иверсон и Голдин-Мидоу (Iverson, Goldin-Meadow 2005) выделили два типа жестововербальных сочетаний. Первый тип — это так называемые избыточные (redundant) сочетания, в которых ребенок указывает на объект и одновременно называет его; второй — это дополняющие (supplementary) сочетания, в которых ребенок указывает на объект и одновременна заявляет что-то про него, например, показывает на печенье и говорит «съесть». Эти исследователи выявили в коммуникации детей поразительно высокую корреляционную связь между «дополняющими» сочетаниями и первыми сочетаниями типа «слово-слово» (rs = 0.94), тогда как корреляция последних с «избыточными» жестово-вербальными сочетаниями отсутствовала. Озчалискан и Голдин-Мидоу (Ozcaliskan, Goldin-Meadow 2005) распространили эти результаты даже на более сложные языковые явления (см. также Capirci et al. 1996). Интересно здесь, что дополняющие жестово-вербальные сочетания воплощают в себе нечто вроде простого синтаксиса, который можно наблюдать у «говорящих» обезьян и детей, пользующихся «домашними» жестами: высказывания, состоящие из указательного жеста и некоего иконического или произвольного знака, обозначающего действие, свойство объекта или другой предикат, при этом — без участия каких-либо синтаксических средств (указание и слово обычно порождаются одновременно, поэтому вопрос о порядке слов здесь вообще не встает).
В своих первых многословных (multiword) высказываниях маленькие говорящие дети довольно часто делают все немного по-дру-тому (хотя разница все равно не столь велика). Начиная с 18 месяцев, большинство детей порождают словосочетания, одна составная часть которых не меняется, другая же непостоянна. Прототипически слова, выражающие отношение или событие, используются с большим числом различных обозначений объектов (например, More milk ‘Еще молоко’, More grapes ‘Еще виноград’, More juice ‘Еще сок’, или Ball gone ‘Мяч нету’, Dog gone ‘Собака нету’, Grapes gone ‘Виноград нету’). Следуя за работой Braine 1963, мы можем называть их «осевыми схемами» (pivot schemas), которые представляют широко распространенную и продуктивную стратегию для детей, овладевающих многими мировыми языками, иногда включая продуктивные высказывания, которые не были услышаны от родителей — например, знаменитое allgone sticky ‘совсем_нету липкое’[23]. Хотя первые грамматичные сочетания у глухих детей, обучающихся конвенциональному жестовому языку, изучены в объеме, несравнимом с коммуникацией обычных детей, можно сказать, что они обладают теми же свойствами (Schick 2005). Один из путей концептуализации этих ранних осевых схем, а также предикатных фреймов у детей, пользующихся «домашними» жестами — это довольно прямая манифестация развивающейся у них концептуализации структуры событий и их участников, такая, что фактически любой участник коммуникации может сыграть любую из имеющихся ролей. Эта концептуализация событий зависит от чего-то вроде имитации смены ролей в совместных видах деятельности, в которых ребенок, как описано выше, в целом концептуализирует событие с позиций всех его участников, включая свою собственную, в одном и том же формате репрезентации. Это, возможно, еще одна причина, по которой человекообразные обезьяны склонны «говорить» о простых конкретных действиях в форме просьбы: они на самом деле не осмысляют события целиком, и поэтому не создают ничего похожего на осевые схемы или предикатные фреймы с незаполненными слотами.
Но все-таки, осевые схемы у маленьких детей не являются по-настоящему синтаксическими. Другими словами, хотя во многих ранних осевых схемах имеется устойчивый порядок слова-события и слова-участника события (например, More___ ‘Еще___’ или ___gone ‘___нету’), повторю: устойчивый порядок слов — не то же самое, что продуктивное синтаксическое маркирование, подчеркивающее роль данного слова в более крупной комбинаторной структуре. Это же несложное рассуждение имеет силу и относительно ранних этапов усвоения детьми языков, в которых имеется падежное маркирование: дети усваивают свои первые существительные в том или ином падеже, но не способны к сопоставлению разных падежных форм одного и того же слова. Это означает, что, хотя маленькие дети и используют осевые схемы для мысленного разграничения происходящего с помощью различных слов, они не способны к эффективному использованию порядка слов или падежного маркирования для указания на различные роли, которые играют разные участники событий в данный момент (см. обзор в Tomasello 2003).
Таким образом, возможности маленьких говорящих детей, а также маленьких глухих детей, обучающихся конвенциональным жестовым языкам, не ограничиваются грамматикой просьбы, но начинают они речевое общение, тем не менее, без какого-либо «серьезного» синтаксиса. В данном случае причина проста: требуется некоторое время для того, чтобы научиться распознавать грамматическую структуру, содержащуюся в определенных высказываниях, которые можно услышать в сообществе, пользующемся звучащим языком. Это важный факт в любых дискуссиях об эволюционном происхождении грамматики. Маленькие дети, естественно овладевающие звучащим языком, хотя и обладают всеми необходимыми когнитивными и социально-когнитивными возможностями и мотивациями, а также сложившимся языковым сообществом, в котором они живут, тем не менее, начинают говорить не синтаксически структурированными высказываниями, а простыми с синтаксической точки зрения конструкциями, пока не использующими продуктивных синтаксических средств.
Если говорить об эволюционном развитии, ни одна из ситуаций, разбиравшихся нами выше (кроме естественной коммуникации человекообразных), не характерна для ранних стадий эволюции человека. «Говорящие» обезьяны растут в современных условиях рядом с людьми, а все маленькие дети обладают когнитивными возможностями, которых у древних людей, вероятнее всего, не было, в особенности — навыков воспроизведения смены ролей и навыков совместных намерений. Так что наша модель первых этапов эволюции грамматики должна представлять собой некое сочетание этих различных ситуаций (кратко охарактеризованных в табл. 6.2). Коммуникативные средства, которые наш воображаемый Homo мог бы в то время иметь для того, чтобы произвести это потенциальное сочетание (см. главу 5), — это указательный жест и конвенционализированные интенциональные движения (conventionalized intention-movements), поскольку полноценные иконические жесты предполагают возникновение коммуникативного намерения (см. раздел 5.2.2).
Несколько более простой нашу задачу делает то, что, помимо естественных жестовых последовательностей человекообразных обезьян, во всех остальных описанных ситуациях индивиды демонстрируют подлинные жестовые сочетания со схожей простой грамматической структурой — в том смысле, что они делят референтную ситуацию на составные части, часто — на события и их участников. Интересно, что хотя, и указательный жест, и пантомима могут сами по себе обозначать объекты или действия, все индивиды в демонстрируемых ими сочетаниях обычно используют указательный жест для обозначения объектов (участников событий), а пантомиму — для обозначения событий. Принимая во внимание повсеместное распространение подобных различий в жестовых и звучащих языках мира, мы можем утверждать, что организация событий и их участников (возможно, представляющая собой основу для противопоставления глаголов и существительных) естественным образом появляется как у человекообразных обезьян, так и у человека[24].
Таким образом, мы можем предположить, что первые представители рода Homo на Земле умели создавать не только последовательности, но и сочетания жестов, членящие ситуацию на составляющие (обычно это события и их участники), но при этом без какого-либо синтаксического маркирования их роли в высказывании в целом.
Представители рода Homo обладают способностью комбинировать несколько жестов для того, чтобы попросить друг друга о чем-либо. В этой связи возникает вопрос: что происходит с их многожестовыми (multigesture) сочетаниями в контексте совместных видов деятельности и совместного внимания, когда они, а именно, Earlier sapiens (букв, «более ранние». — Прим. пер.) выходят за рамки просьбы и начинают информировать друг друга о положении дел с желанием помочь, даже в отсутствие непосредственного сотрудничества (вследствие процессов непрямого взаимного обмена — indirect reciprocity). Информирование, как правило, включает в себя события и их участников, помимо меня и тебя в момент «здесь-и-сейчас», поскольку они касаются вещей, о которых реципиент на данный момент не осведомлен. Коммуникация по поводу этого более широкого круга событий и объектов задает, по меньшей мере, три новых коммуникативных задачи:
Идентификация (Identifying): выходя за пределы просьбы, коммуникант должен иметь возможность упоминать отсутствующие или незнакомые объекты и события, даже используя несколько элементов в качестве единой, функционально связной составляющей, но при этом помещая акт референции, в интересах реципиента, в контекст их совместных понятийных представлений;
Структурирование (Structuring): выходя за пределы просьбы, коммуникант должен иметь возможность синтаксически маркировать, как, кто, кому и что сделал (включая третьих лиц) в указанном событии или положении дел;
Выражение (Expressing): когда в коммуникации возникают мотивы, не являющиеся просьбами, коммуникант должен выделять их (а возможно, и установки других лиц) для реципиента.
Существует множество разных способов решения каждой из этих задач как в жестовой, так и в голосовой модальностях. Во-первых, в современных жестовых и звучащих языках есть много путей идентификации определенных участников и событий для реципиента, когда они не находятся в ситуации «я и ты здесь-и-сейчас». В обеих модальностях, правда, разгадка в том, что коммуникант использует эту ситуацию — т. е. актуальную структуру совместного внимания, совместные знания или дейктический центр по Бюлеру (1934/1990) — для помещения своих актов референции в контекст того, что оба они ощущают или знают совместно. Следовательно, коммуникант, если он может, укажет на что-либо, что есть в поле восприятия, или обозначит объект жестовым знаком, созданным для вещей, уже находящихся в актуальном совместном внимании (например, с помощью местоимений «она» или «оно»). Но для отсутствующих объектов и событий большинство содержательных слов или жестовых знаков в обеих упомянутых выше модальностях является категориальными понятиями (category terms), которые не могут сами указывать на определенные референты; если я скажу или покажу жестами понятия cat ‘кошка’ или bite ‘укусить’, это не станет основанием для подбора реципиентом индивидуальных референтов из фонда наших совместных знаний или откуда-либо еще, без дальнейшего уточнения. Поэтому коммуникант должен указывать направления поиска для нахождения индивидуальных референтов: объекты должны в основном быть локализованы в пространстве, за исключением «концептуального пространства» (conceptual space), а события должны в основном быть локализованы во времени, за исключением «воображенного времени» (imagined time) (Langacker 1991; Croft 1991). Таким образом, в зависимости от ситуации я произнесу или покажу знаками что-то типа the cat ‘кошка’ (если это единственная кошка в нашем общем поле внимания), или ту cat ‘моя кошка’, или the cat that lives in the vacant house on the corner ‘кошка, которая живет в пустом доме на углу’, для того, чтобы выделить одного представителя данной категории. В языке имеется целая референциальная иерархия, зависящая от того, насколько заметен имеющийся в виду референт в нашем актуальном фонде совместных знаний (см. Chafe 1994; Gundel, Hedberg, Zacharski 1993). И я скажу или покажу знаками, например, will bite ‘укусит’ или was biting ‘кусала’, чтобы обозначить, какое конкретное или воображаемое событие я упоминаю, располагая его во времени относительно нынешнего момента. Тот факт, что несколько элементов объединяются в определенном паттерне для того, чтобы оказать влияние на единую связную коммуникативную функцию (например, путем обозначения отдельного объекта или события), означает, что они формируют единую составляющую более крупной конструкции — то есть, создают иерархическую структуру.
Во-вторых, в современных жестовых языках есть ряд способов прояснения того, кто, что и кому сделал, самый простой из которых — порядок жестов (Liddell 2003); и, естественно, порядок слов весьма часто используется и в звучащих языках. Почти во всех языках мира, как жестовых, так и разговорных, актор/субъект ставится в высказывании перед пациенсом/объектом, по-видимому, поскольку в реальной жизни каузатор (causal source) обычно движется и проявляет активность ранее тех вещей, на которые он воздействует или влияет. Таким образом, этот принцип упорядочения хотя бы в какой-то мере имеет естественное происхождение, но чтобы быть продуктивным, он нуждается в конвенционализации в противовес другим альтернативам. К тому же, жестовые языки часто тоже используют пространство для этой же функции: например, для того, чтобы знаками показать, что я даю тебе что-либо, я делаю свой знак иконичным, изображая факт передачи чего-либо от меня тебе в пространстве, аналогично — с передачей от тебя мне; это явно средство естественного происхождения. Говорящие на жестовом языке также могут, как было замечено выше, обозначить пациенс данного действия путем пантомимического показа этого действия в направлении перцептивно доступного объекта; это средство иногда называют согласованием, подчеркивая его сходство с таким явлением, как согласование глагола с подлежащим в звучащих языках. Чтобы обозначить, кто совершает действие, использующие жестовые языки могут также располагать свое тело в пространстве таким образом, чтобы индексально имитировать пространственную перспективу участника; это еще одно естественное иконическое средство. Оба типа языков также иногда используют конвенциональные жестовые знаки, слова или маркеры (например, предлоги, падежные маркеры) для обозначения роли, которую гот или иной участник играет в событии.
В-третьих, в обеих модальностях коммуникант каким-то образом выражает свой мотив (а иногда и другие установки) в качестве дополнительной информации, чтобы помочь реципиенту сделать вывод о своей социальной интенции. В обеих модальностях эти установки склонны становиться естественными способами выражения эмоций, хотя для того, чтобы выполнять функции контрастивных маркеров (contrastive markers), они должны быть конвенционализированы. Поэтому вопрос задается с определенным выражением лица в жестовых языках и/или с определенной интонацией в звучащих языках, что, вероятно, в древности было связано с естественными выражениями замешательства и/или удивления. «Не очень вежливые» просьбы (not-so-polite requests) могут осуществляться с требовательным выражением лица или требовательным тоном, что, вероятно, в древности было связано с выражениями гнева. Эти выражения мотивов — с естественной основой в виде человеческих эмоциональных реакций как в жестовых, так и в звучащих языках — приобрели конвенциональность, каждое своим особым образом, в обеих модальностях.
В предыдущей главе то, что мы называли естественной коммуникацией, означало коммуникацию, основой которой являются жесты, основанные на действиях (action-based gestures) и адаптировавшиеся к таким естественным реакциям человека, как прослеживание взора другого — т. е. указательный жест — и интерпретация действий окружающих с точки зрения их намерений — т. е. пантомима. Люди обладают способностью понимать эти жесты без какой-либо специальной подготовки (если мы предполагаем, что у них имеется базовая структура разделения намерений кооперативной коммуникации с коммуникативными намерениями, совместными знаниями и т. д.). Так турист понимает подобные жесты естественным образом в магазине или на вокзале в другой стране. Конвенционализация устраняет естественность и заменяет ее, так сказать, совместной историей обучения: каждый, кто вырос в данном сообществе, знает, для чего обычно используется та или иная произвольная коммуникативная конвенция, поскольку у всех был похожий опыт обучения в этой области, и это, в свою очередь, тоже является общим знанием.
Синтаксические средства и конструкции устроены похожим образом, несмотря на попытки превратить их в бессодержательные алгебраические правила (см., напр., Chomsky 1965; Pinker 1999). Каждый из множества разнообразных языков, которые есть в мире, как звучащих, так и жестовых, обладает своими синтаксическими и прочими грамматическими конвенциями, необходимыми для структурирования высказываний, чтобы решать различные задачи, которые ставит информативная коммуникация. На самом деле, в каждом языке мира имеется множество заранее сформированных конструкций, которые сочетают в себе различные типы жестовых знаков/слов и грамматических маркеров для использования в рекуррентных коммуникативных ситуациях. Например, в английском языке пассивная конструкция (скажем, The dog was injured by the car ‘Собака была ушиблена машиной’) состоит из определенной конфигурации составляющих (каждая из которых также имеет свою внутреннюю структуру) для выражения конкретной коммуникативной цели. Этот, более функциональный, подход к грамматике, не отрицает ни наличия принципов обработки или вычисления, которые в какой-то мере формируют или ограничивают виды грамматических паттернов, которые человек может конвенционализировать, ни гипотезы о том, что все начиналось с «естественных» принципов, таких, как постановка первым агенса действия. Но то, из чего грамматика состоит наиболее непосредственно, — это набор конвенциональных средств и конструкций (по-разному конвенционализированных в разных языках), необходимый для облегчения коммуникации, когда необходимо обозначить сложные ситуации за рамками момента «здесь-и-сейчас».
Крайне интересная иллюстрация перехода от «простого» синтаксиса к «серьезному» (и заодно истоков конвенционализации грамматики) предоставляется различными поколениями пользователей никарагуанского жестового языка (Nicaraguan Sign Language, далее — NSL). Этот язык демонстрирует ситуацию, в которой глухие дети, каждый из которых самостоятельно добился некоторого успеха в использовании некоей разновидности «домашних» жестов, были сведены вместе в условиях школы. Они самопроизвольно сформировали способы коммуникации друг с другом, используя простой набор жестов, а новые дети, приходившие в школу, учились этим жестам от них. Уникальность этой ситуации в том, что она возникла всего несколько десятилетий назад, и поэтому первое поколение детей еще живо, а два других поколения, на данный момент взрослых и детей, также доступны для изучения. Основное открытие заключается в том, что более юные носители, судя по всему, более свободно владеют им и, по всей видимости, добавили к этим жестовым знакам некоторую грамматическую структуру, в сравнении с создателями языка, относящимся к старшим поколениям.
Пользователи «домашних» жестов, как отмечалось выше, весьма привержены ко всему, что изобретается ими или их родителями, с упором на «естественность» (иконичность); это связано с тем, что другие люди не участвуют в процессе создания жестов. Но при рождении нового языка, такого, как этот, вступает в действие новый процесс. В процессе коммуникации друг с другом множеством носителей языка изобретаются новые жестовые знаки и конструкции, и когда они путем имитации усваиваются «новичками» в данном языке, нс всегда осознающими естественность их происхождения, мы опять приходим к «дрейфу в направлении произвольного выбора средств» («а drift to the arbitrary»). Мы можем называть этот процесс конвенционализацией грамматики (или «грамматикализацией», хотя у этого термина есть другие коннотации), и он будет довольно подробно описан ниже. Для наших нынешних целей важен просто тот факт, что добавление новых знаков и их передача приводят к появлению грамматической структуры, превосходящей ту, которая была создана людьми, пользовавшимися своими собственными уникальными жестовыми знаками домашнего изобретения.
В случае NSL и анализ спонтанного его использования, и экспериментальные исследования в области порождения и понимание жестовой речи доказали, что грамматическая структура была создана за очень короткий период времени. Сначала более поздние поколения носителей NSL научились использовать пространство разными путями для того, чтобы грамматически структурировать свои высказывания способами, напоминающими средства конвенциональных жестовых языков (тогда как первое поколение носителей этого не делало). Например, они используют пространство для идентификации отсутствующих в ситуации референтов, которая может потребовать нескольких знаков, объединенных в последовательность (т. е. в структуру составляющих — constituency). Так, они используют общую пространственную точку отсчета (common spatial reference point) для обозначения элементов, объединенных каким-либо образом в одной составляющей (иногда это явление называют согласованием) — так, что, например, объект и модифицирующее выражение могут производиться в одном и том же локусе, обозначая модифицирующее отношение; то же возможно для агенса и действия. Вдобавок, пространственные маркеры (spatial devices) также используются для отслеживания референтов во времени: если коммуникант упомянул объект при помощи жестового знака, впоследствии для повторного упоминания он может просто указать на то место в пространстве, где этот знак был продемонстрирован — что очень напоминает местоимения в звучащих языках. Это, в сущности, и есть использование пространственных маркеров для обозначения вещей таким способом, который позволяет опираться на уже созданную рамку совместного внимания. Другой любопытный вариант использования пространства во втором поколении носителей NSL — обозначение принимаемой точки отсчета (perspectival reference point) до показа жеста, например, указание на место в пространстве, связанное с ранее упомянутым объектом, но с позиции кого-то другого из собеседников, а не своей (Senghas, Coppola 2001; Senghas 2003).
Во-вторых, что касается порядка жестов как средства структурирования высказывания, то экспериментальные исследования, где испытуемые рассказывали, что происходило в некотором фильме, показали различия между носителями NSL из разных поколений. Носители NSL первого поколения упоминали только одного участника на действие (как это по большей части бывает в «домашних» системах жестовой коммуникации), так что порядок жестов даже в сравнительно длинных повествованиях представлял собой чередование глаголов и жестов, относящихся к участникам. В отличие от них носители второго поколения были склонны к порождению высказываний, в которых глагол ставился на последнее место вне зависимости от количества участников, а акторы/подлежащие/темы почти неизменно ставились до пациенсов/дополнений/рем (Kegl, Senghas, Coppola 1999)[25]. Этот порядок с конечным расположением глагола (verb-final ordering) был обнаружен также в другом недавно созданном жестовом языке — бедуинском жестовом языке (Bedouin Sign Language), в котором высказывания этого типа численно превосходили высказывания других типов в соотношении примерно 6:1 (Sandler et al. 2005). Так же, как и некоторые пользователи «домашних» жестов, носители этих молодых языков ориентируют жесты-действия в сторону объектов, чтобы обозначить, что эти объекты являются пациенсами или прямыми дополнениями данных действий.
Носители NSL второго поколения, таким образом, начали (в отличие от пользователей «домашних» жестов и носителей NSL первого поколения) использовать ряд грамматических структурирующих средств, ставших основой «серьезного» синтаксиса. Поскольку спонтанное возникновение жестовых языков случалось неоднократно, а все сформировавшиеся жестовые языки обладают развитой грамматической структурой, можно предполагать, что такая конвенционализация является нормальным процессом, с помощью которого сообщество создает полноценный жестовый язык.
Вскоре после того, как типично развивающиеся дети начинают продуцировать многословные высказывания — часто в виде осевых конструкций, как описано выше, — они начинают грамматически структурировать свои высказывания, как и глухие дети, овладевающие жестовым языком. Довольно рано в их высказываниях можно наблюдать иерархическую структуру — в том смысле, что у них появляются многоэлементные именные и глагольные группы, которые опознаются благодаря определенным структурным паттернам (см. обзор в Tomasello 2003). Они также довольно рано начинают использовать синтаксические средства второго порядка для структурирования ролей, которые участники играют в событиях, используя механизмы упорядочения или другие виды синтаксического маркирования, такие, как падежная маркировка. Первоначально такие средства обычно привязаны к конкретным типам событий. Например, дети могут научиться пользоваться конкретным средством упорядочения для обозначения агенсов и пациенсов в определенных типах событий, типа «давать» или «толкать», но не использовать его для других типов событий. Эти так называемые «глагольные изолированные конструкции» (verb island constructions; Tomasello 1992a, 2003) означают, что раннее синтаксическое маркирование у детей весьма ограничено по объему и становится полным и абстрактным лишь постепенно. Главный вывод, в рамках наших нынешних целей, прост: синтаксические средства (даже конвенциональные, которые разительно меняют смысл сказанного) могут распространяться либо только на конкретные слова/жесты, либо на целые категории слов/жестов. Поэтому с эволюционной точки зрения разумным будет предположение, что на ранних этапах существования в грамматике информирования «серьезного» синтаксиса люди могли структурировать свои высказывания посредством грамматических средств, которые работали лишь локально, с определенными словами/знаками, а не по категориям, объединяющим все известные слова/жесты.
Повторю, что с точки зрения эволюционного развития ни одна из ситуаций, рассмотренных нами выше (NLS и овладение детьми конвенциональным жестовым или звучащим языком), не соответствует ни одной из ранних стадий эволюции человека. Дети, создававшие и изучающие могут быть весьма близки к какой-то из ранних стадий, но они обладают более развитыми когнитивными и социальнокогнитивными навыками, чем мог обладать человек на рассматриваемый нами момент (особенно в отношении разделения = приобщения и следования нормам). Кроме того, все они начинали с обучения «домашним» жестам во взаимодействии со зрелыми говорящими людьми, своими современниками. Мы ищем нечто, что было бы новообразованием и выходило бы за рамки грамматики просьбы, т. е. включало бы в себя более сложное грамматическое структурирование. Однако, это «нечто» все равно не будет включать все синтаксические средства, необходимые для того, чтобы делиться опытом в нарративах, а также не будет включать нормативное измерение человеческой кооперативной коммуникации.
Главное новообразование, исследуемое нами в грамматике информирования — это использование коммуникантом конвенциональных синтаксических средств для того чтобы а) выделять и идентифицировать референтов в текущей структуре совместного внимания, включая использование с этой целью многоэлементных составляющих; б) структурировать высказывания целиком для реципиента путем обозначения различных ролей, играемых участниками события; в) конвенционально выражать мотивы и установки (часто все же в придачу с эмоциями, передаваемыми с помощью мимики и интонаций). Эти новообразования возникают благодаря новой коммуникативной функции, хотя очевидно, что переход к использованию каких-либо из этих средств не определяется напрямую теми или иными функциями, поскольку разные языки осуществляют его очень по-разному. В грамматике просьбы, завязанной на ситуации «я и ты в момент здесь-и-сейчас», все эти сложности не нужны; в грамматике информирования они становятся необходимы. Предположительно, первые в эволюционном развитии конвенциональные синтаксические средства возникли из «естественных» принципов (т. е. тех, использование которых естественно для всех людей вследствие их общих предрасположенностей, когнитивных, социальных и мотивационных — таких, как «актор на первом месте» или «тема на первом месте», или как иметь озадаченный взгляд, когда задаешь вопрос) — но процесс конвенционализации затем трансформировал их в коммуникативно значимые синтаксические средства человеческой кооперативной коммуникации.
Мотив приобщения, разделения опыта (sharing), как это уже было замечено, является разновидностью информирования. Он отражает базовую человеческую потребность делиться информацией, и, что важнее, выражать свое отношение к ней. Мы предполагаем, что такой способ обмена информацией с другими служит расширению фонда совместных знаний индивида: делясь информацией, он хочет быть как все в группе, надеется нравиться членам группы и иметь возможность более тесного общения с ними, что послужит установлению связей и построению социальной идентичности. Также отметим, что этот мотив приобщения/идентификации приводит к формированию норм общественного поведения. Возникает скрытое давление общества на индивида: необходимо вести себя так, как это делают другие. Поскольку язык демонстрирует очень жестко заданную нормативную структуру — ив том, как мы следуем языковым конвенциям, описывая какую-либо вещь, и в том, как мы отличаем грамматически неправильное высказывание от правильного, можно предположить, что мотив приобщения несет хотя бы частичную ответственность за наши суждения вроде: «Так не говорят».
В любой культуре основным «местом» обмена информацией и отношением к ней с другими членами группы являются нарративы. По сути говоря, в каждой культуре есть нарративы, которые помогают ей оставаться единым целым в потоке времени. Мифы о сотворении мира, народные сказки, притчи и так далее — все они, несомненно, передаются от поколения к поколению как часть культурной матрицы. Примечательно, что даже пользователи «домашних» жестов, не обладающие истинно конвенциональным языком, способны рассказывать простые нарративы с помощью иконических жестов (Goldin-Meadow 2003b), как и дети, осваивающие NSL (Senghas, Kita, Özyürek 2004). С точки зрения лингвистики, нарративы, содержащие сложные истории, вызывают массу проблем с передачей временной последовательности событий и обозначением их участников. Эти проблемы разрешаются с помощью различных синтаксических средств в рамках того, что мы могли бы назвать «искусным синтаксисом». Несомненно, что такие средства, созданные, согласно нашей гипотезе, для решения проблем, порожденных нарративами и другими сложными формами дискурса, кажутся нам внешне беспорядочными в грамматике современных языков. Повлияло это и на грамматические правила, которые люди используют для построения простых фраз. Языковое выражение последовательности событий, которая передается в отдельных высказываниях или даже в репликах диалога, может быть сокращено и грамматически структурировано. Образуется целостная конструкция с более или менее единым интонационным контуром, в которой находится место для большого количества событий. Такие вещи возможны, и они нередко случаются как в звучащих, так и в жестовых языках. Мы хотим доказать, что это было характеристикой Позднего человека разумного (Later Sapiens).
Чтобы заняться построением нарративного дискурса, нам нужно найти средства, позволяющие говорить о многочисленных, по-разному связанных друг с другом событиях и сложно организованном положении дел. Еще нам понадобятся способы освобождения дискурса от того, что и так содержится в актуальном неязыковом контексте, и от того, что входит в языковой контекст, сформированный предшествующим дискурсом. Быть талантливым рассказчиком означает мастерски управлять набором средств, обеспечивающих последовательность и связность событий, чтобы выстроить происходящее в хорошую историю.
Построение нарративного дискурса ставит две главных задачи: соотнесение эпизодов по времени и отслеживание их участников, которые могут оставаться все теми же или меняться от события к событию, а могут и вовсе играть разные роли.
Во-первых, прослеживание временной последовательности событий требует невероятно сложных грамматических структур. Самая простая ситуация — событие расположено во времени так, что его можно соотнести с настоящим: I slept for an hour ‘Я спал час’ или I will sleep for an hour ‘Я буду спать час’. Но нарративы требуют, чтобы мы нашли место и таким вещам, расположение которых во времени и пространстве задано друг относительно друга. В результате получаются такие конструкции:
Действие в прошлом происходит во время другого действия в прошлом: While I was sleeping, a bomb exploded ‘Пока я спал, взорвалась бомба’
Действие в прошлом происходит после другого действия: After I had slept for an hour, mother came ‘После того, как я проспал час, пришла мама’
Момент в будущем, по отношению к которому другой момент в будущем является прошедшим: By next month, I will have finished ту hook ‘Когда начнется следующий месяц, я уже закончу свою книгу’
Момент в будущем, к которому завершится некое продолжительное действие: By the time I finish ту hook, I will have been living in Australia far ten years ‘К тому времени, как я закончу свою книгу, пройдет первое десятилетие моей жизни в Австралии’
Трудно представить другой коммуникативный контекст, нежели нарративный дискурс, который потребовал бы такого вычурного учета времени событий в форме различных видов и времен глагола.
Во-вторых, не менее сложной является задача по отслеживанию референтов в событиях. Иногда на референта вообще не нужно указывать во втором действии: Bill drove to town and___bought a shirt
‘Билл поехал в город и___купил рубашку’ В других случаях референт обозначается местоимением, и ситуация усложняется: если в истории было несколько героев, то референтом может оказаться любой из них. Например, в предложении: Bill drove Sarah to town and__bought a shirt ‘Билл отвез Сару в город и___купил рубашку’ герой рассказа, покупающий рубашку (Билл), оказывается дальше от слова «покупает», чем другой участник событий (Сара). Но это затруднение можно обойти, используя разные местоимения и другие средства маркирования, как в предложении: Bill drove Sarah to town and she bought a shirt ‘Билл отвез Сару в город, и она купила рубашку’. Местоимение женского рода не даст нам перепутать такую ситуацию с предыдущим примером. Языки, в которых существительные разделены по родам (genders or noun classes), способны значительно более эффективно, чем английский, использовать эту стратегию. Эти примеры относятся к так называемому отслеживанию референтов в дискурсе (reference tracking in discourse), и являются простой иллюстрацией того, как потребности коммуникации могут придавать форму развивающейся грамматике. К примеру, необходимость создать способы отслеживания референтов в различных событиях могла привести к возникновению разнообразных местоимений, родов существительных и других способов маркирования согласования (agreement marking). Как отмечается, в знаковых языках коммуникант разрешает подобные проблемы, показывая знак определенного субъекта или объекта в некотором месте, и в дальнейшем просто указывая на это место, когда ему необходимо упомянуть данный субъект или объект.
Организация последовательности событий во времени и отслеживание объектов устроены гораздо сложнее, чем мы здесь рассмотрели. В решении этих проблем языки демонстрируют великое разнообразие средств. Суть состоит в том, что процессом управляет коммуникативная функция, и всем языковым сообществам, которые хотят обладать нарративами и другими сложными формами дискурса, необходимо создать грамматические конвенции, подобные описанным здесь.
Усложнение дискурса приводит к появлению более сложных синтаксических конструкций, с помощью которых в одной фразе можно описать сразу несколько событий. Дискурс, описывающий развернутую последовательность событий, неточно распределенную во времени и выражающуюся различными интонационными единицами, с течением времени сокращается до относительно плотно организованных грамматических конструкций с единым интонационным контуром. Далее мы рассмотрим этот процесс более подробно. Существует три основных типа таких конструкций, которые отвечают за идентификацию, структурирование и выражение отношения.
Что касается определения референта, то здесь существует несметное число конструкций, использующих разные элементы — например, именные группы (the big green car ‘большая зеленая машина’) и составные сказуемые (will have been sleeping ‘будет спать’) в английском. Наиболее сложными конструкциями такого типа являются определительные придаточные предложения (relative clauses), поскольку они определяют референта через событие:
The man who was wearing the green coat left early ‘Мужчина, который был одет в зеленое пальто, ушел рано’
There’s that woman who was at the shop yesterday ‘Там женщина, которая была вчера в магазине’
Другие конструкции направлены на смену угла зрения и акцентирование существенных моментов, позволяющих выявить ту фигуру, которая является ключевой в повествовании:
It was the man who got robbed (not the woman, as you suppose) ‘Это мужчину обокрали (а не женщину, как ты думаешь)’
It was the girl who robbed him (not the boy, as you suppose) ‘Это девочка его обокрала (а не мальчик, как ты думаешь)’
Не будем отвлекаться на детали функционирования таких конструкций, а лишь повторимся, что они нужны для определения референтов, а их происхождение связано с расширенным дискурсом (extended discourse), что будет рассмотрено ниже.
Займемся теперь вопросом структурирования. Во всех языках есть сложные конструкции, которые соотносят события друг с другом и с их участниками сложными, но систематичными путями. К примеру, мы можем соотнести события следующими способами:
She finished1 her homework, and then she went2 to town ‘Она закончила_делать1 домашнее задание и потом пошла2 в город’
She pulled1 the door, but it wouldn 't shut2 ‘Она потянула1 на себя дверь, но та не закрывалась2’
She rode1 her bike because she needed to find2 him quickly ‘Она поехала1 на велосипеде, потому что ей надо было побыстрее его найти2’
Это лишь несколько примеров. В дискурсе и нарративах такие связки событий, соотнесенных с помощью служебных слов, которые определяют вид отношений между ними, встречаются на каждом шагу. Существует много других типов связи, и в различных языках мы сталкиваемся с огромным разнообразием подобных нечетко организованных конструкций.
Рассмотрим способы выражения отношения. Существуют специальные конструкции, позволяющие определить функции и мотивы речевого акта, например, вопросы и команды:
Close the door! ‘Закрой дверь!’ (императив).
Did you close the door? ‘Ты закрыл дверь?’ (вопрос).
Не closed the door ‘Он закрыл дверь’ (утверждение).
В других конструкциях, выражающих переживания говорящего, событие обрамляется информацией о чьем-либо психологическом состоянии или отношении. Некоторые конструкции такого типа выражают желание и намерение, многие (и с ними дети знакомятся в первую очередь) выражают актуальное отношение коммуниканта к произошедшему событию.
Самые простые из них:
I want to play Batman ‘Я хочу поиграть в Бэтмена’
I must do ту homework ‘Я должен сделать домашнее задание’
I’т trying to win ‘Я пытаюсь выиграть’
Все это можно обобщенно назвать сообщениями о психологическом состоянии других людей или отношении к происходящему. Другие конструкции из той же категории описывают эпистемические состояния. Приведем простые примеры:
I know I can do it ‘Я знаю, что могу сделать это’
I think he went home ‘Я думаю, что он пошел домой’
I believe she’ll come to the party ‘Я думаю, что она придет на вечеринку’
Конечно, к таким конструкциям относятся и сообщения о психологическом состоянии других людей.
Надо подчеркнуть, что современным детям не нужно самостоятельно выстраивать грамматику своих самых ранних сложных конструкций, так как они слышат конкретные примеры их употребления в речи взрослых (Diessel, Tomasello 2000; 2001; Diessel 2005). Это еще одно проявление общего принципа культурной диалектики, согласно которому продукты культуры постепенно усложняются с течением времени в результате социальных взаимодействий, но новые поколения просто усваивают новый продукт с помощью имитации или другой формы культурного научения (эффект храповика — the ratchet effect; Tomasello, Kruger, Ratner 1993). Решающим доводом здесь служит тот факт, что множество, если не большинство сложнейших грамматических конструкций исторически сформировались из длинных дискурсивных последовательностей. Это позволило разрешить проблемы с построением развернутых высказываний и многоактных нарративов. Далее мы в общих чертах разберем этот процесс.
Почему люди разных культур так часто рассказывают истории? В главе 5 мы изложили эволюционные причины, по которым люди делятся информацией, эмоциями и установками с другими. Такое приобщение к опыту друг друга является способом расширения совместных знаний, а тем самым — и коммуникативных возможностей, что, в свою очередь, делает нас более похожими на окружающих и увеличивает наши шансы на социальное принятие (social acceptance). Вспомним, что сходство с группой играло ключевую роль в процессе культурного группового отбора. Рассказывание нарративов способствует этому процессу, поскольку только члены нашей группы знают наши истории, а также важным объединяющим механизмом является наша одинаковая оценка героев и их действий (см. Bruner 1986, который выделяет в нарративах «пространство действия» — «the landscape of action» — и «пространство оценки» — «the landscape of evaluation»).
В главе 5 мы также показали, что этот процесс приводит к возникновению социальных норм. Люди испытывают сильную потребность принадлежать к какой-либо социальной группе, и групповые нормы поведения — что ты должен быть послушным, должен одеваться, есть и вести себя, как мы, — действенны лишь потому, что индивиды чувствительны к групповой оценке и санкциям (и даже предвосхищают их, испытывая застенчивость, стыд и вину). Такое давление заставляет людей быть конформными и вступать в группы. Отметим, что многие повседневные занятия членов социальной группы регулируются нормами: так мы, члены такой-то группы, собираем мед (так же, как это делали и наши предки с начала времен), так мы едим палочками, и т. п.
Феномен грамматичности — то, что определенные высказывания воспринимаются как грамматически неверные («Это не по-английски», «По-русски так не говорят»), — казалось бы, отстоит очень далеко от подчинения социальным нормам с целью избежать стыда и вины. Ио мы утверждаем, что это просто еще одна реализация на практике социальных норм повседневного поведения (подобно сбору меда и использованию палочек именно «нашим», особым внутригрупповым образом), действие которых значительно усиливается благодаря тому, что высказывания с общепринятой грамматической структурой мы слышим десятки, а то и сотни раз на дню. Схема таких высказываний в нашей коммуникации задана весьма жестко. Отметим, что искажения грамматики в тех высказываниях, которые мы слышим редко, звучат не так ужасно, как в часто используемых фразах и грамматических структурах (Brooks и др. 1999). Интересно, что представители второго поколения обучавшихся NSL, по всей видимости, обладали чувством грамматичности, которого не было у создателей языка (то есть, они замечали, что первое поколение не всегда все «делает правильно»; Senghas, Kita, Özyürek 2004). Можно предположить, что когда процесс конвенционализации разворачивается там, где индивиды приобретают современные когнитивные и социальные навыки и являются членами некоторого языкового сообщества, у них создается впечатление, что следует делать все строго определенным образом, а некоторые не умеют делать это правильно.
Многие лингвисты и философы ломали головы над проблемой грамматичности: если это не готовые правила, которым учат в школе (понятно, что владение прескриптивной грамматикой будет указывать окружающим на уровень образования и социальный статус), а что-то более глубинное, то что это? Согласно текущим представлениям, это просто еще один случай нормативности группового поведения, усиленной частыми случаями употребления до такой степени, что нарушения норм звучат странно. Это — неожиданный, но очень важный дополнительный эффект мотива приобщения/конформности/групповой идентификации в эволюции человеческого общения.
Я уже вижу, как лингвисты с отвращением взирают на представленные в этом кратком изложении страшные упрощения дискурса и сложных конструкций (и, конечно же, «серьезного» синтаксиса тоже). Но мои цели здесь были просты и конкретны. Я пытался показать следующее:
• построение расширенного дискурса и нарратива создает функциональную потребность в средствах, позволяющих соотносить события друг с другом, отслеживать их участников и простраивать перспективы на будущее;
• во всех известных языках имеются грамматические средства для удовлетворения данных потребностей, но существует огромное множество путей для этого, и поэтому все языки значительно разнятся по этим средствам;
• рекуррентные дискурсивные последовательности, в которых описывается несколько событий, являются первоисточником сложных синтаксических конструкций.
У индивидов, просто запрашивающих что-либо друг у друга в момент «здесь-и-сейчас» или даже информирующих друг друга о чем-то, немного удаленном от этого момента во времени и пространстве, не возникает потребности в большинстве изощренных синтаксических средств, которые мы наблюдаем в современных языках. Возможности таких средств прямо связаны с функциональными запросами нарративного дискурса, нуждающегося в структурированных группах событий, удаленных друг от друга во времени и пространстве.
В любом случае, мы можем подытожить этапы нашего эволюционного развития в терминах грамматики просьбы, грамматики информирования и грамматики приобщения и нарратива, как это показано на рис. 6.1. В этой иллюстрации сделана попытка дать самую общую характеристику грамматических средств, возникавших в человеческой коммуникации по мере того, как различные мотивы коммуникации преобладали на протяжении эволюции. (На этой иллюстрации, также как и на рис. 5.1, термины Человек, Ранний человек разумный и Поздний человек разумный — Homo, Earlier Sapiens and Later Sapiens — используются просто как понятные и удобные ярлыки, отражающие суть этапов эволюционного развития, не более). Процесс конвенционализации, происходящий в культурно-историческом времени, здесь не описывается, но именно к нему мы обратимся после краткого подведения итогов.
Рис. 6.1. Эволюционные основания грамматики (три ступени)
Другим примером, отражающим нашу итоговую схему из трех этапов эволюции, может служить происходящее сейчас формирование пиджинов и креольских языков, появление которых вызвано социальными причинами, воздействующими на носителей различных звучащих языков. Гипотеза здесь такова, что хотя эти люди по своему умственному развитию значительно отличаются от своих предков — ранних людей, — набор грамматических структур, который они будут использовать для взаимодействия в рабочих ситуациях, недосчитается значительной доли средств структурирования, развившихся в современных языках. Чтобы попросить кого-то выкопать яму, не нужно осваивать плюсквамперфект или сочинять придаточные предложения, и это подтверждается нашими знаниями о том, что на начальных уровнях развития пиджины имеют крайне ограниченную грамматическую структуру (так называемый жаргон; McWhorter 2005). Но затем, если люди захотели делиться друг с другом полезной информацией, особенно о третьих лицах и о вещах, отдаленных во времени и пространстве, наступает второй этап. Необходимость выполнять новые функции приводит к конвенционализации некоторых серьезных синтаксических средств — таких, как контрастивный порядок слов (contrastive word order), синтаксическое маркирование, сложные именные группы и т. д. — и более сложных грамматических конструкций, вследствие чего и возникает пиджин. На стадии 3 пиджин можно назвать креольским языком, или даже полноценным естественным языком. Это происходит, когда его носители начинают идентифицировать себя как определенную культурную группу, существование которой опираегся на общий язык и, возможно, на нарративы, которыми, разговаривая на своем языке, делятся друг с другом члены этой группы.
Функционирование современных языков представляет собой сложную смесь «естественных» принципов коммуникации и грамматики (процессов, проистекающих из строения человека как познающего мир и взаимодействующего с окружающими) и конвенционализированных элементов коммуникации, созданных и передающихся в пределах культурных групп. Очевидно, что процессы, посредством которым коммуникативные средства конвенционализируются, относятся к процессам не биологической, а культурно-исторической эволюции. Ключом к пониманию этого процесса является феномен изменения языка. Чтобы разобраться с изменениями языка там, где мы имеем дело с грамматикой, необходимо сначала выяснить, что именно создается и передается (ответ: конструкции). Дальше необходимо понять, почему грамматические конструкции меняются в ходе исторического процесса. Затруднение состоит в том, что для эффективной коммуникации между всеми членами группы, особенно когда они принадлежат к разным поколениям, было бы разумным сохранять неизменными коммуникативные конвенции, включая грамматические. Итак, возникают вопросы: кто и зачем меняет их (ответ: нарочно этого не делает никто) и в какой модальности это происходит (ответ: и в жестовых, и в звучащих языках).
Коммуникантам нет необходимости изобретать абсолютно новые способы составления сложных высказываний для каждого речевого события — и у них нет «правил», добытых из книг по грамматике (хотя такое и случается). Дело в том, что они не используют разрозненные слова и отдельные грамматические средства: у них наготове внутренне структурированные «расфасовки» доступных в языковом сообществе коммуникативных конвенций, известных как языковые конструкции. Последние представляют собой сформированные осмысленные структуры, которые подходят для применения в повторяющихся (рекуррентных) типовых коммуникативных ситуациях. Такие структуры могут состоять из слов и фраз, например: «Как дела?», «До встречи», «Понятия не имею» (англ. «How ya doin’?», «See ya later», «I dunno»). Эти структуры могут и не содержать какие-то конкретные слова, а быть абстрактными паттернами некоторого типа слов, как, например, страдательный залог (X was VERBed by Y ‘X был ГЛАГОЛен Yom’) или прошедшее время (VERB + ed ‘ГЛАГОЛ + ен’).
Одно из самых значительных теоретических продвижений в лингвистике XX века произошло благодаря осознанию того, что конвенциональные грамматические конструкции могут приобрести характеристики гештальта и существовать независимо от значений отдельных слов, что создает для них определенную автономию на грамматическом уровне анализа (Langacker 1987; Fillmore 1989; Goldberg 1995; 2006; Croft 2001). Так, если вам скажут: The dax got mibbed by the gazzer ‘Дакс был смиббен газзером’, вы поймете (не имея ни малейшего представления о смысле отдельных слов), что газзер сделал что-то (что называется «миббить») с даксом (и мы рассматриваем эту ситуацию с позиции дакса как пациенса). На самом деле, во многих ситуациях гештальт-качества конструктов могут «перевешивать» значения отдельных слов. К примеру, книги по грамматике сообщат вам, что глагол «чихать» является непереходным, с единственным актором — тем, кто чихает. Но можно сказать что-нибудь вроде: Не sneezed her the tennis ball ‘Он чихнул ей теннисный мячик’, — и вот у вас уже появилась картинка, как его чихание переносит мячик к ней. Это перемещение мячика передается не столько глаголом «чихать», сколько всей конструкцией в целом (а это дитранзитивная конструкция — ditransitive construction). Не таким уж и преувеличением будет сказать, что сама конструкция — обобщенный паттерн — является языковым символом, хотя и комплексным, обладающим внутренней структурой (Goldberg 1995). Это означает, что языковые сообщества в процессе создания и распространения слов в своем лексиконе создают и распространяют и грамматические конструкции. Конструкции, включающие определенные слова и фразы, могут передаваться обычным для культуры способом: с помощью имитации. Но поскольку абстрактные конструкции, фактически, являются паттернами использования, их прямая имитация невозможна; скорее, детям приходится (реконструировать их в процессе приобретения индивидуального учебного опыта с опорой на примеры таких конструкций.
Но ни слова, ни грамматические конструкции не передаются со стопроцентной точностью. Все, что нужно сделать человеку, который является носителем английского языка и хочет в этом убедиться — это попробовать почитать любое из произведений Чосера. Большая часть текста окажется непонятной, хотя разница составляет всего несколько столетий. Современная лингвистика началась с открытия, что почти все европейские языки, существующие и в таких далеких странах, как Индия, имеют общий источник: их предком является протоиндоевропейский язык (proto-Indo-European). Большинство языков, на которых сейчас говорят в Европе, развились и дифференцировались всего за несколько тысячелетий. И эта дифференциация затронула не только слова: грамматические конструкции в этих языках также развились и обособились друг от друга. За период всего в несколько столетий английский язык, к примеру, для обозначения того, кто, что, кому сделал совершил переход от использования главным образом падежного маркирования к использованию главным образом фиксированного порядка слов. Пережитки старой системы падежной маркировки до сих пор заметны в местоимениях: I-me, he-him, she-her и так далее. Если мы хотим понять, как языковые конструкции возникают и передаются от поколения к поколению, придется начать с анализа изменений, протекающих в языке.
Любые особи, принадлежащие к любому социальному виду (всего лишь за одним исключением), могут эффективно общаться между собой, используя присущие им сигналы и сформировавшиеся у них коммуникативные проявления (communicative displays), которые остаются практически неизменными в ряду поколений. Даже птицы, поющие на разных диалектах, могут распознать песни друг друга и должным образом на них ответить. У этого правила есть лишь одно исключение, имя которому человек. Представители рода человеческого говорят на более чем 6000 языков, и говорящие на одном из них не могут понять тех, кто говорит на другом. Более того, носители одного и того же языка, жившие в разные эпохи, также испытали бы значительные затруднения, пытаясь понять друг друга (примерно как Чосер и мы). Объяснить этот феномен несложно: людские языковые сообщества постоянно переизобретают свой язык, и делают они это неосознанно.
Создание и изменение языка можно назвать «феноменом третьего типа» (который, вслед за Адамом Смитом, называют также феноменом невидимой руки; Keller 1994). Наряду с инфляцией, истощением ресурсов и другими феноменами социального уровня, они являются следствием целенаправленных людских действий, хотя ни один индивид, ни даже группа индивидов не стремилась к тому, чтобы это произошло. Создание и изменение языка являются следствиями открытости и динамичности человеческого общения, в котором собеседники производят постоянную настройку друг на друга, стремясь к эффективной коммуникации и достижению других социально заданных целей, в зависимости от обстоятельств и степени взаимопонимания. Хотя исследований, посвященных когнитивной составляющей данного феномена, пока существует немного, ниже приведено объяснение его механизмов, которое согласуется с языковыми явлениями, наблюдаемыми рядом специалистов (Croft 2000; Dahl 2004; Deutscher 2005).
Когда люди разговаривают между собой, коммуникант старается быть эффективным: изложить информацию как можно более четко, использовав при этом минимальное количество средств. Реципиент заинтересован в получении того количества информации, которое позволит ему правильно понять сообщение. Он использует не только речь, но и совместные знания, общие знания, которые связывают его с говорящим. Итак, если я спрошу: «Где Джефф?», уместно будет дать такие односложные ответы, как: «В Нью-Йорке», «Спит», или любые другие, содержащие только ту информацию, которая мне нужна. Общая информация остается за скобками: нет нужды говорить: «Джефф в Нью-Йорке», «Джефф спит». Если мне зададут вопрос, ответ на который мне неизвестен, мой ответная реплика на разговорном английском будет плохо понятна тому, кто не является носителем этого языка. Тем не менее, я уверен, что мое краткое «I dunno» (англ. «Я не знаю», сокр. «I don’t know») будет понято вполне однозначно, ведь количество возможных ответов совсем невелико. В определенных ситуациях, когда у людей много общего, как, например, у зубного врача и его ассистента, которые годами работают вместе, возникает особый сокращенный код. С помощью такого кода информация передается эффективно и очень кратко: взаимный опыт успешно заменяет проговаривание. Слова, несущие малую информационную нагрузку и находящиеся в легко предсказуемых местах, в повседневной речи произносятся нечетко, со слабой артикуляцией; к примеру, выражение отказа может звучать как «m-busy» вместо «I am busy» (англ. «Занят» вместо «Я занят»). Основной принцип здесь таков, что чем больше совместных знаний и предсказуемого контекста имеется у собеседников, тем более краткими по форме становятся их высказывания. Стремление к краткости сдерживается только ограниченной способностью партнера к пониманию.
Итак, высказывания в ситуациях языкового общения представляют собой своеобразные компромиссы между стремлением коммуниканта сделать сообщение понятным с помощью минимального количества слов, и желанием реципиента получить всю информацию, необходимую для понимания. Это происходит на двух уровнях. Во-первых, дикурсивная последовательность со сложными интонационными контурами (intonation contours) сокращается до единой конструкции, как правило, произносимой в рамках одного интонационного контура. Ниже приводятся несколько примеров, основанных на книге Т. Гивона (Givon 1979), хотя во многих случаях записи не дают достаточной уверенности в деталях:
• Независимые дискурсивные высказывания вроде Не pulled the door and it opened ‘Он потянул на себя дверь, и она открылась’ могут видоизменяться в результативные конструкции (resultative constructions) типа Не pulled the door open ‘Он потянул на себя дверь, (чтобы) открыть’
Независимые дискурсивные высказывания вроде Му boyfriend… Не plays piano… Не plays in a band… ‘Мой парень… Он играет на фоно… Он играет в группе’ могут превращаться в Му boyfriend plays piano in a band ‘Мой парень играет в группе на фоно’; аналогичным образом, Му boyfriend Не rides horses Не bets on them ‘Мой парень… Он ездит на лошадях… Он делает на них ставки’ становится Му boyfriend, who rides horses, bets on them ‘Мой парень, который ездит на лошадях, делает на них ставки’ (относительное придаточное предложение — relative clause construction).
Если кто-то, к примеру, выражает уверенность в том, что Мэри выйдет замуж за Джона, его собеседник может ответить согласием — 1 believe that ‘Я верю в это’, — затем повторно выразив свое убеждение: Mary will wed John ‘Мэри выйдет замуж за Джона’, — что вместе и образует предложение: I believe that Mary will wed John ‘Я верю, что Мэри выйдет замуж за Джона’ (сентенциальное дополнение — sentential complement construction).
Первоначально независимые высказывания 1 want this I buy it ‘Я хочу это… Я куплю это’ трансформируются в конструкцию I want to buy it ‘Я хочу это купить’ (инфинитивное дополнение).
На другом уровне цепочки слов, состоящие из большого количества слогов, сокращаются до меньшего количества слов и слогов. Простейшим примером из английского языка является показатель будущего «gonna» (букв. — напр., «(я) собираюсь», «(ты) собираешься и т. д. — Прим, пер.), произошедший из слияния слов «going» и «to». Первоначально «going» — это «идти», глагол движения, часто используемый с предлогом «to», указывающим направление. Пример: «I’m going to the store» (англ. «Я иду в магазин»). В некоторых случаях «going to» используется для указания действия, которое станет возможным как раз благодаря тому, что индивид движется в заданном направлении. Например:
— Why are you going to London? ‘Почему ты едешь в Лондон?’
— I’т going to see ту bride ‘Я собираюсь увидеться с моей невестой’
В дальнейшем конструкция приобрела следующий вид: I’т gonna VERB ‘Я собираюсь ГЛАГОЛ’, — где «gonna» указывает уже не на намерение сделать что-то в будущем, а на будущее время как таковое (необязательно включая компонент движения или намерения, подробнее об этом см. Bybee 2002). Этот дополнительный элемент — обозначение намерения, которое первоначально было всего лишь возможной импликацией — мог возникнуть только из совместных для собеседников знаний. Ниже приведены другие хорошо известные примеры:
• Основной показатель будущего времени в английском языке, «will», произошел от полноценного смыслового глагола «хотеть». Пример: «I will it happen» (англ. «Я желаю, чтобы это случилось»). Впоследствии это выражение приняло вид «It’ll happen» (англ. «Это случится»), а «волевая» составляющая глагола поблекла.
Английские фразы «on the top of» и «in the side of» сократились до «on top of» (англ, «на вершине», «над») и «inside of» (англ, «внутри»), а потом и вовсе стали предлогами «atop» и «inside». В некоторых языках слова, служебные слова, подобные этим предлогам, в свою очередь, присоединяются к существительным как падежное окончание, выступая показателями падежа, обозначающего место (locative case markers).
Во французском языке основным отрицанием является конструкция «ne…pas», как в предложении «Je ne sais pas» (франц. «Я не знаю»). Сегодня в разговорном французском «ne» используется все реже, а основным маркером отрицания становится «pas», которое когда-то обозначало «шаг» в выражениях, аналогичных по смыслу английским «not one bit» и «not one step further» (англ, «нисколько» и «ни на шаг»).
Ключевыми составляющими этого процесса являются развитие и распространение возникших изменений на все языковое сообщество (к примеру, распространение новообразования в зависимости от социального положения см. Croft 2000). Для нас особый интерес представляет передача языка от поколения к поколению. Вспомним, что, объясняя возникновение языковых конвенций в истории человечества, мы постулировали наличие некоторого «дрейфа к произвольности», основанного на факте существования лиц, не обладающих всей полнотой контекста, на которой строится «естественность» разговорного языка. Таким «аутсайдерам» тяжело даются понимание и анализ коммуникативных знаков, которые используются окружающими. Похоже, нечто подобное происходит и с грамматикой. Дети слышат речь и просто хотят научиться тому, что умеют взрослые — они не знают, да и не хотят знать о том, каковы первоисточники той или иной конструкции. Представим, что дети слышат фразу, части которой отсутствуют, или их трудно расслышать, или они их не знают. Им может показаться, что такая фраза работает по-другому, нежели это подразумевает произносящий ее взрослый. То есть, дети сами угадывают, какую коммуникативную функцию обслуживает та или иная часть фразы. Это называется повторным функциональным анализом (functional reanalysis), который проистекает из попытки «понимающего» (comprehender) делать две вещи одновременно. С одной стороны, он пытается понять смысл всей фразы: что именно говорящий хотел от меня, что мне надо сделать, узнать, почувствовать? Но, кроме этого, они приписывают некоторое значение (blame assignment process) каждому элементу: какую роль он сыграл в построении общего смысла? Так, если ребенок слышит, как взрослый говорит: «I’d better go» (англ. «Мне лучше уйти», сокращение от «I should better go», которое буквально переводится: «Мне следует лучше уйти», где долженствование передается модальным глаголом «should»), он может пропустить «’d» и предположить, что «better» (англ, «лучше») является модальным вспомогательным глаголом, как во фразах «I must go», «I should go» и «I can go» (англ. «Я должен идти», «Мне следует идти» и «Я могу идти»). Такое значение слова «better» отличается от того, которое подразумевал взрослый. Если в какой-то момент появится большое количество детей, использующих слово «better» в новом значении, то оно станет новым модальным глаголом английского языка, таким, как повсеместно используемый «must». Такой переанализ происходит постоянно, и даже распространяется по аналогии на похожие конструкции (подробное изложение процесса см. Croft 2000).
Иллюстрацией к описанному нами циклу может служить рис. 6.2. Когда степень предсказуемости велика благодаря общему контексту, собеседники автоматизируют и сокращают языковые конструкции, что делает их трудными для понимания теми, кто только учит язык. Новички, в свою очередь, производят повторный анализ конструкций, после чего сокращенные, видоизмененные формы вновь объединяются в дискурсе, и весь процесс начинается заново. Так же и в случаях, когда детям приходится восстанавливать из речи взрослых обобщенные конструкции, «соскальзывание» в передаче значения может произойти, если влияние этих конструкций распространяется на другие случаи: в результате дети получают немного другие конструкции, чем те, которыми пользуются взрослые. Пример из английского языка: когда взрослые начинают реже употреблять неправильные глаголы в прошедшем времени (для глагола «sneak» — «прокрадываться» — это «snuck», для глагола «dive» — «нырять» — это «dove»), дети начинают обращаться с этими глаголами как с правильными (т. е. просто прибавлять окончание «-ed», когда требуется употребить глагол в прошедшем времени: «sneaked» и «dived»). Это происходит потому, что для закрепления форм-исключений необходимы постоянные и многочисленные примеры их использования, в противном случае побеждает общее правило (Bybee 1995).
Рис. 6.2
Как это нередко бывает, в своем экскурсе в лингвистику я чрезмерно все упростил и упустил важные детали. Но это произошло потому, что для достижения нашей цели нам надо лишь прийти к достаточному уровню понимания описываемых процессов. Это позволит выделить два ключевых момента, находящихся в особом отношении к рассматриваемому нами процессу совместной намеренности. Во-первых, конвепционализация грамматики, как мы ее описали, имеет место лишь в том случае, когда коммуникант и реципиент вовлечены в общую деятельность и объединены целью достичь взаимопонимания. Это, как мы говорили выше, определяет результат процесса грамматикализации как компромисс между нуждами коммуниканта и реципиента. Компромисс возможен лишь в том случае, когда участники коммуникации работают вместе для достижения общей цели: верного понимания реципиентом сообщения коммуниканта, и при том условии, что каждый из участников следит за действиями другого. К примеру, реципиент подает сигнал о понимании или непонимании, а в ответ на это коммуникант может изменить формулировку своего сообщения. Этот процесс в корне отличается от компромисса коммуниканта и реципиента в общении человекообразных обезьян, который был описан в главе 2. В общении обезьян каждый индивид оканчивает фразу своим индивидуальным сигналом, который распознается другими. В доказательство наших построений можем еще раз заметить, что, согласно всем имеющимся у нас данным, представители ни одного биологического вида, кроме человека, не просят коммуниканта пояснить сообщение и не повторяют его для реципиента.
Во-вторых, создание и изменение грамматических конструкций, особенно в процессе повторного анализа, в значительной мере зависит от того, как функционируют совместные знания и совместное внимание. В особенности изменениям подвержены те элементы языковой коммуникации (простые и составные), которые, благодаря тому, что собеседники могут использовать общий контекст, легко считываются, несмотря на слабость языкового сигнала. Это хорошо для знающего (cognoscenti), но для новичков, таких как дети, языковые конструкции оказываются менее прозрачными, так что им приходится просто заучивать сочетания формы и функции. Делая это, они вовлекаются в процесс образования значений и определяют, какие части конструкции управляют той или иной функцией, и их выводы могут отличаться от знаний опытных участников коммуникации. Наше важнейшее предположение заключается в том, что конвепционализация грамматических конструкций — грамматикализация и сходные процессы — может проходить только у тех видов, которые обладают когнитивными навыками по созданию фонда совместных знаний в совместном внимании, и в сообществах, социально организованных настолько сложно, что разные индивиды обладают разными совместными знаниями (см. Croft 2000). Следовательно, если мы попытаемся «познакомить» представителей различных видов «говорящих» обезьян, то, даже если они попытаются общаться и продемонстрируют свои «языковые» знаки друг другу, эти знаки и их комбинации не будут развиваться, поскольку обезьяны не конструируют никакого общего контекста во время своей коммуникации.
Итак, можно сказать, не боясь противоречий, что человеческие навыки языковой коммуникации разнообразны и берут начало из нескольких источников. Основополагающий аспект, связанный с кооперативной коммуникацией, сформировался в основном благодаря эволюционным процессам. Но актуальное создание языковых конструкций и конвенций, которые люди используют, чтобы структурировать свое речевое взаимодействие в рамках того или иного языка, зависит как от культурно-исторических процессов, которые стоят над индивидами, так и от психологических процессов, протекающих в онтогенезе социального научения, совместного внимания, построения аналогий и других. Совместная намеренность, присущая коммуникации с общей целью и в рамках совместных понятийных представлений, сочетается со способностью человека к разнообразной переработке информации и к автоматизации. Благодаря этому отдельным языковым сообществам предоставляется возможность для создания и развития языка, и такой процесс мы наблюдаем в течение культурноисторического времени.
Эмпирически установлено, что мировые культурные общности сформировали разные наборы языковых конвенций и конструкций, основанных на очень разных грамматических принципах. Все эти конвенции и конструкции можно «распихать» по разным категориям, взятым из современной и классической лингвистики, но остается неясным, целесообразно это или нет. Пока что лингвисты наконец согласились, что несправедливо увязывать все европейские языки с латинской грамматикой, как это было принято раньше, и что нет смысла подгонять все недавно открытые «экзотические» языки под категории классической европейской грамматики: не следует искать в них подлежащие, прямые дополнения, придаточные предложения и все прочее.
Лингвисты-типологи занимаются изучением языкового разнообразия; те из них, кто не занимается укладыванием всех языков на прокрустово ложе индоевропейской семьи, сообщают о невероятном множестве странных средств, которые используются разными языковыми сообществами для грамматического структурирования своих высказываний (Croft 2003). Так, слова одних языков имеют множество мелких морфологических окончаний, в то время как другие языки обходятся вовсе без них. Некоторые языки разбивают сложные явления и идеи на мелкие единицы, для каждой из которых существует отдельное слово, а в других языках сложные явления обозначаются одним словом. Часть языков работает с категориями подлежащего и прямого дополнения, в то время как другие языки обходятся без них. В каких-то языках существительное и глагол имеют резкие различия, в других есть один класс слов, которые могут играть обе роли (например, английские слова «brush» и «kiss», каждое из которых может оказаться как существительным «щетка»/«поцелуй», так и глаголом — «чистить»/«целовать»). В одних языках распространены вложенные конструкции, например, придаточные предложения, а в других они встречаются крайне редко. Какие-то языки строят именные группы, в которых все элементы держатся вместе (например, «большая зеленая рыба»), для других языков свойственно «раскидать» их по всему предложению. Языки уникальны по своему набору предлогов, вспомогательных и модальных глаголов, спряжений, артиклей, наречий, междометий, союзов и местоимений. Некоторые языки позволяют говорящему беззаботно пропускать референтные члены предложения (referential terms), когда референт подразумевается (эллипсис; т. е. пропуск члена высказывания, легко восстановимого в данном речевом контексте. — Прим. пер.) а в других этого делать нельзя. И это лишь мелкая рябь, бегущая по поверхности моря чудес, которыми полны все языки мира.
Но не стоит забывать и о языковых универсалиях. Может быть, они не так очевидны, как это представлялось ранее. И состоят они не из особых синтаксических средств или конструкций, а из общих ограничений или функций. Доводом в пользу существования языковых универсалий является тот факт, что люди, говорящие на любом языке мира, одинаково осмысляют мир с помощью таких единиц, как агенсы, совершающие действия с объектами; объекты, перемещающиеся с место на место; события, влекущие за собой другие события. В языках отражаются люди, постигающие разные явления, люди воспринимающие, думающие и чувствующие, люди, которые общаются и взаимодействуют между собой — и за всем этим многообразием стоит простое разграничение на события и их участников. Другим доводом служит большой набор коммуникативных функций, необходимых всем людям, каким бы языком они не пользовались. Их существование обусловлено общими для всего человечества мотивами и социальными устремлениями. Люди просят нужные им вещи, передают другим важную информацию и делятся тем, что у них есть. Еще один довод заключается в том, что носители разных языков одинаково управляют вниманием окружающих. К примеру, они по-разному преподносят то, что уже попало в поле внимания (темы), и совершенно новую информацию (ремы). Люди во всем мире получают и перерабатывают информацию одними и теми же способами, основанными на процессах зрительного восприятия, категоризации, аналогии, автоматизации, рабочей памяти и усвоении культуры (cultural learning). Именно в этих пределах и разворачиваются процессы языковой коммуникации, конвенционализации и овладения языком. Люди всего мира обладают одинаковым слухоречевым аппаратом и одинаково обрабатывают поступающую через него информацию. Если вернуться на ту позицию, с которой мы рассматриваем все явления — навыки и мотивы индивидуальной и совместной намеренности, — то обнаружится и еще один довод: люди всего мира тоже похожи, в том числе общей эволюционной историей использования указательного жеста и пантомимы в кооперативной коммуникации.
В связи с этим возникает вопрос: может быть, у людей существуют некоторые общие языковые и грамматические принципы, формирование которых не зависит от процессов познания и общения? Наиболее известная теория, разрабатывающая это предположение, принадлежит Хомскому. Гипотеза, из которой он исходил при построении своей универсальной грамматики, была вначале весьма прямолинейной, в результате чего туда попали существительные, глаголы и общие правила грамматики европейских языков. Впоследствии оказалось, что в эти построения не укладываются языки других семейств, и гипотеза изменилась, чтобы включить в себя весьма общие лингвистические понятия, вероятно, представляющие универсальную внутреннюю структуру языка — такие, как ограничение действия трансформаций только одним нижележащим уровнем (subjacency constraint), принцип пустой категории (the empty category principle), теза-критерий (the theta-criterion), принцип проекции (the projection principle) и другие. Но оказалось, что все эти вещи полностью зависят от породившей их теории, и от них пришлось отказаться. Сейчас предполагают, что в лингвистике существует всего один принцип анализа — принцип рекурсии (recursion), и возможно, что он распространяется не только на лингвистику (Hauser, Chomsky, Fitch 2002). Таким образом, гипотеза Хомского о врожденной универсальной грамматике на сегодня не имеет логически связной формулировки (Tomasello 2004).
Несомненно, что существуют универсальные вычислительные ограничения (universal computational constraints), в которых языки могут возникать, усваиваться и изменяться, и даже импликативные универсалии: если язык выполняет функцию X некоторым способом, то почти всегда это означает и то, что функция Y будет выполняться аналогично (Greenberg 1963). Вопрос в том, нужно ли нам искать врожденную универсальную грамматику, чтобы делать предположения о таких вещах. В недавних исследованиях множество импликативных универсалий и ограничений удалось рассмотреть исходя из общих принципов работы процессов обработки информации у людей (Hawkins 2004) и того, как они побуждают сосредоточить внимание на элементах разных конструкций (Goldberg 2006). С этой точки зрения, универсальные вычислительные ограничения во всех языках выражают общие когнитивные, социальные и слухоречевые принципы и ограничения, берущие начало в психологическом функционировании человека. Становлению языка предшествовали начальные этапы человеческого познания и социализации (sociality), которые, если следовать нашей гипотезе, предоставили все необходимое для его формирования. Мы не говорим о том, что эволюция универсальной грамматики или других врожденных синтаксических форм невозможна. Заметим лишь, что на сегодняшний день нет эмпирических доказательств их существования, нет точной теоретической формулировки для их обозначения — да и нет необходимости их искать, если мы правильно понимаем природу языка.
Наш вывод заключается в том, что даже если многие аспекты языковой способности имеют под собой биологическую основу, к ним не относятся грамматические принципы и конструкции. Все универсалии в грамматической структуре различных языков произошли из более общих процессов и ограничений человеческого познания, общения и слухоречевого восприятия, которые действуют на протяжении всего времени конвенционализации и передачи определенных грамматических конструкций в рамках конкретных языковых сообществ. Не так легко дать ответ на вопрос о том, почему группы людей создали свой собственные языковые конвенции, включая грамматические, которые к тому же невероятно быстро меняются. По-видимому, здесь отражаются более масштабные процессы, характерные для культуры в целом: люди рождены, чтобы подражать и уподобляться тому, кто их окружает, и язык — лишь одно из проявлений этого. Наиболее правдоподобное объяснение существования различных языков заключается в том, что это отвечает потребности одной группы людей отграничить себя от других групп, и язык служит барьером, не позволяющим пришельцам становиться полноправными членами общества. И напротив, как было показано выше, использование языка в повествованиях, позволяющее поделиться опытом и выразить отношение к происходящему вокруг, является основным путем сплочения культурных групп, которые с помощью языка выстраивают свою внутреннюю идентичность. Большинство изменений в грамматической структуре языка происходит из-за беспорядка, который устраивают дети, пытаясь вычленить обобщенные конструкции из имеющихся случаев их употреблений, причем опыт каждого ребенка уникален (Croft 2008).
Современные когнитивные науки не формулируют ясно, что мы имеем в виду, когда используем понятия «грамматика» или «синтаксис». На самом деле, имеется целый ряд недавних исследований, в которых дети и человекообразные обезьяны обнаруживали повторяющиеся (рекуррентные) паттерны в потоке искусственно синтезированных звуков; это принято называть «грамматическим научением» («grammar learning»; более осторожные исследователи говорят «statistical learning» — букв, «статистическое научение»), хотя звуки не имеют ни смысловой нагрузки, ни коммуникативного значения. Это не то, что я на протяжении всей книги называю грамматикой. Грамматика предполагает наличие по меньшей мере интенциональной коммуникации, а затем грамматические средства и конструкции структурируют многоэлементные высказывания так, чтобы они стали функционально осмысленны. И конвенциональные грамматические средства и конструкции, и простые конвенции (такие, как слова) являются культурно-историческими продуктами, созданными определенными культурными группами для удовлетворения своих коммуникативных потребностей. Языковые универсалии порождаются сообществами из социальных, когнитивных и слухоречевых «сырьевых» материалов, которые и стимулируют, и ограничивают процесс конвенционализации. По мнению Э. Бейтс (Bates 1979), в языке есть универсалии, поскольку люди по всему миру должны выполнять одни и те же коммуникативные «обязанности» и при этом обладают одинаковыми когнитивными и социальными орудиями для этого.
Следовательно, сложность при попытке реконструировать эволюцию языковой коммуникации, построенной на фундаменте кооперативной коммуникации людей в целом, заключается в том, что в человеческих группах имеются как универсалии, так и своеобразие. Это позволяет предположить, что где-то в Африке имелась некая группа, состоявшая из представителей современного человечества, которая долго шла к современным звучащим языкам (неизвестно, насколько долгим был этот путь), но затем, когда подгруппы из членов этой большой группы стали распространяться по всему миру, они конвенционализировали свои собственные языковые конвенции и конструкции. Все эти группы, естественно, сохраняли одинаковые когнитивные, социально-когнитивные, коммуникативные и слухоречевые возможности, и поэтому процесс конвенционализации происходил по одним и тем же законам для всех них.
Ответ на вопрос о том, откуда взялась грамматика, таков: много откуда. Уже человекообразные обезьяны связывают жесты в последовательности, чтобы общаться друг с другом. «Говорящие» обезьяны даже порождают истинные сочетания, в рамках которых разбивают предполагаемое сообщение на несколько элементов, которыми часто являются события и их участники. Когнитивная структура этого «простого» синтаксиса имеет тем самым очень глубокие эволюционные корни. И пока мотив коммуникации — это разновидность простого запроса («я хочу, чтобы ты сделал нечто здесь и сейчас»), не возникнет необходимость в более сложном грамматическом структурировании высказываний.
Как только кооперативная коммуникация и мотив информирования, структурированные совместными знаниями и коммуникативными намерениями, возникли, люди стали общаться друг с другом значительно более сложным образом. Грамматика информирования требует дополнительных средств для определения того, о каких именно событиях и участниках идет речь (возможно, с помощью сложных, но логичных составляющих, помещающих их в контекст текущей структуры совместного внимания), и маркирования ролей, которые они играют в данных событии или ситуации. А когда мне нужно рассказать о целой последовательности событий — например, о том, что со мной случилось во время вчерашней охоты, — грамматика со-участия и нарратива, обладающая даже большим количеством грамматических средств, необходима для связывания событий друг с другом и отслеживания их участников. Эволюционные корни грамматик информирования и со-участия в повествовании проистекают из базовых компетенций кооперативной коммуникации и ее сложного фундамента, основанного на совместной намеренности. Но реальные грамматические конвенции, конечно, формируются вследствие не эволюционных, а культурно-исторических процессов (т. н. «невидимая рука» — «invisible hand»), совокупность которых мы назвали процессом конвенционализации грамматических конструкций.
Таким образом, грамматические конструкции современных языков человечества представляют собой продукты длинной и сложной последовательности событий в человеческой истории, включавшей в себя и эволюционные, и культурные процессы, которые разворачивались в рамках ограничений, накладываемых основными когнитивными и социально-когнитивными процессами. Большая часть этого произошла в жестовой модальности, что объясняет, почему жестовые языки способны сегодня так внезапно и легко возникнуть. Формирование и модификация грамматических конструкций возможны, на текущий момент, лишь потому, что коммуникация людей друг с другом представляет собой совместную деятельность с общей целью, а коммуникант оставляет многое невысказанным, если предполагает, что это понятно в силу наличия совместных знаний и поэтому прагматически прогнозируемо реципиентом, вследствие чего люди, находящиеся за пределами этого кокона совместного внимания, часто анализируют то, какие части высказывания выполняют соответствующие функции новым для них образом. Даже на самых поздних стадиях процесса эволюции языка основополагающие навыки и мотивы разделения совместных намерений, с которых для человечества начался путь кооперативной коммуникации, остаются в его основе.