СООТНОШЕНИЕ КАТЕГОРИЙ КОЛИЧЕСТВА И КАЧЕСТВА В СИСТЕМЕ ЯЗЫКА

Соотношение категорий качества и количества в языке и языкознании (канд. филол. наук Л.М. Гриднева)

В процессе конкретного научного познания переход от незнания к знанию является переходом от неопределенности к определенности, то есть переходом от неразличения и невозможности выделить предмет познания в данном разнообразии к различению, возможности мысленно выделить этот предмет среди других.

«Сначала мелькают впечатления, затем выделяется нечто, – потом развиваются понятия качества (определения вещи или явления) и количества» [1, 301].

Качество в методологическом плане – определенность предмета познания – устанавливается отождествлением и разграничением его с другими предметами при необходимом условии – целостном восприятии признаков, абстрагировании от внутреннего разнообразия выделенного предмета. Данная категория может иметь методологическое значение вне отношения «качество – количество». В некоторых науках (химии, геологии, лингвистике и др.) исследователи часто ограничиваются качественным описанием, если нет необходимости или возможности обратить внимание на степени проявления каких-либо признаков и отношения неравенства между ними.

Вообще говоря, такое положение было доминирующим в большинстве отраслей познания до XX ст.; современное развитие наук состоит именно в переходе к изучению наряду с качеством количества и количественных отношений. Познание становится более результативным тогда, когда после качественного подхода используется категория количества и соответствующий метод. Знание количества сопровождается мысленным отвлечением от целостности предмета; внимание направляется на внутрикачественные различия, степени проявления, степень интенсивности определенных признаков.

Зависимость количества от качества состоит в том, что познание качества необходимо предшествует количественной определенности однокачественных предметов, подготавливает условия познания количества; например, формирует конкретное множество дискретных предметов и тем самым создает условия для счета. Это значит, что традиционные методики качественного анализа предметов познания с развитием конкретных наук никоим образом не утрачивают своего значения.

Существуют разные уровни познания количества; им соответствуют многообразные формы перехода от качества к количеству. Основные из них:

1) чувственно-непосредственное познание;

2) первичное абстрактное познание количества, для выражения которого используется естественный язык, обладающий большим арсеналом нужных для этой цели средств: числительные, местоимения и наречия типа все, некоторые, много, мало, категория числа изменяемых частей речи, сравнительная и превосходная степени прилагательных и наречий, антонимы и т.д.;

3) процедуры счета и измерения; здесь возможна простая констатация частотности и наиболее развитая форма перехода от качества к количеству – использование аппарата статистики или теории информации.

«Считай все, что можешь считать! – призывал в 70-х годах XIX века крупный английский ученый Френсис Гальтон. – Считай!.. Пока феномены какой-нибудь отрасли знания не будут подчинены измерению и числу, они не могут приобрести статус и достоинство науки» [21, 130].

Примерно так же говорил великий русский химик Д.И. Менделеев, давший миру необычайно важные и глубокие научные законы:

«Наука начинается тогда, когда начинаются измерения» [21, 130].

Замечательный языковед прошлого столетия Бодуэн де Куртенэ указывал на необходимость применять в языковедении количественное, математическое мышление, приближая таким образом его все более и более к точным наукам [2, 17].

Соотношение категорий качество и количество, представленное в виде закона, можно рассматривать в двух аспектах: онтологическом и гносеологическом. В зависимости от точки зрения необходимо различать два закона, которые описывают переход от одного состояния к другому и для формулировки которых используются названные категории.

Первый – закон перехода количественных изменений в качественные – универсальный закон диалектики, вскрывающий наиболее общий механизм развития. В онтологии отношения между элементами и место элементов в системе не зависят от исследователя. Задачей познания в данном случае является изучение количественных изменений в предмете познания, взаимодействия количественных и качественных изменений, проходящих через ряд промежуточных фаз, и, наконец, скачка от одного явления к другому, чему необходимо сопутствует преобразование всей системы связей между элементами целого и образование новой структуры целого.

Развитие любой системы всегда представляет собой переход от старого качества к новому, что связано прежде всего с количественными изменениями в данной системе. Процесс развития сочетает в себе диалектическое единство непрерывного и прерывного.

«Мир – это и не сплошной поток, и не стоячее озеро, а совокупность и относительно устойчивых и изменчивых систем» [26, 154].

Для обозначения постепенных количественных изменений и изменений отдельных свойств в рамках данного качества в языкознании существует принцип постепенного развития, понятие «эволюция». Любой живой язык постепенно изменяется, эволюционирует, тем самым предмет лингвистики подобен предметам естественных наук, например биологии, которая изучает эволюцию растительного и животного мира.

Естественный язык, выполняющий коммуникативную функцию, в отличие от искусственно созданных языков, находится в постоянном движении; он

«не является созданным, а непрерывно создается языковой деятельностью. Язык, в известном смысле, – это „результат“; в случае языка „результат“ является одновременно непосредственно „потенцией“, условием дальнейших актов. Если результат „окончателен“, то мы говорим о „мертвом языке“. Напротив, в той мере, в какой язык продолжает функционировать как таковой, результат никогда не бывает окончательным» [13, 157].

Наука о языке имеет дело с реальными динамичными системами, в которых наблюдаются остатки старых явлений, отражение настоящего и зачатки новых тенденций.

«Симметрия элементов системы то нарушается, то снова восстанавливается. Поэтому лингвист не в праве не видеть своей существенной задачи в изучении развития системы и ее элементов. Правда, на определенном этапе изучения он может абстрагироваться от диахронии и постараться объяснить механизм синхронно действующей системы языка, но полное и всестороннее изучение языков требует уделять диахронии столько же (если не больше) внимания, сколько и синхронии, причем одна из основных задач такого изучения – выявить, как взаимодействуют синхрония и диахрония в языке, т.е. уяснить, какие моменты развития являются релевантными при становлении системы» [15, 88].

Если рассматривать язык в течение длительного промежутка времени, то ясно, что он и не останется тем же самым языком, но и не будет совершенно другим.

«Именно то, что язык остается частично идентичным самому себе и одновременно включает в себя новые традиции, обеспечивает его функционирование как языка и его характер „исторического объекта“. Исторический объект является таковым только в том случае, если он одновременно есть непрерывность и следование» [13, 343].

Так, если сравнить русский язык XIII – XIV вв. с современным русским языком, выясняется, что за этот небольшой для истории языка промежуток времени морфологическая система претерпела значительные преобразования, хотя принципиально в грамматике мало что изменилось, то есть система частей речи в древнерусском языке в целом была той же, что и в современном. Категории, присущие именам, были теми же, что и в современном языке: категории рода, числа и падежа. Категория рода не изменилась совсем. Категории числа и падежа изменились: русский язык оставил в прошлом двойственное число и звательный падеж. Основное направление развития склонения существительных в древнерусском языке состояло в уменьшении значительного разнообразия форм: укрупнения некоторых типов склонения за счет утраты малопродуктивных склонений. Так, существительные с бывшей основой на согласный разошлись по разным типам склонений, условно называемым I, II, III, которые установились в русском языке в результате упрощения многотипности склонений существительных.

Глагольная система характеризовалась целым рядом категорий, которые присутствуют и в системе современного русского языка, но роль и формы их не совпадают с современными. Система времен включала в себя настоящее время, четыре прошедших, два сложных будущих времени. В результате разрушения и перераспределения системы вместо многочисленных старых времен в языке остались лишь три формы времени – настоящее, прошедшее, будущее; прежде всего вместо четырех прошедших времен – аориста, имперфекта, перфекта и давнопрошедшего времени – устанавливается одна, восходящая к перфекту [11; 30].

Очевидно, что изменения происходят в определенных точках системы, а именно в точках слабой функциональной нагрузки, в тех точках, где существует не единственно возможная, а множество реализаций, где нарушено равновесие системы (здесь имеют в виду, например, неиспользуемые признаки или неполные корреляции) и т.д. Количественные изменения и изменения некоторых свойств системы приводят к качественным преобразованиям, к появлению предмета с новой мерой, в которой заложена иная количественная определенность. Количественные изменения в системе бывают разные: изменение числа частей объекта, изменение характера связи элементов, модификация частных и изолированных элементов независимо от системных отношений. В том случае когда изменяется сеть отношений между элементами системы, говорят о структурных изменениях.

На протяжении своего развития язык не сразу отказывается от каких-то явлений; в нем еще долго можно наблюдать остатки утраченных элементов системы. Современная форма родительного падежа единственного числа с окончанием -у восходит к особому типу склонения, утраченному русским языком. То же самое можно сказать и о формах современного предложного падежа единственного числа и родительного падежа множественного числа. Двойственное число было утрачено во всей морфологической системе, но остались следы, указывающие на наличие этих форм в прошлом (формы множественного числа с окончанием на -а: глаза, берега). Частица чу является по происхождению формой аориста III лица ед. числа от глагола чути, а частица бы – формой II – III лица ед. числа аориста от быти [11; 30].

На разных уровнях современного языка обнаруживается целый ряд остатков старых явлений и отношений. Однако, как бы они ни были значительны, они нерелевантны, несущественны в системе современного языка. Так, в современном украинском языке присутствуют остатки явлений и законов, которые действовали еще в общеславянском языке. В частности, речь идет о законе открытого слога и судьбе редуцированных. Принято считать, что на базе отдельных славянских языков закон открытого слога прекратил свое существование, падение редуцированных способствовало прекращению действия праславянской тенденции к восходящей волне сонорности (открытого слога) [4; 16]. Однако никакой четкой границы между периодом действия этого закона и периодом появления так называемых новозакрытых слогов не существовало. Важнейшим результатом падения редуцированных гласных в славянских языках было появление самостоятельных мягких согласных фонем в позиции перед гласными переднего ряда, в частности перед ь. Письменная форма слов сохраняет слабый редуцированный ь и в конечной и в серединной позициях. Как показывает исследование, проведенное на материале Орфографического словаря современного украинского языка, комбинаторика мягкого знака, начиная с четвертой позиции в слове, подобна комбинаторике гласных, то есть он продолжает функционировать как гласный переднего ряда и имитирует слогообразующую роль [8, 12].

Итак, ясно, что в современном состоянии языка мы можем обнаружить архаизмы. Но поскольку они существуют и продолжают функционировать в языке, они являются элементами современного языка. Архаизм является более старым только с точки зрения данного момента языка; в более ранние века он мог не быть таковым. По-видимому, в современном состоянии языка намечаются будущие системы, которые, вообще говоря, на данном этапе представляют собой чистую возможность и вполне могут никогда не реализоваться; выявить это можно только ретроспективным путем.

«То, что называется изменением в языке, является таковым лишь по отношению к языку предшествующей эпохи, а с точки зрения современного языка это кристаллизация новой традиции, то есть как раз неизменение. Фактор прерывности по отношению к прошлому, изменение является в то же время фактором непрерывности по отношению к будущему» [13, 155].

Все это лишь подтверждает мысль, высказанную еще Ф. де Соссюром, о том, что в каждый данный момент речевая деятельность предполагает одновременно фиксированную систему и эволюцию [25].

Если перейти от онтологии к методологии, то есть от плана исследуемой действительности к плану исследования (в нашем случае от речевой деятельности или языка к теории лингвистики), здесь известные нам категории участвуют в формулировании совсем других законов – законов познания.

Закон перехода от качества к количеству и выявлению меры – закон познания. Речь идет не о количественных и качественных изменениях в предмете, а о познании качественной и количественной определенности этого предмета в их единстве, переход в этом контексте представляет собой развитие мысли, движение ее в сторону более глубокого знания о некотором предмете; задача познания – исследовать предмет всесторонне и как можно полнее.

Знание количественной определенности важно само по себе. Кроме того, оно ведет к углубленному познанию явлений. Количественные методы – это не только процедуры счета или измерения, то есть этап экспериментально-количественного исследования, но и дальнейшая обработка результатов анализа и получения в итоге более точного, глубокого знания о единстве качественного и количественного определений. Конкретные количественные данные обрабатываются и обобщаются таким образом, чтобы выявить меру[23] и закон взаимодействия свойств.

«Велика сила – познакомиться с эмпирическими силами природы… но бесконечно большая заслуга состоит в том, чтобы заставить исчезнуть эмпирические определенные количества и возвести их во всеобщую форму количественных определений так, чтобы они стали моментами некоторого закона или некоторой меры» [5, 400].

Количественные законы отличаются от других окончательной формулировкой: связь между явлениями формулируется как обобщенное отношение количественных характеристик. Количественные законы в сравнении с законами, которые не учитывают количественной определенности признаков, глубже и точнее описывают качество предмета познания, поскольку они устанавливают и конкретизируют определенную связь: прямую или обратную, линейную и т.д. Количественный закон может быть выражен лаконичными математическими средствами: формулами, графиками, таблицами, уравнениями, – а также с помощью естественного языка.

Переход от качества к выявлению меры и закона – это сложный, многоступенчатый процесс, разные этапы которого отличаются друг от друга формой, ценностью и содержательностью результатов и в целом способствуют переходу на более высокие теоретические уровни исследования. Границы обобщения знания мер и законов нет, как нет ее у познания.

Результаты счета или измерения, в какой бы науке они ни были получены, никогда не являются самоцелью, так как сами по себе они ничего не раскрывают. Количественные данные оправдывают себя лишь в том случае, если из этих данных можно сделать содержательные (качественные) выводы о свойствах, структуре, тех или иных характеристиках изучаемого предмета. Этап экспериментально-количественного исследования должен стать базой для обратного перехода от знания количества к знанию меры и закона; таким образом, достигается более глубокое знание о единстве качественной и количественной определенности.

Любой предмет познания в принципе требует и качественного и количественного подходов, а результатами исследований будут соответственно качественные и количественные законы. Специфика каждой отдельной науки состоит в большем или меньшем значении количественных методов и законов на том или ином этапе ее развития. В XX в. во многих отраслях знания современное развитие характеризуется преобладающей ролью количественных методов, большим вниманием к изучению количественных отношений. Возрастающая роль количественных методов в конкретных науках является одной из сторон усиления математизации научных знаний, что присуще наукам в период современной научно-технической революции.

Есть, по крайней мере, две причины увеличивающихся темпов математизации наук, которые можно объяснить с точки зрения общей теории познания: убыстрение темпов развития, углубление каждой конкретной науки; расширение границ самой математики, что дает возможность использовать математические методы в других науках [6, 3].

Количественные методы успешно используются для изучения очень широкого круга языковых явлений – от общих закономерностей дистрибуции фонем или графем, или слов в тексте до измерения степени генетического родства двух или нескольких языков. Приведем ряд примеров для иллюстрации действия закона двойного перехода – от количества к качеству и от последнего к мере – в языкознании, перехода от накопления разрозненных количественных данных к новым содержательным выводам на их основе, созданию новых гипотез, моделей, теорий.

Накопление статистического материала (частотных словарей) явилось основой для теоретических обобщений полученных данных. Наиболее известным в статистической лингвистике является так называемый закон Ципфа, устанавливающий зависимость между частотой слова и его номером в списке по убывающим частотам. Найденное соотношение послужило для Ципфа основой для утверждения «принципа минимального усилия» как фундаментального закона человеческого поведения (ср. с законом наименьшего усилия А. Мартине [14, 532]), а для других исследователей – отправной точкой для поправок, уточнений к закону, создания новых гипотез, отличных от ципфовской. Практический смысл закона Ципфа заключается в том, что он позволяет подсчитать пропорцию слов с заданным номером, рассчитать частоту слова по его номеру и обратно, решать различные задачи, для которых необходимы номера слов в частотном списке и соответствующие им частоты; закон широко используется при построении простых алгоритмов машинного распознавания темы документа.

Наблюдения над частотной структурой текстов различной длины и различных жанров на разных языках позволили исследователям И.Ш. Надарейшвили и Ю.К. Орлову сделать нетривиальные выводы, которые основываются на сложных математических построениях, но в своем окончательном виде не содержат ни одной формулы. Закон Ципфа – Мандельброта в его канонической форме присущ отдельному высокоорганизованному сообщению, а не языку или речи вообще; в нехудожественных текстах в целом этот закон выполняется хуже, чем в художественных, и разрушается на отрывках литературных произведений. Все это дало возможность высказать гипотезу о том, что, по-видимому, автор в процессе порождения текста (а читатель в процессе чтения) следит за частотной структурой текста и управляет ею, добиваясь того, чтобы закон Ципфа – Мандельброта был выполнен именно на полной длине текста.

«Не исключено, что авторы разной степени одаренности могут различаться „качеством“ этого механизма, способностью к точному выполнению обобщенного закона Ципфа – Мандельброта, и, может быть, степень точности выполнения закона как-то коррелирует с художественными достоинствами текста или с одаренностью его автора» [17, 552].

Исследователи, работающие в области стилостатистики, обрабатывают результаты статистических экспериментов таким образом, что бы выявить статистическую меру, которая выражала бы различия стилей. Такая попытка различения стилей на разных уровнях речи и языка была предпринята авторами монографии «Статистичнi параметри стилiв» [27]. Рассматривались частоты 74 разных явлений на различных уровнях языковой структуры: на фонологическом уровне – 17 явлений (группы фонем, типы слогов и т.д.), на морфологическом – 19 (флексии, глагольные формы, префиксы и т.д.), на синтаксическом – 21 (сказуемое в его окружении, длина предложения и т.д.), на лексическом – 17 (префиксальные словоформы, средняя длина слова и т.д.). Оказалось, что на каждом уровне языковой структуры – фонемном, морфемном, синтаксическом и лексическом – есть такие единицы, которые являются стилеразличительными параметрами. Более родственные стили выразительнее разграничиваются на синтаксическом уровне, менее родственные – на лексическом. Наилучшим образом разграничиваются две группы стилей: беллетристические и небеллетристические. Каждый отдельный стиль характеризуется как набором индивидуализирующих параметров, так и границами, в пределах которых изменяются частоты этих параметров. Обращает на себя внимание большое количество индивидуализирующих явлений на фонемном уровне в поэзии (частота гласных, мягких согласных, слога IVI). Очевидно, на подбор единиц фонемного уровня оказывают влияние правила ритма и рифмы, чего нет в других стилях.

Статистика не только подтверждает интуитивно ясные представления об особенностях стилей, но и позволяет установить такие закономерности, которые другим способом обнаружить невозможно. Например, поэзия характеризуется наиболее низкой частотой гласных (это верно не только для украинского языка, но и для других славянских языков [18]) и наиболее высокой частотой слогов типа IVI, сочинительных и подчинительных союзов.

Кроме стилевой дифференциации, статистические методы эффективно используются для внутренней характеристики стиля, описания литературного стиля отдельного автора, относительной хронологии работ одного и того же автора и т.д.

Количественные методы не являются чем-то новым для исторического и сравнительного языкознания. Так, еще в середине прошлого века Ферстеман исследовал распределение гласных и согласных в различных индоевропейских языках [32, 10].

При типологическом сравнении языков измерение степени сходства производится для того, чтобы использовать ее в качестве объективного критерия генетической близости между языками одной или разных языковых семей. Среди первостепенных задач современной типологии проф. В. Скаличка называет познание количественных отношений между некоторыми фактами определенных языков [23; 24]. В попытках создать типологию с преобладанием количественного момента лингвистика сближается с другими науками, особенно с психологией.

«Логика оказывает им помощь в стремлении заменить старую классификационную типологию типологией новой, типологией меры» [24, 31].

Результатом такого подхода к классификации у Э. Сэпира является многоступенчатая шкала, или лесенка, соседние ступени которой связаны между собой и на которых факты сопровождаются пояснительными замечаниями типа: сильно, слабо, гораздо, более и т.п. – приблизительной оценкой количественной определенности [22]. Многие исследователи стремятся оперировать точными числами. Количественный подход к типологии языков разрабатывался Я. Чекановским на основе некоторого числа фонологических и морфологических признаков [31], П. Менцератом и У. Майер-Эпплером на основе формальной структуры слов (числа слогов в слове, числа звуков в слове, типа слова, определяемого последовательностью согласных и гласных) [33; 34], Дж. Гринбергом на основе нескольких характеристик определенных типов морфем [9].

Ясно, что при разработке общей таксономии языков еще не одно поколение лингвистов будет использовать квантитативные методы. И всегда им должны быть близки слова одного из основоположников сравнительного и исторического языкознания Ф. Боппа о том, что исследование родства языков – это орудие проникновения в секреты развития языка.

«При историческом изучении языков, при определении степени родства различных языков речь идет не о том, чтобы установить внешние условия в известных частях грамматики, а выяснить, не обусловлены ли эти различия общими законами и нельзя ли вскрыть те скрытые процессы, посредством которых язык от своего предполагаемого прежнего состояния пришел к своему нынешнему (различия перестают быть различиями, как только устанавливаются законы)» [3, 35].

Можно говорить о возникновении в системе лингвистической и исторической науки особого направления, представители которого развивают теорию и практику дешифровки письменных текстов на базе статистических понятий. Б.В. Сухотин создал свою теоретическую и методическую концепцию лингвистической дешифровки. Алгоритм классификации букв Сухотина, основанный на вычислениях, может также служить примером того, что конечной целью количественных вычислений является получение чисто качественных выводов: результаты работы – чисто качественная классификация букв на гласные и согласные [28].

Некоторые из последних работ В. Ингве посвящены исследованию моделей устройства предложения, которые можно было бы использовать в качестве составной части программы синтеза при машинном переводе. Поскольку подход Ингве ориентирован на машинное использование модели синтеза предложения и описания его синтаксической структуры, то в основе его лежит требование о том, что устройство, порождающее предложения, должно иметь конечную оперативную память. В ходе обсуждения адекватности своей модели (гипотезы глубины) Ингве показал непосредственную связь между структурой дерева предложения и объемом оперативной памяти, который необходим для ее порождения.

Гипотеза глубины состоит в том, что многие из нераскрытых ранее особенностей английского синтаксиса можно понять, если принять во внимание ограничение объема непосредственны памяти человека (мы способны запомнить с одного взгляда и правильно воспроизвести около семи произвольно взятых цифр, слов, наименований; по-видимому, мы можем вспомнить сразу не более семи грамматических или синтаксических ограничений). Синтаксис английского языка располагает множеством средств, чтобы автоматически удерживать высказывание в пределах, диктуемых ограничениями объема памяти, а также обойти эти ограничения для сохранения экспрессии [12].

В. Ингве обобщил свои наблюдения в виде гипотезы о том, что различные языки ведут себя по отношению к глубине одинаковым образом.

«Эта гипотеза, несомненно, имеет значение не только для лингвистики, но и для психологии. Если проверка гипотезы Ингве на других языках даст положительные результаты, то этот механизм порождения предложений нужно будет принять в качестве модели порождения речи человеком – независимо от того, какова окажется роль этого механизма в машинном переводе» [20].

Категории количество – качество – мера представляют собой пример подсистемы диалектики как философской науки. Последняя является сложной системой, состоящей из подсистем взаимно связанных друг с другом категорий. Каждый из аспектов исследования количество – качество – мера, форма – содержание, часть – целое, элемент – структура – система, необходимость – случайность и т.д. дает возможность познать лишь одну из граней предмета. Синтез различных абстрактных методов помогает в какой-то степени разрешить противоречие между односторонностью отдельных методов и необходимостью расширения и углубления научных знаний.

В науке нет абсолютных методов – ограниченность, безусловно, присуща и количественному методу. Она необходима для более детального изучения отдельных сторон явлений. То, что сознательно и временно теряется при количественном подходе, восстанавливается при качественном подходе и синтезе обоих. То, перед чем бессильны количественно-качественные методы, познается в союзе с другими методами, при других подходах к предмету познания.

Особенную роль в усилении влияния количественных методов в разных науках, в частности лингвистике, играют моделирование, системный, структурный, функциональный методы. Каждый из них может быть использован сам по себе, независимо от других. Но более ценным является именно комплексное применение методов, при котором они дополняют друг друга.

Количественный подход играет в языковедении заметную роль. В последнее время область приложения количественного анализа значительно расширилась с использованием математической статистики и теории информации[24], что имело большое значение в становлении новых теоретических лингвистических дисциплин, таких, как структурная лингвистика, инженерная лингвистика, вычислительная лингвистика, и решении прикладных задач, таких, как машинный перевод, информационный поиск и т.д.

Непосредственным стимулом развития комплексных количественных исследований и идей квантитативной лингвистики является область знаний, связанных с моделированием процессов интеллектуальной деятельности и обработкой информации в коммуникационных системах «человек – ЭВМ – человек». Общение человека и электронной вычислительной машины с помощью естественного языка может осуществляться лишь при знании специфики функционирования языка в системе «человек – машина – человек». В память ЭВМ может быть введена модель, которая представляет собой сокращенное формализованное описание естественного языка, – машинный базовый язык.

«Построению машинного базового языка предшествует вероятностно-статистическое описание речи, выявляющее основные элементы и текстообразующие свойства конкретного языка. Это описание осуществляется с помощью последовательного использования различных вероятностно-статистических и информационных моделей все возрастающей сложности» [19, 59].

Начальным этапом этой работы является накопление статистических характеристик языковых единиц на разных уровнях языковой структуры, различные информационные характеристики текста, составление частотных словарей слов и словоформ как простейших вероятностно-статистических моделей текста, которые используются для обучения электронно-вычислительных машин.

Известно, что схема процесса познания состоит в переходе от живого созерцания к абстрактному мышлению, а от него – к практике. Математическое языкознание всегда было связано с практикой. Ценность его методологии заключается в том, что если с помощью квантитативных методов удается раскрыть механизм действия каких-либо структур, то такой механизм будет действовать с автоматической точностью. С теоретической точки зрения это значит, что языковедческая теория получает объективное подтверждение своей истинности и из гипотезы превращается в доказанную теорию. А с практической точки зрения это означает, что научные результаты можно передать машине и получить колоссальную экономию человеческих сил в переводе с языка на язык, в реферировании текстов, в дешифровке письменности и т.д. Интенсивная работа в таких областях, как машинный перевод, моделирование порождающих грамматик, построение программирующих языков для ЭВМ, является стимулом для развития квантитативной лингвистики и в будущем будет оказывать влияние на развитие лингвистики в целом.

«Описание и истолкование языка и речи, языковых и речевых стилей, функционирование языка и его развитие получат мощное усиление и обновление на основе органического синтеза качественных и количественных сведений и представлений – в полном соответствии с той реальностью, которую мы все привычно обозначаем словами „язык“ и „речь“» [7, 173].

Список литературы

1. Ленин В.И. Философские тетради. – М.: Политиздат, 1969. – 782 с. – (Полн. собр. соч., т. 29).

2. Бодуэн де Куртенэ И.А. Избранные труды по общему языкознанию. – М.: Изд-во АН СССР, 1963. – Т. 2. 891 с.

3. Бопп Ф. Сравнительная грамматика санскрита, зенда, армянского, греческого, латинского, литовского, старославянского, готского и немецкого. – В кн.: Звегинцев В.А. История языкознания XIX и XX веков в очерках и извлечениях. М.: Учпедгиз, 1960, ч. 1, с. 30 – 35.

4. Булаховский Л.А. Исторический комментарий к русскому литературному языку. – Киев: Рад. школа, 1950. – 412 с.

5. Гегель Г. Наука логики. – М.: Мысль, 1970. – Т. 1. – 501 с.

6. Глушков В.М. Гносеологические основы математизации науки. – Киев: Наук. думка, 1965. – 25 с.

7. Головин Б.Н. Язык и статистика. – М.: Просвещение, 1971. – 191 с.

8. Гриднева Л.М. Дистрибуция графем и порождение слога в современном украинском языке. Автореф. дис. … канд. филол. наук. – К., 1975. – 16 с.

9. Гринберг Дж. Квантитативный подход к морфологической типологии языков. – Новое в лингвистике, 1953, вып. 3, с. 60 – 94.

10. Зиндер Л.Р., Строева Т.В. К вопросу о применении статистики в языковедении. – Вопр. языкознания, 1968, № 6, с. 120 – 123.

11. Иванов В.В. Развитие грамматического строя русского языка. – М.: Учпедгиз, 1960. – 128 с.

12. Ингве В. Гипотеза глубины. – Новое в лингвистике, 1963, вып. 4, с. 126 – 138.

13. Косериу Э. Синхрония, диахрония и история. – Новое в лингвистике, 1963, вып. 3, с. 143 – 346.

14. Мартине А. Основы общей лингвистики. – Новое в лингвистике. 1968, вып. 3, с. 347 – 566.

15. Мачавариани М.В. О взаимоотношении математики и лингвистики. – Вопр. языкознания, 1963, № 8, с. 85 – 91.

16. Мейе А. Общеславянский язык. – М.: Изд-во иностр. лит-ры, 1951. – 491 с.

17. Надарейшвили И.Ш., Орлов Ю.К. Рост лексики как функции текста. – Сообщ. АН ГССР, 1971, 64, № 3, с. 547 – 552.

18. Никонов В.А. Интерпретация фонетических частот. – Учен. зап. АН СССР. Ин-т славяноведения, 1963, т. 17, с. 459 – 271.

19. Пиотровский Р.Г. Текст, машина, человек. – Л.: Наука, 1975. – 327 с.

20. Плат У. Математическая лингвистика. – Новое в лингвистике, 1965, вып. 4, с. 201 – 245.

21. Почему похожи близнецы? – Наука и жизнь, 1977, № 4, с. 130 – 135.

22. Сепир Э. Язык. – М.; Л.: Соцэкгиз, 1934. – 223 с.

23. Скаличка В. К вопросу о типологии. – Вопр. языкознания, 1966, № 4, с. 22 – 30.

24. Скаличка В. О современном состоянии типологии. – Новое в лингвистике, 1963, вып. 3, с. 19 – 35.

25. Соссюр де Ф. Курс общей лингвистики. – М.: Соцэкгиз, 1933. – 272 с.

26. Спиркин А.Г. Курс марксистской философии. – М.: Мысль, 1964. – 503 с.

27. Статистичнi параметри стилiв. – К.: Наук. думка, 1967. – 260 с.

28. Сухотин Б.В. Алгоритмы лингвистической дешифровки. – В кн.: Проблемы структурной лингвистики. М.: Изд-во АН СССР, 1963, с. 75 – 101.

29. Тимофеев И.С. Методологическое значение категорий «качество» и «количество». – М.: Наука, 1972. – 216 с.

30. Шахматов А.А. Историческая морфология русского языка. – М.: Учпедгиз, 1957. – 400 с.

31. Czekanowski J. Wstęp do historii Słowian. – Lwow, 1927.

32. Förstemann E. Über die numerische Lautverhältnisse im Deutschen (Germania). 1846, VII.

33. Menzerath P. Typologie of Languages. – J. Acoust. Soc. Amer. V, XXII: 1950, N 6, p. 698 – 701.

34. Menzerath P., Meyer-Eppler W. Sprachtypologische Untersuchung. – Studia linguistica, 1950, 1/2.

Исследование системных отношений в языке с помощью статистических методов (канд. филол. наук Т.А. Грязнухина)

Одним из основных положений марксистской диалектики является взгляд на все предметы и явления объективного мира как на взаимосвязанные и взаимообусловленные. Диалектический материализм не ограничивается лишь констатацией всеобщности категорий взаимосвязи, но нацеливает наше мышление на необходимость раскрытия существенных связей, отношений при исследовании любых явлений действительности.

«Отдельное бытие (предмет, явление etc.), – указывал В.И. Ленин, – есть (лишь) одна сторона идеи (истины). Для истины нужны еще другие стороны действительности, которые тоже лишь кажутся самостоятельными и отдельными… Лишь в их совокупности … и в их отношении … реализуется истина» [1, 178].

Наиболее полное, логически последовательное выявление исследуемых объектов обеспечивается системным подходом, свойственным современной науке [4; 5; 21]. При системном подходе любой объект познания рассматривается как определенным образом организованная система элементов, характеризующаяся устойчивостью и предназначенная для выполнения определенной функции. Свойства системы, ее качество определяются природой компонентов, их количеством, а также, что не менее важно, способами связи и взаимодействия между ними и подсистемами данной системы [25, 301 – 327]. Сеть этих связей образует структуру системы и обеспечивает ее целостность, отличает ее от простой совокупности элементов. Таким образом, поскольку любая система существует благодаря диалектическому единству трех основных ее атрибутов – структуры, субстанции, функции, системный подход обязательно предусматривает исследование существующих в системе отношений.

В последних работах по общей теории систем выделяется еще одна существенная особенность системы – ее иерархичность, базирующаяся на отношении части к целому. Основной вопрос, связанный с этой особенностью системы, это: каким образом из простого образуется сложное, как возникает новое качество в результате усложнения при переходе к новым более высоким уровням организации системы. И отсюда возможность объяснять свойства сложного путем изучения его простейших частей, учитывая то, что различие между целым и суммой частей состоит в наличии связей между последними. Следовательно, системное изучение объекта обязательно предусматривает исследование не только связей элементов на каждом уровне, но и отношений между ее уровнями.

Именно обнаружением и изучением взаимосвязей между различными явлениями действительности занимается одна из математических наук – статистика. Количество – объективная определенность качественно однородных явлений [26, 552]. Статистические показатели находятся между собой в определенных связях и соотношениях, которые, в свою очередь, отражают объективные связи явлений действительности [20]. По своему характеру эти связи многообразны. Чтобы раскрыть их и измерить, необходимо применять различные статистические приемы. Так, метод группировок выявляет связи между отдельными варьирующими признаками элементов той или иной совокупности. Для этого совокупность разбивается на группы по значению признака-фактора, влияние которого изучают. В каждой группе исчисляют среднее значение признака-следствия, изменение которого исследуется. Если с изменением признака-фактора меняется средняя величина признака-следствия, то это свидетельствует о наличии между ними связи зависимости. В статистике эти связи называются факторными. Изучаются они и с помощью корреляционного анализа, который дает возможность не только установить присутствие взаимосвязи, но и измерить ее силу, то есть определить степень приближения ее к функциональной зависимости. Индексный метод позволяет определять роль отдельных компонентов в изменении сложного явления [20, 72 – 114, 317 – 342, 297 – 302]. Таким образом, в тех случаях, когда уровень развития науки и техники позволяет измерять связи, вполне правомерно изучать их с помощью статистики. Естественно, что чем сложнее организация системы, тем труднее найти специфические параметры, допускающие точные измерения, определить соответствующие единицы измерения.

Возможность применения статистических методов при исследовании существующих в языке отношений обусловлена, прежде всего, системным характером языка. Язык представляет собой объективно существующую реальность, определенным образом организованную, которой свойственно большое количество измерений [9], а не хаотическое объединение явлений, оторванных одно от другого. Системное описание языка предусматривает анализ конкретных субстантных свойств элементов языка и анализ тех связей, в которые вступают данные элементы, учитывая при этом, с одной стороны, принципиальное отличие структурных и субстантных свойств единиц языка, а с другой – их взаимозависимость [13].

Чтобы охватить целостный характер системы языка, изучение существующих в ней отношений должно, исходя из иерархического строения ее структуры, осуществляться как на каждом уровне, так и между уровнями, поскольку каждый уровень системы одновременно является автономным по отношению к другим и в то же время зависящим от них. Переход от одного уровня к другому знаменует появление нового качества. Чем выше уровень, тем сложнее его структура, тем разнообразнее связи между элементами;

«непосредственно наблюдаемые отношения вытесняются глубинными, скрытыми опосредствованиями» [6].

Второй предпосылкой возможности применения статистических методов при исследовании системных отношений в языке является наличие объективно присущих ему количественных признаков [7], дающих возможность посмотреть на язык как на порождающую тексты систему с вероятностными ограничениями [9, 11].

Целесообразность применения статистических методов для выявления системных отношений в языке диктуется и современными проблемами автоматической переработки текстовой информации; в ходе решения этих проблем стала очевидной недостаточность использования при разработке алгоритмов машинного перевода, информационного поиска, автоматического реферирования только методов алгебраической лингвистики и необходимость обращения к методам квантитативным [3, 9, 26]. Кроме того, моделирование механизма перехода от языка к речи также требует обращения к статистике. Оказалось, что контекстно-свободные грамматики, создаваемые на основе неколичественной математики, порождают большое число нереальных предложений для данного языка. Исключить последние возможно, лишь применив к объектам языка вероятностные характеристики (создание контекстно-зависимых грамматик) [3].

Изучение отношений в языке осуществляется опосредованно через их исследование в речи. Теоретической основой такого пути является наличие определенного соответствия между внутренней организацией языка и речью [2], которая представляет собой реализацию языковой системы. Собственно говоря, многие закономерности, законы, наблюдаемые в речи, потому и действуют там, что они обусловлены законами языка. Характер лексем, форма грамматических связей – все эти категориальные черты языка формируют речевые высказывания [11, 27]. Яркой иллюстрацией сказанному выше может служить выведенный в результате анализа двухфонемных интервокальных сочетаний согласных в словаре, представляющем собой инвентарь лексических единиц украинского языка, закон предпочтения [18, 154 – 157]. Закон этот состоит в том, что незначительная часть определенного множества языковых единиц повторяется очень часто, а бóльшая часть их является низкочастотными. Проявление этого закона в речи было замечено впервые Дьюи на материале английских текстов задолго до открытия самого закона [28]. Статистическое исследование текстов дало возможность Дьюи установить закономерную зависимость между частотой звуков текста и процентом покрываемости ими объема текста (небольшое количество звуков очень часто употребляется в текстах и покрывает бóльшую их часть, а большое количество низкочастотных звуков занимает совсем незначительную часть текста). Эта же закономерность прослеживается автором на уровне слогов и на уровне слов текста. Исследования же В.И. Перебейнос доказывают, что установленная Дьюи закономерность заложена в самой основе строения единиц языка.

Подчеркнем, что как при любом научном исследовании, так и при изучении системных отношений в языке определение количественных соотношений является лишь способом познания качественных характеристик этих отношений, что свидетельствует о диалектическом единстве количества и качества объективной действительности. Интересными с этой точки зрения представляются наблюдения В.А. Никонова [15] над существующими в языке связями между фонемным и морфемным уровнями. Автор исследует частотные характеристики элементов этих уровней. Подсчеты реализации в текстах славянских языков самых частотных согласных т, н, с показали, что частота т наибольшая в русском и болгарском языках, н – во всех остальных языках. Некорректность объяснения этого факта артикуляционными особенностями или заимствованиями из других языков В.А. Никонов доказывает, во-первых, тем, что из всех русских т лишь 5% являются результатом оглушения д, во-вторых, и в русском и в болгарском языках заимствования из венгерских языков, которым свойственно широкое распространение т, образуют очень небольшое количество слов с этой согласной фонемой. И с помощью опять-таки статистики автор доказывает, что частота фонем зависит от их морфематических функций, что именно отнесение фонем к тем или иным морфемам обусловливает их частоты в речи. Установлено, что морфологическая функция т выступать в глагольных флексиях и обеспечила т количественный перевес в русских текстах. Сочетания задненебных с и в дали в русском языке зв и цв, а в западнославянских остались как гв и кв, но эти фонетические различия не проявляются в сравнительной частоте звуков г, к, з, ц в русском и польском языках, поскольку они почти не связаны с грамматическими элементами словоизменения или словообразования (в обоих языках чаще употребляются в корнях слов). Таким образом, частота фонемы, по В.А. Никонову, в тексте, прежде всего, зависит от ее участия в средствах словообразования или словоизменения как максимально повторяемых элементах речи. В других работах исследователя [16] эта же зависимость частоты элементов одного уровня от связей его с высшим уровнем доказывается на примере анализа зависимости частоты употребления падежей от их грамматических связей, то есть связи системы падежей с синтаксисом языка. Выводы автора являются одновременно и еще одним подтверждением философского положения о взаимозависимости части и целого при доминантной роли целого.

Ярким примером того, как статистика помогает выявлению системных отношений в языке на всех его уровнях, начиная с определения инвентаря единиц самого нижнего уровня и кончая установлением грамматики языка (морфологии и синтаксиса), является применение статистических методов при дешифровке неизвестных текстов [12]. Точкой опоры в данном случае служат количественные показатели, свойственные известным языковым системам, и данные, полученные в результате статистического исследования текстов на неизвестном языке. Общее число всех разных знаков и частоты появления новых знаков дают возможность установить систему письма, то есть набор исходных единиц языка. Каждая система письма имеет свои количественные характеристики: как правило, в алфавитном письме бывает до 30 знаков-букв; в системах письма, где знак соответствует слогу, насчитывается около 50 – 80 различных знаков. В иероглифическом письме их значительно больше – около 500. Письмо, в котором каждый знак обозначает отдельное слово, должно насчитывать несколько десятков или сотен тысяч знаков. Подсчет частоты повторения знаков и их сочетаний выявляет классы знаков. Например, при алфавитной системе письма для разделения на гласные – согласные применяется алгоритм Б.В. Сухотина, в основе которого лежит гипотеза о том, что в большинстве языков за гласной следует согласная, за согласной – гласная, а инструментом служит таблица частот двухбуквенных сочетаний [24, 7 – 9]. Грамматика дешифруемого языка строится на показателях частоты повторяемости знаков (букв, иероглифов) с привлечением позиционной статистики. В любом из известных нам языков мира присутствуют два вида морфем: корневые и грамматические, служебные. Среди самых частых знаков содержатся грамматические показатели, а среди редких – корневые морфемы. Поэтому предполагается, что редко встречаемые в дешифруемых текстах знаки обозначают неизвестные корни или основы, а знаки, которые находятся в их окружении и имеют относительно большую частоту, принадлежат к классу грамматических показателей. Позиция их по отношению к корневым определяет морфологическую структуру языка. Если грамматические знаки стоят перед корневыми, то они образуют класс префиксов или предлогов. Грамматические знаки, стоящие после корневых морфем, принадлежат к классу суффиксов или флексий. Возможно и вклинивание грамматических знаков в корневые, тогда они принадлежат к инфиксам.

Грамматические знаки сочетаются не только с корневыми, но и друг с другом. Определив, каким образом тот или иной грамматический знак сочетается с другими грамматическими знаками, можно выявить и синтаксис языка.

Системный подход к изучению языка позволяет выделить определенные наборы элементов языка, которые связаны системными отношениями и образуют определенные субсистемы, представляющие собой часть соответствующего уровня языка [11]. Так, при исследовании лексического уровня русского языка Э.Ф. Скороходько в отдельную субсистему выделяет терминологию [23]. В данном случае для нас представляет интерес способ установления связей и определение степени связности терминов в пределах выделенной субсистемы. Исследователь раскрывает качественные характеристики терминологии через установление количественных отношений между единицами субсистемы. Системность терминологии, по мнению автора, предполагает системность плана содержания, то есть системность семантического наполнения терминологии; системность плана выражения, то есть системность словесного наполнения терминологии, и системность соответствия плана выражения плану содержания.

Значения терминов соотносятся с соответствующими единицами действительности, взаимосвязанными между собой. Отсюда, значения лексических единиц тоже взаимосвязаны. Среди связей каждого предмета есть такие, которые однозначно выделяют данный предмет. Фиксируются эти связи в словарных статьях (определениях) толковых или терминологических словарей как отношения между значениями слов – семемами. Совокупность семем и существующих между ними отношений образует семантическую сеть языка. В качестве одного из признаков лексической системы языка, в частности ее терминологической субсистемы, может быть выбран показатель степени взаимосвязи между значениями ее единиц, определять который Э.Ф. Скороходько предлагает на основе соотношения количества семантически связанных пар терминов, то есть таких, значения которых, отраженные в определениях, прямо или опосредствованно производны от одного и того же значения (от одной и той же семемы), и общего числа терминов в системе. Сила семантической взаимосвязи терминов определяется длиной цепочки семем, связывающих в семантической сети сопоставляемые термины с общим компонентом в их значении. Указанные параметры, вычисленные для различных терминологических субсистем, могут свидетельствовать о степени однородности выбранных субсистем. Например, низкий показатель семантической связанности терминов означает или то, что система внутренне разнородна, то есть в нее включены термины других областей, или то, что при определении некоторых из ее терминов не отображены существенные связи внеязыковой действительности. Эти же показатели являются количественными характеристиками отличия любой терминологической субсистемы от общеупотребительной лексики. (В системе общеупотребительной лексики они будут значительно ниже.)

Метод установления смысловых связей слов на основе статистических показателей совместной встречаемости их в тексте, разработанный А.Я. Шайкевичем [27], оказался эффективным способом построения автоматических тезаурусов [10]. По этой методике семантическая связь слов (в тезаурусе такие слова объединяются в один класс) выводится на основе наблюдения их совместной встречаемости в текстах без обращения к значению этих слов. Для анализируемых слов вычисляется абсолютная частота их в тексте и относительная в заданном интервале, при этом фиксируются все слова, встретившиеся с анализируемыми. По формуле x = np вычисляется ожидаемая встречаемость этих же встретившихся слов в том же интервале (n – число случаев появления в тексте слов, которые встретились с заданными; p – вероятность встречаемости анализируемых слов в выбранном интервале). Сравнение наблюдаемой и ожидаемой встречаемости слов выявляет существенные между ними расхождения, настолько значительные, что считать их случайными некорректно, и поэтому может быть сделан вывод о наличии между данными словами определенной семантической связи. Чем больше величина указанных расхождений, тем теснее связь между словами. Содержательная интерпретация связей показала, что в большинстве случаев это смысловые связи.

Кэмбриджская группа, работающая над автоматизацией информационного поиска, применив подобную методику для выявления связей слов, предложила вычислять коэффициент интенсивности (Aab) связи между словами a и b как отношение частоты (f) совместной встречаемости слов в заданном интервале (f(ab)) и частоты контекстов, в которых присутствует хотя бы одно из этих слов:

Aab = f(ab) / (fa + fbfab).

Изменение длины интервалов показало, что выявление формально определяемой связи зависит от величины интервала, в котором исследуется совместная встречаемость слов. Во всех интервалах обнаруживаются связи однокорневых слов с различными словоизменительными и словообразовательными показателями. Полученные с помощью описанного статистического анализа классы слов в большинстве случаев соответствуют логико-интуитивному представлению исследователя о семантической связи слов в пределах этих классов. Следовательно, количественные методы вполне правомерно применимы при выявлении формальным путем различных типов отношений на лексическом и грамматическом уровнях языка.

До сих пор речь шла об исследованиях с помощью статистических методов системных отношений или в пределах определенных уровней языка или межуровневых связей, то есть о тех случаях анализа, когда исследователь не выходит за рамки одного языка. Описание же любого объекта как целостной системы обязательно предусматривает определение не только ее внутренних, но и внешних связей. Остановимся на целесообразности применения статистических методов и в последнем случае, а именно при типологическом анализе языков. В задачи типологического описания языков входит:

1) изучение фактов отдельных языков;

2) изучение взаимоотношений между этими фактами в различных языках;

3) определение количественных отношений данных фактов [22].

Значимость статистического анализа в типологии стала очевидной после осмысления политипологичности языков, что обусловило необходимость изучения степени проявления того или иного типологического признака в языке [14]. Установлено, например, что в случаях, когда структурные отличия у языков незначительны, наиболее информативные результаты дают количественные показатели. Первой работой, в которой были применены статистические методы в типологических исследованиях, была работа Яна Чекановского [29]. В ней для установления степени сходства славянских языков был предложен метод таблиц 2×2 из 4 клеток: одна отведена для признаков, общих у пары сравниваемых языков, вторая – для признаков, свойственных первому языку, но отсутствующих во втором, третья – для признаков, присутствующих во втором, но не свойственных первому, четвертая отводится для признаков, отсутствующих в обоих языках. Этот метод успешно применяется в типологическом сравнении фонемных систем славянских и германских языков при установлении коэффициента родства для каждой пары исследуемых языков и при вычислении степени близости каждой системы фонем языка ко всем системам фонем сопоставляемых языков [19].

В типологических исследованиях интересной является и проблема сопоставления соотношений между различными уровнями языковых систем. Исходным положением при этом является тезис о взаимозависимости различных явлений в языке. Формируется эта взаимозависимость таким образом: если в языке есть A, то предусматривается, что будет и B (например, если есть согласование, то языку свойствен свободный порядок слов в предложении и наоборот). Совокупность таких взаимозависимых явлений называется типом [22]. Обнаруживать эти типы снова-таки помогает статистика. В исследовании Н.В. Омельяновича [17] указывается, что типологически различные языки отличаются не только способом выражения пассивного значения, но и частотой его употребления. Так, свойственные английскому, русскому и бирманским языкам пассивные конструкции с наибольшей частотой употребляются в английском языке. Связано это с тем, что фиксированный порядок слов английского языка позволяет осуществить перераспределение коммуникативной роли слов в предложении лишь путем употребления пассивных конструкций, тогда как в языках со свободным порядком слов это перераспределение может быть достигнуто простой перестановкой слов (мы прочитали книгукнигу прочитали мы). На основе приведенного объяснения расхождений в частотных характеристиках использования пассивных конструкций выводится гипотетическая универсалия: в языках с фиксированным порядком слов при развитом глагольном формообразовании широко распространены пассивные конструкции.

Особого внимания в типологических исследованиях с точки зрения применения статистических методов заслуживает квантитативный подход к морфологической типологии языков Гринберга, при котором учитывается не наличие или отсутствие в языках тех или иных признаков, а преобладающая тенденция их в языках. В основе типологии лежит сепировский принцип морфологической структуры слова. Делается попытка охарактеризовать каждый признак через отношение двух единиц, каждая из которых достаточно точно определяется путем вычисления ее относительной частоты в тексте. Например, способ связи между морфемами в слове характеризуется отношением случаев, когда элементы в слове, соединяясь, не изменяются, к числу случаев их взаимной модификации [8]. Идеи Гринберга послужили толчком к развитию реляционной типологии, основанной на вычислении корреляций между выведенными им индексами, что дает возможность глубже проникнуть в структуру языков.

Таким образом, системный подход к изучению языка, при котором качество объекта определяется не только (и не столько) природой его компонентов, сколько способами их связи, организацией их в целостную систему и внешними связями системы [26, 301 – 327], в силу диалектического единства количества и качества значительно содействует более глубокому изучению отношений в языке путем выявления количественных соотношений его элементов.

Список литературы

1. Ленин В.И. Философские тетради. – М.: Политиздат, 1969. – 782 с. – (Полн. собр. соч., т. 29).

2. Андреев Н.Д. Статистико-комбинаторные методы в теоретическом и прикладном языкознании. – Л.: Наука, 1967. – 403 с.

3. Бектаев К.Б., Пиотровский Р.Г. Математические методы в языкознании. – Алма-Ата: Изд-во Казах. ун-та, 1973. – Ч. 1. 281 с.

4. Блауберг И.В., Садовский В.Н., Юдин Э.Г. Системный подход в современной науке. – В кн.: Проблемы методологии системного исследования. М.: Мысль, 1970, с. 7 – 49.

5. Богданович В.И. К определению понятия «системный параметр». – В кн.: Системные исследования. Ежегодник. М.: Наука, 1972, с. 158 – 164.

6. Гаузенблаз К., Данеш Ф. Проблематика уровней с точки зрения структуры высказывания и системы языковых средств. – (Цит. по книге: Общее языкознание. Внутренняя структура языка. М.: Наука, 1969. – 565 с.).

7. Головин Б.Н. Язык и статистика. – М.: Просвещение, 1971. – 191 с.

8. Гринберг Дж. Квантитативный подход к морфологической типологии языков. – Новое в лингвистике, 1963, вып. 3, с. 60 – 94.

9. Ермоленко Г.В. Лингвистическая статистика: Краткий очерк и библиограф. указ. – Алма-Ата: Изд-во Казах. ун-та, 1970. – 155 с.

10. Иванова Н.С. Установление смысловых связей между словами на основе статистической методики. – Вопросы лингвистики и автоматизаций лингвистических работ, 1967, вып. 1, с. 52 – 62.

11. Колшанский Г.В. Соотношение субъективных и объективных факторов в языке. – М.: Наука, 1975. – 231 с.

12. Кондратов А.М. Машинный перевод (ЭВМ и дешифровка древних письмен). – М.: Знание, 1967. – 32 с.

13. Кубрякова Е.С., Мельников Т.П. Описание языковой системы и ее главных признаков в современной лингвистике. – (Цит. по: Общее языкознание. Внутренняя структура языка. М.: Наука, 1972. – 565 с.

14. Меморандум о языковых универсалиях. – Новое в лингвистике, 1970, вып. 5, с. 31 – 44.

15. Никонов В.А. Интерпретация фонетических частот. – Учен. зап. / АН СССР. Ин-т славяноведения, 1963, 27, с. 259 – 271.

16. Никонов В.А. Статистика падежей русского языка. – Машинный перевод и прикладная лингвистика, 1959, № 3/10.

17. Омельянович Н.В. К вопросу об универсальных количественных отношениях в системе языка. – В кн.: Языковые универсалии и лингвистическая типология. М.: Наука, 1969, с. 135 – 141.

18. Перебийнiс В.С. Кiлькiснi та якiснi характеристики системи фонем сучасноi украiнськоi лiтературноi мови. – К.: Наук, думка. 1970. – 270 с.

19. Перебейнос В.И. Использование статистических методов в типологических исследованиях (на материале славянских и германских языков). – В кн.: Проблемы языкознания: Докл. и сообщ. на X Междунар. конгр. лингвистов (Бухарест, 1967). М.: Наука, 1967, с. 230 – 235.

20. Ряузов Н.Н. Общая теория статистики. – М.: Статистика, 1971. – 368 с.

21. Садовский В.Н. Некоторые принципиальные проблемы построения общей теории систем. – В кн.: Системные исследования: Ежегодник. 1971. М.: Наука, 1972, с. 35 – 55.

22. Скаличка В. К вопросу о типологии. – Вопр. языкознания, 1966, № 4, с. 22 – 31.

23. Скороходько Э.Ф. Семантические сети и некоторые количественные характеристики терминологической лексики. – В кн.: Лингвистические проблемы научно-технической терминологии. М.: Наука, 1970, с. 160 – 170.

24. Сухотин Б.В. Оптимизационные методы исследования языка. – М.: Наука, 1976. – 169 с.

25. Тюхтин В.С. Закон перехода количества в качество в свете данных современной науки. – В кн.: Диалектика – теория познания: Пробл. науч. метода. М.: Наука, 1964, с. 301 – 327.

26. Философская энциклопедия. – М.: Сов. энциклопедия, 1962. – Т. 2. – 575 с.

27. Шайкевич А.Я. Распределение слов в тексте и выделение семантических полей языка. – Иностр. яз. в высш. школе. 1963, № 2.

28. Dewey D.J. Relative frequency of English Sounds. – London, 1923 (цит. по кн.: Перебийнiс B.C. Кiлькiснi та якiснi характеристики системи фонем сучасноi украiнськоi лiтературноi мови. – К.: Наук. думка, 1970. – 270 с.).

29. Czekanowski J. Wstęp do historii Słovian. – Lwow, 1927 (цит. по кн.: Общее языкознание. Методы лингвист. исслед. М.: Наука, 1973. – 318 с.).

Место количественных методов в стилистических исследованиях (канд. филол. наук Н.П. Дарчук)

Математические методы познания все глубже проникают во все отрасли современной науки. С точки зрения материалистической диалектики это целиком закономерный процесс:

«Предмет, не отраженный в аспекте количества, не может считаться конкретно познанным… Наука вообще достигает совершенства лишь там и в той мере, в какой ей удается взять на вооружение математику» [2, 552].

Как учит диалектика, ни качественный анализ в отрыве от количественного, ни односторонне количественные исследования в отрыве от качественных не могут привести ученого к глубокому познанию действительности.

Классики марксизма-ленинизма рассматривают категорию количества прежде всего в связи с установлением количественных (математических) закономерностей, связанных с качественными изменениями объектов. Наличие закономерностей, как отмечал Ф. Энгельс, можно проследить во всех отраслях науки, где закон перехода количества в качество подтверждается на каждом шагу [1, 389]. Поскольку количественные отношения в существующем мире исследуются математически, то из этого непосредственно вытекает возможность применения математики ко всем наукам. Ф. Энгельс указывал, что только недостаточным развитием точного измерения можно объяснить отсутствие количественных закономерностей в тех или иных отраслях науки.

Долгое время целью лингвистических исследований была методика изучения родного и иностранного языков, получение данных исторического и географического характера [28]. Лишь в конце 40-х – начале 50-х годов XX в. в лингвистике произошли изменения, которые были следствием распространения кибернетики, появлением новых применений лингвистики (автоматический перевод, автоматическая обработка информации, записанной в виде текстов на естественных языках). Контакты человека с машиной могли быть осуществлены лишь в том случае, когда сообщение на естественном языке перекодировалось в математический язык компьютера. Такое перекодирование возможно только на основе математического описания естественного языка.

Именно эти прикладные задачи показали недостатки неформализованных методов, поскольку большинство лингвистических описаний и утверждений нельзя было перевести в алгоритм, передать ЭВМ [28]. Недостатком этих описаний была логическая непоследовательность, неоднозначность, неэксплицитность. Поэтому началось активное проникновение математических методов в лингвистику, которое диктовалось стремлением к более точному, строгому, объективному описанию лингвистического материала.

В настоящее время в языкознании наряду с неточными активно применяются точные методы, которые используют математический аппарат. Точные методы могут быть неколичественными и количественными. Неколичественные методы основываются на принципах таких математических дисциплин, как, например, математическая логика, теория множеств, теория алгоритмов. В теоретическом языкознании сформировалось целое направление, которое условно называется алгебраической лингвистикой (это теория порождающих грамматик Хомского, теоретико-множественные модели Маркуса и др.).

Количественные методы прочно входят в языковедческую практику, необходимость их признается большинством лингвистов. Это направление в теоретическом языкознании называется лингвостатистикой.

Остановимся на вопросе о месте количественных методов в стилистических исследованиях.

Значение количественных методов в научном познании состоит в том, что исследователь, применяя их, может сделать вывод с некоторой обусловленной им степенью достоверности полученных данных в ситуации с явно неполной информацией об исследованных явлениях [28]. Количественные методы в лингвистике – это методы, благодаря которым можно правильно организовать лингвистические наблюдения, обеспечивающие надежность, точность, достоверность рассуждений в науке о языке.

Возможность использования количественных методов в языкознании основывается на особенностях строения языка и речи.

Язык – это система, состоящая из дискретных единиц, которые имеют количественные характеристики. Эти характеристики свойственны всем единицам всех уровней.

Язык как система имеет свой способ организации, то есть структуру. Все элемента языка структурно организованы. Это значит, что все элементы связаны системой отношений, то есть каждый элемент связан с другими сеткой отношений, а также системой отношений с другими уровнями. Элементам языковой системы свойственны как количественные, так и качественные признаки. А количественные признаки элементов языка на одном уровне являются одной из причин, которые формируют качественные признаки элементов на другом, высшем уровне.

Очевидно, если какой-нибудь условный язык имеет в своем распоряжении 10 корней и 5 суффиксов, его возможности создавать разные по качеству слова будут резко отличаться от возможностей языка, который имеет 10 корней и 50 суффиксов [10]. Таким образом, можно с полной достоверностью допустить действие отношений на определенном уровне и определить результаты его.

Язык имеет вероятностный характер. Это код с вероятностными ограничениями. В общем смысле код – это средство представления информации в форме, пригодной для передачи по каналу связи. Любой код – это определенное множество физически разных знаков, каждый из которых может однозначно соотноситься с тем или иным объектом из множества объектов, на которые распространяется действие данного кода [11].

С точки зрения теории вероятностей язык является неравномерным кодом с большим основанием. Множество знаков языкового кода – это слова, а в множество объектов кодирования входят обозначенные словами предметы, понятия. Например, элементами языкового кода служат фонема [11, 128]. Значит, код русского языка имеет основание в 40 элементарных единиц. Поскольку длина слова в русском языке колеблется от одной до 20 и больше фонем, то максимальное количество кодовых комбинаций, которое можно получить из фонем русского языка, бесконечно велико. В действительности для образования слов используется лишь незначительная часть возможных комбинаций фонем, в чем выражается действие вероятностных ограничений в сочетании фонем.

Речь является реализацией системы языка, ее элементов. Можно указать по меньшей мере на три фактора, которые позволяют применять количественные методы к рассмотрению речевых данных:

1) массовость языковых единиц;

2) повторяемость их в высказываниях;

3) возможность выбора определенного элемента из ряда однородных.

Количественные отношения между элементами в системе языка не тождественны количественным отношениям этих элементов в разновидностях речи, что является результатом проявления особенностей языка как средства общения и выражения мысли [19].

На речь, то есть на речевую цепочку, влияют законы языка (закономерности строения единиц языка, использования их в речи), законы сочетаемости единиц языка в речи, законы жанра, тема высказывания, вкусы автора, его психофизическое состояние и др. Действие этих факторов так переплетается, что невозможно определить результаты их влияния. Но если совокупность этих факторов относительно постоянна, то результаты их будут приблизительно одинаковы. Это значит, что строение речи будет характеризоваться такими постоянными чертами, которые могут быть раскрыты количественными методами.

Таким образом, основной задачей статистической стилистики является применение количественных методов для раскрытия некоторых закономерностей функционирования единиц языка в речи, а также установление закономерностей построения текста.

Вместе с тем нельзя и преувеличивать значение исключительно количественных методов в лингвистике. Применение их в языкознании можно рассматривать лишь как способ познания определенных закономерностей, как способ проникновения в тайны строения и функционирования языка. Любая математическая экспликация лингвистического явления должна иметь содержательную интерпретацию [5].

При этом традиционно-качественные методы языкознания не теряют своего значения. Н.Д. Андреев говорил, что

«традиционное языкознание, обновляясь и обогащаясь благодаря синтезу с новыми методами, – в первую очередь с математикой, – было и остается центральным направлением нашей науки» [4, 12].

Не противопоставлять количественный анализ качественному, не игнорировать количественную методику, а сочетать качественный и количественный методы исследования языкового материала – вот задачи языковеда. Этот союз необходим хотя бы потому, что сначала надо определить строго однозначно единицы счета. Если такого определения не будет, то и результаты исследования будут несопоставимы. С помощью качественного лингвистического анализа мы получаем качественные характеристики единиц языка: фонем, морфем, слов, частей речи и т.д. Опираясь на результаты проведенного качественного анализа единиц, с помощью количественного метода исследователь раскрывает закономерности функционирования этих единиц и новые данные для качественных оценок на новом уровне исследования [9, 17].

О первых попытках применения количественных методов к речевому материалу, в частности к лексическому, свидетельствует история составления частотных словарей, количество которых уже сегодня составляет более 300.

Частотный словарь отличается от других типов словарей тем, что, во-первых, он включает лишь те лингвистические единицы, которые встретились в исследованном тексте (или текстах); во-вторых, указывает при лингвистических единицах частоты их употребления в этом тексте (или текстах).

С каждым годом растет внимание ученых к частотным словарям, они составлены для более чем 17 языков. В них исследователи находят материал для типологии и текстов и языков. Идею количественного подхода к типологии сформулировал Дж. Гринберг [12]: сравнивая отрывки текста фиксированной длины, написанные на разных языках, можно сделать вывод о близости или отдаленности строения языков на основе количественных соотношений между словами этих текстов и компонентами их морфологического строения.

На основе частотных словарей изучаются статистические закономерности функционирования словарного состава языка. В связи с этим особое значение приобретают способы интерпретации данных частотного словаря: например, разные пласты частотной лексики отражают структуру текста.

Особенности функционирования словарного состава языка в стилевых и авторских разновидностях речи интересуют как лексикологов, так и стилистов.

Представители точных и инженерных специальностей используют частотные словари как источник статистических данных о некоторых лингвистических единицах для обеспечения эффективности передачи сообщений по каналам связи.

Специалисты в области автоматической обработки языковой информации опираются на количественные описания подъязыков некоторых отраслей для образования системы поиска и реферирования текста при помощи ЭВМ [3; 18; 21; 22; 30].

Особенно следует подчеркнуть большое значение частотных словарей в методике изучения языка, поскольку преподаватель языка обращается к частотному словарю в поисках объективно отобранного учебного материала. Поэтому целью большинства частотных словарей иностранных языков было обеспечить методику изучения языка теми, для кого этот язык является неродным.

Одновременно отметим возможность применения статистики при изучении языка учащегося. Ведь наша школа до сих пор еще не имеет объективных данных, что такое хороший, посредственный или плохой язык учащихся разных классов, какой необходим запас слов, грамматических форм и конструкций [9; 27].

Кроме того, особенно важной и актуальной в педагогике, психологии (а также в филологии и информатике) является проблема измерения сложности текста. Объективные количественные методы измерения сложности текста имеют первостепенное значение для определения понятности, доступности учебных текстов, публицистических материалов, научной, научно-популярной информации [26].

Вообще частотные словари преследуют цель получения материала для всестороннего лингвистического анализа текста на лексическом, морфологическом и графемном уровнях. Авторы словарей проводят не только лексикологический анализ текста, но и исследуют его на других лингвистических уровнях. Таким образом, частотный словарь является лишь первоначальным этапом тщательного изучения структуры текста.

Частотные словари регистрируют функционирование единиц языка в речи. Но речь характеризуется не только функционированием в ней единиц языка, но и своими речевыми единицами. В литературе дискутируется вопрос о том, что считать единицей речи. Единицей речи можно считать такую цепочку единиц языка, которая не относится к языковым единицам. Составители частотного словаря сочетаемости современного английского языка [6; 7; 8] считают необходимым регистрировать как частоту единиц языка в текстах, то есть слов, так и частоту единиц речи, к которым они относят цепочки связей некоторого слова в предложении.

Цепочка связей слова в речи может совпадать со словосочетанием или с предложением, а также может представлять собой нечто среднее между тем и другим. Такую цепочку ни грамматики, ни словари не считают единицей языка. Но поскольку такая цепочка имеет свою структурную организацию, может повторяться, характеризуя разные слова и имея частоту в текстах, вполне правомерно считать ее единицей.

В стилистике количественные методы стали применять сравнительно недавно. Эффективность количественных методов в стилистике объясняется тем, что речь – это явление, где действует большое количество факторов, а объект исследования настолько сложный, что нельзя указать на какой-либо один фактор, который порождает такое его действие.

Исследователи отмечают по этому поводу, что случайность явления обусловливается большим количеством факторов, действие каждого из них непосредственно выявить невозможно. Наконец, вероятностно-статистическая устойчивость свидетельствует о закономерности этого явления, а также о причинной обусловленности [14, 121].

Текст является объектом исследования стилистики. Это вытекает из того, как он (текст) создается. Прежде всего автор должен иметь в своем сознании тему рассказа и его коммуникативную направленность, то есть самые общие характеристики адресата и функционально-стилистической принадлежности произведения, в зависимости от них автор осуществляет выбор определенных грамматических конструкций языка, на котором он пишет. И если при этом выбор одних языковых средств определяется темой, законами жанра, стиля, то выбор других средств – случайный, потому что для выражения того или иного понятия есть средства, безразличные к стилю, жанру и даже к теме текста [20, 19].

Следовательно, в образовании текста основной процедурой можно считать выбор единиц из большого их количества, что связано с повторяемостью этих единиц. Это чисто статистическая черта текста. Используя статистические методы в стилистике, исследователи считают, что каждый языковой материал (в том числе и текст) является результатом отбора некоторых единиц из общенародного языка [23, 23].

В свою очередь, в тексте действуют законы речи, которые ограничивают выбор единиц, влияют на их расположение, управляют связями и сочетаемостью единиц в языковые цепочки, членят тексты на абзацы и пр. Большую роль играют законы функционального стиля и жанра, а также экстралингвистические факторы (настроение автора, его личные вкусы, чувство языка, способности и т.п.). В результате переплетения всех этих факторов, взаимосвязанных и взаимообусловленных, создается текст с его статистическими параметрами [20, 19].

Таким образом, стилисту приходится рассматривать объект (текст), который рождается скрытым от него механизмом, причем его интересует этот механизм, однако выводы он может делать только на основании объектов, которые порождаются этим механизмом. А интересует его этот механизм именно потому, что ему необходимо знать те особенности функционирования механизма, которые обусловливают порождение данной совокупности.

Иначе говоря, привлекая термины кибернетики, язык можно представить себе в виде кибернетической системы, на входе которой имеются определенные единицы и набор операций над ними, а на выходе – порожденные этой системой тексты. Анализируя совокупность текстов, можно образовать гипотетическое описание этой системы или языка. Ведь закономерности структуры языка, его внутреннее строение познаются через его функционирование. Как отмечал акад. Н.А. Колмогоров,

«исследование потока речи без гипотез о механизме его порождения не только малопродуктивное, но и не интересное» [16, 75].

Другими словами, стилисту приходится двигаться в своем исследовании в противоположном, сравнительно с автором текста, направлении: от текста – к правилам его построения, от потока слов – к закономерностям их выбора.

Поэтому считать в стилистике необходимо для того, чтобы выявить закономерности функционирования языковых средств в разновидностях речи, без чего невозможно передать содержание.

Конечно, стилистика не может быть ограничена только цифрами и подсчетами. Цифры и подсчеты для стилиста являются лишь орудием, инструментом, который помогает ему точнее измерить расхождение между стилями, увидеть такие особенности стилей, какие без использования количественных методов заметить трудно или совсем невозможно. Поэтому количественные методы используются как эффективная методика научного познания стилистических особенностей речи.

Получение количественных данных – это лишь первый этап. Задачей исследователя является интерпретация этих данных. Основным методологическим принципом использования статистики в стилистике есть учет единства качественных и количественных сторон речи. Известно, что изменение количества приводит к изменению качества, а новое качество свидетельствует о другом, сравнительно с «прежним», количестве, что обязательно должно учитываться в методике исследования. Только сочетая качественные и количественные методы, можно получить правильные выводы о языковом материале [15, 33].

Целью количественного метода в стилистике является определение качественных различий и закономерностей функционирования языковых средств:

«любая статистика показывает симптомы, сигналы, качества, которые можно выразить количественно» [14, 121].

Таким образом, количественный анализ поставлен на службу качественному, он показывает качественные признаки, но своим, особенным образом [15, 51].

Приведем несколько примеров использования количественных методов в стилистике и интерпретацию данных качественным путем.

Материал исследования: шесть частотных словарей, составленных на материале выборок по 20 тыс. словоупотреблений сплошного текста из шести произведений пяти авторов:

А. Довженко «Поема про море» – сокращенно ДП,

Ю. Смолич «Мир хатам, вiйна палацам» (СМ),

Г. Тютюнник «Вир» (ТВ),

О. Гончар «Прапороносцi» (Г2),

М. Стельмах «Кров людська – не водиця» (C1), «Хлiб i сiль» (C2).

В результате применения статистического метода (корреляционного анализа) для сравнения частотных словарей, в частности, к группе слов, высокочастотных во всех словарях, оказалось, что в целом, несмотря на расхождение между частотой некоторых слов в этих произведениях, высокочастотные группы имеют одинаковые закономерности в функционировании. Это позволило сделать вывод о том, что тексты разных авторов подобны, благодаря функционированию в них слов с высокой частотой.

Однако есть слова, которые используются с высокой частотой только в одном произведении, а в других существенно меньше. Так, привлекает внимание функционирование

1) местоимений: ви, вона, ми, мiй, я;

2) союза та;

3) существительного око.

Остановимся на характеристике именно этих семи слов с целью установить причины, которые вызывают высокую частотность в некоторых произведениях. Существует мнение, что показателями авторских стилей бывают редко употребляемые, эмоционально окрашенные или диалектные слова, а наиболее часто употребляемые, как правило, не могут различать авторские стили в пределах одного функционального [13, 12].

Однако исследования показали, что высокочастотные слова способны разграничивать авторские стили, то есть быть их параметрами [17]. Установлено, что, как правило, чем больше частота слова, тем больше его стилеразличительная мощность [17, 174]. Интересно и то, что среди высокочастотных слов высшую стилеразличительную мощность имеют служебные слова.

Это означает, что частота высокочастотных слов служит выражением количественной определенности авторского стиля. А поскольку качество и количество диалектически связаны между собой, то «повышенная» количественная характеристика какого-то слова в одном из произведений свидетельствует о качественной определенности, об отличии данного произведения от других произведений.

Значит, наряду с диалектными, эмоционально окрашенными, просторечными словами, на характеристике которых очень часто останавливаются исследователи при изучении авторского стиля, следует уделять внимание так называемому стилистически нейтральному пласту, который, как оказывается, не всегда является нейтральным относительно стиля, тем более, что слова всех частей речи способны разграничивать стили.

Поэтому важным является поиск таких критериев, при помощи которых можно было бы объективно, без влияния вкусов или желаний исследователя, изучать особенности авторского стиля. Между тем очень часто описание отдельных случаев словоупотребления бывает выборочным и не может дать четкого представления о речевой ткани произведения. А иногда разные исследователи одним и тем же языковым фактам в одном и том же произведении дают разную интерпретацию или обращают внимание на отдельные средства художественного изображения, которые им кажутся интересными, ничем не обосновывая свой выбор. Едва ли существует хотя бы два человека с одинаковой лингвистической подготовкой, одинаковым чувством языка и восприятием художественного произведения. Однако это не должно влиять на результаты научного исследования, на их объективность.

Таким объективным критерием является частота слова, которая может быть орудием, инструментом в руках исследователя, и помогающим точнее установить расхождение между авторскими стилями.

Объектом нашего внимания, как указано выше, будет семь высокочастотных слов. И если высокая частота сама по себе является результатом влияния таких факторов, как законы языка и речи, функционального стиля, то всплеск частоты определенного слова в каком-либо одном произведении, сравнительно с другими, сигнализирует о качественных особенностях – об особенностях тематики, композиционного построения, об индивидуальном авторском стиле.

Попытаемся показать это на нашем материале.

Для местоимений ви, ми, мiй, я наблюдаем такую картину:

ви:

ДП > СМ в 2 раза

ДП > ТВ в 2 раза

ДП > Г2 в 2 раза

ДП > С1 в 2 раза

С2 > СМ в 2 раза

С2 > ТВ в 2 раза

ми:

ДП > СМ в 2 раза

ДП > ТВ в 2 раза

ДП > С1 в 2 раза

мiй:

ДП > СМ в 2 раза

ДП > ТВ в 2 раза

ДП > С1 в 2 раза

я:

ДП > СМ в 5 раз

ДП > Г2 в 2 раза

ДП > С1 в 3 раза

ДП > С2 в 2 раза

ТВ > СМ в 3 раза

Г2 > СМ в 2 раза

С2 > СМ в 2 раза

ТВ > СМ в 2 раза


Таблица 6.

Соотношение прямой и авторской речи, %


Речь \ Произведение: ДП СМ ТВ Г2 C1 С2
Прямая 43,83 21,49 34,19 24,19 28,95 35,92
Авторская 56,17 78,51 65,81 75,81 71,05 64,08

Итак, частота этих местоимений в произведении ДП в несколько раз выше частоты в других исследуемых произведениях. Кроме ДП, частота личного местоимения ви в произведении С2 вдвое больше, чем в СМ и ТВ, а местоимения я в несколько раз меньше в СМ, чем в других произведениях.

Причина высокой частоты местоимений ви, ми, мiй, я в ДП состоит в том, что в этом произведении наибольший процент прямой речи (табл. 6).

Диалогическая в своей основе, она базируется на живой устной речи и чаще использует личные местоимения, свойственные непосредственному общению.

Особенно повышенная частотность местоимения я в ДП объясняется тем, что автор выступает действующим лицом, лирическим героем киносценария, он высказывает в лирических отступлениях свои собственные взгляды и свое отношение к изображаемой действительности. Иными словами, А. Довженко не является в своем произведении пассивным наблюдателем всего, что будет отражено на экране.

По количеству прямой речи произведение С2 занимает второе место, поэтому в нем чаще встречаются местоимения ви, мiй, ми.

Наименьший процент прямой речи из всех произведений в СМ, чем и объясняется сравнительно низкая частота местоимений ви, ми, мiй, я.

В этом же произведении СМ отличается своим функционированием местоимение вона, которое встречается вдвое меньше, чем в других произведениях.

Анафоричное по функции, это местоимение употребляется для обозначения лица, предмета, явления, понятия и обозначает живые существа и неживые предметы. Поэтому можно допустить, что частота местоимения вона должна была бы зависеть от количества действующих лиц женского пола.

Было учтено, что в исследованном отрывке в 20 тыс. слов в произведении СМ действующими лицами являются 11 мужчин и четыре женщины: Тося Колиберда, Меланья Бриль, Марта Колиберда, Марина Драгомирецкая. Количество женщин в произведении СМ действительно значительно меньше, чем, например, в ДП и ТВ (по 13 действующих лиц – женщин).

Но оказывается, что на таком же отрывке в 20 тыс. слов в С2 – 6 женщин, в Г2 – 4, а в C1 вообще только три: Ольга, Марийка Бондарь, Василина (дочь Мирона Пидопригоры). Между тем на частоту местоимения вона это не повлияло. Даже в произведении Г2, посвященном Великой Отечественной войне, где темой обусловлено почти отсутствие действующих лиц – женщин, которые встречаются лишь эпизодически, частота местоимения вона большая.

Значит, на частоту местоимения вона влияет также количество неживых предметов женского рода, которые обозначаются этим местоимением.

Оказывается, что в произведении Г2 больше, чем в других, употребляется местоимение вона, которое обозначает неживые предметы.

В произведениях CI и С2, где сравнительно мало действующих лиц женского пола, местоимение вона почти поровну обозначает живые существа и неживые предметы и явления, причем из 72 случаев с обозначением неживых предметов в произведении C1 24 раза местоимение вона обозначает существительное земля, а в произведении С2 из 50 примеров – 8 обозначают землю, что вызвано темой этих произведений: в романе C1 «Кров людська – не водиця» рассказывается о жизни украинского села в буреломный 1921 год, а в основе романа С2 «Хлiб i ciль» – жизнь украинского села в период русской революции 1905 – 1907 гг. В центре внимания обоих произведений – борьба за то необходимое и самое дорогое, без чего не может жить крестьянин, – за землю.

Словами глубокой благодарности и любви проникнуты строки, в которых говорится о земле, иногда даже создается впечатление, что земля для автора – это живое существо.

«– Любиш землю?

– А хiба ii можна не любити? – рiзко всiм тiлом обернувся до невiдомого, болотом заляпаного чоловiка. – Худоба – i та ii любить, губами кожну билинку цiлуе, а що вже говорити про людину! – враз неждано розкрилася замкнута душа пiдлiтка, яка теж однiею землею жила» [24, 69 – 70].

«А вона [земля], розкiшна i убога, ласкава i жорстока, манила iх [селян] теплим дзвоном червоноi пшеницi i гнала в холодних кайданах у Сибiр; вона пестила руки м″яким, як дiвоча коса, колосом i рвала спини нiмецькими i гайдамацькими шомполами. Та невже вона й тепер поманить i обдурить дядька» [24, 15].

«З неi [землi] живемо, значить жива вона» [24, 33].

В произведении СМ местоимение вона чаще обозначает живые существа, а неживые предметы значительно реже (например: пiсня – 3 раза, влада – 2, хата – 2, груда, дiжа, земля, кирея, кров, республiка – по 1-му разу). Возможно, это объясняется небольшим количеством существительных женского рода, встретившихся в исследованном тексте, или особенностью стиля Ю. Смолича, который избегает употребления анафорических местоимений и отдает преимущество «называнию» предметов, явлений, понятий. Во всяком случае это требует дальнейшего исследования.

Таким образом, в единстве качественной и количественной определенностей ведущее место принадлежит качеству. Качество определяет рамки количественных изменений.

Привлекает внимание функционирование в некоторых произведениях союза та (табл. 7). Известно, что союзы как служебные слова употребляются для выражения логико-грамматических связей между однородными членами предложения, словосочетаниями и частями сложного предложения и функционируют в речи различного стилистического направления. А.А. Шахматов писал:

«Союз имеет значение не сам по себе, а как выразитель того или иного сочетания, как словесное выявление такого сочетания» [29, 98].

То есть, утратив самостоятельное лексическое значение, союзы только оформляют логические отношения между синтаксическими единицами.

Сочинительный союз та часто употребляется в СМ, ТВ, C1, о чем свидетельствуют такие соотношения:

СМ > ДП в 6 раз

СМ > ТВ в 2 раза

СМ > Г2 в 6 раз

СМ > С1 в 7 раз

СМ > С2 в 3 раза

ТВ > ДП в 2 раза

ТВ > Г2 в 2 раза

ТВ > С1 в 2 раза

С2 > ДП в 2 раза

С2 > Г2 в 2раза

С2 > Г2 в 2 раза

С2 > С1 в 2 раза

Значительно меньше его частота в произведениях ДП, Г2, C1.

В связи с тем что союз та оформляет синтаксические отношения между равноправными, относительно независимыми членами предложения и словосочетаниями или предложениями, мы выделили частоту употребления союза та отдельно для прямой речи и авторской в двух случаях:

1) союз та соединяет слова;

2) союз та соединяет предложения.


Таблица 7.

Функционирование союза та в произведениях разных авторов


Примеры ДП пр ДП авт СМ пр СМ авт ТВ пр ТВ авт Г2 пр Г2 авт С1 пр C1 авт С2 пр С2 авт
Слова 15 7 18 144 35 34 14 9 6 14 22 21
Предложения 7 3 8 33 7 12 7 4 6 5 24 7
Всего 22 10 26 177 42 46 21 13 12 19 46 28

Оказывается, что союз та в СМ почти в 7 раз чаще встречается в авторской речи, чем в прямой, в ТВ – почти поровну, а в С2 – преимущественно в прямой речи.

Во всех произведениях, особенно в авторской речи произведения СМ, союз та выступает чаще как средство соединения членов предложения. Эти данные подтверждают вывод «Современного украинского литературного языка», что союз та выступает преимущественно как средство «нанизывания» сказуемых и реже употребляется для соединения однородных членов предложения [25, 516 – 517]. Лишь в прямой речи обоих произведений М. Стельмаха союз та одинаково часто оформляет синтаксические отношения как между предложениями, так и между словами. Причем в прямой речи произведения С2 в 12 случаях предложения начинались союзами та. Например:

«Та вони [чиновники] знаходять iнший шлях…» [24, 17].

«– Ваш хлiб не м″який.

Та i його можуть позбутися i селяни, i навiть помiщики» [24, 18].

«Є у вузликах дещиця. Та й стара щось вив″язувала, з городини видать» [24, 21].

«Остануться тут однi пани та хуторяни. Та й тi повиздихають без нас» [24, 22].

Следует заметить, что союз та разграничивает текст одного автора C1 и С2: во-первых, вдвое меньше встречается в тексте C1, чем в С2; во-вторых, в С2 больше используется в прямой, а в С2 – в авторской речи; в-третьих, в C1 не зафиксировано ни одного случая, когда бы предложение начиналось союзом та.

Значит, союз та имеет стилеразличительную мощность и разграничивает не только тексты авторов, как, например, текст СМ, для которого характерна самая высокая из всех произведений частота союза та, но и произведения одного автора (С1 и С2).

Таким образом, качественное различие данных произведений выражается в количественных соотношениях. Новая качественная определенность – другое произведение одного и того же автора – обусловливает и новую количественную определенность – новые частоты даже у одних и тех же слов.

Теперь обратимся к полнозначному слову, существительному око, которое характеризуется высокой частотой в обоих произведениях М. Стельмаха. Например:

С1 > ДП в 2 раза

С2 > ДП в 2 раза

С1 > СМ в 3 раза

С2 > СМ в 4 раза

С2 > Г2 в 2 раза

Значит, писатель, несмотря на тему произведения, придает какое-то особенное значение этому слову.

Поскольку каждое слово, отражая то или иное содержание, несет в себе не только название конкретной реалии, но и элементы обобщения, мы проанализировали контексты, в которых употребляется в обоих произведениях М. Стельмаха слово око.

Оказывается, что во многих случаях этому слову придается образность, необыденность, нетрафаретность использования в контекстах. Так происходит метафоризация на основе определенных ассоциаций. Например, неоднократно подчеркивается не зеленый цвет глаз Аркадия Валериановича Стадницкого, а прозелень в очах:

«…його [Аркадiя Валерiановича] сiрi, з прозеленню, синцями пiдведенi очi насмiшкувато обмацують Тадея Станiславовича» [23, 36].

«…в панськi з прозеленню очi презирливо впиваються втомленi селянськi» [24, 46].

«…в прозеленi очей Стадницького блиснула злоба» [24, 15].

«…затремтiла хмiльна колюча прозелень в очах» [24, 36].

Только устами Лисовского автор раскрывает, с чем ассоциируется эта прозелень в глазах Стадницкого. Как лишайник среди растений, так и Стадницкий в человеческом обществе является паразитом:

«I Лiсовському здаеться прозелень в очах Стадницького схожа на потрiсканi в час дозрiвання цятки лишайнiков, що виростають на старих воротях чи хвiртках» [24, 36].

А в других местах, связывая в единый замкнутый круг мысли Стадницкого с его поступками, хозяйством, Лисовскому приходит мысль, что из-за богатства

«…душа i погляди хижiшають. Так можна дiйти до того, що чиiсь очi будуть здаватися не очима, а двома срiбними полтиниками…» [24, 40].

Такая ассоциация раскрывает сущность и душу Стадницкого.

При помощи метафорического употребления существительного око или употребления его в метафорическом контексте автору удается высказать самую разнообразную гамму мыслей и чувств:

«очима на Тетяну гедзики пускаю» [24, 60];

«господаря очима жертиме» [24, 48];

«очi посивiшали в чоловiка» [24, 5];

«набухають, злiстю звуженi жовтi очi Плачинди» [24, 25];

«…Лiсовський бачить, як обурюються очi старого» [24, 44];

«…скорботно дивуються очi старого» [24, 21].

При помощи подобранного окружения прилагательных, которые выступают эпитетами и сопровождают существительное око, автор дает характеристику действующих лиц. Например:

· у учителя Степана Васильевича Левченко красота лица – в очах: «…жагучi, що в душу дивляться» [24, 30];

· у управителя – очi «холодно-брезгливi» [24, 23];

· у Романа «насмiхаються карi, виразнi на бiлому виду очi» [24, 25];

· «у Iвана очi сумнi» [24, 21];

· у «Чайченка – тоскнi, одичалi вiд смутку» [24, 31];

· у «дiда Дуная – сивi, задуманi» [24, 21];

· у сестры Никанора – «великi, темiнню обведенi» [24, 10];

· у деда Дорохтея – «гарячi» [24, 30];

· у Сергея Майбороды – «свiтло-карi, виснаженi» [24, 43].

В другом произведений этого автора «Кров людська – не водиця» тоже встречаем множество эпитетов при существительном око:

невеликi, збiльшенi, запалi, посвiтлiлi, вдячнi, непрiмиреннi, болючi, безневиннi, сумонитi, дикуватi, упертi, злющi, чорнi, намуленi, лихi, зеленаво-сiрi з рiдкими крплинами голубого моря, рудi як тютюн, тютюновi;

стилистически нагруженное употребление глагола:

«Марiйка засмiялась, заграла очима» [24, 26];

«…чужi очi впиваються в спину» [24, 25];

«…все його [Тимофiя] життя недовiрливо сторожили чужi очi» [24, 34] и т.д.

Все это приводит к мысли, что в портретной характеристике действующих лиц автор придает большое значение очам, будто наследуя известную мысль, что очi – это зеркало души человека. Интересным является и то, что в обоих произведениях это существительное почти не встречается без разнообразнейших по семантике эпитетов, цель которых – подчеркнуть характерную черту человека, особенность, качество его характера, а метафоричность употребления этого существительного создает компактность и образность.

Следовательно, проанализировав причины, которые вызывают повышенную частотность слов в некоторых произведениях, мы пришли к выводу, что ими могут быть:

1) соотношение прямой и авторской речи (напр., в ДП);

2) особенности авторского стиля (частота местоимения вона, существительного око в С1, С2, союза та в СМ, С1, С2).

В заключение можно сделать следующие выводы.

Данные, полученные количественным путем, дают строгие основания для качественных стилистических интерпретаций, обосновывая, уточняя, обогащая интуитивные домыслы исследователей.

Возможно, что за сухими цифрами расхождений и совпадений частот языковед со временем научится распознавать те условия, которые их вызывают, то есть перейдет от структуры речи к структуре художественного содержания.

В использовании количественных методов имеются и свои трудности, которые связаны с нестрогостью понятий, имеющихся в традиционных описаниях языка и речи. Они не позволяют иногда правильно и однозначно выделять те или иные элементы речи. Это хорошо известно, например, составителям частотных словарей, которые должны сами искать пути к различию грамматических омонимов: союз – частица, наречие – частица, прилагательное – причастие и др. В этом состоит зависимость количественных методов от качественных.

Однако не вызывает сомнений, что наиболее эффективным является комплексный подход, диалектически сочетающий количественные и качественные методы, как две стороны единого процесса познания при исследованиях как языка, так и речи.

Ясно одно – результаты, полученные количественными методами за 25 лет их применения, дали очень много сведений как для теоретического языкознания, так и для решения многих прикладных задач: машинного реферирования, построения различного рода информационно-поисковых систем, методики преподавания языка.

Список литературы

1. Энгельс Ф. Анти-Дюринг. – Маркс К., Энгельс Ф. Соч., 2-е изд., т. 20, с. 5 – 342.

2. Философская энциклопедия. – М.: Сов. энциклопедия, 1962. – Т. 2. – 575 с.

3. Автоматическая переработка текста. – Кишинев: Штиинца, 1972. – 149 с.

4. Андреев Н.Д. Статистико-комбинаторное моделирование языков. – М.; Л.: Наука, 1965. – 502 с.

5. Бектаев К.Б.. Пиотровский Р.Г. Математические методы в языкознании. – Алма-Ата: Изд-во Казах. гос. ун-та, 1973. – Ч. 1. – 281 с.

6. Волкова Н.О., Гинзбург Р.С., Перебойнос В.И. и др. Частотный словарь сочетаемости современного английского языка. – М.: МГПИИЯ им. М. Тореза. 1971. – Ч. 1. – 76 с.

7. Волкова Н.О., Гинзбург Р.С., Перебейнос В.И., Санкин А.А. Лексикографическое пособие. Частотный словарь сочетаемости современного английского языка. – М.: МГПИИЯ им. М. Тореза, 1972, Ч. 2, Вып. 1 (статьи make и good), М.: МГПИИЯ им. М. Тореза, 1972, Ч. 2, Вып. 2 (статьи side, stand, time, there); M.: МГПИИЯ им. M. Тореза, 1972, Вып. 3 (статья word). Донецк, 1974, Вып. 4 (статьи still, think).

8. Волкова Н.О., Гинзбург Р.С., Перебейнос В.И., Хидекель С.С. О частотном словаре современного английского языка. – Иностр. яз. в высш. школе, 1976, вып. 11, с. 56 – 63.

9. Головин Б.Н. Язык и статистика. – М.: Просвещение, 1971. – 191 с.

10. Головин Б.Н. Введение в языкознание. – М.: Высш. школа, 1973. – 320 с.

11. Григорьев В.И. О коде и языке. – Вопр. языкознания, 1959, № 6, с. 128 – 130.

12. Гринберг Дж. Квантитативный подход к морфологической типологии языков. – Новое в лингвистике, 1963, вып. 3, с. 60 – 94.

13. Ермоленко Г.В. Лингвистическая статистика: Кратк. очерк и библиограф. указ. – Алма-Ата: Изд-во Казах. ун-та, 1970. – 155 с.

14. Зиндер Л.Р., Строева Т.В. К вопросу о применении статистики в языкознании. – Вопр. языкознания, 1968, № 6, с. 120 – 123.

15. Кожина М.Н. О речевой системности научного стиля сравнительно с некоторыми другими. Учеб. пособие. – Пермь: Мин-во высш. и сред. образован. РСФСР, Пермск. гос. ун-т им. А.М. Горького, 1972. – 395 с.

16. Колмогоров Н.А. Замечания по поводу анализа ритма «Стихов о советском паспорте» Маяковского. – Вопр. языкознания, 1965, № 3, с. 70 – 75.

17. Комарова Л.I. Стилерозрiзнювальна потужнiсть слова. – В кн.: Структура мови i статистика мовлення. К.: Наук. думка, 1974, с. 163 – 175.

18. Лингвостатистика и автоматический анализ текста. – Минск: Минск. ин-т иностр. яз., 1973.

19. Муравицька М.П. Статистичнi лiнгвiстичнi дослiдження в украiнському мовознавствi. – Мовознавство, 1967, № 5, с. 47 – 58.

20. Перебейнос В.И. Методы и уровни моделирования нулевого стиля. – В кн.: Вопросы статистической стилистики. К.: Наук. думка, 1974, с. 16 – 35.

21. Статистика казахского текста. Труды группы «Статистико-лингвистическое исследование и автоматизация». – Алма-Ата: Изд-во Казах. ун-та, 1973.

22. Статистика речи и автоматический анализ текста. – Л.: Наука, 1971, вып. 1. – 464 с.; 1973, вып. 2. – 339 с.; 1974, вып. 3. – 404 с.

23. Статистичнi параметри стилiв. – К.: Наук. думка, 1967. – 260 с.

24. Стельмах М. Твори. – К.: Держ. видав. худ. лiт-ри, 1962. – Т. 1, 2.

25. Сучасна украiнська лiтературна мова. – К.: Наук. думка, 1969. – Т. 2. – 436 с.

26. Тулдава Ю.А. Об измерении трудности текста. – В кн.: Труды по методике преподавания иностранных языков. Тарту: Metodice, 1975.

27. Тулдава Ю.А. О статистической структуре текста. – В кн.: Советская педагогика и школа. Тарту: Изд-во Тартус. ун-та, 1974, с. 5 – 33.

28. Фрумкина Р.М. Роль статистических методов в лингвистических исследованиях. – Маш. перевод и прикл. лингвистика. М.: МГПИИЯ им. М. Тореза. 1972, вып. 15, с. 3 – 34.

29. Шахматов А.А. Синтаксис русского языка. – Л.: Учпедгиз, 1941, изд. 2. – 620 с.

30. Энтропия языка и статистика речи. – Минск: Минск. ин-т иностр. яз., 1966. – 340 с.

Загрузка...