Создать язык-посредник, конечно, очень трудно. Он должен вместить в себя все богатство нескольких тысяч языков, все грамматические формы, все падежи, суффиксы, приставки, формы единственного, множественного, двойственного и тройственного чисел.
Пока что такого удивительного языка-посредника для машинного перевода еще не существует. Но ученые разрабатывают различные проекты этого «всеобщего языка». Например,-создается «универсальная грамматика»: она должна показать самые общие законы, присущие всем языкам мира. Мы расскажем здесь лишь о наиболее увлекательной и многообещающей области машинного перевода. Это создание «языка смысла», с помощью которого ученые надеются научить машину понимать переводимый ею текст!
Как переводит человек с языка на язык? Разумеется, по смыслу. Поиск в словаре нужных слов — это важная, но отнюдь не главная часть перевода. И она, как вы сами убедились, легко автоматизируется. Но как автоматизировать перевод по смыслу?
Решить эту, казалось бы, неразрешимую задачу помогают так называемые «смысловые множители».
«Паровоз», «пароход», «самолет», «вездеход», «вертолет»… Состав этих сложных слов ясен. Ясны и те «единицы смысла», из которых образуется их значение. Ну, а если взять не сложные слова, а простые? Можно ли в них найти «единицы смысла»? Или, может быть, значение отдельного слова (разумеется, простого, а не сложного) как раз и является тем самым «атомом смысла», из которого затем строятся «молекулы» сложных слов и целых предложений?
Этим вопросом занялись сотрудники лаборатории машинного перевода при Первом московском педагогическом институте иностранных языков. По их предположению, «атомом смысла», является не слово, а более мелкие единицы — «смысловые множители».
Вот как выявлялись эти «атомы смысла». Сначала брали два одинаковых по значению высказывания. Например, «он недомогает» и «он нехорошо себя чувствует».
Затем из этих фраз извлекали смысловые множители. Первый- «отрицание» (из слова «нехорошо»); второй — «положительность» (из того же слова); третий — «ощущение» (из слова «чувствовать»). Значение слова «недомогать» можно тогда выразить как сочетание трех смысловых множителей: «отрицание» — «положительность» — «ощущение».
Точно так же можно записывать смысл и других слов, и целых фраз, после того как извлечены другие смысловые множители, новые «атомы смысла». Например, слова «да», «конечно», «так», «верно», «истинно», «правильно», «ей-ей», «как же», «совершенно верно», «именно», «согласен» записываются одним семантическим множителем — «утверждение». Из одних и тех же смысловых множителей могут состоять не только слова, но и целые фразы.
Например, приведенные нами фразы: «он недомогает», «он нехорошо себя чувствует» и, кроме них, «плохо себя чувствует» — имеют одни и те же смысловые множители:
«отрицание» — «положительность» — «ощущение». «Он болеет»: «отрицание» — «положительность» — «ощущение»
(ведь болезнь — это и есть отрицание «хорошего чувствования»), «Он занемог» — те же множители, и т. д. Иногда число фраз, составленных из одних и тех же «атомов смысла», может доходить до четырехсот — настолько богат русский язык.
Зная «атомы смысла», машина-переводчик может анализировать текст, записывать его в виде единиц смысла. Затем мы можем дать ей команду записать этот же смысл, но уже в виде слов другого языка. Ведь основные «атомы смысла», вроде приводимых нами «отрицание» — «положительность» — «ощущение», во всех языках мира одни и те же. Подобно тому как бесконечное многообразие нашего мира строится из «горстки» атомов и молекул, бесконечное многообразие фраз и слов всех языков мира строится из небольшого количества «атомов смысла». Они-то и могут быть «словами» машинного языка-посредника.
Более того: осуществляя перевод с помощью смысловых множителей, машина, по существу, делает то же, что и человек-переводчик, — она переводит по смыслу!
Поиск «атомов смысла» только начат. Часть слов как русского, так и других языков мира потребует особой записи. Например, собственные имена, названия видов животных и растений, домашней утвари, вероятно, будут записываться не в виде смысловых множителей, а обозначаться номерами. Эти номера будут храниться в «памяти» машины.
Большие трудности доставят ученым и стилистические особенности речи. На языке смысловых множителей фразы «ничтожный человек», «маленький человек», «человечек», «ничтожество», «человек без способностей», «бездарность» будут записывать одними и теми же «атомами смысла». Но любому ясно, что это не совсем так — эмоциональная окраска придает словам и фразам различные оттенки смысла, увы, пока что невыразимые в «атомах смысла».
Впрочем, никто и не пытается автоматизировать перевод эмоциональной, обыденной речи. А тем более поэзии и художественной прозы. Перевод научной и технической литературы с помощью электронных вычислительных машин — такова задача сегодняшнего дня. И, как замечает один из пионеров машинного перевода Уоррен Уивер, «Пушкин может не беспокоиться»,