ТЬМА-ТЬМУЩАЯ

Почти одновременно с опытом машинного перевода на БЭСМ был проделан и другой эксперимент на машине «Стрела» под руководством О. С. Кулагиной. Машина переводила с французского на русский язык. И хотя опыт Кулагиной не получил широкой известности, как опыт машинного перевода на БЭСМ, он имеет, по мнению специалистов, гораздо большее значение для дальнейших работ в области машинного перевода. Ведь первые переводы, сделанные с помощью электронной вычислительной машины, были лишь опытами. Для того чтобы поставить машинный перевод «на широкую ногу» (добиться, чтобы, вложив в машину книгу на одном языке, мы могли через некоторое время получать перевод на другом), предстоит много работы.

Первый машинный перевод, например, был сделан с помощью словаря из 250 слов. И лишь шесть грамматических правил «управляли» этими словами.

Одно и то же слово может иметь множество значений. В опытах по машинному переводу брались только те слова, которые имели одно, в крайнем случае, два значения. Но здесь возникает трудность — какие из значений выбрать? Машина переводит в полном смысле слова «автоматически», не понимая смысла текста. Какое, например, русское слово выбрать, переводя английское слово «instance», — «инстанция» или «пример»?

Для этого машина начинает «просматривать» окружение слова. Если перед «instance» стоит предлог «for», значит, нужно переводить сразу два слова: «for instance» — «для примера», «например», а не «инстанция».

Ну, а если таких грамматических и синтаксических показателей в окружении многозначного слова нет? Как быть тогда?

Приходится ориентироваться на другие признаки.

Например, английское «solution» может иметь два значения — «решение» и «раствор». Машина просматривает всю фразу, в которой встречалось это слово. Если в ней встречается слово «вопрос» или слово «проблема», то тогда она переводит «solution» русским словом «решение». Если же слов «вопрос» или «проблема» в фразе нет, то дает перевод «раствор».

Решение, конечно, грубое, но на первых порах пригодно и оно. Зато другие языковые тонкости и трудности даже приблизительно, в грубой форме преодолеть гораздо сложнее. Например, такую.

«Un joly papillon» по-французски значит «красивая бабочка». Можно сказать и несколько иначе: «Un papillon joly» — «бабочка красивая». Смысл фразы не изменится от перестановки слов. Но не всегда. Так, «un vrai conte» в переводе на русский язык — «настоящая сказка». A «un conte vrai» — «истинное происшествие», то есть с противоположным по смыслу значением. Как научить машину, переводящую с французского на русский, в одних случаях учитывать значимую перестановку слов, а в других — нет?

Еще пример. Лишь в одном случае из полутора тысяч существительное стоит после прилагательного. Казалось бы, порядок строгий и однозначный. Но только для научной речи. В обычном русском языке мы то и дело ставим прилагательное после существительного. «Друг дорогой», «тоска черная» и тому подобные обороты очень часты в нашей речи. Значит, правило «прилагательное стоит перед существительным» для перевода обычной прозы не годится.

А как быть с синонимами — словами, разными по звучанию, но одинаковыми по смыслу? Возьмем хотя бы одно простое слово «много». Тот же смысл в нашем языке имеют обороты и слова: «обильно», «видимо-невидимо», «по горло», «полон рот», «множество», «бездна», «уйма», «громада», «кипа», «целый короб», «целый лес», «прорва», «пропасть», «тьма», «тьма-тьмущая», «неисчислимое множество», «орава», «плеяда», «куча», «ряд», «сила», «масса» и т. д. и т. п. Как учесть эти слова?

Можно, конечно, все синонимы внести в «машинный словарь». Но какое из них выбрать при переводе английского слова «much»? Ведь они имеют разные оттенки смысла. Выражения «грибов в лесу — сила!» или «грибов в лесу много» в принципе значат одно и то же. Но по стилю различаются. Да к тому же и английское слово «much» имеет несколько значений.

Трудностей, как видите, действительно «тьма-тьмущая». И преодолевать их надо не на глазок, не приблизительно, а с математической точностью. Недомолвок и недочетов машина не признает. Один лишь программист, «хозяин» машины-переводчика, не может решить их. Нужна помощь языковеда.

Но языкознание не привыкло иметь дело с числами. Мел, бумага и доска — вот и вся лингвистическая техника. Слова языка, описательно объясняющие законы языка, — такова точность науки лингвистики.

Однако так было лишь до недавнего времени. Машинный перевод и другие задачи, связанные с кибернетикой, заставили языковедов обратиться к числам и формулам. Родилась математическая лингвистика — дисциплина, совмещающая две, казалось бы, далекие друг от друга науки: языкознание и математику.

Загрузка...