В конце 40-х годов вопрос о возможности машинного перевода только обсуждался американскими и английскими учеными; в 50-х началась совместная работа математиков и лингвистов. В январе 1954 года в конторе фирмы «Интернейшнл бизнес мэшинз» была проведена первая публичная демонстрация перевода с русского языка на английский. В конце следующего года был проведен первый опыт машинного перевода в нашей стране.
Идея Троянского о том, что перевод с помощью машины надо членить на части, «препарировать» текст, получила практическое подтверждение. Только «препарирование» это производит сама машина. Вот как выглядит схема автоматического перевода с русского на английский:
Программа, вложенная в «память» машины, должна учитывать грамматику языка, с которого переводится текст. Точно так же нужно учесть и грамматику языка, на который переводится текст; конечно же, нужен англо-русский словарь, если переводят с английского на русский язык, и т. п.
Все это — и правила грамматики, и словарь — записывается в виде чисел. В последовательность чисел преобразуется и текст, который нужно переводить. Сделать это нетрудно. Каждую букву надо обозначить числом, например: а = 00, б = 01, в = 02, и т. д. Любой текст таким образом можно перевести на машинный язык чисел. Точно так же в виде чисел записывают и словарь.
Первый опыт машинного перевода в нашей стране был проделан под руководством Д. Ю. Панова. Машина БЭСМ переводила с английского языка на русский. Вот как выглядели некоторые английские слова в числовой записи:
the = 212608 (21 — t, 26 -h, 08-е);
method = 110821262830 (11 -m, 08 -e, 21-t, 26 -h, 28 -o, 30 -d).
Встретив в тексте, который нужно переводить, последовательность чисел 212608 110821262830, машина легко может сопоставить их с записанными в «памяти» такими же последовательностями чисел и дать русский перевод — «метод».
А как быть с записью грамматики? Например, в английском языке есть артикли, а в русском их нет. Зато в русском языке есть показатель рода, отсутствующий в английском. В других языках, например полинезийских, вообще отсутствуют грамматические формы склонения, спряжения, рода — их передают служебные слова, а не грамматические окончания.
Поэтому в словарь для машинного перевода рядом со словами ставят целый ряд их дополнительных признаков. Например, указывают род, склонение, обозначает ли данное слово одушевленный предмет. Вот часть из такого англо-русского машинного словаря:
31. Alternate — чередоваться (глагол I спряжения).
32. Altogether — вообще (наречие).
33. Among — среди (предлог-+-родительный падеж).
Конечно, в «памяти» машины эти грамматические категории также обозначаются числами: существительному соответствует число 1, глаголу — 2, и так далее.
Поиск слов в словаре машина делает с огромной скоростью. И точность ее действия весьма велика. С грамматикой дело сложней. Например, при переводе с английского машина «выдала» такую русскую фразу: «Так что хочем ли знать будущий путь Юпитера в небесах или путь электрона в электронном микроскопе». А при переводе с французского на русский: «Мы могем сделать».
Грамматика может хромать и у машины! Впрочем, машина здесь не виновата. Просто составители программы не включили нужное правило, вернее, исключение из правила. В самом деле, если фразы «я прыгаю», «я бегаю» во множественном числе будут «мы прыгаем», «мы бегаем», то почему бы «я могу» не стало во множественном числе «мы могем»? Машина так и сделала, подобно тому как иногда поступают и маленькие дети, обучающиеся языку. И дети, и электронная машина-переводчик добросовестно и последовательно соблюдают все правила языка и только потом узнают, что, кроме правил, есть еще и исключения из них.