Алло, робот! - читать бесплатно онлайн полную версию книги автора Александр Михайлович Кондратов (Глава 8 МАШИННЫЙ ПЕРЕВОД ЧТО ТРУДНЕЕ!) #54

Глава 8
МАШИННЫЙ ПЕРЕВОД
ЧТО ТРУДНЕЕ!

Что труднее — дешифровать древние письмена или переводить с иностранного языка? Вопрос по меньшей мере странный. Ведь при дешифровке письмен нужно, помимо всего прочего, давать и перевод с чужого языка.

И тем не менее переводить с иностранного языка трудней.

Но только не человеку, а машине.

Во время второй мировой войны секретные донесения противника расшифровывались с помощью электронных вычислительных машин и методов статистики. Эти методы и заставили ученых задуматься: а нельзя ли применить их для перевода текстов с языка на язык?

«Нельзя ли рассматривать проблему перевода как проблему расшифровки тайнописи? — писал один из первых инициаторов машинного перевода американский ученый Уоррен Уивер. — Когда я смотрю на статью, написанную по-русски, я говорю: «Это написано по-английски, но закодировано неизвестными символами. Сейчас начну расшифровывать».

Задача, таким образом, сводится к расшифровке. Только не сообщений, написанных неизвестным секретным кодом, а текстов, написанных на чужом языке. А такая расшифровка секретных сообщений — дело нетрудное для вычислительных машин.

Но первые же попытки применить ее к задачам перевода сразу показали, что этот орешек будет покрепче. Да и к расшифровке древних письменностей эта методика не применима. Когда мы расшифровываем секретное донесение, мы твердо знаем, что оно написано на .каком-то из известных нам языков. Форма, структура языка не затрагивается шифром, он является подобием «морзянки». Поэтому возможно раскодировать самый запутанный секретный шифр.

При дешифровке древних письмен язык неизвестен, и нет никакой уверенности, что можно подыскать среди «живых» языков мира подходящий. Напротив, почти с полной уверенностью можно утверждать, что такой язык не найти.

Вы, наверное, читали рассказ Эдгара По «Золотой жук». Его герой Уильям Легран нашел пожелтевший пергамент с загадочной надписью:

Пользуясь статистикой, Легран сумел прочесть эту шифрованную надпись. Зная, кал часто встречаются буквы английского языка, он приравнял самый частый знак надписи к самой частой букве алфавита; второй по частоте знак шифровки — ко второй букве, и т. д. Но если бы Легран попробовал применить свой метод к расшифровке древних письмен, он не получил бы желаемого результата.

Например, стремясь расшифровать рукописи майя, он быстро бы зашел в тупик. Как отождествлять знаки рукописи? Древний язык майя неизвестен, и неоткуда взять «самую частую букву языка» и сопоставить ее с «самым частым знаком». К тому же знаки майя могут передавать не только одну букву, но и целые слоги и даже слова. И сколько бы ни бился дешифровщик над письменами, при такой методике он ни за что не смог бы прочесть древние знаки. Не помогли бы и электронные вычислительные машины, будь они во времена Эдгара По.

Задача машинного перевода еще бодее сложна, чем дешифровка древних письмен. Ведь при переводе с языка на язык, как замечает один из пионеров машинного перевода в нашей стране Дмитрий Юрьевич Панов, мы «меняем всю ту сложнейшую и тончайшую систему выражения мыслей, которая веками вырабатывалась тем или иным народом и теснейшим образом связана с его мышлением, историей, обычаями, образом жизни».

А это значит, что для машинного перевода нужно искать новые методы, новые программы, а не слепо идти проторенной, но ведущей в тупик «шифровальной» дорожкой.