Фреймы для представления знаний - читать бесплатно онлайн полную версию книги автора Марвин Минский (Приложение Критика логистического подхода) #7

Приложение Критика логистического подхода

«Когда кто-либо пытается описать реальные мыслительные процессы с помощью традиционно-формальной логики, результат часто оказывается неудовлетворительным; в этом случае, несмотря на существование целого набора правильных операций, теряется смысл процессов, а то, что было жизненно важным, значительным, творческим, как-то исчезает из формулировок».

М.Вертхаймер (1959)

В приложении я хотел бы разъяснить, почему считаю большинство логических подходов малоэффективными. Еще со времен Аристотеля предпринимались серьезные усилия, чтобы представить рассуждения с помощью логистической системы, т.е. такой системы, в которой полностью отделены друг от друга предложения, которые содержат конкретную информацию, и силлогизмы или общие законы построения правильных высказываний. На протяжении веков никому не удалось продемонстрировать успешное функционирование такой системы на реальном и значительном множестве высказываний. Я полагаю, что подобные попытки будут и впредь заканчиваться неудачно, но не вследствие дефектов логических формализмов, а из-за самого характера логистического метода. (Последние опыты базировались на логике предикатов первого порядка, но не в ней корень зла).

Типичная попытка имитации рассуждений на уровне здравого смысла начинается с выбора «микромира» ограниченной сложности. С одной стороны, задаются цели высокого уровня, например: «Я хочу попасть из дома в аэропорт»; с другой — множество небольших высказываний — аксиом, например: «Автомобиль находится в гараже», «Никто не выходит из дома раздетым», «Чтобы попасть в какое-то место, человек должен двигаться в том направлении» и т. д. Для работы системы используются процедуры эвристического поиска, с помощью которых должна быть доказана достижимость поставленной цели и найден соответствующий перечень необходимых действий.

Я не буду останавливаться и анализировать историю всех имевших место попыток получить из набора аксиом целевые высказывания, а приведу по этому вопросу свое мнение: в простых случаях можно добиться, чтобы подобные системы могли «действовать», но по мере приближения выбранного микромира к реальному трудности становятся непреодолимыми. Проблема поиска подходящих аксиом или, иначе, проблема «задания фактов» на основе всегда логически правильных допущений оказалась значительно более трудной, чем это ранее предполагалось.

ФОРМАЛИЗАЦИЯ ЗНАНИЙ. Главной проблемой в изучении интеллекта является проблема создания основы знаний. Мы слишком мало знаем о содержании и структуре обычных знаний независимо от того, какую цель преследуют наши исследования: создание логистических систем или что-либо иное. Самая простая система здравого смысла должна быть информирована о таких категориях, как причина и следствие, время, цель, местоположение, процесс, вид знаний; ей также необходимы сведения о том, как приобретаются, представляются и используются знания. В этой области необходимы серьезные эпистемологические исследования. Работы Дж.Маккарти (смотрите, например, Дж.Маккарти, 1968а,б; Дж.Маккарти и П.Хэйес,1969) и Е.Сандуолла(1970) ценны именно в этом плане. У меня еще не сложилось определенного представления о том, как следует проводить подобные исследования; замечу лишь, что выбранный аппарат представления будет сильно влиять на ценность решаемых задач и здесь уже логистика приносит вред.

РЕЛЕВАНТНОСТЬ. Ключевой является проблема выбора из избыточного множества релевантной информации. Современная эпистемология во многом отличается от прежних теорий познания. Необходимы новые и общие представления о вычислениях. Наиболее ценная по своему характеру часть знаний не может передаваться нам извне, скорее, она внутренне должна быть доказана. Для каждого факта человеку требуются метафакты, сообщающие о том, каким образом и когда их можно использовать. В пределах ограниченного микромира можно установить способы взаимодействия между ситуациями, действиями и случайными явлениями. И хотя данная система сможет на базе заданных аксиом выполнять дедуктивные построения, она не сможет определить, когда ей следует это делать, а когда нет.

Например, человек может пожелать сообщить системе следующее: «Не переходи дорогу, если приближается автомобиль». Но он не может потребовать того, чтобы система доказала, будто автомобиль не приближается, поскольку подобное доказательство обычно будет совсем не тем, что нам нужно. Системе PLANNER (С.Хьюитт,1971) можно дать указание попытаться доказать, что автомобиль приближается, и сообщить, что только в том случае, если эта (ограниченная) попытка дедуктивного вывода окажется безуспешной, можно переходить улицу. Чисто логистическая система ничего подобного сделать не позволяет. Первой реакцией должно быть: «Посмотреть налево, посмотреть направо». Но если сообщить системе данные о скоростях, тупиковых переулках, вероятностях обгона на повороте и др., доказательство становится необозримым и потому невозможным. Нам следует представить и сделать понятным системе слово «обычно». В конечном счете, потребуется понять компромисс между гибелью и деятельностью, ибо нельзя ничего сделать, будучи парализованным страхом.

ЕДИНООБРАЗИЕ. Даже сформулировав ограничения на использование релевантной информации, в логистических системах нам все равно придется столкнуться с проблемой её правильного использования. В таких системах все аксиомы обязательно должны быть «разрешенными», ибо с их помощью вырабатываются новые заключения. Любая дополнительная аксиома ведет к появлению новых теорем, и поэтому ни одну из аксиом потерять нельзя. Вся сложность в том, что нет явного способа указать системе, какие выводы следует делать, а какие — не следует. Если мы зададим достаточно аксиом, чтобы на их основе вывести все требуемые нам следствия, то, кроме того, мы докажем значительно большее число других вещей. Если, однако, попытаться изменить это положение, задав ряд аксиом о релевантности данных, то это приведет лишь к росту числа нежелательных теорем: к старым добавятся такие теоремы, которые будут содержать утверждения относительно их нерелевантности.

Логиков обычно интересуют сами процедуры доказательств, они не обращают внимания на возможный рост дедуктивных систем и поэтому могут получать те утверждения, которые их интересуют. При развитии интеллекта ситуация будет иной. Субъект должен научиться определять, во-первых, какие из признаков в каждой ситуации основные, а какие нет, и, во-вторых, какие виды дедукции не должны восприниматься слишком серьезно. Обычная реакция на рассказы лгунишки — смех, из чего следует сделать вывод, что отклонять следует не его исходную посылку-аксиому, а его дедуктивные построения. В этой связи возникает следующая проблема.

ЗНАНИЯ ДЛЯ УПРАВЛЕНИЯ ПРОЦЕДУРАМИ. Отделение аксиом от процесса вывода делает невозможным использование классифицированных знаний об имеющихся в системе утверждениях или фактах. Мы также не можем включить в нее знания об управлении процессом дедукции. Проблема состоит в том, чтобы аксиоматизировать наши представления об аппроксимации и близости объектов друг к другу. Человеку привычно свойство транзитивности, скажем:

(А около B) /\ (B около С) => (А около С),

но неограниченное применение такого правила приведет к тому, что все предметы окажутся расположенными по соседству друг с другом. Можно применить нечто вроде технической шутки:

(А (около)^¹ В) /\ (В (около)¹ С) => (А (около)² С),

допустив при этом, скажем, только пять степеней для понятия «около»: около, (около)², .... (около)⁵. Можно изобрести какие-то аналоговые величины или параметры. Но в логистической системе нельзя ограничиться применением, например, трех правил транзитивности подряд, если на то нет серьезных оснований. Я не знаю пока, как же следует разрешить эту проблему, и, по имеющимся сведениям, никто еще не предложил в этом плане чего-либо делающего ему честь. Хочу лишь отметить тот факт, что, поскольку логистический подход достаточно распространен, никто непредвзято не исследовал подобный тип процедурных ограничений.

КОМБИНАТОРНЫЕ ПРОБЛЕМЫ. Логическим системам, на мой взгляд, не удастся избежать комбинаторного взрыва в том случае, если будет найдена возможность представления более обширных знаний. Хотя время от времени мы получаем сведения об успешной работе подобных систем в ограниченных микромирах, следует иметь в виду, что для исследований по искусственному интеллекту это обычная ситуация: система высокого качества, решающая трудные головоломки, часто оказывается непригодной для работы в более крупных проблемных областях.

СОВМЕСТИМОСТЬ И ПОЛНОТА. В процессе своей умственной деятельности человек критически оценивает имеющиеся у него планы и перечни целей, пересматривая свои знания и правила их использования. Некоторые из этих действий можно непосредственно внести в саму программу доказательства теорем и использовать их для последующего самоанализа, но человек в действительности хочет представлять их себе более естественным образом, в виде свода декларативных правил. Почему же тогда ученые стремятся, чтобы именно логистические системы выполняли эту работу? Действительная причина заключается в том, что такие системы весьма просты и элегантны; если бы они еще были и эффективны, было бы просто замечательно. Чаще указывают на другую причину, неверную по своей сути, именно, что подобные системы математически строги, поскольку они обладают свойствами:

(1) полноты, т.е., «можно доказать все истинные утверждения», и

(2) совместимы, т.е. «нельзя доказать ни одно ложное утверждение».

По всей видимости, люди часто не понимают, что полнота — это достоинство не такое уж редкое. Оно является тривиальным следствием любой процедуры исчерпывающего поиска, поэтому всякая система может быть переведена в категорию «полных», если к ней подсоединить любую другую полную систему и после этого чередовать этапы вычислений. Совместимость — понятие более тонкое, оно предполагает отсутствие противоречивости в наборах аксиом. Мне кажется, что в системах искусственного интеллекта подобного требования не следует придерживаться, ибо ни одна система естественного интеллекта не является полностью совместимой. Важно то, каким образом человек разрешает парадокс или находит выход из конфликтной ситуации, каким образом человек учится на своих и чужих ошибках, как распознает и отбрасывает всевозможные несоответствия.

Подобные неправильные представления привели к тому, что теорема неполноты Гёделя стимулировала появление совершенно беспочвенных утверждений о различиях между человеком и машиной. Никто, видимо, не заметил ее более «логичной» интерпретации, именно, что стремление к совместимости налагает определенные ограничения.

Конечно, есть и будут различия между людьми (которые доказуемо несовместимы) и машинами, конструкторы которых создавали их на основе этого принципа. Но для машин вовсе не является необходимым программирование на основе только совместимых логических систем. Те же философские рассуждения, которые выше не были нами приведены, но, тем не менее, подразумевались, использовали это ненужное допущение. (Полученные не так давно результаты, показывающие совместимость современной теории множеств, рассматриваются мною не как доказательство потенциальной возможности ее использования в системах искусственного интеллекта, а, наоборот, как подтверждение ее вероятной неприменимости для наших целей.)

Когда одного известного математика предупредили, что, сделав еще один логический шаг в своем доказательстве, он придет к парадоксу, тот совершенно серьезно ответил: «А я не буду делать этот шаг». Значительная часть наших обычных (и даже математических) знаний напоминает знания людей — представителей опасных профессий, которые должны очень хорошо знать, когда и какие действия следует считать неразумными. В наших условиях нужно дать ответы на следующие вопросы: в каких случаях возможно применение тех или иных видов аппроксимаций; когда различные критерии могут предопределить получение различимых оценок; какие утверждения и какие типы ссылок допустимы и другое. Концепции, основанные на свойстве транзитивности, представляют значительный интерес и от них вовсе не следует отказываться лишь потому, что еще не найдена удовлетворительная система аксиоматизации. Подводя итоги, отметим следующее.

1. Логические рассуждения недостаточно гибки и не могут служить основой для мышления; они представляются мне в виде набора эвристических методов, эффективных только тогда, когда применяются к упрощенным схематическим планам. Совместимость, требуемая логикой, в иных аспектах обычно не обеспечивается и, вероятно, даже нежелательна, поскольку совместимые системы по своим возможностям будут, видимо, недостаточно мощными.

2. Я сомневаюсь в возможности эффективного представления обычных знаний в виде совокупности простых, независимых, «истинных» утверждений.

3. Стратегия полного отделения конкретных знаний от общих правил вывода слишком радикальна. Мы нуждаемся в разработке более непосредственных способов соединения фрагментов знаний, позволяющих дать совет, каким образом их следует использовать.

4. Декларативная форма представления информации, которую долгое время считали наиболее подходящей для проведения дедуктивных выводов, оказалась не столь уже необходимой, ибо мы нашли способы манипуляции структурными и процедуральными описаниями.

Я не собираюсь утверждать, что мышление во многом может самостоятельно развиваться без чего-либо подобного рассуждениям. Мы, без сомнения, нуждаемся и используем элементы силлогистической дедукции, однако их применение должно подчиняться процессам «согласования» и «конкретизации», вызванным к жизни другими функциональными потребностями. К традиционной формальной логике следует подходить как к техническому инструменту для уточнения всего, что может быть выведено из некоторого множества данных или для подтверждения того, что данное следствие можно получить совершенно определенным образом; формальная логика совершенно непригодна для обсуждения того, какая информация требуется и что должно выводиться при обычных обстоятельствах. Подобно абстрактной теории синтаксиса формальная логика нуждается в мощной процедуральной семантике, без которой она попросту бессильна в сложных проблемных ситуациях.

Не следует категорически утверждать, что принцип совместимости, столь важный для математической логики, оказал губительное влияние на исследования в области моделирования мышления. Однако в общем плане он привел к роковой концепции о потенциальных возможностях машин вообще. На «логическом» уровне были заблокированы попытки представления обычных знаний, ибо все работы предполагали поиск набора таких истин, которые бы не зависели от контекста и были почти всегда сами по себе справедливы. На уровне моделирования интеллекта был задержан процесс осознания того факта, что мышление всегда начинается с наводящих на мысль, но несовершенных планов и образов, которые (если это вообще имеет место) постепенно совершенствуются и заменяются лучшими вариантами.