Глава третья Обучение, память и парадигмы[1]

«Природа дает ребенку различные средства для исправления всяческих ошибок, которые он может совершить по отношению к окружающим его предметам. При каждой возможности его взгляды корректируются опытом; неудача и боль являются непременными спутниками ошибочных взглядов, тогда как удовольствие и наслаждение возникают при правильных суждениях. Имея таких учителей, нам ничего другого не остается, как стать хорошо информированными людьми и быстро научиться рассуждать правильно...

В научной практике наблюдается нечто совершенно противоположное: ошибочные суждения, которые мы вырабатываем, не влияют ни на наше существование, ни на наше благополучие, и никакая физическая необходимость не заставляет нас их изменить. Напротив, воображение, которое вечно старается выйти за рамки истины, в сочетании с самовлюбленностью и самонадеянностью, которые мы так склонны лелеять, побуждают нас делать заключения, которые непосредственно из фактов не следуют...»

А.Лавуазье(1952)

Парадигма (от греч. paradeigma — пример, образец) – система форм изменяющегося слова или целой конструкции в предположении. Здесь этот термин используется для обозначения совокупности различных представлений об одних и тех же объектах или процессах.

Как удается обнаружить фрейм для представления новой ситуации? Очевидно, что мы не можем разрабатывать какую-либо законченную теорию вне рамок глобальной схемы для организации знаний вообще. Если же допустить, что мы работаем в относительно узкой области, то у нас появится возможность обсудить некоторые важные вопросы:

ПРЕДВОСХИЩЕНИЕ: как сделать первоначальный выбор такого фрейма, который бы удовлетворял некоторым заданным условиям.

ДЕТАЛИЗАЦИЯ: как выбирать и конкретизировать субфреймы, чтобы иметь возможность представлять дополнительные подробности.

ИЗМЕНЕНИЕ: где и как искать другой фрейм, если предыдущий подходит недостаточно хорошо.

ОБНОВЛЕНИЕ: что делать, если приемлемого фрейма найти не удается. Можно ли модифицировать один из существующих или надо строить совершенно новый?

ОБУЧЕНИЕ: какие фреймы должны запоминаться в долговременной памяти, а какие модифицироваться в процессе накопления опыта?

Широко распространено мнение, что память — это нечто совершенно отличное от остальной части мышления; однако для того, чтобы создать полезную и эффективную модель памяти, требуются те же стратегические принципы, которые используются при анализе других аспектов мышления.

Мы говорим о человеке, что он умен, если он может быстро находить весьма подходящие фреймы. Система извлечения информации у этого человека работает лучше, чем у других при выработке правдоподобных гипотез, при определении условий, которым должен удовлетворять новый фрейм, и в части использования тех знаний, которые были приобретены на «неудачных» ветвях процесса поиска. Организация удачной модели памяти является задачей не менее сложной, чем решение любых других задач того же класса. Поэтому хороший механизм извлечения информации лишь частично может базироваться на основных «врожденных» механизмах. Он в значительной степени должен зависеть от (приобретенных в процессе обучения) данных о структуре своих собственных знаний. Наше предложение по этому вопросу объединяет в себе ряд компонентов, включая методы распознавания образов, теорию групп и сети подобия.

При зрительном восприятии, например, комнаты или процессе понимания рассказа человек собирает сеть, состоящую из фреймов и субфреймов. В этой сети представляется все, что было замечено, или существует в предположении, будь то правильным или ошибочным. Мы уже отмечали, что активный фрейм, т.е. участвующий в процессе «понимания» системой ИИ (в данном случае) внешней для нее ситуации, не может оставаться таковым, если не выполнены условия, определяемые маркерами его терминалов.

Теперь мы вводим постулат о том, что все фреймы, задания которых конкретизированы в некоторой ситуации, обязательно должны выступать в качестве значений для терминалов фреймов более высоких уровней. Это же относится и ко всем существенным фрагментам «данных», собранным при наблюдении и хранимым в памяти системы ИИ.

Конечно, здесь не может не быть исключений! Мы должны предусмотреть возможность существования определенного числа групп данных, связанных с чем-то подобным регистрам «кратковременной памяти». Следует, однако, помнить, что лишь незначительная часть информации может длительно храниться в памяти, если она не связана с соответствующими фреймами. Предложенная схема концептуальна по своей сути, но, тем не менее, в определенных областях следует допустить существование других типов «зацепок» в памяти и специальных сенсорных буферов.

3.1. Требования к памяти

Мы можем представить себе, что память — это система, управляемая двумя дополняющими друг друга потребностями. С одной стороны, это потребность в правильном представлении объектов (сообщений, новых предметов и пр.), которое осуществляется с помощью подключения их к более крупным фреймам; с другой — потребность в конкретизации заданий терминалов. Остальная часть этой системы будет стремиться сбалансировать их требования, но не столько на базе «общих принципов», сколько в соответствии со специальными знаниями и теми условиями, которые определяются текущими целями.

Если применение какого-либо фрейма окажется неудачным (например, нельзя подобрать нужное задание по какому-то важному условию), следует что-то предпринять, но что? На наш взгляд, существуют следующие возможные пути приспособления фреймов.

СОПОСТАВЛЕНИЕ ОБРАЗЦОВ. Когда ничего более конкретного найти не удается, можно воспользоваться одним из основных механизмов — механизмом ассоциативного поиска. Это может принести успех в относительно простых ситуациях, но должно являться лишь вспомогательным средством при использовании других тактик.

ОПРАВДАНИЕ. Довольно часто может быть найдено объяснение или оправдание неудаче при согласовании. Например, маленький по своим размерам стул может относиться к классу предметов «игрушки».

СОВЕТ. Фрейм содержит четкие указания относительно того, что делать при его неудачном согласовании. Ниже мы рассмотрим обширную «сеть подобия», получаемую в результате обучения и хранящую подобные знания.

РЕЗЮМЕ. Если фрейм нельзя приспособить к реальной ситуации или заменить другим, от него следует отказаться. Но прежде надо четко указать причину отказа или составить резюме так, чтобы в будущем помочь любому процессу в решении задач, связанных с аналогичной переориентацией субфреймов.

На мой взгляд, все эти четыре варианта жизненно необходимы, поэтому дальше я рассматриваю их более подробно.

3.2. Сопоставление образцов

При замене одного фрейма другим не имеет смысла начинать весь процесс согласования заново. Но каким образом можно сохранить то, что было уже ранее установлено? Будем рассматривать лишь тот случай, когда при отсутствии специальных знаний система обращается за помощью к некоторой «общей» стратегии. Ни на один из универсальных методов мы не можем в данном случае возлагать очень больших надежд, но если удастся подыскать такой фрейм, который использует достаточное число общих со старым фреймом терминалов, то некоторые из общих заданий можно будет сохранить и это, видимо, будет лучшим выходом из положения.

Данная проблема может быть сформулирована следующим образом: допустим, что Е есть штраф за потерю одного полностью согласованного терминала, а F — потери от того, что какой-то другой терминал не может конкретизировать свои задания. Тогда, если Е больше F, то любой новый фрейм должен сохранять старый субфрейм. При наличии какой-либо приоритетности среди терминалов типичный запрос на вызов нового фрейма должен включать:

1. Поиск фрейма с возможно большим числом терминалов, общих с конкретизированными терминалами (a, b,… z) старого фрейма и расположенных в порядке убывания их приоритетности.

Следует помнить, что заменяемый фрейм является обычно субфреймом некоторого более крупного фрейма и поэтому должен удовлетворять маркерам того терминала, к которому он подключен. Это предопределяет наличие другой формы обращения к памяти, направленной в ее иерархии скорее вверх, нежели вниз.

2. Поиск или создание нового фрейма, обладающего свойствами (a, b,…, z).

В том случае, когда мы в большей степени подчеркиваем различия, а не их общие характеристики, можно объединить оба правила в одно:

3. Поиск нового фрейма, во всем подобного старому фрейму, за исключением различий (a, b, …, z) между ними.

Реализация правил 1 и 2 может быть выполнена с помощью процесса поиска в памяти с параллельной выборкой или хаш-кодированием (метод функции расстановки), если терминалы или свойства (a, b , ..., z) — простые атомарные понятия. (В любом случае должен существовать какой-то механизм для поддержания работы генерирующих программ или для одного из видов сопоставления образцов). К сожалению, для осуществления всего этого имеется так много различных способов, что нельзя указать на какие-нибудь характерные для данных целей требования к конструктивным особенностям этих механизмов.

Хотя правила 1 и 2 формально являются частными случаями правила 3, на практике они различны, поскольку для работы со сложным правилом 3 требуются знания о том, каковы же эти различия (a, b, ..., z). Действительно, последнее правило слишком сложно, чтобы его можно было использовать по той схеме, как это предполагалось выше: я приведу доводы в пользу того, что следует в большей степени полагаться на особые, выявленные в процессе обучения различия между парами фреймов, чем на общие принципы.

Нужно еще раз подчеркнуть, что оснований считать реальной возможность быстрого достижения успеха практически нет. Для решения новых и трудных задач необходимо построить новую структуру представления, а это потребует применения как общих, так и специальных знаний. Работа П.Фримэна и А.Ньюэлла(1971), в которой рассматривается проблема конструирования структур, дополняет данную работу в одном важном направлении. В ней рассматривается вопрос о том, каким образом следует создавать структуры, удовлетворяющие наборам функциональных требований, т. е. условиям, связанным с достижением целей, в дополнение к тем требованиям, которые определяются необходимостью использования определенных субфреймов и символов.

3.3. Оправдание

Можно допустить, что фрейм представляет собой «идеальный» образ реального предмета или явления. В том случае, когда какой-то фрейм не может быть согласован с действительностью (по своей природе все идеальное — ошибочно), он должен быть заменен другим фреймом. Особенность «идеальных» образов заключается в том, что они являются превосходными упрощениями действительности; они привлекательны своей простотой, но реальные возможности и преимущества таких структур зависят от дополнительных знаний об их взаимодействии между собой. Следовательно, у нас нет особых причин отказываться от такого «идеального» образа только потому, что не удалась попытка заполнения конкретными данными всех его пробелов, правда, если при этом подобные расхождения можно объяснить, прибегнув к помощи межфреймовского взаимодействия. Ниже приводятся примеры, в которых «оправдание» такого рода может помочь при неудаче процесса согласования.

ЗАСЛОНЕНИЕ. Мы знаем, что у стола четыре ножки. Однако стоящий рядом стул может заслонять одну из них; чтобы убедиться в правильности такого «оправдания», можно попытаться найти Т-образные соединения элементов конструкций или проанализировать тени от этих предметов.

ФУНКЦИОНАЛЬНОЕ НАЗНАЧЕНИЕ. Геометрически ножка стула представляет собой обыкновенный брусок, но что более важно, в функциональном отношении она представляет собой опору. Поэтому в качестве приемлемой замены для всех ножек можно предложить конструкцию, состоящую из центрального стержня и прикрепленной к нему сверху пластины. Многие предметы могут использоваться для самых различных целей, поэтому в их описании должен преобладать функциональный, а не физический подход.

ПОЛОМКА. Отсутствие необходимых деталей можно объяснить либо тем, что их просто нет, либо тем, что они поломаны. В реальной жизни существует огромное число причин — ниспровергателей наших идеальных представлений.

ПАРАЗИТНЫЕ КОНТЕКСТЫ. Предмет, отличающийся от стула только лишь размерами, может быть (и, видимо, является) игрушечным стулом. Сетование на то, что кто-то или что-то является «слишком маленьким», может быть неправильно интерпретировано с помощью контекстов, содержащих другие предметы из мира детей и их игр.

В большинстве этих примеров для исправления заданий и сохранения текущего фрейма используются знания достаточно общего типа; они могут быть присоединены к фреймам более высоких уровней. В дальнейшем упор будет сделан на более локальные типы знаний, которые естественно разместить в самом фрейме в целях выработки рекомендаций относительно его собственной замены.

3.4. Суждения и сети подобия

«Подтверждение правильности утверждения Наполеона (если оно вообще принадлежит ему) о том, что люди, пытающиеся представить себе любое событие во всех его будущих подробностях, не имеют данных для того, чтобы стать командирами, следует искать именно в первой части этого высказывания. Командир, ожидающий, что ход сражения будет протекать точно так же, как и раньше, через две минуты после его начала обнаружит нечто совсем иное. Его ожидания не оправдаются, а в запасе будет в лучшем случае еще одна схема, да и та не сможет быть ему полезной длительное время. Не менее правдивым может оказаться и такой вариант, когда после первой неудачи этот горе-командир вспомнит сразу так много различных примеров, что не будет знать, как поступить в данном конкретном случае. Слишком конкретизированный опыт прошлого создает такие же затруднения, как и его полное отсутствие. Для правильного удовлетворения требований постоянно меняющейся обстановки мы должны не только уметь выделять те объекты и явления, которые имеют отношение к переменам, но и знать, какие их части (свойства) могут развиваться и изменяться, не нарушая при этом общего смысла и функциональной значимости».

Ф.Бартлетт(1932)

При перемещении по знакомой квартире нам известна структура поиска информации, основанная на фрейме комната. Когда мы проходим через дверь D комнаты X, то ожидаем, что очутимся в комнате Y (конечно, если D не является наружной дверью). Этот факт может быть представлен с помощью трансформации простейшего типа, состоящей из указателей между двумя фреймами комнат в рамках системы фреймов типа дом.

Если дом, где происходит действие, ранее не был знаком, то в своих рассуждениях логично переместиться вверх на один классификационный уровень и использовать следующее правило: когда вы выходите из одной комнаты, обычно следует предполагать лишь то, что вы очутитесь в какой-то другой комнате и не более. Недостаточность конкретной информации может быть преодолена использованием обобщений типа классов ситуаций; если же вернуться к незадачливому командиру Ф.Бартлетта, то описанная у него дилемма разрешается применением некоторой формы абстракции или обобщения.

В некотором смысле использование обобщений (классов) является неизбежным: если конкретная информация отсутствует, человек обращается к классам как к теории «первого порядка», лежащей в основе любых сложных моделей. К счастью, нет необходимости использовать классы явным образом, что могло бы повлечь за собой определённые неприятности. Если рассматривать класс в буквальном или строго математическом смысле, то это вовлекает нас в проблему иерархии, основанную на включении в нее различных понятий; порядок в такой системе будет неудовлетворительным из-за различным образом связанных между собой концепций, находящихся в разных контекстах. Этот вывод справедлив также для процедур и фреймов. Нам следует стремиться к тому, чтобы не оказаться связанными с подобными негибкими классификаторами знаний.

П.Уинстон(1970) предложил способ создания системы поиска информации, в которой могли бы быть представлены классы и обеспечен ряд дополнительных возможностей. Указатели поиска информации в такой системе можно приспособить для выражения целевых условий и результатов действий, а также для определения принадлежности понятий к определенным классам. Поскольку эта идея известна еще далеко не всем, я попытаюсь объяснить ее на примере, взятом из работы П.Уинстона(1970).

Что означает ожидать увидеть стул? Обычно то, что он состоит из четырех ножек, нескольких перекладин, сидения и спинки, находящихся друг с другом в определенных отношениях. Например, ножки должны опираться на пол и находиться ниже, а спинка выше сидения; само сидение должно располагаться горизонтально, спинка — вертикально и т. д. Предположим теперь, что система зрительного восприятия не смогла обнаружить спинку: все есть (четыре ножки, ровная поверхность — сидение), а спинки нет. «Различие» между тем, что мы видим, и тем, что мы ожидали увидеть, состоит в отсутствии требуемого числа спинок, а это свидетельствует скорее о наличии не стула, а скамьи или стола.

П.Уинстон считает целесообразным снабдить каждое описание, находящееся в памяти, указателями к другим описаниям, причем каждому указателю должен соответствовать свой маркер отличия между связанными им парами понятий. Если в процессе согласования фрейма встретятся какие-либо затруднения, то они должны согласовываться с указателями, выходящими из данного фрейма; это может снабдить систему предложениями по выбору более подходящего фрейма. П.Уинстон назвал образующуюся при этом структуру сетью подобия.

Он предлагает поручить компьютеру вести упорядоченное сопоставление находящихся в памяти моделей во время его «холостого хода» и при выявлении между ними существенных различий вводить соответствующие указатели.

Та же информация может быть получена и в процессе согласования какой-либо реальной ситуации с хранимыми в памяти данными, ибо следующие одна за другой попытки дают результаты далеко не во всем отличные друг от друга, а различия эти всегда можно зафиксировать. Таким образом, в процессе обычного использования содержащихся в памяти данных можно получать дополнительные сведения и использовать их для расширения сети подобия. Если процедура образования новых указателей чувствительна к записи различий, относящихся к достижению цели, то результат будет еще более ценным, ибо появится возможность реализации механизма обучения на основе собственного опыта.

Можно ли на практике создать сети подобия? На первый взгляд кажется, что это может привести к неограниченному росту требуемого объема памяти. И в самом деле, если имеется N фреймов и К типов различий, то общее число указателей может достигнуть величин KNN и следует опасаться того, что:

1) если N велико, скажем, равно 107, то NN будет слишком велико и объем требуемой памяти, по крайней мере, для людей, может оказаться попросту нереальным;

2) для устранения какого-то различия или согласования фрейма может потребоваться такое большое число указателей, что система окажется малоэффективной ввиду ее плохих избирательных свойств;

3) само К может быть весьма велико в том случае, когда параметры системы вариативны.

Фактически же ни одна из этих проблем не представляется достаточно серьезной, если рассматривать их по отношению к возможностям человеческой памяти. По современным представлениям (правда, еще недостаточно обоснованным) скорость накопления информации в долговременной памяти человека такова, что вопрос о ее насыщении затрагивать вообще не следует.

Реальность состоит в том, что нам не только не грозит опасность насыщения, но, как это ни парадоксально, связей может просто не хватить! Более того, нельзя рассчитать, во-первых, что мы получим достаточно времени, чтобы установить все требуемые связи, и, во-вторых, что каждое нуждающееся в указателе различие будет в действительности им обладать. Ниже мы рассмотрим вопрос о том, как следует хотя бы частично обойти эту проблему.

3.5. Группы, классы и географические аналогии

«Несмотря на то, что рассмотрение некоторых признаков, свойственных ряду таких категорий, как игры, стулья или листья, часто помогает нам узнавать, каким образом следует использовать то или иное понятие, не существует каких-то определенных совокупностей характеристик, одновременно применимых ко всем элементам данного класса и только к ним одним. Если мы сталкиваемся с ранее неизвестным нам видом деятельности, то используем для его представления тот термин, например „игра“, который соответствует группе похожих действий и, как мы знаем, носит это название. Короче говоря, игры, стулья и листья являются естественными семействами, каждое из которых определяется сетью перекрывающихся, перекрещивающихся одних и тех же признаков. Существованием такой сети объясняется наша успешная идентификация объектов или действий».

Т. Кун (1975)

Чтобы организовать более «полное» функционирование сети подобия, рассмотрим следующую аналогию. В городе каждый человек может посетить любого другого жителя; однако мы не строим пути между всевозможными парами домов, а объединяем группы домов в «кварталы». Мы не соединяем один квартал с другим своей собственной дорогой, ибо знаем, что должны существовать улицы «совместного пользования». Мы не связываем дорогами один город с другим, а прокладываем магистрали между наиболее крупными областными (или другими) центрами. В пределах такой организации каждый ее член непосредственно соединен с другими на своем собственном «уровне», в первую очередь с теми, кто по смыслу наиболее им близок; кроме того, каждый индивидуум связан по крайней мере с небольшим числом ключевых членов групп более высоких уровней. Таким образом, между любыми двумя элементами сети существует (если вообще существует!) весьма короткий путь, состоящий из небольшого числа последовательных связей.

При решении задач поиска в подобных структурах используется иерархия связей, похожая чем-то на ту, что заложена в каждом почтовом адресе. Любой человек обладает определенными сведениями о каких-то обобщенных понятиях, например, он знает, где в его стране расположены наиболее крупные города. Населению крупного города обычно известны многие пригородные центры, а их жителям — близлежащие деревни. Ни одному из нас неизвестны все возможные в городе пути между любыми двумя домами, но зато человек может без труда запомнить самый короткий путь к своему другу, живущему в другом городе; этот путь будет лучше (короче), нежели тот, который согласно общему правилу должен проходить через главный населенный пункт его района. Для решения таких проблем используются адресные книги, с помощью которых выбираются стандартные маршруты между основными узлами в сети. Индивидуальные маршруты могут пролегать в обход главных узлов через хорошо знакомые пункты. И поскольку наши разветвленные службы транспорта успешно справляются со своими задачами, те же стандартные маршруты обеспечивают сравнительно небольшое число пересадок при движении из одного произвольного пункта в другой.

На каждом уровне имеются свои центры или капитолии. Они составляют основу групп следующих иерархических уровней. Например, между городами Нью-Хейвен и Сан-Хосе нет беспосадочной авиалинии, поскольку более рационально использовать магистральную воздушную трассу между Нью-Йорком и Сан-Франциско. Оба этих крупных города являются капитолиями на данном уровне объединения.

По мере роста сети следует ожидать, что появится необходимость в объединении тех элементов, на которые направлены наши указатели подобия. Решения относительно того, что считать главными отличительными признаками, а что второстепенными, будут оказывать значительное влияние на возможности всей системы в целом. Эти решения, накапливаясь, формируют концепты наших представлений об окружающем мире.

Таким образом, дивергенции и конвергенции указателей подобия, которые носят неслучайный характер и связаны с каждым D-различием, объединяют наш концептуальный мир вокруг d-групп и d-капитолиев. Отметим, что идеальным является вариант, когда в одной группе сосредоточены такие капитолии, для которых не существует ни одного более общего для них всех атрибута. В этом случае перекрестные «сходства» являются следствиями локальных соединений в нашей сети подобия. Они, несомненно, достаточны для объяснения того, каким образом мы можем предполагать, что же такое стул или игра, хотя не всегда при этом способны «логически» определить это понятие как элемент в некоторой иерархии классов. Для отражения в сети четких определений не требуется явная согласованность концептуальных групп, однако, она может понадобиться для преодоления затруднений при ориентированном на различия поиске путей, ведущих к поставленной цели.

Выбор капитолиев соответствует выбору таких стереотипов или типичных элементов, чьи заранее заготовленные значения (задания отсутствия) чрезвычайно полезны. Например, формы стульев могут быть самыми разными, поэтому следует тщательно отбирать те фреймы, которые могут стать главными капитолиями в «мире» стульев. Они будут использоваться для быстрого согласования и установления приоритетности среди самых разных различий. Те черты, который относятся к центральному элементу группы и имеют низший приоритет, либо отражают несущественные и в большинстве случаев отсутствующие свойства для всех типов стульев, либо, если требуется большая точность, служат в качестве указателей на локальные «города» и «деревни» в мире стульев. Указатели различия могут носить функциональный, а не только геометрический характер. Поэтому после первой неудачной попытки отнести заданный предмет необычной формы к классу «стулья», человек может проверить применимость к нему следующего функционального правила: «стул есть нечто такое, на чем можно сидеть». Это потребует проведения более глубокого анализа с привлечением таких понятий, как сила и сопротивляемость действию силы. Конечно, этот анализ не будет охватывать игрушечные стулья и стулья с таким утонченным украшением, что о применении их для сидения не может быть и речи. Их лучше рассматривать с помощью метода «оправданий», при котором причина ищется не в виде геометрических или функциональных объяснений, а на основе контекстов, связанных, например, с миром искусства или играми.

Важно подчеркнуть, что нет оснований ограничивать структуру памяти иерархией одного и того же вида, а понятие «уровень» объединения может не совпадать для разных типов различий, d-капитолии могут существовать не только в виде явных деклараций, но и в неявной форме, определяемой посредством сходящихся d-указателей, которые задают их местонахождение в структурах данных.

В системе GPS (General Problem Solver — универсальная программа для решения задач) А.Ньюэлла и Г.Саймона(1959) «различия» упорядочены в иерархию неизменной структуры. Если же приоритетность различий определять в зависимости от решаемых задач, то можно на базе тех же структур памяти достигнуть значительно большего; получающийся при этом решатель задач потеряет свое изящество и простоту, что явится своеобразной платой за отход от используемой в системе GPS логики предикатов первого порядка.

Следует, наконец, отметить и тот факт, что нет надобности создавать какой-то особый механизм для организации групповых структур. Можно предположить, что в процессе эволюции ранее образовавшиеся фреймы будут стремиться стать капитолиями для своих более поздних собратьев (если, конечно, это не очень противоречит опыту), поскольку всякий раз, когда использование одного стереотипа оказывается успешным, его центральное положение подчеркивается присоединением еще одного указателя. Иначе говоря, выделение новых центров знаний происходит в значительной степени под влиянием внешних факторов: словарного запаса, поведения окружающих нас объектов, знания общечеловеческой культуры, полученного нами в школе и семье. На каждом этапе структура уже приобретенных знаний оказывает решающее влияние на весь последующий ход их расширения и углубления. Описанные выше группы и формы представления знаний должны возникать в результате взаимодействия механизмов памяти с внешним миром.

3.6. Аналогии и альтернативные описания

Мы рассмотрели вопросы применения различных фреймов одной и той же системы для описания одной ситуации с помощью различных средств: для изменения положения при восприятии зрительных изображений и для смещения акцентов при использовании языка. Например, в эпизоде с волком и ягненком два фрейма используются в ситуационной паре типа «до — после». Иногда при поиске решений мы применяем два или большее число описаний, если ищем какие-то аналогии или используем разные виды анализа для оценки одной и той же ситуации. Для решения сложных задач использование одной проблемной области обычно оказывается недостаточным!

Предположим, что в вашем автомобиле стал разряжаться аккумулятор. Вы полагаете, что произошло короткое замыкание или неисправен генератор. Генератор можно представить себе как механическую систему: ротор снабжен ведомым колесом, приводимым в движение ремнем от двигателя. Тут же возникают вопросы: достаточно ли туго натянут ремень и имеется ли этот ремень вообще? С точки зрения механика выходным элементом является кабель, идущий от аккумулятора к каким-то другим устройствам: исправен ли он, хорошо ли затянуты болты, прижимаются ли щетки к коллектору? С точки зрения электрика генератор должен описываться иначе. Ротор рассматривается не как вращающееся устройство, а как катушка, индуцирующая магнитный поток. Щетки и коллектор выполняют роль электрических переключателей. Выходным параметром является электрический ток, протекающий по паре проводов, которые соединяют щетки, схему управления и аккумуляторные батареи.

Таким образом, ситуация описана нами в двух различных системах фреймов. В одной из них якорь является механическим ротором со шкивом, а другой — проводником в постоянно меняющемся магнитном поле. Одни и те же (или аналогичные) элементы совместно используются терминалами разных систем фреймов, и эти системы могут трансформироваться одна в другую.

Различия между двумя этими системами фреймов существенны. В «электрической» системе фреймов шасси автомобиля всегда соединено с одной из клемм аккумулятора. Тот, кто ставит диагноз о неисправности, должен использовать в своих рассуждениях и действиях оба вида представления. Если ток не течет, то часто это является следствием того, что проводник его не проводит. Для этого случая трансформация приводит к фрейму, с помощью которого можно установить, что прочное механическое соединение исключает обрыв в электрической цепи. Поэтому любое нарушение проводимости, выявленное путем электрических измерений, заставит нас искать неисправность в «механической» системе фреймов. В нашем обычном понимании «исправность» чего-либо есть синоним понятия «механическая исправность» и поэтому проводимый диагноз должен заканчиваться именно в «механической» системе. В конечном итоге мы можем обнаружить неисправное механическое соединение, выявить разболтавшееся крепление проводника, коррозию, износ и т. д.

Но почему генератор должен быть представлен двумя отдельными системами фреймов, а не одной объединенной структурой? Я полагаю, что в рамках таких сложных задач человек не может сразу представлять себе очень большое число различных подробностей. В каждый момент времени человек должен мыслить в пределах разумно простой структуры. Я утверждаю, что любая проблема, которую вообще может решить человек, вырабатывается в каждый момент времени в рамках небольшого контекста и что ключевые операции, используемые при поиске решений, связаны с формированием соответствующей рабочей среды.

Действительно, поиск неисправности в предыдущем примере требует одновременной работы сразу с тремя фреймами: визуальным, электрическим и механическим. Если данные электрических измерений указывают на неисправность механического соединения, то визуальный фрейм используется человеком при ее отыскании.

Существуют ли общие методы построения компетентных систем фреймов? На этот вопрос можно ответить и положительно, и отрицательно! В самом деле, нам известны некоторые во многом очень ценные стратегии для приспособления уже существующих фреймов к новым целям; вместе с тем следует подчеркнуть, что люди не обладают каким-то единым и таинственным механизмом, позволяющим решать все сложные проблемы. Мы не должны впадать в крайность и требовать существования таких теорий человеческого поведения, которые объясняли бы невозможные вещи!

Не следует ожидать, что для любой ситуации можно будет отыскать или, в крайнем случае, построить в точности соответствующий ей фрейм. Нам, однако, предстоит много поработать над этим вопросом; важно напомнить здесь и о том вкладе общечеловеческой культуры, который был сделан ею в разработку вопросов оценивания сложности различных проблем. Опытному механику при выполнении своей обычной работы нет нужды что-либо изобретать; у него уже сформировано представление, например, о двигателе как совокупности систем зажигания, смазки, охлаждения, синхронизации, смешивания топлива, трансмиссии, сжатия и т.д. Система охлаждения подразделяется на схему циркуляции жидкости, воздушного потока и др. Большинство из таких «обычных» проблем решается систематическим применением аналогий, которое обеспечивается трансформациями между парами фреймов-структур. Элементы огромной сети знаний, приобретенных в школе, из книг, в процессе профессионального обучения, а также из других источников, накрепко связаны друг с другом указателями различия и релевантности. Нет сомнения в том, что культура оказывает большое влияние на формирование такой сети благодаря обычному использованию одинаковых слов при объяснении различных мнений об одних и тех же предметах или явлениях.

Что можно сказать о взаимодействии между элементами фреймов-структур, которое тесно связано со всеми рассматриваемыми здесь вопросами? Гештальт-психолог потребовал бы выполнения такого синтеза (на базе имеющихся у человека сведений), при котором двигатель будет представляться как единое целое. Неплохо, однако, для начала вспомнить, что автомеханик сможет выявить неисправность (если вообще сможет ее отыскать), возникшую как результат взаимодействия трех или более элементов двигателя, только после изнуряющей замены многих его исправных частей. Следует признать, что стремление к полным синтетическим представлениям нецелесообразно и не может выступать в качестве требования для теоретических построений. В действительности должна существовать некоторая структура, объединяющая различные концептуальные типы фрейма «двигатель». Но она тоже может быть относительно простой. К уже рассмотренным типам фрейма «двигатель» следует, видимо, добавить еще один — суперфрейм, терминалы которого будут указывать на первые три типа фрейма (электрический, механический и визуальный) и, будучи связанными друг с другом указателями, сообщать, как и когда именно следует использовать эти субфреймы. Каждая сложная «понимающая» система, по всей вероятности, содержит подобные структуры суперфреймов, которые управляют использованием субфреймов.

Заманчивой кажется идея о том, что более крупные понятия формируются на подсознательном уровне человеческого мышления. По наблюдениям X.Пуанкаре, после периода умственной активности, за которым следует более длительный период ее спада, на человека находит внезапное озарение. Подсознательную деятельность (если следовать взглядам X.Пуанкаре) следует рассматривать как комбинаторный эвристический поиск, в котором вероятность успеха зависит в первую очередь от качества ингредиентов, введенных во время активной умственной работы; эти элементы объединяются самыми разными способами до тех пор, пока не будет получена такая конфигурация, которая выдержит определенный вид проверки.

«Я говорил о чувстве абсолютной уверенности, сопровождающем наше вдохновение..., оно часто вводит нас в заблуждения, но мы обнаруживаем это только тогда, когда пытаемся привлечь на свою сторону доказательства».

X. Пуанкаре (1946).

Итак, продуктом вдохновения является не полностью детализированное решение, а «точка отсчета» или план, доведенный до сознательного уровня мышления, потому что он прошел через порог «эстетической разумности».

Что же касается взглядов X.Пуанкаре, то он, видимо, придерживался (по крайней мере, в данном вопросе) концепции холизма, ибо в его понимании «элегантные» математические объекты есть не что иное, как объекты, «элементы которых расположены настолько гармонично, что ум в состоянии охватить их всех сразу, целиком и в то же время представлять себе все возможные подробности». Из нерассмотренных остался еще вопрос о том, требуется ли для работы фильтров, которые передают на сознательный уровень новые описательные комбинации, проведение активного их анализа или действия таких фильтров смогут получить объяснение на основе более простых операций согласования и поиска информации. К несчастью, математики, за исключением X.Пуанкаре, Д.Пойа и некоторых других, не сумели внести значительный вклад в понимание механизмов решения задач. Мне кажется, что это все же не было следствием их приверженности концепции «элегантности», которая передавалась от одного поколения другому как почитаемое, но не объяснимое и не проанализированное качество. В любом случае я не вижу оснований считать, что подсознательная деятельность отличается либо мощными параллельными вычислениями, либо необычным синтезом, предусматриваемым философией холизма. Более правдоподобно выглядит предположение о проводимых на этом уровне быстрых и неглубоких исследованиях с привлечением тех данных, которые были подготовлены в процессе активного анализа материала. Аспект подсознательного может только указать на отсутствие «аннотации» и какой-либо регистрации мыслительных операций: в противном случае мы получили бы возможность рассмотрения и анализа этих процессов. Вопрос относительно сложности фильтров остается, по-прежнему, открытым.

3.7. Резюме. Использование фреймов в эвристическом поиске

За последние десять лет широкое распространение получила идея о том, что важны все аспекты представления информации с помощью «пространства задачи»; однако мысль о том, что описания могут быть полезны и для самих программ, и для авторов этих программ, не стала столь же популярной. Прогресс в понимании этого ключевого момента был фактически задержан остроумными схемами, созданными для того, чтобы избежать явных манипуляций описаниями.

Основным устремлением, особенно при доказательстве теорем и моделировании игр, была разработка средств, ведущих к систематическому уменьшению протяженности поиска в пространстве задачи. Иногда простая задача может быть решена при помощи последовательного перебора допустимых методов решения: перебор производится до тех пор, пока один из методов не даст положительного результата. В более сложных ситуациях используются усовершенствованные локальные правила поведения, а также варианты «восхождения к вершине» в пределах пространства задачи. Однако если нам и удается таким способом решить определенную задачу, мы получаем мало сведений о пространстве задачи и, следовательно, не повышаем свою квалификацию, что весьма пригодилось бы нам в будущем. Наиболее разработанными в эвристических методах являются игровые методы поиска решений, в которых используются различные стратегии для уменьшения дерева перебора, оценки терминальных вершин и выработки разумного хода. Однако даже в тех системах, где применяются различные способы организации иерархий символьных целей, отсутствует «осознанный» самой системой подход к процессу поиска решений и не совершенствуется качество представления информации. Я предлагаю следующее более совершенное и мощное правило.

Главной целью при решении задач должно быть стремление лучше понять пространство задачи и найти такие представления, в рамках которых данная задача решается довольно просто. Цель поиска состоит в том, чтобы получить информацию для формирования надлежащего представления, а не для нахождения решения, как это обычно предполагается; после того, как удастся соответствующим образом представить это пространство задачи, решение найти будет значительно легче.

В частности, я являюсь противником того, что значимость интеллектуального эксперимента должна оцениваться либо относительно категорий «неудача — частичный успех — успех», либо с помощью таких понятий, как «улучшение ситуации» и «уменьшение различия». Применение какого-то метода или изменение представления могут быть ценными лишь в том случае, когда они ведут к совершенствованию стратегии проведения последующих экспериментов. В более ранних формулировках роли стратегий в эвристическом поиске эти возможности не были выделены, хотя в неявной форме они содержались в рассуждениях о задачах планирования.

Каким образом можно объединить новое правило с классической стратегией минимакса? Пусть мы находимся в определенном узле А дерева решения (играя в какую-нибудь игру, например, шахматы) и исследуем два (или более) возможных хода, скажем В и С. Каждый из этих ходов получает значения оценок V(B) и V(C). Затем оба этих значения объединяются с помощью функции М для того, чтобы выработать одну общую оценку

S(A) = M( V(B), V(C) ) .

По существу, с помощью функции М должны подводиться итоги поиска на всем дереве ниже узла А и определяться оценка позиции А.

Посмотрим, в чем заключается цель подобных действий. Если можно было бы произвести поиск на всем дереве перебора, то мы смогли бы использовать найденную в каждом узле оценку S для принятия решения о том, какой следующий ход лучше всего сделать. Если, однако, оценка S дается просто в виде числа, то на этой основе невозможно будет провести значительные рассуждения, требуемые для анализа существующей ситуации.

Если значение S(B) невелико, то можно предположить, что В — неудачная позиция. Но если мы хотим, чтобы генератор ходов не повторял своих прежних ошибок, сообщение S должно включать некоторую дополнительную информацию относительно того, чем нас не удовлетворяет позиция В или как поступить в данном случае. Нам фактически требуется итоговое объяснение того, что обнаружено в процессе поиска; поскольку мы работаем с деревом перебора, нам требуется также рекурсивное суммирование подобных резюме.

Рассмотрим проблему, названную нами «расхождением резюме». Если резюме для ситуации А содержит (в общем случае) любое явное описание для В и С, то существует опасность того, что любая схема рекурсивного описания будет повторять дерево ходов; это приведет к столь же длительному поиску итогового сообщения, как и поиску самого решения. Чтобы этого не произошло, можно воспользоваться довольно простым способом — ограничить размеры самого резюме. В этом случае следует позаботиться о том, чтобы избежать сильного уменьшения информативности сообщений. Во фреймах-описаниях важные черты и отношения, находящиеся на верхних уровнях, могут служить в качестве резюме, а вспомогательные описания становятся доступными лишь по необходимости. Вопрос о том, какая часть проанализированного дерева должна оставаться в долговременной памяти, а какая отбрасываться после того, как сделан очередной ход, зависит от других аспектов использования участником игры всего накопленного им опыта.

Какие принципы должны лежать в основе образования резюме? И в этом вопросе концепция фреймов демонстрирует свою гибкость. Вместо того чтобы попытаться ограничить сообщения какими-то жесткими форматами, мы можем построить набор «резюме»-фреймов для каждого данного случая; любой фрейм будет вызываться, когда его терминалы подходят к описаниям ситуаций более низких уровней, а маркеры согласуются с текущими целями. Таким образом, каждый из этих фреймов выполняет свою работу только тогда, когда он соответствует текущей ситуации. Например, у человека могут быть самые разные фреймы типа «шахматной вилки». Если конь занимает такую позицию, что угрожает одновременно и шахом, и взятием ладьи, то активируется фрейм вилки, соответствующий следующему условию: при любом из двух возможных ходов теряется та фигура, которая не изменит своей позиции. Как только будет активирован этот фрейм, он может дать конкретную рекомендацию, вероятно, следующего содержания: генератор ходов того игрока, который попадает под вилку, должен выяснить, не может ли какой-нибудь ранее сделанный ход обеспечить защиту того поля, откуда исходит угроза вилки.

3.8. Фреймы в качестве парадигм

«До тех пор, пока не была создана эта парадигма схоластов (средневековая теория „первого толчка“), маятники как таковые не были известны людям, а ученые видели в них только качающиеся камни. Существование маятников было открыто благодаря изменению парадигмы, очень напоминающему переключение гештальта.

Следует ли нам описывать то, что отличает взгляды Галилея от воззрений Аристотеля или Лавуазье от Пристли с позиций трансформации зрительных образов? Действительно ли они видели разные вещи, когда смотрели на одни и те же предметы? Имеются ли у нас какие-то основания утверждать, что они проводили свои исследования, находясь в разных мирах?

Я отчетливо предвижу трудности, которые могут возникнуть в том случае, если предположить, что когда Аристотель и Галилей смотрели на качающийся камень, первый видел в этом лишь несвободное падение тела, а второй — маятник. Тем не менее, я убежден, что нам следует научиться находить смысл в утверждениях, подобных данному утверждению».

Т.Кун (1975)

Согласно предложенной Т. Куном эволюционной модели наука развивается с помощью установленных описательных схем. Крупные открытия являются результатом новых парадигм, новых способов описания вещей, которые приводят к новым методам и методикам. В конце концов, изменяется содержание научного знания.

Т.Кун предпочитает применять свою весьма эффективную схему нового описания на уровне крупных научных революций; мне кажется, что эта идея применима и к проблемам повседневного мышления. Действительно, последнее процитированное предложение Т.Куна подтверждает ту его точку зрения, что в визуальном восприятии парадигмы должны играть не метафорическую, а, скорее, самостоятельную роль, а это именно то, что мы предлагаем в нашей концепции фреймов.

Когда обычно наши воззрения не пригодны, когда не удается отыскать в своей памяти эффективные системы фреймов, нам следует построить новые системы, которые позволят правильно отразить новые реалии. По всей видимости, обычным следует считать способ построения новой системы из двух или более старых систем с последующим редактированием или «доводкой» ее до такого совершенства, когда она во всем будет соответствовать имеющимся обстоятельствам. Но каким образом можно это сделать? Заманчиво сформулировать эту задачу так: построить систему фреймов с наперед заданными свойствами. Подобная постановка задачи может упростить решение, поскольку позволяет разбить его на два этапа: вначале формулировка требований, затем само решение проблемы.

Этот путь, однако, несвойственен процессу человеческого мышления, ибо требования никогда не формулируются все сразу, а новая система не строится по заранее и полностью построенному сценарию. В действительности неудовлетворенные требования осознаются нами последовательно в процессе видоизменения непригодного для нас представления в виде тех или иных недостатков или «дефектов».

Мне кажется правильной мысль С.Пейперта (1972) о том, что способность к диагностике и модификации своих собственных процедур — это важный элемент человеческого интеллекта. (Об этом смотрите работу М.Минского и С.Пейперта (1972)).

«Доводка», фундаментально важный его компонент, обладает своими особыми методами и процедурами. Каждый нормальный человек имеет возможность пользоваться ими в полной мере; в противном случае он не научился бы ни видеть, ни говорить. Обратимся теперь к работам И. Голдштейн (1973) и Дж.Суссмана (1973), в которых рассматриваются вопросы явного использования знаний о доводке при обучении символьным представлениям. В этих работах строятся новые процедуры, которые должны удовлетворять многочисленным требованиям с помощью простых и вместе с тем мощных методов. Перечислим некоторые из них:

1. Первую попытку сделайте с помощью простого объединения процедур, каждая из которых позволяет достигнуть одну определенную цель.

2. Если что-то получается не так как, нужно, попытайтесь представить один из дефектов как особый (и нежелательный) тип взаимодействия двух процедур.

3. Примените тот «метод доводки», который согласно информации, имеющейся в памяти, дает хорошие результаты при исправлении этого особого вида взаимодействия.

4. Составьте резюме по итогам выполненных операций и включите его в хранящуюся в памяти «библиотеку методов доводки».

Эти методы могут показаться несколько наивными, однако в тех случаях, когда новая проблема не слишком отличается от старых, имеются значительные шансы на успех, особенно при правильном подборе процедур — кандидатов на совместную работу. Коли же новая проблема резко отличается от всех предыдущих, то не следует ожидать, что вообще должна существовать такая теория обучения, которая будет хорошо работать в этих условиях. Без структурированного познавательного плана, без «почти промахов» П.Уинстона(1970) и без хорошей подготовки к решению проблем данного типа нельзя ожидать появления совершенно новых парадигм, как бы остро мы в них ни нуждались.

Что представляют собой «виды взаимодействий» и «методы доводки»? Самым простым для них, видимо, следует считать тот случай, когда результат достижения первой цели оказывает влияние на некоторые условия, необходимые для достижения второй цели. В этом случае можно предложить использовать эту предпосылку в качестве нового условия; известны, однако, такие ситуации, в которых применение только этой методики не приведет к успеху, ибо это новое условие несовместимо с первой целью.

Если задать вопрос о наиболее важных задачах в области искусственного или естественного интеллекта, то, на мой взгляд, среди них следует отметить, во-первых, проблему взаимодействия между рассмотренными выше идеями и, во-вторых, использование многочисленных вариантов представления для изучения одной и той же ситуации с нескольких точек зрения. Проведение исследований в этих направлениях потребует новых идей относительно взаимодействий между трансформируемыми элементами. Здесь проявляется определенная ограниченность представления о системе фреймов, взятой в изолированном виде. Образование новых представлений на базе старых является сложным процессом, в рамках нашей теории эта задача может быть решена лишь с помощью сложного предварительного ввода данных (конечно, если ее вообще можно решить). Более того, требуется особое искусство при разработке методов решения данной задачи, которую я считаю одной из основных в теории интеллекта.

Загрузка...