Низшая форма мышления — это простое опознание. Высшая — это глубокая интуиция человека, видящего всякую вещь как часть некоторой системы.
Каковы главные проблемы восприятия паттернов ?
Что является конструктивным восприятием и прямым восприятием? Приведите несколько примеров иллюзий и объясните их.
Что такое гештальт-психология и как она объясняет восприятие? Приведите несколько примеров канонических перспектив.
Каковы главные особенности следующих идей о распознавании паттернов: сравнение с эталоном, теория геонов, подетальный анализ и прототипное сравнение?
Что такое предварительная подготовка и почему она считается важной в современной когнитивной психологии?
Как эксперты (например, шахматные гроссмейстеры) организовывают зрительные паттерны?
Какие уже знакомые вам объекты вы сегодня видели? Если вы похожи на большинство людей, количество виденных и опознанных вами объектов огромно. А теперь ответьте на более сложный вопрос: как вы смогли быстро и точно распознать так много объектов?
Удивительным свойством восприятия является его способность опознавать знакомые паттерны сенсорной информации. Благодаря этому свойству мы можем узнать старого знакомого среди моря лиц, по нескольким нотам определить всю музыкальную пьесу, можем прочитать слова, наслаждаться вкусом марочного вина или восхищаться запахом розы. Когнитивная система, как правило, отличается тем, что работает слаженно, быстро и без особых усилий. В повседневной жизни мы постоянно распознаем паттерны, однако мы лишь недавно пришли к пониманию когнитивных структур, лежащих в основе их распознавания. Как, например, вы узнаете вашу бабушку? Неужели при помощи «эталона бабушки», не совпадающе» го больше ни с какими бабушками? Или у вас есть прототип бабушки, очень схематичный, но тем не менее позволяющий вам узнать ее и когда она надевает очки, и даже когда у нее другая прическа? («А, бабуля, еле узнал тебя!») Или вы быстро сканируете ее черты и сверяете каждый элемент со списком «главных черт моей бабушки»? Хотя дальше мы будем говорить только о распознавании зрительных паттернов, другие виды «паттернов» — слуховые, тактильные и т. д. — тоже влияют на наше поведение, но они гораздо меньше изучены, чем зрительные, и данная глава отражает это неравенство. Как мы увидим, даже самое обычное распознавание паттернов включает сложное взаимодействие ощущения, восприятия, КВП, ДВП и когнитивного поиска с целью идентификации стимулов. Хотя распознавание объекта — довольно сложный процесс, оно более или менее точно осуществляется за доли секунды. На основе лабораторных исследований и здравого смысла мы имеем определенное представление о распознавании паттернов. Оно включает следующие человеческие способности:
Психологи, изучающие восприятие, разработали две основные теории восприятия мира людьми. Согласно первой — теории конструктивного восприятия, — люди «конструируют» воспринимаемые образы, активно отбирая стимулы и объединяя ощущения с воспоминаниями. Согласно второй — теории прямого восприятия, — восприятие заключается в прямом приобретении информации из окружающей среды, Сначала рассмотрим позицию конструктивистов.
Теория конструктивного восприятия основана на представлении, что в процессе восприятия мы формулируем и проверяем гипотезы о воспринимаемых объектах на основе того, что ощущаем и что уже знаем. Таким образом, восприятие — это общий результат того, что поступает через нашу сенсорную систему и что мы уже знаем о мире благодаря опыту. Когда вы издалека видите направляющегося в вашу сторону друга, вы узнаете его, потому что вы воспринимаете через зрение его внешний вид, его нос, глаза, волосы и т. д., а также потому, что вы знаете, что его обычно можно увидеть в это время в этом месте. Вы сможете узнать его, даже несмотря на то, что он, возможно, недавно отрастил усы, или изменил прическу, или надел солнечные очки. По мнению конструктивистов, эти изменения в паттерне первоначальных стимулов все же позволяют вам правильно узнать его из-за подсознательного умозаключения, процесса, посредством которого мы спонтанно объединяем информацию из нескольких источников для конструирования восприятия. По мнению конструктивистов, мы видим в равной степени благодаря мозгу с его богатым запасом знаний о мире и глазам (и другим органам чувств), которые обеспечивают нас новой сенсорной информацией. Эта теория близка к представлению о сенсорной обработке «сверху вниз» (которое рассматривается в следующем разделе) и согласуется с точкой зрения многих когнитивных психологов, работающих над проблемой распознавания зрительных паттернов, например Джерома Брунера, Ричарда Грегори и Ирвина Рока. Она ведет начало от классических исследований Германа фон Гельмгольца, проведенных им в конце ХIХ.века.
Согласно теории прямого восприятия, содержащаяся в стимулах информация — важный элемент в восприятии, а научение и другие когнитивные процессы необходимы при восприятии. Ведущим сторонником этой теории был Джеймс Гибсон (Gibson, 1966, 1979) и его последователи в Корнеллском университете, включая Джеймса Каттинга (Cutting, 1986, 1993), который утверждал, что «прямое восприятие предполагает, что богатство оптической матрицы лишь отражает богатство мира». Идея, получившая поддержку среди экологически ориентированных психологов, состоит в том, что стимул содержит достаточно информации для правильного восприятия и не требует внутренних репрезентаций. Воспринимающий в процессе восприятия делает минимальную работу, потому что мир предлагает достаточно информации и ему остается лишь конструировать образы восприятия и делать умозаключения. Восприятие заключается в прямом получении информации из окружения. Рассмотрим пример, относящийся не к зрению, а к слуху. Если вы слушали пьесу, исполняемую на фортепьяно в тональности «соль», и затем ту же самую пьесу, исполняемую в тональности «до», вы, вероятно, заметите, что эти пьесы похожи, а если бы между первым и вторым исполнением прошло достаточно времени, вы могли бы заключить, что они идентичны. Даже при том, что ноты в одной пьесе отличались от нот в другой пьесе, отношения между ними будут постоянные или инвариантные. Подобные инварианты можно найти и в зрительном восприятии.
Гибсон пришел к выводу, что зрительные признаки типа линейной перспективы, относительного размера и т. д. не соответствуют восприятию глубины в реальном мире. Он нашел подтверждение своей точки зрения, когда участвовал в экспериментальном отборе пилотов во время Второй мировой войны и обнаружил, что пилоты, хорошо выполнившие тест на восприятие глубины, при пилотировании самолетов не были лучше тех, кто показал плохие результаты в ходе тестирования. Он сделал вывод, что традиционный набор признаков глубины не был адекватен восприятию в реальном мире. Теория прямого восприятия имеет много общего с теорией восприятия формы «снизу вверх», которую мы вкратце обсудим далее.
В настоящий момент два американских космических корабля «Вояджер», покоряя пространство, направляются к звездам. Эти корабли необычны тем, что каждый из них несет защищенную золотым покрытием фонограмму; когда ее расшифруют представители далеких цивилизаций, она расскажет им о нашей планете и культуре. Каждая запись содержит около 90 мин звуков музыки, земных звуков, приветствия на 60 языках и 118 фотографий людей и планет. Что будут делать с этой информацией разумные обитатели далеких планет? Для когнитивного психолога более важен другой вопрос: какие предположения о человеческом восприятии и обработке информации содержатся в этой задаче? Для иллюстрации наших предположений об особенностях восприятия сложных форм людьми и неземными существами посмотрим на фотографии № 61 и № 62.
Схема Джона Ломберга из книги: Carl Sagan, F. D. Drake, Ann Drugen, I. Ferris, Jon Lomberg and L S. Sagan. Murmurs of Earth: The Voyager Interstellar Record, Random House, Inc. Фотография H. M. Фарбмана, Life Magazine, Time, Inc.
На фото 62 (справа) охотник племени бушменов и предположительно его сын охотятся на небольшое рогатое четырехногое животное. Большинство людей легко различат, что это животное больше, чем его абсолютные размеры на фото. На фото 61 (слева) изображены обработанные силуэты трех основных объектов с фото 62 вместе с размерами животного и мальчика. Предполагалось, что неземные существа смогут использовать указанные размеры, чтобы получить представление о восприятии глубины, которым наделены мы, люди. Все же, если говорить о вероятно уникальной истории эволюции земных и других существ, маловероятно, что даже эти признаки достаточны для полного и непосредственного понимания. В процессе восприятия формы люди используют мириады когнитивных и физиологических признаков, чтобы получить одно целостное впечатление; насколько нам известно, это свойственно лишь разумным существам.
Каждая из этих теорий восприятия имеет множество горячих сторонников, и, по крайней мере на первый взгляд, они представляют собой прямо противоположные и несовместимые суждения. Все же на другом уровне анализа эти теории могут рассматриваться как взаимно дополняющие друг друга. Теория конструктивного восприятия интуитивно привлекательна, так как, читая слова на этой странице, вы в конце концов понимаете их смысл, потому что обладаете семантическим знанием их значений; когда вы смотрите на художественное произведение, вы понимаете его смысл, располагая информацией о художнике, используемых материалах и контексте. «Восприятие» в этих примерах, по-видимому, зависит от знаний и опыта, которые направляют наше внимание к внутренним репрезентациям. С другой стороны, что может быть более естественным, чем точка зрения, которая подчеркивает важность полноты информации в рецепторах и предлагает, что восприятие происходит просто и без сложных внутренних репрезентаций и дополнительных процедур обработки информации?
На мой взгляд, обе теории хорошо объясняют восприятие, но они сосредоточиваются на различных стадиях этого процесса. Теория прямого восприятия важна для нашего понимания восприятия по двум причинам: она обращает внимание на значение сенсорных стимулов, предполагая, что их обработка является простой и прямой, а также что познание и восприятие являются естественными, основанными на экологии феноменами, — позиция, гармонично сочетающаяся с новым когнитивным эволюционным подходом или когнитивной экологией, обсуждаемой в главе 1. В то время как теория прямого восприятия может помочь нам понять ранние этапы восприятия, теория конструктивного восприятия полезна для понимания того, как мыслящий разум понимает сенсорные впечатления. Способность людей (и животных) к дедукции при восприятии действительности не только полезна для понимания стимулов, которые неполны (например, когда вы видите вашего друга без привычных усов), но и необходима для выживания видов: мы используем ее после того, как обилие стимулов реального мира на пару сотен миллисекунд заполняет наше сознание.
Какие же когнитивные процессы нужно теоретически допустить, чтобы объяснить нашу способность классифицировать и понимать зрительные паттерны? Этот вопрос изучался с нескольких теоретических позиций. Из них мы обсудим следующие.
Теория гештальта. Распознавание паттернов основано на восприятии целого стимульного паттерна. Отдельные части целостной конфигурации приобретают свое значение, находясь в составе целого.
Обработка информации по принципу «снизу вверх» или «сверху вниз». Распознавание паттерна начинается с распознавания отдельных его частей («снизу вверх»), суммирование которых ведет к опознанию всего паттерна; либо распознавание всего паттерна ведет к опознанию его компонентов («сверху вниз»).
Сравнение с эталоном. Распознавание паттернов происходит при наличии совпадения сенсорных стимулов с соответствующей внутренней мысленной формой.
Подетальный анализ. Распознавание паттерна происходит после анализа элементарных свойств входящих стимулов (аналогично обработке по принципу «снизу вверх»).
Опознание по прототипу. Распознавание паттерна происходит при наличии совпадения воспринимаемого паттерна с абстрактным или идеальным умственным паттерном.
Восприятие формы. Восприятие паттерна рассматривается с различных теоретических позиций.
Распознавание паттернов экспертами. Рассматривается распознавание паттернов специалистами в различных областях.
Следует признать, что каждая из этих точек зрения может иметь некоторые общие теоретические моменты с другими позициями, а различия определяют организационную схему нашего дальнейшего обсуждения.
Зрение — акт ощущения электромагнитных волн, осуществляющийся, возможно, благодаря уникальной структуре глаза, которая приспособлена для обнаружения энергии света.
Лучи света попадают в глаз через роговую оболочку и хрусталик, которые фокусируют образ на сетчатке. Распознаваемый паттерн, будь то простая двухмерная черно-белая форма или сложная трехмерная цветная форма, всегда представлен на сетчатке в виде двухмерной[19] формы. На основе этих двухмерных репрезентаций становится возможным восприятие более высокого порядка на сетчатке, включая иллюзию трехмерного пространства: импульсы передаются верительную кору, что в соединении с имеющимися знаниями приводит к узнаванию, например, вашей бабушки, когда она попадает в поле вашего зрения. Аура таинственности, окружавшая зрительный процесс в течение многих столетий, наконец уступает место научному пониманию.
Зрительная система наиболее сложная из всех сенсорных систем. Человеческий глаз имеет приблизительно 7 млн колбочек, чувствительных к хорошо освещенным стимулам, и 125 млн палочек, чувствительных к плохо освещенным стимулам. Палочки и колбочки распределены по сетчатке неравномерно. Колбочки сконцентрированы в центральной ямке, а палочки расположены на отдалении от нее. Несмотря на неравное распределение сенсорных нейронов в глазу, во многих моделях зрительного восприятия, особенно созданных на основе компьютерной метафоры, зрительная система рассматривается как разновидность матрицы, которая может быть описана геометрически как соответствующая решетке х и у. Кроме множества чувствительных клеток и их местоположения существует еще один фактор в понимании зрительного восприятия — интенсивность стимулов, или насколько ярок объект и как это влияет на ощущения. Было обнаружено, что и яркие и темные объекты представлены сходным образом.
В рамках нескольких научных программ предпринимаются попытки смоделировать зрение человека с помощью компьютеров. На данный момент невозможно построить искусственный глаз с миллионами воспринимающих элементов. Удалось создать лишь телевизионный «глаз» с матрицей 512 х 512 (который имеет 262 144 пиксела, или «элемента изображения»), грубо моделирующий глаз человека. Элементы изображения могут быть включены или выключены; интенсивность света может изменяться с помощью компьютерных программ. Также успешно моделировалось определение зрительных границ реальных объектов (для более подробной информации см. Marr, 1982). Мы возвратимся к компьютерному зрению в главе 15, а теперь обратим внимание на модели зрительной обработки информации человеком.
Интересная особенность человеческого зрения — способность «видеть» в физическом мире вещи, которых не существует. Эти иллюзии — не только результат ощущений, поступающих из внешнего мира, но и предрасположенности зрительной/ когнитивной системы к искажению того, что действительно существует в реальном мире; эти искажения называются иллюзиями.
Иллюзия — ошибочное восприятие действительности, свойственное всем людям.
Хотя такое догматическое определение оставляет открытым вопрос: «Что есть действительность?», мы предоставим решать его философам. Все мы бывали «одурачены» странностями восприятия, как, например, в случае с иллюзией Мюллера- Лайера и иллюстрацией М. С. Эшера в предыдущей главе. Изучение иллюзии поможет когнитивным психологам объяснить связь между внешними физическими явлениями и тем, как разум организовывает эти стимулы во «внутренние репрезентации».
Один из видов иллюзий, показывающий, как разум естественно организовывает зрительные стимулы, называется иллюзорным очертанием. Это зрительные образы, контуры которых различимы даже при физическом отсутствии самих объектов. На рис. 4.1 показан пример иллюзорного очертания. Иллюзорные очертания — это результаты перцепции форм, когда формы существуют в перцептивно-когнитивной системе, а не в стимуле. Кажется, что они находятся на рисунке, а не на фоне и реально присутствуют в восприятии, хотя наблюдатель, по-видимому, чувствует, что они на самом деле «не реальны». (Последнее положение представляет собой интересную проблему, однако этой теме посвящено слишком мало исследований. Возможно, какой-нибудь читатель-энтузиаст исправит этот недостаток.)
Рис. 4.1. Можете ли вы видеть парящий в воздухе белый треугольник? Он существует физически или только в вашем мысленном взгляде?
Посмотрите на рис. 4.1. Что вы видите? Вероятно, ваш «мысленный взгляд» усматривает в центре парящий в воздухе равносторонний треугольник даже при том, что физического треугольника нет. Тем не менее вы его видите! Более того, иллюзорный треугольник имеет отчетливые свойства; например, он более светлый, чем окружающая его область, он как бы плавает над фоном.. К тому же линии иллюзорного треугольника проявляются, несмотря на то что лишь небольшая его часть определена разрезами в трех кругах по углам. Иллюзия треугольника настолько непреодолима, что если смотреть на него в течение нескольких секунд, а затем закрыть внешние черные круги, образ треугольника сохранится. Возможно, сохранение образа вызвано латеральным торможением, или тенденцией смежных нервных клеток сетчатки тормозить активность соседних клеток, таким образом подчеркивая контуры. (Для дополнительной информации см. Coren, 1991; Kanizsa, 1976; Lesher, 1995; Lesher & Mingolla, 1993.) И все же, хотя можно создать треугольник-фантом, остается ощущение, что этот рисунок — иллюзия, а не изображение физического объекта.
Четкость, с которой воспринимаются грани, и яркость фигуры, по-видимому, являются следствиями плотности определяющих ее деталей, как показано на рис. 4.2. Мы видим, что правая фигура создает очень сильную иллюзию парящей в воздухе фигуры с четкими границами, тогда как средняя форма наименее четкая, и различить ее труднее.
Рис. 4.2. Некоторые иллюзорные контуры становятся отчетливее, когда контраст между фигурой и фоном более выражен
Есть множество объяснений возникновения подобных иллюзий. С точки зрения когнитивной биономии потребность видеть формы, грани и движения (а также лица) была продиктована необходимостью в выживании. Таким образом, даже при отсутствии реальных линий или форм наша сенсорно-когнитивная система использовала частичную информацию, чтобы создать эти формы в попытке сделать понятным внешне хаотический мир. Это объяснение основано на эволюции механизмов выживания, и существа, развившие способность воспринимать такие фигуры, были способны выделить фигуру из фона, когда важная фигура была почти того же цвета или той же яркости, что и фон. Некоторые теоретики (например, Ramachandran, 1987) предполагают, что восприятие иллюзорных очертаний — это средство устранения эффектов маскировки.
Шутники-гештальтисты проверяют иллюзию
С другой стороны, есть доказательства того, что иллюзорные очертания действительно активизируют клетки в зрительной коре (области, идентифицированные как V1 и V2). Гештальт-психологи, о которых пойдет речь в следующем разделе, утверждают, что мы создаем субъективные иллюзии, потому что склонны видеть в своем окружении простые, знакомые или «хорошие» фигуры (прегнантные). Действительно, это объяснение с точки зрения «хорошей фигуры» отвечает на вопрос: «Какова наиболее вероятная зрительная организация внешних стимулов?» Каждое из этих объяснений сосредоточено на одном аспекте сложной проблемы восприятия.
Некоторые стимульные паттерны одинаково опознаются разными людьми. Так, большинство людей опознают следующий зрительный паттерн:
и называют его квадратом. В начале XX века гештальт-психологи изучали то, как мы организуем и опознаем зрительные стимулы. По мнению первых гештальт-психологов, паттерн организован так, что все стимулы действуют совместно и, таким образом, производят впечатление большее, чем сумма ощущений от каждого отдельного стимула.
Согласно Вертгаймеру (Wertheimer, 1923), некоторые стимульные паттерны стремятся к естественной (иди «спонтанной») организации. Например, весьма вероятно, что изображение
вызовет у вас впечатление ряда из восьми точек. А если из них составить такой паттерн,
то вы будете склонны видеть четыре группы двухточечных паттернов, при чем вам будет достаточно трудно мысленно переставить их так, чтобы видеть первую точку отдельно, вторую и третью — вместе, четвертую и пятую — вместе, шестую и седьмую — вместе, а восьмую — снова отдельно. Или, если те же самые восемь точек расположить так:
вы будете склонны видеть квадрат, круг и абстрактную форму соответственно.
Обратите также внимание на то, как глаз «естественно» определяет сторону, в которую указывают треугольники на рис. 4.3[20]. Посмотрите на этот рисунок в течение нескольких секунд, и вы увидите, что ориентация треугольников изменилась с одного направления на другое, а затем на третье. Одно из объяснений этого изменения состоит в том, что мысленный взгляд постоянно ищет альтернативную перцептивную организацию. В данном примере стимулы, попадающие на сетчатку, идентичны, но различна их интерпретация. Хотя реорганизация может произойти спонтанно, ее также можно контролировать произвольно. Эти примеры демонстрируют влияние высших психических процессов на зрительное восприятие.
Рис. 4.3. Посмотрите на эти треугольники. В какую сторону они указывают? Посмотрите снова. Направление изменилось? Вы можете управлять направлением?
Влияние памяти на восприятие формы можно увидеть на рис. 4.4. Взгляните на эти фигуры. Что вы видите? На рис. 4.4, а люди обычно видят устойчивый двухмерный объект, а на рис. 4.4, б — неустойчивый трехмерный. Однако если вы посмотрите более пристально, то увидите, что оба рисунка идентичны, за исключением того, что один из них повернут на 45° по отношению к другому. Почему так радикально различается восприятие двух почти идентичных паттернов? Согласно позиции конструктивизма, причина состоит в том, что с точки зрения прошлого опыта на рис. 4.4, б мы видим коробку. Фигура напоминает нам коробку, имеющую три измерения. Форма на рис. 4Ä, a не похожа на коробку. В лучшем случае это было бы странное изображение коробки. Нам сложно увидеть ее в трех измерениях; на самом деле мы видим симметричный двухмерный объект, который, очевидно, состоит из двух связанных между собой квадратов. Эту устойчивую иллюзию особенно трудно преодолеть представителям западной цивилизации; но возникла бы эта иллюзия у людей, которые в своей повседневной жизни не сталкивались с коробками или прямоугольными формами? Вероятно, нет. (См. Deregowski, 1980, для дальнейшего обсуждения.)
Рис. 4.4. Влияние ориентации на восприятие. Какая из этих форм кажется трехмерной?
Одно из известных предположений ранних гештальт-психологов, в частности Келера (Kohler, 1947), состояло в том, что спонтанная организация паттерна является естественной функцией самого стимула и имеет лишь минимальное отношение к прошлому опыту испытуемого. Хотя споры об источнике «естественной организации» продолжаются, значительное число исследований (некоторые из них основаны на межкультурных наблюдениях) подтверждает представление о том, что «естественная организация» паттернов прямо связана с перцептивным опытом человека.
Художники-оформители знают о влиянии принципов гештальта на передачу сообщения. Рассмотрим приведенный ниже пример общей группировки.
Яркость фона оказывает сильнейшее влияние на чтение сообщения. Вероятно, общие области помогают организовать текст.
Изучение когнитивными психологами вопроса распознавания паттернов расширило исследования ранних гештальт-психологов. Некоторые современные когнитивные психологи сконцентрировались на «внутренних» структурах и процессах, связанных со сложным распознаванием паттернов, вместо того чтобы выделять характеристики простых стимулов. Ниже описаны некоторые из моделей и паттернов, на которых они основываются.
Идеи гештальт-психологов развиваются в исследованиях канонических перспектив.
Канонические перспективы — это изображения, которые лучше всего представляют объект, а также образы, которые первыми приходят на ум при вспоминании определенной формы. »
Если я попрошу, чтобы вы подумали об обычном объекте, скажем пишущей машинке, образ, который придет на ум, вероятно, будет канонической перспективой. Исследования в этой области важны, так как они объединяют в себе открытия гештальт-психологов и наши знания о процессе формирования прототипа, — тема, которая более подробно рассматривается позже в этой главе.
Если ваша каноническая перспектива пишущей машинки совпадает с моей, вы вызвали следующий образ: вид пишущей машинки спереди, повернутой на несколько градусов влево и рассматриваемой немного сверху. Вы «не видите» ее прямо сверху, сзади, с большой книгой, частично закрывающей ее, или с точки зрения крошечного муравья, ползающего по рычагам и клавишам. Однако каждая из этих перспектив возможна. (Зрительное воображение подробнее рассматривается в главе 6.)
Канонические репрезентации могут быть сформированы на основе опыта восприятия подобных членов категории (называемых образцами), хотя некоторые исследователи предполагают, что они представляют собой идеализйрованные формы, являющиеся частью коллективного бессознательного. Увы, насколько бы ни были интересны (если не сказать курьезны) эти взгляды, они выходят за рамки эмпирической науки. В течение нескольких лет я просил людей по всему миру «нарисовать чашку и блюдце», и некоторые из этих рисунков показаны на рис. 4.5.
Рис. 4.5. Канонический вид чашки и блюдца
Явные отличия являются результатами различий в художественных способностях и личных качествах, но замечательная особенность этого небольшого эксперимента состоит в том, что большинство людей от Пало-Альто, Калифорния, до Чикаго, Лондона и Стамбула рисовали в основном одну и ту же «чашку и блюдце». Мой собственный рисунок «чашки и блюдца», взгляд сверху на тот же объект, приведенный на рис. 4.6, удовлетворяет требованиям задачи и после идентификации легко узнаваем. Он заметно отличается от других эскизов, потому что не является каноническим; и все же, когда вам говорят, что это, вы легко «видите это».
Рис. 4.6. Чашка и блюдце — вид сверху
Одно из теоретических объяснений общности канонических перспектив состоит в том, что через общий опыт восприятия объектов мы создаем постоянные воспоминания наиболее репрезентативного вида объекта, сообщающего наибольшее количество информации о нем. Таким образом, исследования канонических перспектив предоставляют нам информацию о восприятии формы, но они гораздо больше говорят об обработке информации, формировании прототипа (или типичных репрезентациях объектов в памяти), структуре мышления и, в упомянутом выше примере с чашкой и блюдцем, эффективности коммуникации. Мы храним понятия об общих классах объектов и используем своего рода зрительную стенографию, чтобы рассказать другим о наших впечатлениях.
Экспериментальные данные подтвердили эти выводы. Палмер, Рош и Чейз (Palmer, Rosch & Chase, 1981) делали серии фотографий обычных объектов в различных ракурсах (рис. 4.7). Испытуемые оценивали типичность этих ракурсов и степень знакомства с ними. Во второй части эксперимента испытуемым показывали фотографии лошади и других объектов (например, фотоаппарата, автомобиля, фортепьяно и т. д.), которым была дана подобная оценка, и просили назвать объекты как можно быстрее. Неудивительно, что канонические виды были идентифицированы быстрее всего; при этом время реакции увеличивалось по мере увеличения степени отличия изображения от канонического. Также следует отметить, что зрительная система все же работает достаточно эффективно, даже оценивая не вполне «совершенные» фигуры.
Есть несколько возможных причин того, что время реакции обычно больше для картин, отступающих от канона.
Рис. 4.7. Двенадцать видов лошади, используемых в эксперименте Палмера, Роша и Чейза (Palmer, Rosch & Chase, 1981 ), со средними оценками «хорошей фигуры»
1. Меньшее количество деталей объекта попадают в поле зрения. Посмотрите на вид сзади на рис. 4.7. Сколько частей тела лошади вы можете видеть, смотря на нее сзади? Не очень много. (И кто знает, о чем бы вы подумали, если бы вам показали эту фотографию.)
2. Лучший (канонический) вид (фигура в верхнем левом углу) — тот, который мы видим наиболее часто. Мы «видим» пишущие машинки, стулья, автомобили, телефоны и лошадей в одном ракурсе чаще, чем в других, и поэтому этот вид нам более привычен.
3. Канонический вид — это идеальный, или лучший, вид объекта. Постоянно воспринимая мир, мы формируем умственную картину класса объектов, которая и представляет образ класса в памяти. Когда я прошу вас вообразить пишущую машинку, вы, вероятно, представляете одну из обычных пишущих машинок, а не особую модель причудливой формы. Тот же самый принцип работает, когда мы вспоминаем собак, лошадей, спортивные автомобили и птиц. Эта точка зрения согласуется с теориями формирования прототипа, которые вкратце обсуждаются в этой книге.
Как мы распознаем образ? Узнаем ли мы собаку потому, что сначала увидели ее шерсть, четыре ноги, глаза, уши и т. д., — или мы узнаем эти составляющие потому, что сначала увидели собаку? Эта проблема — начинается ли распознавание с частей паттерна, которые служат только основанием для распознавания целого (обработка «снизу вверх»), или же оно начинается с выдвижения гипотезы о целом, которая позволяет его идентифицировать, а потом мы опознаем его составные части (обработка «сверху вниз») — называется аналитическим парадоксом. (Термины «снизу вверх» и «сверху вниз» заимствованы из компьютерной лексики.) Некоторые теоретики, например Палмер (Palmer, 1975a), предположили, что при определенных обстоятельствах опознание частей и целого может происходить одновременно в направлении снизу вверх и сверху вниз. В качестве примера взаимодействия стратегий «от частного к общему» и «от общего к частному» Палмер приводит опознание частей лица в контексте и без такового. Как видно из рис. 4.8, части лица, легко опознаваемые в контексте, выглядят неоднозначно, если стоят отдельно, но становятся узнаваемыми при более подробном изображении или когда снабжены дополнительной информацией.
Рис. 4.8. Черты лица, опознаваемые в контексте всего профиля (а), вне контекста опознать труднее (б). Однако если эти черты изобразить более полно и реалистично (е), они опознаются легче. Источник: Palmer, 1975a
В различных контекстах мы ожидаем увидеть определенные объекты. В кабинете врача мы обнаруживаем стетоскоп, на кухне — столовое серебро, в офисе — компьютер, а на улице — пожарный кран. Похоже, что это «знание о мире» каким-то образом облегчает идентификацию объектов в знакомых контекстах и мешает их идентификации в неподходящих. Несколько исследований «влияния контекста», проведенных Бидерманом и его сотрудниками (Biederman, 1972; Biederman, Glass & Stacy, 1973; см. также раздел «Теория геонов» далее в этой главе), показали, что когда испытуемые ищут объект в сценах из реального мира (например, объекты в своем институте или на улице), то точность опознания и требуемое для идентификации время зависят от соответствия объекта его положению в данной сцене.
Из этих и других аналогичных исследований, касавшихся идентификации букв и слов, ясно, что на восприятие объекта значительно влияют ожидания человека, задаваемые контекстом.
Одна из гипотез, касающаяся распознавания паттернов и форм, называется «сравнение с эталоном». В нашем случае распознавания паттернов человеком эталон — это некоторая внутренняя структура, которая при сопоставлении с сенсорными стимулами позволяет опознать объект. Согласно этому представлению о распознавании, в процессе приобретения жизненного опыта у нас образуется огромное количество эталонов, каждый из которых связан с некоторым значением. Так, зрительное опознание формы, например геометрической фигуры, происходит следующим образом: световая энергия, исходящая от этой фигуры, воздействует на сетчатку глаза и преобразуется в нервную энергию, которая передается в мозг. Среди имеющихся эталонов осуществляется поиск. Если находится эталон, соответствующий нервному паттерну, человек опознает этот паттерн. После сопоставления объекта с его эталоном может происходить дальнейшая обработка информации и интерпретация объекта.
Распознавание паттернов
Посмотрите на объекты, изображенные на этих рисунках. Какие два похожи друг на друга? Как вы пришли к такому выводу? Какие факторы повлияли на ваше решение? Для дальнейших размышлений ознакомьтесь с темами сравнения с эталоном, предварительной подготовки и подетального анализа.
Сравнение с эталоном как одна из теорий распознавания паттернов имеет свои сильные и слабые стороны. С одной стороны, кажется очевидным, что для опознания некоторой фигуры, например буквы или какой-нибудь визуальной формы, нужен определенный контакт с соответствующей внутренней формой. На каком-то уровне абстракции для опознания объекта «внешней реальности» необходимо, чтобы он был представлен в долговременной памяти. С другой стороны, буквальная интерпретация теории сравнения с эталоном сопровождается определенными трудностями. Например, если опознание возможно только тогда, когда между «внешним» объектом и его «внутренней» репрезентацией имеется соответствие 1:1, это значит, что даже при незначительном расхождении между объектом и его эталоном опознания не произойдет. Поэтому строгое следование этой теории означало бы необходимость формирования несчетного количества эталонов, соответствующих каждой из разнообразных геометрических форм, которые мы видим и узнаем.
Здесь показаны разные буквы, в которых вы легко узнаете вариации буквы А Однако маловероятно, что вы видели и сформировали в памяти точные копии всех этих вариантов. Мы можем выполнить эту и многие другие подобные задачи на распознавание паттернов, потому что уже сформировали образы различных классов объектов, например буквы А и способны применить эту информацию к широкому классу подобных форм.
Легкость, с которой мы распознаем зрительные образы в повседневной жизни, может навести на мысль, что этот процесс очень прост, и все же, когда мы пытаемся воспроизвести опознание с помощью искусственных средств, оказывается, что результат от нас ускользает. Возьмем для примера опознание букв и устройство для распознавания слов. Чтобы научиться хорошо читать, нужно потратить несколько лет, но, научившись распознавать орфографическую конфигурацию, составляющую слово, мы можем мгновенно узнать это слово в различных контекстах, произнести его и вспомнить его значение. Как бы вы смоделировали исходный процесс опознания буквы на компьютере? Один из способов — хранить в «памяти» компьютера каждую из букв алфавита. Тогда каждый раз при сканировании буквы оптическим устройством воспринимаемая зрительная конфигурация «настраивалась» бы на элемент памяти (эталон), связанный с этой буквой. Так, слово CARD (карточка) анализировалось бы как C-A-R-D, то есть С настраивалось бы на ячейку памяти, соответствующую конфигурации С, для А нашлось бы соответствие в ячейке А и т. д. «Вуаля! — мог бы воскликнуть компьютер. — А я читаю буквы!» Но что если бы мы попросили его опознать буквы в слове card? В его памяти нет конфигураций для написания букв в нижнем регистре. Решение просто, скажете вы: увеличьте память и включите туда буквы нижнего регистра. Но тогда мог бы наш компьютер прочитать (как это делаем мы) буквы, написанные вот так:или так:, или так:, или так:?
Конечно же, в чтении участвуют гораздо более сложные процессы, чем простое опознание букв. Прием, используемый в компьютерной технике — сравнение конфигурации букв с конкретными конфигурациями в памяти машины, — называется «сравнение с эталоном»; это похоже на поворот ключа в замке. Чтобы открыть замок, конфигурация бороздок и выемок на ключе должна совпасть с конфигурацией замка. На языке распознавания образов при сравнении с эталоном происходит следующее: когда зрительная конфигурация соответствует совместимой с ней репрезентации в памяти, информация высвобождается. Как видно из примера с компьютером, метод сравнения с эталоном сопряжен с трудностями при попытке опознать слово card, если в его написании есть какие-либо отклонения, — это все равно, что пытаться открыть замок погнутым ключом.
Сравнение с эталоном -основа многих кодирующих систем, ставших частью нашей повседневной жизни. Например, почти все банки в Соединенных Штатах используют систему идентификации счетов по специальным цифрам (номер ABA), напечатанным в нижней части чека; во многих магазинах используют подобные коды (напечатанные на упаковке товара) для ускорения процесса выписки счетов и проведения переучета товаров. (По этому коду компьютер определяет единицу товара и указывает его цену, печатаемую затем на контрольной ленте кассового аппарата.)
Эти разновидности кодов читаются посредством сравнения с эталоном. Число ABA имеет отличительные особенности, которые позволяют компьютеру различать символы, а штриховой код читается по положению линий, их ширине и расстоянию между ними. Коды преобразуются сканером в электрические импульсы, из которых составляется сигнальный паттерн; последний передается в компьютер, идентифицирующий этот паттерн путем сравнения его с аналогом (эталоном), находящимся в памяти.
Таким образом, сравнение с эталоном — это элементарная процедура распознавания паттернов, основанная на том, что конфигурация сенсорной информации точно подходит к соответствующей «конфигурации» в памяти; и, хотя ее возможности ограничены, она имеет определенное теоретическое и практическое значение. Теоретические вопросы, связанные с этим методом, мы затронем позднее. Что же касается его практических применений, то они весьма многочисленны.
Итак, в случае распознавания паттернов человеком «жесткое» следование этой модели привело бы к необходимости создания миллионов отдельных шаблонов, каждый из которых соответствовал бы отдельному зрительному паттерну. Если бы нам приходилось хранить так много эталонов, наш мозг был бы таким громоздким, что пришлось бы возить его на тачке. Так что этот трюк не пройдет по неврологическим соображениям. Но даже если это было бы возможно, то для доступа к памяти, где хранятся многие миллионы эталонов, потребовалась бы процедура поиска, занимающая чрезвычайно много времени, что никак не соответствует нашей способности быстро опознавать множество различных паттернов. Наконец, эта модель неправдоподобна потому, что мы можем опознавать незнакомые формы и фигуры (например, новые варианты начертания буквы Л).
Существует альтернатива жесткой модели сравнения с эталоном, требующей бесчисленных миллионов форм для сравнения с ними повседневных образов мира. Она предполагает, что человеческая система обработки информации имеет ограниченное число простых геометрических «базисных элементов», которые могут быть применены к сложным формам. Одна из подобных теорий, также имеющая некоторое сходство с подетальным анализом (мы рассмотрим его далее в этой главе), была сформулирована Ирвингом Бидерманом из Университета Южной Калифорнии.
Ирвинг Бидерман продвинул наше понимание распознавания объекта с помощью новаторских экспериментов и теорий, особенно теории геонов
Представления Бидермана о восприятии формы основаны на понятии геон (сокращение от «геометрические ионы»). Согласно этой концепции, все сложные формы состоят из геонов. Например, чашка составлена из двух геонов: цилиндра (емкость для воды) и эллипса (ручка). (Примеры геонов и объектов приведены на рис. 4.9.) Теория геонов, как ее сформулировал Бидерман (Biederman, 1985, 1987, 1990; Biederman & Cooper, 1991; Biederman & Gerhardstein, 1993; Cooper & Biederman, 1993), предполагает, что распознавание объекта, например телефона, чемодана или еще более сложных форм, состоит из распознавания по компонентам, при котором в сложных формах обнаруживаются простые формы. Геоны — это 24 особые формы, и, подобно буквам алфавита, они образуют определенную систему. При объединении они формируют более сложные формы, так же как буквы, из которых составлены слова на этой странице. Число различных форм, которые могут быть получены путем объединения первичных форм, является астрономическим. Например, три геона, расположенных во всех возможных комбинациях, дают 1,4 млрд трехгеонных объектов! Однако мы используем только часть из возможного числа сложных форм. Бидерман считает, что мы используем приблизительно 30 тыс. сложных форм, из которых мы имеем названия только для 3 тыс.
Рис. 4.9. Геоны и объекты. Объекты представлены как конфигурации геонов, являющихся простыми зрительными объемными фигурами. Источник: Biederman, 1990
Теорию геонов можно проверить, например, с помощью упрощенных форм, как показано на рис. 4.10. Какую из этих фигур (а или 6) легче идентифицировать?
Рис. 4.10. У чашки было удалено 65% линий контура, относящихся либо к середине отрезков (а), либо к вершинам (б). Источник: Biederman, «Human Image Understanding: Recent Research and a Theory» in Computer Vision, Graphics and Image Processing, 1985, 32, 29-73. Copyright 1985 by Academic Press. Воспроизведено с разрешения
На этой иллюстрации у простого объекта удалено 65% контура. У чашки слева (а) удалены середины отрезков, что все же позволяет наблюдателю видеть, как связаны основные отрезки. У чашки справа (б) удалены части отрезков вершин, включая основные углы, связывающие отрезки друг с другом. Бидерман предъявлял испытуемым объекты такого типа на 100 мс. Он обнаружил, что при удалении частей соединяющих линий (a) испытуемые правильно идентифицировали объект приблизительно в 70% случаев; когда были удалены вершины (6), доля правильных идентификаций была равна приблизительно 50%. Таким образом, в соответствии с положением теории о том, что идентификация объекта основана на наблюдении основных форм, удаление критической информации об отношениях между частями объекта сделало его идентификацию более трудной, чем в случаях наличия такой информации.
В других экспериментах, включающих задачи на классификацию объектов, Бидерман и другие исследователи использовали метод предварительной подготовки, при котором на короткое время предъявляется стимул (подготавливающий), а затем, после задержки, предъявляется второй стимул и испытуемого просят дать ему оценку, например: «Действительно ли второй стимул "тот же самый", что и первый?» Этот метод использовался когнитивными психологами нескольких поколений, и разновидность простой подготовки (подсказка испытуемому) можно найти уже на ранних этапах истории экспериментальной психологии, относящихся к XIX веку. С появлением современного тахистоскопа (устройства, которое позволяет предъявлять стимулы на короткое время и измерять время реакции), компьютеров и, совсем недавно, технологии отображения мозга эксперименты по изучению влияния предварительной подготовки становятся все более популярными. Логические основания экспериментов с предварительной подготовкой, особенно разработанных для проверки семантических эффектов, состоят в том, что при активировании одного стимула, который может быть связан с другим стимулом, увеличивается восприимчивость ко второму стимулу. Этот эффект называют эффектом семантической подготовки, и он более подробно описан в главе 12. Если, например, вы видите ярко-красный лоскут, вы узнаете слово «кровь» быстрее, чем если бы не видели никакого стимула или если бы вы видели ярко-зеленый лоскут (Solso & Short, 1979). (Марсиане могут действовать иначе, но здесь мы ограничиваем наши наблюдения земными существами.)
Пабло Пикассо, великий художник-абстракционист, испытывал влияние Поля Сезанна, великого художника-импрессиониста. Сезанн вдохновил Пикассо на изучение природы «конусов, цилиндров и сфер», так как он полагал, что сложные живописные произведения должны быть организованы вокруг этих «базовых» форм. Пикассо всерьез воспринял этот совет и экспериментировал, составляя картины из этих основных форм, что в конце концов привело к возникновению кубизма.
Второй тип эффекта, названный эффектом объектной подготовки, подобен семантической подготовке. Как правило, в нем присутствуют две стадии. Первая стадия состоит в предъявлении объекта, например контуров самолета; далее следует интервал, который может быть кратким (100 мс) или продолжительным (несколько месяцев). На второй стадии предъявляется другой объект, похожий на первый, но обычно измененный, представленный в другом ракурсе, с дополнительными или отсутствующими деталями (например, могут быть утрачены некоторые из контуров), и измеряются точность ответов испытуемого и (иногда) время реакции. В некоторых случаях используется обратная процедура; то есть испытуемый видит неполную форму, а затем его просят идентифицировать целый объект. С испытуемыми из контрольной группы выполняются те же процедуры, но без предъявления первого объекта. (Для более подробной информации см. Tulving & Schacter, 1990.)
Рассмотрим типичный эксперимент с предварительной подготовкой, показанный на рис. 4.11. Испытуемому подают сигнал, за которым следуют стимул, маскирующий стимул (чтобы подавить влияние «остаточного образа») и второй стимул. Во многих экспериментах с использованием зрительного материала было отмечено, что предварительная подготовка к восприятию объекта с помощью предъявления подобной фигуры в некоторой степени улучшает восприятие объекта. Использование метода предварительной подготовки поднимает важную для когнитивной психологии проблему: предъявление подготавливающего, или исходного, стимула, по-видимому, активизирует целый диапазон тенденций реагирования, которые наблюдатель не осознает. Эту несознательную активацию называют имплицитной памятью в противоположность эксплицитной памяти, которая включает сознательное припоминание прошлого опыта. В примере, показанном на рис. 4.11, маловероятно, что испытуемые сознательно думали о втором типе стула, когда они видели первый. По этой причине данный тип тестируемой памяти называют имплицитной памятью.
Рис. 4.11. Последовательность событий при разнице в ориентации 0"; «другой» стимул в задаче на распознавание знакомых объектов («тот же» — «другой»). Испытуемые должны были ответить «тот же» только в случае, если два образца стула были одинаковы независимо от ориентации. (Ориентация в разных испытаниях была произвольной.)
Пример применения метода предварительной подготовки для проверки теории распознавания объектов можно обнаружить в книге Бидермана и Купера (Biederman & Cooper, 1991). Чтобы проверить распознавание обычных форм (например, фортепьяно, фонарика или замка), испытуемым сначала предъявляли в качестве подготавливающего стимула контурные рисунки фигур, на которых отсутствовали части линий. Каждому из них показывали соответствующий рисунок, на котором название объекта было тем же, что и на подготавливающем стимуле, но тип объекта отличался (например, подготавливающим стимулом был рояль, а объектом было пианино[21], рис. 4.12). Результаты экспериментов указывают на то, что эффект предварительной подготовки (priming effect) был визуальным, а не понятийным. Это согласуется с другими результатами исследований кратковременной памяти (см. обсуждение исследований Познера с коллегами в главе 7).
Рис. 4.12. Пример подготавливающего стимула и объекта, используемых Бидерманом и Купером (Biederman and Cooper, 1991 )
Еще один подход к проблеме извлечения информации из сложных стимулов — это подетальный анализ. В соответствии с ним восприятие — это «высокоуровневая» обработка информации, которой предшествует этап идентификации входных стимулов по их более простым деталям. Так, прежде чем произойдет оценка информации зрительного паттерна «в полном объеме», осуществляется минимальный анализ его составных частей. На элементарном визуальном уровне слово — например, слово ARROW (стрела) — не переводится непосредственно в свою понятийную или мысленную репрезентацию в нашей памяти (например, «заостренное древко для стрельбы из лука» или знак «>»). Оно не читается как arrow, и его отдельные буквы не воспринимаются как A-R-R-O-W, а вместо этого обнаруживаются и анализируются детали или компоненты каждой буквы. Так, буква A может быть разложена на две наклонные линии (/ \) и одну горизонталь (-), острый угол (^), перевернутую емкость (/-\) и т. д. Если процесс опознания основан на анализе деталей и это найдет свое подтверждение, то получается, что ранние этапы обработки информации более сложны, чем мы предполагали вначале[22].
В результате исследований, проводимых в двух направлениях, — неврологическом и бихевиористском, были получены данные в пользу гипотезы о подетальном анализе. Мы сосредоточимся на втором из них, но сначала обратимся к экспериментам Хьюбеля и Визеля (Hubel & Wiesel, 1959, 1963[23]; Hubel, 1963b), из которых прямо видно, какой тип информации кодируется в зрительном участке коры мозга. Ученые вживляли микроэлектроды в зрительную кору кошки и обезьяны, находившихся в состоянии легкого наркоза, а потом изучали нервную активность, возникавшую в результате проекции простых световых паттернов на экран непосредственно перед глазами животного. Регистрируя возбуждение отдельных нервных клеток и усиливая возникающие в них электрические импульсы, они обнаружили, что некоторые клетки реагируют только на горизонтальные фигуры, а некоторые — только на вертикальные. В других экспериментах они обнаружили, что некоторые клетки чувствительны к краям зрительного стимула, некоторые — к линиям, а некоторые — к прямым углам. На рис. 4.13 показано, как усиленная мозговая активность клеток коры у очень молодого (и соответственно зрительно неопытного) котенка связана с конкретной ориентацией освещенной полосы (фрагменты a-d), предъявлявшейся на экране в поле зрения животного. Горизонтальными отрезками над каждой записью активности обозначены периоды, когда стимул был виден. Хьюбель (Hubel, 1963b) пришел к выводу, что формирование этих кортикальных кодов воспринимаемых фигур является врожденным и специфичным для каждой клетки.
Рис. 4.13. Реакции клеток зрительной коры котенка на стимуляцию глаза светлой полосой. Фрагменты а-д показывают ориентацию светлой полосы (вытянутый прямоугольник сплошными линиями) относительно оси рецептивного поля (штриховые линии). На фрагменте д полоса была ориентирована так же, как на а и б, но быстро двигалась из стороны в сторону. Источник: Hubel & Wiesel, 1963
Теперь становится понятным значение огромного числа клеток в зрительной коре. Видимо, каждая клетка имеет свое особое назначение: отвечает за одну ограниченную зону сетчатки, реагируя лучше всего на одну конкретную форму стимула и на одну конкретную ориентацию. Если посмотреть на эту проблему с противоположной стороны, то для каждого стимула — каждой зоны сетчатки, на которую воздействует стимул, каждого типа линии (край, полоса или отрезок) и каждой ориентации стимула — существует определенный набор простых кортикальных клеток, которые на них реагируют; всякое изменение расположения стимула вызывает ответную реакцию новой группы клеток. Количество клеточных групп, последовательно реагирующих по мере того, как глаз следит за медленно вращающимся пропеллером, трудно вообразить.
Следовательно, сложный и громоздкий механизм разложения паттерна на простые детали — не только возможность, имеющая отношение к неврологии, но действительно неврологическая необходимость, то есть подетальный анализ может оказаться необходимым этапом обработки информации, прежде чем анализ паттерна сможет начаться на высшем уровне.
Непосредственное отношение к подетальному анализу имеют наблюдения за движениями глаз и зрительными фиксациями. Можно предположить, что если вы относительно долго смотрите на некоторую деталь паттерна, то вы извлекаете из нее больше информации, чем при мимолетном взгляде. Результаты экспериментов с фиксацией, проведенных русским биофизиком Ярбусом (Yarbus, 1967), показаны на рис. 4.14. Ярбус предположил, что чем больше информации содержит некоторая деталь (например, люди или взаимосвязи между ними на указанной иллюстрации), тем дольше на ней фиксируется взгляд. Он также заключил, что распределение точек фиксации зависит от целей наблюдателя. В одной серии экспериментов испытуемых просили при разглядывании сложного изображения делать некоторые оценки (например, каковы материальные условия членов семьи, сколько им лет). При этом взгляд останавливался на тех деталях, которые наиболее важны для целей испытуемого. Таким образом, восприятие деталей сложного паттерна зависит не только от физических свойств стимула, но и от работы высокоуровневых когнитивных процессов, таких как внимание и мотивация.
Рис. 4.14. Записи движений глаз испытуемого при разглядывании картины (слева вверху). Траектория 1 получена, когда испытуемый рассматривал картину произвольно. Последующие траектории получены после того, как испытуемого просили оценить экономическую состоятельность изображенных людей (траектория 2); их возраст (3); предположить, что они делали, перед тем как пришел «посетитель» (4); запомнить их одежду (5); запомнить положение людей и объектов в комнате (6) и оценить, как долго «посетитель» не видел эту «семью» (7). Источник: Yarbus, 1967
Альтернативой сравнению с эталоном и подетальному анализу как средствам распознавания паттернов является теория формирования прототипов. Вполне вероятно, что в ДВП хранятся не конкретные эталоны и тем более не детальные признаки многочисленных паттернов, которые нам приходится опознавать, а своеобразная абстракция паттернов, которая и служит в качестве прототипа. Паттерн сопоставляется с прототипом и при наличии сходства происходит его опознание. Применительно к человеку гипотеза прототипного сравнения больше отвечает принципу неврологической экономичности и процессам поиска в памяти, чем гипотеза о сравнении с эталоном; она позволяет также опознавать «необычные» паттерны, которые тем не менее как-либо связаны с прототипом. В такой системе можно, например, сформировать прототип идеальной буквы Л, относительно которого все остальные А будут оцениваться по принципу сходства. Если расхождение велико (например, если это не А, а другая буква), то мы отмечаем отсутствие «совпадения» и отвергаем предъявленную букву как не А; затем можно искать прототип, который лучше подходит для этой буквы.
Свидетельства в пользу прототипного сравнения — повсюду вокруг нас, и интуитивно эта гипотеза выглядит весьма достоверной. Мы узнаем машину марки «Фольксваген», даже если у нее другие цвет и форма или она облеплена всякими безделушками, которые никак не сходятся с идеальной моделью в нашей голове. В этом смысле прототип — это не только абстракция из набора стимулов, но и «краткий конспект», наилучшая репрезентация данного паттерна[24].
Хотя приведенные аргументы говорят в пользу сравнения с прототипом, можно задать вопрос: необходимо ли точное соответствие между образом и прототипом? Может быть, эталоны — это некоторое приближение к образу, нужное, чтобы открыть ячейку памяти? Однако если бы это было так, то разве могли бы мы делать тонкие дифференцировки, необходимые для обычного зрительного восприятия? Возьмем, Например, сходство деталей в буквах О и Q или В, Р и R. Хотя эти зрительные паттерны похожи друг на друга, мы редко их путаем. Значит, эталоны не могут быть «приблизительными» или «размытыми» — иначе мы слишком часто ошибались бы при распознавании образов, что, очевидно, не так.
Таким образом, сравнение с эталоном как принцип распознавания образов полезно для компьютерных программ (чтение кодов на чеках и т. п.), но в своей жесткой форме оно не может адекватно объяснить разнообразие, точность и экономичность распознавания образов человеком. Подводя итог, скажем, что распознавание образов предполагает проведение операций с памятью. В простейшем случае можно полагать, что при распознавании образа происходит сопоставление сенсорной информации с некоторым следом, хранящимся в памяти.
Как мы предположили, на одном уровне зрительного опознания может происходить сравнение с эталоном, но на другом уровне могут использоваться прототипы. Предполагается, что прототип — это абстракция набора стимулов, воплощающая множество сходных форм одного и того же паттерна. Прототип позволяет нам распознавать образ, даже если он не идентичен прототипу, а только похож на него. Так, мы распознаем различные написания буквы А не потому, что они точно подходят к некоторой ячейке памяти, а потому, что члены класса А обладают некоторыми общими чертами.
Экспериментальные исследования, направленные на подтверждение теории прототипов как средства распознавания образов, часто посвящались вопросу о том, как формируются прототипы и как обеспечивается быстрая классификация новых паттернов. Этот вопрос не нов; он беспокоил епископа Беркли (цит по: Calfee, 1975) еще много лет назад:
Перед его мысленным взором все изображения треугольников обладали весьма конкретными свойствами. Они были или равносторонними, или равнобедренными, или прямоугольными треугольниками, и он напрасно искал мысленный образ «универсального треугольника». Хотя то, что мы имеем в виду под треугольником, легко определяется вербально, совсем неясно, как выглядит совершенный треугольник. Мы видим множество самых разнообразных треугольников; что же из всего этого множества мы создаем в своих мыслях как основу для опознания треугольника?
Воображаемая «одиссея Беркли» о «совершенном» треугольнике растянулась на несколько столетий и наконец стала предметом эмпирического исследования в эксперименте Познера, Гоулдсмита и Уэлтона (Posner, Goldsmith & Welton, 1967), который сам стал для многих прототипом. Эти ученые нашли прототип треугольника (и других фигур), а затем измеряли время реакции испытуемых на другие фигуры, в чем-то подобные прототипу. В первой части эксперимента они разработали серию прототипов (рис. 4.15) путем расстановки девяти точек в матрице 30 х 30 (стандартный лист в клеточку, 20 квадратов на дюйм) так, чтобы получились треугольник, буква или случайная фигура. Путем сдвига этих точек с их исходных позиций были получены по четыре искаженные фигуры для каждого оригинала. (На рис. 4.15 показаны также искаженные треугольные паттерны.) Испытуемым показывали по одному каждый из четырех искаженных паттернов и просили классифицировать их по прототипам. После того как испытуемые классифицировали каждый паттерн (они делали это нажатием соответствующей кнопки), им сообщали, какой из их выборов был верен; прототип не предъявлялся.
Рис. 4.15. Четыре паттерна-прототипа и четыре искаженных паттерна треугольника, использованные в эксперименте Познера, Гоулдсмита и Уэлтона. Адаптировано из: Posner, Goldsmith & Welton, 1967
Из этого первого эксперимента стало очевидно, что испытуемые научались относить искаженные паттерны конкретного прототипа к некоторой общей категории, тогда как другие паттерны, полученные из другого прототипа, были отнесены к другой общей категории. За первоначальной задачей шла задача на перенос, в которой испытуемых просили рассортировать ряд паттернов по трем предыдущим категориям. Новые наборы паттернов состояли из: 1) старых искаженных паттернов; 2) новых искаженных паттернов (основанных на тех же исходных прототипах); 3) самих прототипов. Старые искаженные паттерны были классифицированы правильно и легко — с точностью около 87%, но что более важно, прототипы (которых испытуемые никогда не видели и не классифицировали) были «правильно» классифицированы примерно с тем же успехом. Новые искаженные паттерны были классифицированы менее удачно, чем другие два типа. Поскольку прототипы были столь же точно классифицированы, как и старые-искаженные паттерны, это означало, что испытуемые действительно что-то узнали о прототипах, хотя они видели только их искаженные изображения.
Отличительной особенностью этого эксперимента было то, что прототип или схема классифицировались правильно примерно с той же частотой, что и первоначально выученные искаженные паттерны, и более часто, чем новые (контрольные) искаженные паттерны. Познер и его коллега утверждали, что информация о прототипах была очень эффективно абстрагирована из сохраненной информации (основанной на искаженных паттернах). Имело место не только абстрагирование прототипов из искаженных паттернов; в самом процессе заучивания паттернов содержалось также знание об их изменчивости. Возможность того, что верная классификация прототипов основана на том, что большинству людей они знакомы (треугольник, буквы F и М), была исследована в эксперименте Петерсена (Petersen et al., 1973). Результаты показали, что прототипы и минимально искаженные тестовые паттерны наиболее значащих конфигураций легче идентифицируются, чем бессмысленные прототипы и минимально искаженные тестовые паттерны. Однако там, где степень искажения была велика, оказалось верным противоположное, то есть наиболее значимые прототипы опознавались реже, чем малозначащие. Такие результаты не противоречат выводам Познера и его коллег, но бросают вызов идее Беркли о взаимодействии между «универсальным треугольником» и его искаженным паттерном. Видимо, мы абстрагируем прототипы на основе сохраненной в памяти информации. Очевидно, хорошо знакомые формы будут подходить к менее широкому диапазону искаженных форм, чем формы относительно малознакомые. Поиски епископом Беркли «совершенного треугольника» привели к выводу, что все треугольники равны, но некоторые равнее!
В эксперименте с формированием прототипа Солсо и Мак-Карти (Solso & McCarthy, 1981а), используя процедуру Франкса и Брансфорда, обнаружили, что испытуемые неверно опознают прототип как ранее виденную фигуру и делают это с большей уверенностью, чем при опознании ранее виденных фигур. Это явление называется псевдопамятью. Они предположили, что прототип формируется на основе часто встречающихся признаков. Такие признаки, например индивидуальные для данной фигуры контуры или черты лица человека, хранятся в памяти. Общий показатель уровня запоминания можно определить по частоте появления признака: как правило, чаще воспринимаемые признаки имеют больше шансов сохраниться в памяти, чем редко воспринимаемые. Более того, возможно, что правила, по которым соотносятся признаки в паттерне, не так хорошо удерживаются в памяти, как сами признаки. Таким образом, можно представить, что процесс приобретения знания о паттерне состоит из двух этапов: получения информации о признаках паттерна и об отношениях между признаками. Пожалуй, наиболее интригующим в загадке формирования прототипов является то, что в процессе приобретения нами знания о паттерне эти два этапа протекают с разной скоростью. Это в чем-то похоже на соревнования, где два атлета бегут с разной скоростью. Тот, что быстрее, — аналог изучения признаков, а более медленный — аналог изучения их взаимосвязей.
В эксперименте Солсо и Мак-Карти лицо-прототип было составлено при помощи фоторобота — устройства, используемого в полиции; оно состоит из набора пластиковых эталонов, на каждом из которых изображена часть лица — волосы, глаза, нос, подбородок, рот. Для каждого из выбранных лиц-прототипов был произведен набор образцов, имеющих различную степень сходства с прототипом (рис. 4.16).
Рис. 4.16. Лицо-прототип (П) и образцы лиц, использовавшихся в эксперименте Солсо и Мак-Карти (Solso & McCarthy, 1981a). Лицо, сходное с прототипом на 75%, имеет все одинаковые с ним черты, кроме рта; лицо, сходное с прототипом на 50%, имеет другие волосы и глаза; лицо, сходное с прототипом на 25%, имеет только такие же глаза; лицо, сходное с прототипом на 0%, не имеет общих с ним черт
Испытуемым показывали образцы, а затем — второй набор, содержащий некоторые из первоначальных лиц, некоторые новые лица, ранжированные по их сходству с прототипом, а также сам прототип. Испытуемых просили решить, видят ли они лица из ранее виденного набора или новые лица, и оценить уверенность в своем ответе. Как видно из рис. 4.17, испытуемые не только принимали прототипы за уже виденные, но выставляли при этом наивысшую оценку уверенности в ответе (пример псевдопамяти).
Рис. 4.17. Показатели уверенности в ответе для прототипа, уже виденных (старых) элементов и новых элементов. Источник: Solso & McCarthy, 1981a
Из всего вышесказанного можно сделать некоторые выводы о формировании и использовании зрительного прототипа. Вышеупомянутые исследования показывают, что мы: 1) формируем прототипы на основе усредненных характеристик отдельных экземпляров; 2) приобретаем определенные знания о прототипе, даже когда имеем дело только с его видоизменениями; 3) приобретаем некоторую обобщенную информацию об общих признаках прототипов, причем хорошо известные прототипы содержат меньше включений, чем менее знакомые (или недавно приобретенные); 4) о модифицированных экземплярах судим по степени их близости к прототипу; 5) формируем прототип путем абстрагирования отдельных образцов и затем оцениваем взаимосвязь между прототипическими формами исходя из степени их отличия от этого прототипа, а также от других отдельных образцов.
Из вышеописанных экспериментов и многих других исследований возникли две теоретические модели формирования прототипов. В одной из них, называемой моделью центральной тенденции, предполагается, что прототип представляет собой среднее из всех экземпляров. Исследование Познера с коллегами (Posner et al., 1967) говорит в пользу этой модели. Познер и Кил (Posner & Keele, 1968), например, считают, что прототип можно представить математически как точку в гипотетическом многомерном пространстве, в которой пересекаются средние расстояния от всех признаков. В экспериментах Познера и Рида можно видеть, как у испытуемых формируется прототип, являющийся абстракцией некоторой фигуры. Таким образом, прототип — это абстракция, хранящаяся в памяти и отражающая центральную тенденцию некоторой категории.
Вторая модель, называемая моделью частоты признаков, предполагает, что прототип отражает моду или наиболее часто встречающееся сочетание признаков. Эксперименты Франкса и Брансфорда, Ноймана (Neumann, 1977) и Солсо и Маккарти подтверждают эту модель. В ней прототип — это синоним «лучшего экземпляра» из некоторого набора паттернов. Прототип — это паттерн, включающий наиболее часто встречающиеся признаки, свойственные некоторому набору экземпляров. Хотя прототип нередко уникален, поскольку состоит из уникальной комбинации признаков (вспомните уникальные геометрические фигуры в эксперименте Франкса и Мак-Карти или уникальные лица в эксперименте Солсо и Маккарти), сами по себе признаки уже воспринимались ранее. Такие признаки — например, геометрические элементы или части лица — есть строительные блоки прототипа. Каждый раз, когда человек смотрит на паттерн, он регистрирует и признаки паттерна, и взаимосвязь между ними. Однако, согласно модели частоты признаков, при освоении прототипа, включающего многие ранее встречавшиеся признаки, у человека возникает уверенность, что он уже видел раньше это изображение, так как его признаки сохранились в памяти. Поскольку взаимосвязь между признаками встречалась реже, чем сами признаки — в большинстве экспериментов экземпляры показывались только один раз, — информация о соотношении признаков хуже сохранилась в памяти, чем информация о самих признаках.
До этого, момента мы познакомились с несколькими гипотезами, касающимися распознавания паттернов. Сначала мы рассмотрели зрительную систему человека с ее огромными возможностями и ее ограничениями. Затем мы рассмотрели некоторые темы гештальт-психологии, указывающие на то, что зрительные паттерны «естественно» организованы предсказуемыми способами. Далее мы обсудили темы обработки «сверху вниз» и «снизу вверх» и узнали о важности контекстных признаков в восприятии формы. Были описаны три модели восприятия формы: сравнение с эталоном, подетальный анализ и формирование прототипа. При развитии других подходов к восприятию формы читателю может показаться, что это так же сложно, как получить от семи слепых описание слона. Один из них хватает его за хвост и описывает это существо как большую веревку; другой держится за хобот и описывает его как змею; следующий прикасается к боку слона, который, очевидно, похож на стену; и т. д.
Каждая из наших теорий восприятия формы, по-видимому, отражает только один из аспектов полной картины без их интеграции. Верно и обратное. Каждая теория по существу правильна, но каждая также нуждается в поддержке, исходящей от других. Например, на простом уровне обработки действует определенный тип обнаружения деталей, как демонстрируют эксперименты Хьюбеля и Визеля. Однако всестороннее представление о восприятии формы более объемно, чем простые идентификаторы полос. Концептуально наличие некоторого типа сравнения между хранящейся в памяти информацией и видимыми объектами, как предполагает модель сравнения с эталоном, кажется разумным. Тем не менее эта теория также не в состоянии объяснить разнообразие в распознавании паттернов. Возможно, теория геонов объяснит разнообразие в деятельности и приспособляемость человеческого глаза и разума при понимании мира, заполненного сложными формами, которые требуют быстрой и точной идентификации. Теория прототипа, хотя и хорошо обоснованная, на определенном уровне должна прибегнуть к другим моделям, чтобы объяснить начальные стадии восприятия. Таким образом, многие теории восприятия формы являются взаимодополняющими, а не антагонистическими. Восприятие формы — сложный процесс, и до настоящего времени не сформулировано никакой всесторонней теории, способной объяснить все его компоненты.
До сих пор мы имели дело только с простыми изображениями; даже лица в эксперименте Рида невыразительны и сильно упрощены. А как видятся более сложные паттерны? Чейз и Саймон (Chase & Simon, 1973a, 1973b) изучали эту проблему, анализируя сложный паттерн фигур на шахматной доске и пытаясь выяснить, чем мастера шахмат отличаются от обычных игроков. Интуиция может подсказывать нам, что когнитивные различия между ними заключаются в том, на сколько ходов вперед мастер может предвидеть игру. Интуиция ошибается — по крайней мере это следует из исследований де Грота (de Groot, 1965, 1966), обнаружившего, что мастер и обычный игрок просчитывают вперед примерно одинаковое количество ходов, рассматривают практически равное количество комбинаций и ищут схемы ходов сходным образом. Возможно даже, что мастер анализирует меньшее количество альтернативных ходов, тогда как обычный игрок тратит время на заведомо неподходящие варианты. В чем же разница между ними? А вот в чем: в способности, посмотрев на доску всего несколько секунд, воспроизвести расположение фигур; слабому игроку очень трудно это сделать. Ключ к этому наблюдению лежит в природе такого паттерна: расположение фигур должно иметь смысл. Если фигуры расположены в случайном порядке или нелогично, то и у новичка и у мастера результаты будут одинаково неважные. Возможно, мастер объединяет по несколько фигур в группы, так же как мы с вами объединяем буквы в слова, а затем складывает эти группы в более крупный значащий паттерн, так же как мы объединяем слова в предложения. Если так, то опытный мастер действительно имеет больше возможностей воспроизведения таких паттернов, поскольку он может закодировать фигуры и группы в некоторую шахматную схему.
Чейз и Саймон проверили эту гипотезу на трех типах испытуемых — мастере, игроке класса «А» (очень сильном) и начинающем игроке. В своем эксперименте они просили испытуемых воспроизвести полностью 20 шахматных позиций, взятых из специальных шахматных журналов и книг, — половина позиций изображала середину партий, а другая половина — их окончания (рис. 4.18).
Рис. 4.18. Пример миттельшпиля (середины) и эндшпиля (окончания) шахматной партии и их дубликаты, образованные по случайному принципу
В этом эксперименте две шахматные доски были поставлены рядом и испытуемый должен был на одной доске воспроизвести положение фигур с другой. В другом эксперименте испытуемые рассматривали шахматную позицию в течение 5 с и затем воспроизводили ее по памяти. Чейз и Саймон обнаружили, что у мастера времени сканирования позиции было ненамного больше, чем у игрока класса «А» или у начинающего, но на воспроизведение позиции мастер затрачивал гораздо меньше времени, чем они (рис. 4.19); на рис. 4.20 показано количество правильно размещенных фигур. Дальнейший анализ результатов показал, что умение видеть значимые группы фигур позволяло более сильным игрокам собрать больше информации за данное время.
Рис. 4.19. Время просмотра и воспроизведения для шахматистов трех уровней мастерства. Адаптировано из: Chase & Simon, 1973a
Рис. 4.20. Распределение правильного размещения шахматных фигур игроками трех уровней мастерства. Игрокам показывали первоначальный паттерн в течение 5 с. Адаптировано из: Chase & Simon, 1973a
Эксперимент Чейза и Саймона имел важное теоретическое значение. Информационные блоки, соединенные вместе более или менее абстрактными отношениями, могут стать основой синтаксиса паттернов. Информационные единицы, не имеющие какого-либо значимого контекста и не объединенные в группы, трудно кодировать, будь то буквы, геометрические фигуры, ноты или шахматные фигуры; но если объединить их в значимые структуры — в стихотворение, архитектурное сооружение, мелодию или элегантную шахматную защиту, — то они обретают значение, поскольку теперь их легко абстрагировать на языке обычной грамматики. В современной теории информации были развиты первичные модели интеллекта, основанные на идее структурных уровней. Мы также были свидетелями бурного развития структурной грамматики языка (она рассматривается далее, в главе 11), музыки, телесных реакций, графических задач и шахмат. Одной из наиболее распространенных способностей человека, применимой ко всем чувственным формам, является, по-видимому, тенденция кодирования информации о реальности на языке абстракций высокого уровня, причем в эти коды может встраиваться новая информация. Вышеприведенные эксперименты с восприятием шахматных позиций и абстрагированием непосредственных стимулов подтверждают это положение.
В этой главе мы уже затронули множество вопросов, связанных с распознаванием паттернов: принципы обработки «снизу вверх» и «сверху вниз», Сравнение с эталоном, компьютерное моделирование опознания паттернов, подетальный анализ, физиологические механизмы распознавания паттернов, сравнение с прототипом, когнитивные структуры, а также проблемы опознания букв, геометрических фигур, человеческих лиц и шахматных позиций. В большинстве этих тем трудно было отделить конкретные функции опознавания паттернов от других когнитивных систем. Мы также рассмотрели влияние контекста и избыточной информации на распознавание паттернов и поняли, что оба эти фактора непосредственно участвуют в опознании сенсорных стимулов. Эти факторы и их связь с восприятием букв и слов будут более подробно рассмотрены в разделе, посвященном языку (глава 11). Система памяти снова и снова появляется на горизонте наших рассуждений. В распознавании паттернов участвуют несколько систем низкого уровня, таких как хранение зрительных ощущений, подетальный анализ, синтез элементов и сравнение с прототипом. Но при опознании паттернов люди используют также ДВП. Мир в нашем естественном окружении наполнен сенсорными стимулами, которые надо организовать и классифицировать, чтобы распознать среди них какой-либо паттерн. Однако стимулы сами по себе ничего не значат и существуют в примитивном виде независимо от того, воспринимаем мы их или нет. Они приобретают значение только в результате анализа на высшем уровне — как составные части паттернов. Вслушайтесь и всмотритесь в ваше непосредственное окружение. Что вы видите и слышите, какой запах или вкус чувствуете, что ощущаете на ощупь? Конечно, вы не воспринимаете бессмысленные и необработанные стимулы, хотя вам известно, что они воздействуют на ваши органы чувств. На самом деле вы ощущаете объекты, что-то для вас означающие. Звонящий где-то колокол, дерево за окном, ряды букв на этой странице, запах свежеиспеченного хлеба — все это примеры стимулов, которые при их опознании в разуме человека начинают означают нечто большее, чем возбуждаемые ими физические структуры. Их значение возникает благодаря нашей памяти на подобные события, которая вводит непосредственные переживания в более обширную сферу реальности. Значение сенсорных стимулов обеспечивается воспринимающим субъектом.
В своих приключениях выдающийся сыщик Шерлок Холмс демонстрирует способность точно описывать жизнь и привычки человека при помощи ряда блестящих дедуктивных рассуждений, основанных всего на нескольких «ключевых» деталях, которые на самом деле являются опорными признаками для памяти и ассоциаций. Эти признаки, равно доступные его компаньону доктору Ватсону, закодированы и структурированы разумом Холмса так, что эти дедукции ему самому — но не Ватсону — кажутся «элементарными». Объяснив значение признаков, Холмс обращается к своему компаньону со словами: «Вы "видите", но вы не "наблюдаете"!» Все нормальные люди «видят», но способность абстрагировать видимое в значимые паттерны в большой степени зависит от созданных ранее структур и знаний из прошлого опыта.
В главе 11, посвященной языку, в контексте информационного подхода мы обсудим, как люди воспринимают и анализируют буквы и слова. В ней, как и в этой главе, мы убедимся, что от нашего прошлого опыта и способа его представления в памяти решающим образом зависит, что и как мы видим.
1. Существует несколько теоретических подходов к объяснению способности человека идентифицировать и обрабатывать зрительные паттерны: гештальтпсихология, принципы обработки информации «снизу вверх» и «сверху вниз», сравнение с эталоном, подетальный анализ и прототипное сравнение.
2. Гештальт-психологи предположили, что восприятие зрительных паттернов организуется по принципам близости, сходства и спонтанной организации.
3. Опознание паттерна может начинаться с описаний его частей, которые затем суммируются (обработка «снизу вверх»), или с выдвижения наблюдателем гипотезы, позволяющей опознать паттерн в целом, а затем — его составные части (обработка «сверху вниз»).
4. Эксперименты показывают, что на восприятие объекта значительно влияют гипотезы, определяемые контекстом.
5. Идея сравнения с эталоном предполагает, что распознавание паттерна происходит в случае точного совпадения сенсорного стимула с соответствующей внутренней формой. Эта идея имеет теоретическое и практическое значение, но не может объяснить многие сложные когнитивные процессы, такие как способность правильно опознавать малознакомые формы и фигуры.
6. Принцип подетального анализа гласит, что распознавание паттернов происходит только после того, как стимулы будут проанализированы по их элементарным компонентам. Эта гипотеза подтверждается результатами неврологических и поведенческих экспериментов.
7. Гипотеза формирования прототипов утверждает, что восприятие паттерна происходит в результате сравнения стимулов с абстракциями, хранящимися в памяти и служащими в качестве идеальных форм, с которыми сравниваются стимульные паттерны. В теории прототипов предложены две модели: модель центральной тенденции, согласно которой прототип представляет собой среднее из набора образцов; и модель частоты признаков, согласно которой прототип представляет собой некую форму или результат суммирования наиболее часто встречающихся признаков.
8. Распознавание зрительных образов человеком включает зрительный анализ на входном этапе и хранение информации в долговременной памяти.
Большая часть работ, рекомендованных к главе 3, существенны и для этой главы. Упомянем также книгу Рида «Психические процессы при распознавании паттернов» (Psychological Processes in Pattern Recognition), сборник под редакцией Хамфри «Понимающее зрение» (Understanding Vision) книгу Мерча «Зрительное и слуховое восприятие» (Visual and Auditory Perception), а также работу Макберни и Коллинза «Введение в ощущение/восприятие» (Introduction to Sensation/Perception). Книга Рока «Логика восприятия» (The Logic of Perception) является важным дополнением к литературе на данную тему. В Psychonomic Bulletin & Review ( 1995) опубликована превосходная статья Лешера по иллюзорным контурам.