С точки зрения морали машина, способная вести себя так по-разному, чтобы во всех случаях жизни действовать так, как нас заставляет поступать наш разум, невозможна.
Тогда Хэл ответил своим обычным тоном:
— Слушай, Дейв, я знаю, что ты пытаешься помочь. Но дело тут либо в антенной системе, либо в твоей процедуре проверки. С обработкой информации у меня полный порядок. Если ты проверишь мои записи, то убедишься, что там совершенно нет ошибок.
— Я знаю все о твоих служебных записях, Хэл, но это не доказывает, что и на этот раз ты прав. Все могут ошибаться.
— Я не хочу на этом настаивать, Дейв, но я не способен ошибаться.
— Ладно, Хэл,- сказал Дейв довольно резко. — Я понимаю твою точку зрения. Мы остановимся на этом.
Он собирался было добавить: «И, пожалуйста, забудь обо всем этом». Но этого Хэл, конечно же, никогда не смог бы сделать.
Что такое искусственный интеллект и как он может влиять на психологию и вашу жизнь?
Проследите историю вычислительных машин до современных программ искусственного интеллекта.
Чем компьютеры на основе кремния похожи на основанный на углероде мозг (человеческий мозг)? Чем они отличаются друг от друга?
Что такое тест Тюринга? Что такое «имитирующая игра» и «китайская комната»?
Как компьютер анализирует зрительные фигуры?
Как компьютеры распознают и генерируют речь?
Какого типа произведения искусства могут быть генерированы компьютерами? Насколько компьютеры успешны в этом?
Сможет ли компьютерный интеллект когда-нибудь превзойти интеллект человека?
Научная фантастика имеет обыкновение становиться научным фактом. В современных лабораториях, занимающихся изучением искусственного интеллекта (ИИ), всерьез обсуждается возможность создания подобия Хэла[101] — бортового компьютера из произведения Артура Кларка «2001: Космическая Одиссея», обладавшего интеллектом и способного принимать этические решения. Я не хочу сказать, что Кларк более точно предсказал перспективу развития компьютеров, чем Жюль Берн — систему запуска за три четверти века до того, как ракета послала космическую капсулу на Луну. Но специалисты по компьютерам разрабатывают компьютерные системы, способные довольно точно имитировать процессы человеческого познания и обработки информации; так что вполне возможно, что к тому времени, когда мы будем стартовать с Земли, что-нибудь вроде Хэла у нас появится[102].
Искусственный интеллект (ИИ) в широком смысле определяется как отрасль компьютерной науки, связанная с разработкой компьютеров (аппаратных средств ЭВМ) и компьютерных программ (программного обеспечения), которые имитируют когнитивные функции человека. В предыдущих пятнадцати главах «когнитивные функции человека» обсуждались довольно подробно, и мы узнали, что познание включает восприятие, память, мышление, обработку языка и многие другие функции, которые выполняются более или менее точно. Вы можете, например, увидеть и узнать лицо друга, решить в уме математическую задачу (7 х 8)/(4 х 5); сочинить осмысленное стихотворение в ямбическом пентаметре, узнать голоса Бивиса и Баттхеда; мысленно вычислить самый короткий маршрут от вашего дома до колледжа, определить, прилично ли пригласить отца невесты на холостяцкую вечеринку жениха, и отличить кислое молоко от свежего. И вы и я делаем подобные вещи каждый день безо всякого усилия (и если экстраполировать результаты исследования Хаира и его коллег, касающиеся скорости метаболизма и интеллектуальной работы, приведенные в предыдущей главе, посвященной человеческому интеллекту, то можно сказать, что делаем мы это без расхода большого количества энергии). Кроме того, мы совершаем много глупостей, например наливаем шампунь на зубную щетку вместо зубной пасты. Мы — люди, и это проблема для компьютеров: будучи совершенными машинами, никогда не допускающими ошибок, тем не менее «ошибаться». Если бы компьютер мог точно моделировать мышление и действия человека, он так же хорошо, как и мы, выполнял бы упомянутые выше действия, но подобно нам он смог бы ошибаться, вплоть до путаницы с шампунем и зубной пастой, пытаясь прийти в себя ранним утром. Важно провести различие между теми, кто пишет программы, успешно решающие встающие перед человеком задачи, например любимую мною программу, которая издает пронзительный звуковой сигнал, когда я отклоняюсь от стандарта правописания, и программы, которые пытаются копировать мышление человека. Компьютеры и их впечатляющие технологии стали такой важной частью нашей повседневной жизни, что непонятно, как мы жили без них раньше; однако они недостаточно умны, чтобы помыться зубной пастой (или наоборот). Чтобы сделать это, они должны были бы точно имитировать мышление и действия человека и тогда были бы неотличимы от него. Позже я расскажу об этом более подробно.
Рассмотрим «простую» когнитивную задачу: решение алгебраической задачи, сформулированной словесно. Многие компьютерные программы могут сделать это быстро и точно, но они не моделируют человеческое познание. В самом начале исследований ИИ Пейдж и Саймон (Page & Simon, 1966) попытались моделировать человеческую деятельность в компьютерной программе под названием STUDENT, которая была разработана для решения словесно сформулированных алгебраических задач на основе простого синтаксического анализа. Некоторые испытуемые в их исследовании решали задачи почти так же, как STUDENT, но многие действовали иначе. Они использовали вспомогательные признаки и физические репрезентации при решении задач, так же как вы, вероятно, делали при попытке определить потерю воды в прохудившемся ведре, которое при этом наполнялось водой, — вы задумчиво делали рисунок.
Несмотря на фундаментальные различия между искусственным интеллектом и интеллектуальным клонированием, ученые достигли в этой области замечательных успехов.
Обсуждая ИИ, мы обычно обращаемся к когнитивной психологии и нейронауке. Идеи одной науки, например нейронауки, могут быть включены в аппарат другой, например искусственного интеллекта, а идеи когнитивной психологии могут быть применены в двух других. Все три области — искусственный интеллект, когнитивная психология, и особенно нейронаука, — являются основами когнитивной науки.
Между ИИ и когнитивной психологией установились своего рода симбиотические отношения, где каждый выигрывает от развития другого, поскольку для того, чтобы искусственным способом воссоздать точную копию человеческого восприятия, памяти, языка и мышления, нужно знать, как эти процессы происходят у человека. И в то же время развитие искусственного интеллекта создает новые возможности для понимания человеческого познания.
В этой главе мы предлагаем вам общее введение в ИИ, который будет обсуждаться в связи с восприятием, памятью, процессами поиска, языком, решением задач, художественной деятельностью и «роботологией».
Хотя тема ИИ связана с разработкой машин, действующих так, как если бы они были «разумны», большинство последних конструируются без всякого намерения подражать когнитивным процессам человека. Однако некоторые ученые заняты разработкой «разумных» машин, моделирующих человеческое мышление, и именно данному направлению — «компьютерному моделированию» (КМ) — будет в основном посвящена эта глава. (Когда-нибудь будет почти невозможно сказать, где кончается ИИ и начинается КМ; мы будем использовать широко принятый термин ИИ для обозначения любых результатов компьютерной деятельности, которые можно было бы счесть разумными, если бы они были произведены человеком.)
Разного рода вычислительные приборы — мозг искусственного интеллекта — существовали на протяжении всей истории человечества. Самым ранним типом таких устройств был абак, который применялся в Китае уже в VI столетии до нашей эры. Египтяне изобрели счетную машину, в которой использовалась галька, незадолго до того как Геродот (приблизительно 450 г. до н. э.) описал этот факт. Подобное устройство имели и греки, а древнеримские авторы упоминают о трех типах вычислительных машин. Большинство этих устройств использовались в сфере торговли, с их помощью производились операции сложения и вычитания. Умножение выполнялось путем повторения операции сложения. Приблизительно в 1633 году малоизвестный немецкий астроном Вильгельм Шикард (1592-1635) изобрел автоматический цифровой калькулятор, в память о котором в 1973 году была выпущена немецкая почтовая марка. Изобретение вычислительной машины чаще приписывают французскому философу Блезу Паскалю (1623-1662), «отцу исчисления». Машина Паскаля могла только складывать и вычитать, но она вызвала широкий интерес. В 1670-х годах Готфрид Лейбниц представил машину, которая могла выполнять умножение и деление. Компьютеры появились позже, когда эксцентричный Чарльз Бэббидж (1792-1871), которого иногда называют первым в мире компьютерщиком, при помощи леди Ады Лавлайс изобрел вычислительное устройство, которое выполняло программируемые операции, содержащие условные следствия. (См. Haugeland, 1989. Модель машины Бэббиджа можно увидеть в Смитсоновском институте в Вашингтоне, округ Колумбия.)
Чарльз Бэббидж (1792-1871). Британский математик и изобретатель, разработавший концепцию программируемого механического вычислительного устройства. Он назвал его «аналитическим устройством»
Дж. Преспер Эккерт (на переднем плане) и Джон Моучли работают на ламповом компьютере ENIAC совместно с военнослужащими армии США и обслуживающим персоналом; 1946 год
Происхождение современной компьютерной науки можно отнести к 1940-м годам, когда для ускорения долгих и утомительных математических вычислений, обычно применяемых военными для расчета траекторий полета артиллерийских снарядов, были изобретены ламповые компьютеры UNIVAC и ENIAC. ENIAC (Electronic Numerical Integrator and Computer — «Электронный числовой интегратор и компьютер») — тщательно засекреченный проект, спонсируемый военным ведомством США и проводимый в Пенсильванском университете — имел 17 468 радиоламп, изготовитель которых гарантировал их работу в течение 25 тыс. ч; это означало, что в среднем каждые 8 минут сгорала одна лампа! Эта чудовищных размеров вычислительная машина весила 30 т, а потребляемая ею мощность равнялась 174 кВт. Руководителями проекта были Джон Моучли и Дж. Преспер Эккерт. Эти первые бесхитростные и не слишком эффективные гиганты открыли дорогу для более компактных, более мощных и более сложных систем, которые, в свою очередь, постепенно сменились микроэлектронными компьютерами, прочно вошедшими в нашу повседневную жизнь.
В когнитивной психологии найдется немного более важных дат, чем 1956 год[103]. Летом этого года группа из десяти ученых собралась на территории колледжа Дортмут с целью обсудить возможность создания компьютерных программ, способных к разумному поведению. Среди участников этой конференции были: Джон Мак-Карти, основавший впоследствии лаборатории ИИ в Массачусетском технологическом институте (МТИ) и Стэнфордском университете и широко признанный как человек, окрестивший новую науку «искусственным интеллектом»; Марвин Минский, ставший затем директором лаборатории ИИ в МТИ; Клод Шеннон, разработавший современную модель системы коммуникации в «Беллз лабораториз»; Герберт Саймон, которому предстояло получить Нобелевскую премию по экономике; и Аллен Ньюэлл, который провел очень важные работы по когнитивной науке и ИИ в университете Карнеги-Меллон. Эта конференция имела историческое значение — намечавшийся до того курс на ИИ был взят. Его зарождение непосредственно повлияло на развитие когнитивной психологии.
Джон Мак-Карти. Первым начал исследования в области искусственного интеллекта и разработал язык Лисп, широко используемый в исследованиях искусственного интеллекта
С момента конференции в Дортмуте развитие ИИ происходило в геометрической прогрессии. Сегодня ИИ так или иначе затрагивает жизнь большинства людей во всем мире, им интересуются студенты, на нем сосредоточены усилия тысяч ученых. Различные теории и практики ИИ невозможно описать в единственной главе или книге и даже во многих книгах, но мы тем не менее приведем несколько примеров работ в области изучения ИИ в их связи с когнитивной психологией.
Самый распространенный тип компьютера из используемых сегодня копирует схему («архитектуру», на компьютерном жаргоне), разработанную венгерским математиком Джоном фон Нейманном (von Neumann, 1958), в 1930 году эмигрировавшем в Соединенные Штаты. Такого рода компьютер иногда называют Johniac, или последовательный процессор, так как электрические импульсы обрабатываются последовательно, или один за другим. Эти цепные последовательности работают очень быстро, каждый шаг требует лишь несколько наносекунд, но для решения сложных задач последовательным способом (таких, как решения с использованием математических функций или трансформация данных или файлов) компьютеру может потребоваться нескольких минут, часов или еще больше времени. Все пользователи компьютеров знают, как невыносимо «много» времени требуется персональным компьютерам, чтобы «обдумать», или «переварить», проблему. Основная причина, по которой компьютеры неймановского типа работают так медленно, состоит в том, что одно действие должно быть закончено прежде, чем начато другое. Последовательные процессоры решают проблемы пошаговым способом.
Джон фон Нейманн (1903-1957). Разработал общепринятую компьютерную архитектуру
В самом начале разработки технологии компьютеров специалисты в области искусственного интеллекта (и авторы научной фантастики) лелеяли грандиозные мечты о мыслящих машинах и роботах. В начале 1940-х годов чикагский психиатр В. С. Мак-Калох и его студент В. Питтс написали оригинальную статью. В ней они ввели понятие, которому суждено было оказать существенное влияние на ученых-компьютерщиков, включая фон Неймана, а позже и сторонников модели PDP. Основываясь на идее о том, что разум определяется как работа мозга, а более точно — основных единиц мозга, нейронов, они утверждали, что нейроны можно рассматривать как «логические устройства» и что «нервные явления и отношения между ними можно объяснить с помощью пропозициональной логики». Когда нейроны взаимодействуют друг с другом, они делают это электрохимически. Небольшой силы электрический ток проходит по аксону клетки к синапсу, где химический медиатор передает импульс другим нейронам. Процессом нейротрансмиссии управляют определенные правила: нейроны генерируют разряд, только когда достигается порог возбуждения, у всех нейронов есть пороги; нейроны генерируют разряд, только когда ток положительный, отрицательный ток тормозит активность нейрона и т. д. Очень важно, что каждый нейрон, по-видимому, суммирует все возбуждающие и тормозящие сигналы от тысяч его связей. В зависимости от своего порога нейрон будет или не будет генерировать разряд, то есть он будет «включен» или «выключен»[104]. (Нейроны такого типа называются нейронами Мак-Калоха-Питтса.) Мак-Калох и Питтс отметили, что этот нейрон в состоянии «включено» или «выключено» можно рассматривать как логическое устройство. Как известно, компьютер работает с помощью схем «включено-выключено». Когда тысячи таких схем соединяются вместе в экспоненциальной последовательности, возможности обработки неизмеримо возрастают. Точно так же основная единица нервной обработки — нейрон и его связи — обладает впечатляющими возможностями.
Вскоре после публикации статьи Мак-Калоха и Питтса фон Нейманн обнаружил связь между логичным поведением нейронов при их взаимодействии между собой и способом работы цифровых компьютеров. «Легко заметить, что эти упрощенные функции нейрона можно имитировать с помощью телеграфного реле или радиоламп». (Транзисторы еще не были изобретены, иначе он, вероятно, назвал бы и их.) Фон Нейманн, который к этому моменту уже разработал наиболее практичную компьютерную архитектуру, предположил, что можно спроектировать компьютер, который бы копировал человеческий мозг — не только по функции, но и по структуре, — а радиолампы, реле, соединяющие провода и аппаратные средства ЭВМ заменяли бы нейроны, аксоны, синапсы и остальную «телесную начинку». Вслед за фон Нейманном попытку создания компьютера предпринял Ф. Розенблатт. Его цель состояла в том, чтобы создать компьютер, способный классифицировать фигуры. Результат его работы получил название «перцептрон», он грубо копировал организацию мозга (см. главы 1 и 2). Машина Розенблатта включала иерархию с тремя уровнями. Каждый уровень был связан с определенной функцией, которые в общих чертах имитировали сенсорный, ассоциативный и моторный паттерны людей. Фундаментальная проблема ранних машин типа перцептрона состояла в том, что они не могли учиться. Они просто обрабатывали узкий диапазон стимулов и выдавали столь же простые реакции.
Люди способны к научению, потому что у них есть поддающиеся изменению синапсы. Вспомните правило Хебба (приведенное в главе 2), согласно которому сила связи между двумя нейронами возрастает, когда они одновременно активизированы. Могло ли это правило использоваться для описания связи между суррогатными нейронами? Обучение такой машины могло бы потребовать встраивания в искусственный мозг соответствующим образом запрограммированного резистора (устройства, которое определяет силу электрического импульса, передающегося от одного транзистора к другому). Резистор действовал бы как регулятор, позволяя передавать одни биты информации и отвергать другие. При этом способные к «научению» перцептроны (научение здесь определяется как «изменение силы связи между единицами, которые моделируют нейроны») действуют подобном нейронам Мак-Калоха- Питтса и в соответствии с теорией Хебба. Сконструированному таким образом компьютеру можно было бы показать простую геометрическую фигуру, например круг, чтобы он мог классифицировать его. Если машина отреагирует, назвав его квадратом, ее можно «научить» реагировать правильно, увеличив сопротивление между определенными единицами и понизив сопротивление между другими. Если реакция правильна, то есть если перцептрон называет круг кругом, величина сопротивления остается той же. В этом смысле перцептроны наказывают за ошибки и не реагируют на успех. Эти первые шаги были важны для проектирования машин, способных к обобщениям и научению, — важным факторам в конструировании «мыслящей машины», которая функционирует подобно человеческому мозгу.
Уже на ранних стадиях разработки компьютеров появляются идеи о значении и возможном использовании этих новых хитроумных изобретений. Одни считали, что если компьютеры запрограммировать должным образом, то есть учитывая надлежащие правила и инструкции, они смогут выполнить любые действия, включая эффективное копирование мышления человека. Другие полагали, что для того, чтобы машина «думала», необходимо, чтобы аппаратные средства компьютера были подобны структурам мозга. Для достижения этой цели требовалось наличие в компьютере слоев связанных электронных заменителей нейронов, организация и функция которых копировали бы человеческий мозг.
Пока нам не удалось создать машину, которая действительно могла бы «думать», или «мозг», которой был бы очень похож на человеческий. Однако, поскольку наука развивается, можно считать, что искусственный интеллект все еще находится в младенческом возрасте. Каждая из упомянутых точек зрения имеет свои недостатки. В первом случае, «мышление» большинства программ искусственного интеллекта ужасно ригидно. Когда я прошу вас извлечь квадратный корень из 73, вы можете сказать: «Ну, по крайней мере это 8, но никак не 9. Приблизительно 8 с половиной». Компьютер даст ответ 8,5440037... Вместо того чтобы плодить бесконечные цепи цифр, человеческий мозг благодаря удивительной способности обрабатывать хаотическую информацию — увидеть знакомое лицо в толпе, ведя машину по автостраде в Лос-Анджелесе, понимать глубокий смысл пьес Чехова или ощущать, как шелк ласкает нашу кожу — находит простые решения. Никакой компьютер не способен на это и, все же... С другой стороны, никакой человек не может выдать ответ на задачу с квадратным корнем за несколько миллисекунд, а любой дешевый калькулятор может.
Рассмотрим задачу, с которой сталкиваются все, кто стремится собрать компьютер, подобный человеческому мозгу. Мозг содержит приблизительно 100 млрд нейронов, каждый из которых соединен с тысячами других нейронов. Это огромное количество связей. Некоторые ученые предпринимали попытки построить компьютерную модель мозга в уменьшенном масштабе (см. Rosenblatt, 1958), но до недавнего времени (см. врезку под названием «Критические размышления: чип для мозга?») они отговаривали других от этой затеи (см. Minsky & Papert, 1968). Ранее (в 1954 г.) Минский написал диссертацию о нервных сетях и даже построил такую сеть с помощью 400 радиоламп, но скоро разочаровался в своем проекте. Эта работа не дала «практических» результатов, хотя в то время разработка компьютерных программ и аппаратных средств ЭВМ была крайне популярным занятием. Мастерские в гаражах разрослись до стоящих огромные деньги фабрик, производящих компьютерные чипы, способные делать вещи, о которых мы могли только мечтать.
Новое поколение компьютерных/когнитивных ученых более оптимистично настроены относительно моделирования нервных функций машиной. Одно из недавних изменений в перцептронах было концептуальным. Вместо того чтобы рассматривать компьютерный мозг как устройство ввода-вывода, ученые добавили третий слой, названный скрытым. Этот скрытый слой соответствует промежуточным нейронам мозга, которые связаны не с информацией на входе или выходе, а передают импульсы к другим нейронам. Данная модель совместима с коннекционистской моделью, упоминаемой в этой книге.
Кремниевый чип, который, как считается, работает очень похоже на клетку мозга человека, был разработан исследователями из Калифорнийского технологического института и Оксфордского университета Махауалдом и Дугласом. Устройство, названное кремниевым нейроном, имеет структуру и функции, которые копируют работу нейронов в коре мозга. Важный аспект этой технологии — аналоговый характер устройства в отличие от цифровых единиц обработки, используемых в большинстве компьютеров. Когда люди видят сложный объект, например лицо человека, они видят не данные в цифровой форме — последовательности пикселов, — а скорее тонкие контуры и непрерывно изменяющиеся оттенки серого цвета. Используя эти сигналы, глаз и мозг извлекают значение из световых сигналов через аналоговый процесс.
Хотя не все принимают в расчет важность этого технологического открытия (хотя бы потому, что в мозге есть нейроны многих типов и это лишь один пример), идея кремниевого чипа, копирующего некоторые важные особенности человеческого нейрона, открывает интересные перспективы и ставит вопрос, насколько далеко может зайти технология в создании мозга.
Если бы у меня был мозг!
Многие из этих вопросов связаны с важной проблемой архитектуры компьютеров и мозга. Однако компьютеры пока не ведут себя как люди; компьютеры и мозг не идентичны. В чем-то компьютеры действуют лучше мозга, а в чем-то — хуже. Это неравенство наблюдается во многих областях, как отмечалось ранее, но особенно проблематичная область — идентификация трехмерных объектов. Наши глаза, двухмерные датчики, быстро и точно передают сигналы, которые интерпретируются как трехмерные. Даже с учетом медлительности нервных структур, постоянного изменения местоположения наблюдаемого объекта и приспособления к размеру объекта наша перцептивная система работает почти совершенно. Компьютеры хуже выполняют подобные операции, даже при том, что скорость передачи сигнала у них в миллионы раз выше, чем в нервной системе.
Как уже упоминалось, одна из причин этого различия состоит в том, что компьютеры, как правило, обрабатывают информацию последовательно (модель последовательной обработки информации), тогда как мозг в основном обрабатывает информацию параллельно. Некоторые исследователи искусственного интеллекта пытаются преодолеть архитектурное различие между мозгом и компьютерами, чтобы ликвидировать это функциональное различие. Один из них, В. Дэниел Хиллис, разработал «связывающую машину» (Hillis, 1987), которая решает задачи, разбивая их на меньшие задачи (что напоминает анализ «средства-результат») и затем обрабатывая их параллельно (модель параллельной обработки информации). Эти меньшие задачи впоследствии распределяются по отдельным областям обрабатывающей сети компьютера. Такие машины отличаются от компьютеров неймановского типа, которые имеют один центральный процессор, обрабатывающий информацию последовательно. В «связывающей машине» Хиллиса 65 536 (простое число с основанием 2) процессоров одновременно работают над одной задачей. Хотя каждый процессор менее мощный, чем компьютер, используемый при подготовке этой рукописи, когда эти 65 ООО с лишним небольших чипов подключены и работают одновременно, они могут выполнять несколько миллиардов команд в секунду. Эта машина впечатляет и концептуально и функционально. Однако Хиллис мечтает о машине с миллиардом процессоров, функционирующих параллельно.
Некоторые из фундаментальных вопросов искусственного интеллекта таковы:
* Какого рода мыслящей машиной является мозг?
* Как машина может имитировать мышление человека?
* Могут ли компьютеры превзойти мышление человека?
* Стоит ли стремиться достичь этих целей?
Ни на один из этих вопросов нет легких ответов, но сторонники основанной на принципах протекания нервных процессов модели параллельной распределенной обработки (и другие ученые) упорно их ищут.
Мозг. После столетия психологических исследований, особенно изучения познания в течение нескольких прошлых десятилетий, ответ на первый вопрос начинает, наконец, принимать определенную форму. Я надеюсь, что содержание этой книги является тому подтверждением. Мы многое узнали о нашей мыслящей машине, называющейся мозгом: она существенно отличается от распространенных компьютеров неймановского типа. Возможно, исследования ИИ продвинулись бы дальше, если бы компьютеры больше походили на мозг. Для прояснения этого вопроса я предлагаю следующее сравнительное резюме.
Таблица 16.1
Человеческое мышление и компьютер. Ответ на второй вопрос, по крайней мере с точки зрения коннекционизма, состоит в том, что мышление человека можно лучше всего скопировать, смоделировав машину по принципу строения основных нервных структур.
Преимущество компьютера. Некоторые компьютерные программы работают намного эффективнее, чем человеческое мышление; однако большинство из них — это в лучшем случае неуклюжие подделки под мозг. Компьютеры могут решать некоторые задачи, например сложные математические, быстрее и точнее, чем люди. Другие же задачи, например требующие обобщений и обучения новым паттернам поведения, люди решают лучше компьютеров.
Необходимость исследований. Наконец-то я могу с легкостью дать ответ на вопрос о том, должны ли мы заниматься этими проблемами, — да, должны. При этом мы больше узнаем о мышлении человека и машин. Однако есть мнение, что исследовать искусственный интеллект столь же глупо, как сражаться с ветряными мельницами.
Если посмотреть на таблицу сравнения компьютеров неймановского типа с мозгом, можно понять, почему исследователи искусственного интеллекта были разочарованы, если не сказать поставлены в тупик. Они работают с неправильными машинами! Кажется, что мы находимся на пороге концептуального прорыва — возможно, сдвига парадигмы — в области искусственного интеллекта, и уже сделаны первые шаги в направлении увеличения сходства компьютеров и мозга с точки зрения их структуры и процессов. Системы нейронных сетей, модели PDP и коннекционизм пытаются найти вычислительные принципы, управляющие сетями нейронов в нервной системе человека. Для достижения этой цели они выбирают средства, которые могут показаться очень абстрактным. Единицы могут представлять нейроны, они подчиняются законам, выведенным на основе наблюдения за поведением нейрона. То есть единица может быть соединена с другими единицами, связь между ними может быть усилена или ослаблена, они могут устанавливать между собой постоянные связи и т. д. (Для дополнительной информации см. Churchland, 1989.)
В то время как американские ученые прошлого поколения безуспешно пытались построить компьютер, подобный мозгу, японский ученый Айзава создал такой компьютер, используя реальные нервные клетки, смешанные с электронными устройствами, в попытке изготовить грубую, наполовину искусственную нейронную сеть. На данный момент он успешно объединил клетки с полупроводниковой смесью индия и окиси олова и обнаружил, что при очень слабой электрической стимуляции органические клетки реагируют управляемым ростом (см. приведенный здесь рисунок).
Слишком рано думать об искусственном мозге, но подобные устройства могли бы выступить в роли интерфейса между нервной системой и такими протезами, как искусственный глаз.
Важная концепция была предложена в связи с нейронными сетями: они также могут учиться. То есть посредством системы синаптических связей инфраструктура мозга может измениться под воздействием опыта (который может быть внешне или внутренне обусловлен).
Мы еще не знаем, насколько успешными будут эти попытки. Однако нам известно, что этот новый взгляд на человеческое познание вызывает большой энтузиазм его сторонников[105]. Даже человек, просто интересующийся когнитивной психологией, отметит важный вклад этих исследований в психологию и будет с нетерпением ждать будущих событий.
Я не знаю другой такой области когнитивной психологии, где происходили бы столь ожесточенные споры о моделировании человеческого мышления машинами. Одну сторону этого спора представляют те ревнители ИИ, которые не только верят, что машины способны точно копировать человеческое познание, но и считают, что наиболее сложные интеллектуальные процессы могут выполняться только машинами. Это надо понимать так, что компьютеры должны непосредственно участвовать в повседневном принятии решений людьми. С другой стороны находятся те, кто считает ИИ интеллектуально извращенным понятием и полагает, что люди, верящие в «мыслящие машины», — это материалистические идолопоклонники. Они полагают, что человеческое мышление — это чисто человеческий процесс; наверное, его можно частично синтезировать в машине, но дублировать с помощью ИИ-программ его не удастся никогда.
В качестве отправной точки полезно рассмотреть дихотомию, предложенную философом из Калифорнийского университета в Беркли Джоном Сирлом (John Searl, 1980). Он описал две позиции в ИИ: «жесткую» и «мягкую»; согласно мягкой позиции, ИИ может использоваться как инструмент в исследованиях человеческого познания; а жесткая предполагает, что соответствующим образом запрограммированный компьютер обладает разумом и способен к пониманию. У «мягкого» ИИ мало оппонентов; почти все признают важность компьютеров в исследовании человеческого познания, и к этому почти нечего добавить. «Жесткий» ИИ, опровергаемый Сирлом, вызвал бурю протеста. Мы продолжим рассмотрение этого спора в разделе про «китайскую комнату», но сначала рассмотрим одну оригинальную задачу, предложенную британским математиком Аланом Тюрингом[106] и касающуюся разума и машин.
Тюринг (Turing, 1950) предложил использовать задачу, в ходе которой человек задает вопросы «неизвестному существу, использующему язык». Задача человека — решить, можно ли отличить это существо от человека. В пользу Тюринга говорит то, что использование «имитирующей игры», ставшей впоследствии широко известной как «тест Тюринга», само по себе было весьма тонким обманом, который, давая специалистам по ИИ конкретный материал для работы, уводил их внимание от философских вопросов о разуме, ставших главным раздражающим фактором в истории науки и психологии. Не обращаясь непосредственно к философским вопросам, как это сделал Тюринг, «существо» спрашивало: «Является ли познание функцией материальных процессов, и если да, то могут ли такие функции продуцироваться неорганической машиной?» или: «Как решить проблему тела и разума?» — то есть «оно» выбирало гораздо более четкие рамки вопроса, основанные на операционализме. Поскольку в литературе сохраняется определенная путаница относительно реальной природы предложенного Тюрингом теста, мы приводим его здесь довольно детально:
Эту... задачу можно описать в терминах игры, известной нам как «имитирующая игра». В нее играют три человека: мужчина (А), женщина (5) и спрашивающий (С), который может быть любого пола. Цель игры для спрашивающего — определить, кто из двух других — мужчина, а кто — женщина. Для него они помечены как X и У, и в конце игры он должен сказать либо: «Х — это А, а Y — это В», либо: «X — это В, а Y — это A». Спрашивающий может задавать А и В следующие вопросы: С: Не скажет ли мне X, какая у него длина волос?
Теперь предположим, что X — это на самом деле А; тогда А должен ответить. Целью игры для А является... заставить С сделать ошибочную идентификацию. Его ответ мог бы быть таким:
«Мои волосы коротко острижены, самые длинные пряди длиной примерно 9 дюймов». Чтобы тембр голоса не указывал спрашивающему на пол, ответы пишутся или еще лучше печатаются. Самый лучший вариант — это принтер, подключенный в соседней комнате. Другим вариантом может быть повторение ответов посредником. Цель третьего игрока (В) — помочь спрашивающему. Возможно, наилучшая стратегия — это давать правдивые ответы. Игрок может прибавлять к своим ответам что-то вроде: «Это я — женщина, не слушай его!» — но это ничего не даст, поскольку так может сказать и мужчина.
Теперь спросим: «Что произойдет, если роль А в этой игре будет исполнять машина?» Будет ли спрашивающий при таком варианте игры ошибаться так же часто, как и тогда, когда играют мужчина и женщина? Эти вопросы заменяют первоначальный: «Может ли машина мыслить?»
Очевидно, эффективность некоторых вопросов, задаваемых X и Y, зависит от моды: если за основу различения взять длину волос и прическу, то, например, в 1970-х годах это привело бы к значительным ошибкам. Тем не менее для специалистов по языку и ИИ в задаче Тюринга есть очень важный момент — для того, чтобы компьютер перехитрил нас и заставил думать, что он — человек, он должен понимать и генерировать ответную реакцию, которая успешно имитировала бы важную когнитивную функцию.
Чтобы продемонстрировать, что жесткая позиция относительно ИИ не выдерживает критики, Сирл предложил следующую головоломку. Предположим, что некоего человека заперли в комнате, где находится много китайских текстов. Этот человек ничего не понимает по-китайски и даже не способен отличить китайские иероглифы от каких-либо других. Ему в комнату передают еще один набор китайских знаков вместе с набором правил для сопоставления первого и второго набора символов. Эти правила всего лишь позволяют связывать один набор символов с другим, и написаны они на английском языке. При помощи этих правил сопоставления человек в «китайской комнате» может давать осмысленные ответы на вопросы о содержании китайских текстов, несмотря на то что он, в сущности, не знает этого языка. Через какое-то время он приобретает такую сноровку, что может отвечать как на своем родном английском, так и на китайском языке, которого не знает, но дает ответы, основываясь на правилах. Результаты настолько хороши, что их «совершенно нельзя отличить от ответов урожденного китайца» (Searl, 1980). Человек, запертый в «китайской комнате», — это простая конкретная иллюстрация компьютерной программы: «данные на входе-данные на выходе». Вплоть до этого момента почти никто из ИИ-защитников не возражает, но затем Сирл делает еще один шаг вперед. Способность выполнять такие функции, как перевод по сложным правилам, не означает, что тот, кто это делает, понимает значение «выходных данных». Человеческий разум характеризуется произвольностью (см. Searl, 1983), которая, согласно Сирлу, определяется как «свойство психических состояний и явлений, направляющее их на объекты и ситуации в окружающем мире». К таковым относятся убеждения, страхи, желания и намерения. Независимо от того, насколько «неотличимо» поддельное мышление от «настоящего» (человеческого), они не суть одно и то же, поскольку у мыслящего человека есть намерения и поскольку между этими двумя «мыслящими» существуют физические различия: одного сделали органическим способом, а второго — электронным.
Вопрос неразличимости функций в другой сфере деятельности рассматривается иначе. Например, предположим, что в больнице работают два хирурга. Один хирург — дипломированный специалист известной медицинской школы, считающийся одним из лучших хирургов в мире. Другой окончил малоприметную медицинскую школу и оценивается как плохой хирург. Однажды потребовалась срочная операция, а первый врач заболел, поэтому второй врач делает операцию без ведома пациента, который находится без сознания. Пациенту не сказали, какой врач его оперировал, и он доволен тем, что операция прошла успешно. Кроме того, другие врачи убеждены, что операция была сделана первым хирургом. Из этого примера мы можем заключить, что тест на неразличимость пройден успешно. Однако, если бы вы были пациентом и узнали, что операцию в действительности делал робот, какой бы вывод вы сделали о профессиональных качествах робота в сравнении с профессиональными качествами хирурга? Вы бы согласились, что они одинаковы? Почему да или почему нет? Трудно дать ответы на эти вопросы, но только не для людей, имеющих твердые убеждения по этому вопросу, таких как Сирл, «вывернувший наизнанку» тест Тюринга.
Компьютерщики немедленно выдвинули возражения против головоломки Сирла (см. Boden, 1989) — прежде всего с позиций семантики: термины «произвольность», «понимание», «мышление» употребляются им без четких операциональных референтов. В качестве возражения был приведен такой пример: если бы человек в «китайской комнате» выполнял описанные функции, то он (или система) действительно достиг бы как минимум некоторого уровня понимания. Кроме того, аргументы Сирла отклонялись на основании «приведения к абсурду»: если довести ситуацию до логического конца, то оказалось бы возможным создать робота, в каждой своей детали идентичного мыслящему человеку, и все же последний был бы способен к «пониманию» и «произвольности», а первый — нет. Наконец, некоторые специалисты по ИИ полагают, что «понимание» и «произвольность» вызываются конкретными материальными свойствами. Пилишин (Pylyshyn, 1980) с иронией замечает, что, возможно, произвольность — это такое вещество, которое выделяется человеческим мозгом; он предлагает свою собственную загадку:
...Если бы все больше и больше клеток вашего мозга заменялись интегральными микросхемами, запрограммированными так, чтобы их характеристики входа-выхода были идентичны заменяемому элементу, вы, по всей вероятности, сохранили бы способность говорить точно так же, как и сейчас, за исключением того, что постепенно перестали бы что-либо под этим иметь в виду. То, что мы, сторонние наблюдатели, все еще принимали бы за слова, для вас стало бы просто некоторым шумом, который заставляют вас издавать ваши микросхемы.
Этот спор далек от завершения, и некоторые, видимо, находят определенную ценность в его философской глубине. Для меня этот спор уж точно не разрешен (на самом деле он, вероятно, неразрешим ! ). Кроме того, оба лагеря ужесточили свои позиции и выдвигают скорее аргументы веры, чем разума. Для такой книги, как эта, его важность двояка. Во-первых, он заставляет читателя глубоко задуматься о том «человеческом», что заключено в человеческом познании. Во-вторых, в связи с этим спором встает вопрос, до какого предела ИИ может имитировать человеческий интеллект. Страсти, разгоревшиеся вокруг «теста Тюринга» и «китайской комнаты» с обеих сторон, отражают сильную заинтересованность современных философов и специалистов по ИИ проблемой электронного джина, выпущенного из бутылки.
В следующем разделе мы рассмотрим некоторые конкретные возможности компьютеров. Развитие этих функций в целом соответствует последовательности обработки информации от восприятия до распознавания паттернов и познания «высшего порядка».
Восприятие человека инициируется внешними сигналами, состоящими из света, звука, молекулярных соединений и давления. Эти сигналы обнаруживаются органами чувств и преобразуются (конвертируются в нервную энергию) в сообщения, понимаемые мозгом. Количество информации, доступной органам чувств, огромно; одна только зрительная система может передавать в мозг 4,3 х 106 бит информации в секунду. Фейгенбаум (Feigenbaum, 1967) предполагает, что некоторые периферийные устройства, иногда называемые периферической системой памяти, действуют подобно сенсорному буферу, предохраняющему мозг от переполнения потоком втекающей в него информации.
Как построить машину, способную подражать этому перцептивному механизму? Логично было бы разработать механизм, способный чувствовать. Эта попытка осуществляется в работе по созданию компьютерных распознающих систем[107].
Один из способов научить компьютеры распознавать геометрические формы путем анализа логических признаков — руководствоваться правилом, согласно которому сложные геометрические формы состоят из простых. В этой программе использован ряд небольших «матриц», систематически сопоставляемых с каждым объектом в поисках соответствия. Пример «матрицы» и идентифицируемого геометрического объекта приведен на рис. 16.1.
Рис. 16.1. Обнаружение левого края посредством шестиэлементной матрицы. Знаки «+» и «-» указывают на элементы, реагирующие на условия «присутствует» и «отсутствует» соответственно
Матрица состоит из сенсоров двух типов — позитивного и негативного; «присутствует», «отсутствует» — это единственный сигнал, подаваемый такой ячейкой, или подразделением матрицы. Изображенная матрица содержит только шесть ячеек — три «минуса» и три «плюса», и, судя по расположению этих компонентов (все «отрицательные» элементы расположены слева), вполне подходит для идентификации левого края объекта. Помещение матрицы ее средней линией над левым краем куба привело бы к полному соответствию. На углу соответствие было бы плохим, а на нижнем крае, где плюс и минус отменяют друг друга, соответствия не будет. Хотя эта эвристика в наибольшей степени ориентирована на возможности машин, она не расходится с результатами изучения восприятия у человека и животных. Ранее в этой книге (см. главу 4) мы упоминали, что психофизиологам удалось найти детекторы линий в клетках коры головного мозга кошек, и, хотя эти данные еще не полностью подтверждены, похоже, что у человека также имеются детекторы края.
Трудность использования вышеприведенной системы состоит в том, что для распознавания даже простых паттернов требуется большое количество матриц (например, детектор левой кромки, детектор правой кромки). Также проблематична «добротность» стимула; большинство геометрических форм (особенно в реальном мире) могут иметь резкие или расплывчатые, яркие или тусклые края. Распознавание паттернов путем распознавания линий можно сильно упростить, если идентифицируемую форму сначала преобразовать в образ, состоящий только из линий, и затем использовать матрицы для определения ориентации этих линий.
Системы распознавания паттернов обычно имеют дело со зрительным материалом. Как правило, воспринимающие устройства у таких систем имеют растр, или матрицу из фотоэлементов, реагирующих на свет. Обычно эти фотоэлементы находятся в двух состояниях: «включено» и «выключено» (для «белого» и «черного»). Рассмотрим элементарную задачу идентификации цифры. На рис. 16.2 показано, как цифры можно преобразовать в двоичный код: 0, или «выключено», — для «черного», и 1, или «включено», — для «белого»
Рис. 16.2. Двоичное представление (колонка в центре) букв (колонка слева). Нули показывают «выключено», или «черный», единицы — «включено», или «белый». В правой колонке показано, как выглядели бы цифры при считывании их сканером
Компьютер считывает каждую цифру (то есть фотоэлементы — один для каждого квадрата сетки, накладываемой на число, «ощущают» световые зоны, т. е. те, которые не заняты числом) исходя из того, насколько данный цифровой код совпадает с матрицей, хранящейся в памяти компьютера. Этот принцип работает очень хорошо, если все буквы одной формы, одинаково расположены и не размыты, такие устройства широко применяются в американской промышленности и государственной почтовой службе. Но когда дело доходит до чтения рукописных писем, присланных для тети Иолы, у оптических сканирующих устройств начинаются разные трудности. Однако в наше время быстро разрабатываются системы для «чтения» даже рукописных текстов.
Идентификация букв и слов средствами ИИ — это не только практическая задача, она также имеет значение для тех ученых, кто интересуются процессом анализа информации человеком. Многое из того, что нам уже известно об идентификации человеком букв и слов, обсуждалось в главе 12. Эти знания помогают разрабатывать компьютерные программы, имитирующие данный процесс. Подробный отчет по этой теме, послуживший руководством для последующих исследований, представили Селфридж и Найссер (Selfridge & Neisser, 1963). Выше описанная общая процедура «восприятия буквы» потребовала бы компьютерной памяти огромного объема (для хранения матрицы каждого нового варианта каждой буквы) или оказалась бы неспособной обнаруживать многие встречающиеся в действительности формы букв.
Основная логика Селфриджа и Найссера была использована в недавно появившихся устройствах, считывающих буквы и слова. Эти компьютеры «читают» текст с помощью ряда подпрограмм, каждая из которых специализируется в одной части задачи чтения, скажем буквы. Такой анализ несколько напоминает способ решения задач «средства-результат», упомянутый в главах 14 и 15, посвященных мышлению. Один из способов работы программы чтения буквы изображен на рис. 16.3. На нем показано, как буква R обрабатывается через ряд довольно простых стадий, пока не устанавливается соответствие на основе исключения альтернатив.
Рис. 16.3. Буква R обрабатывается через ряд стадий идентификации. На каждой стадии программа распознает специфические признаки буквы, такие как диагональные линии, углубления и т. д.
Сторонники модели PDP также детально рассматривают проблему восприятия букв. Общая критика программ ИИ, касающихся идентификации букв и восприятия фигур, состоит в том, что в них не используется сколь-либо удовлетворительное устройство для осуществления функции внимания. Машина «видит» фигуру, будь то буква или геометрическая конфигурация, в целый паттерн и в отличие от человека испытывает затруднения при сосредоточении на критических признаках. Один из способов, которым модель PDP решает эту трудную проблему, — использование датчиков признаков двух типов, один из которых называется элементом ретиноцентрических признаков, а другой — элементом канонических признаков. В ретиноцентрической системе зрительные стимулы регистрируются в «сырой» форме, то есть в форме образа на сетчатке. Канонические признаки соответствуют стандартному способу репрезентации информации, например тому, какой мы ожидаем увидеть букву A в этом тексте. В одной системе Хинтон (Hinton, 1981) описал метод отображения паттернов ретиноцентрических признаков на канонические паттерны. В подробностях эта идея слишком обширна, чтобы быть представленной здесь; отметим лишь, что эта важная проблема активно исследуется сторонниками модели PDP. Всех интересующихся ею я адресую к первоисточникам.
Более старые, и намного более простые, алфавитно-цифровые системы распознавания в рамках ИИ основывались на понятии эталона. Паттерн букв и цифр хранился в памяти компьютера. Когда компьютер «видит» цифру или букву, он «читает» ее, сравнивая с паттерном, например букву A с эталоном А. Если установлено соответствие, буква идентифицируется правильно. Даже описанные ранее методы последовательного и параллельного поиска были явно упрощенными. Более новые, основанные на принципах нервных процессов компьютерные модели фактически способны к «изучению» паттернов. Некоторые из этих компьютеров могут изучать, хранить и распознавать паттерны. Одна такая программа, названная DYSTAL (DYnamically STable Associative Learning — «Динамически устойчивое ассоциативное научение»), успешно усваивает буквы алфавита и последовательности букв и, что, возможно, более важно, распознает их даже при предъявлении только части паттерна (рис. 16.4).
Рис. 16.4. Распознавание паттерна искусственной сетью Алкона происходит согласно многим из правил, демонстрируемых биологическими системами. Когда сеть обучена распознавать паттерн, такой как строчная буква а, изображенная в верхней части рисунка, воспринимающим участкам, участвующим в распознавании, придается больший «вес», чем тем, которые не участвуют в распознавании, то есть их возбудимость повышается. Здесь синаптический вес представлен возвышением элементов в слоях. Повышение возбудимости облегчает образование связей между нейронами, участвующими в воспоминании, когда предъявлена только часть паттерна. (Этот рисунок помог сделать Томас П. Воджи из Экологического научно-исследовательского института Мичигана.) Источник: Alkon, 1989
По мнению Алкона, DYSTAL делает это так же, как мы узнаем знакомое лицо по нескольким линиям эскиза. Система «изучает» паттерн в том смысле, что предварительно в нее не было заложенной никакой связи между информацией на входе и на выходе. Тем не менее связь была установлена через больший вес, приписываемый определенным элементам (участкам), которые участвуют в процессе распознавания.
Другая новаторская особенность этой системы состоит в том, что она может вместить большое количество элементов, не задействуя значительных ресурсов компьютера. Во многих других сетевых системах каждая единица связана с каждой другой единицей, поэтому, когда число единиц возрастает, экспоненциально увеличивается число взаимодействий. Таким образом, системе, имеющей даже 100 единиц, требовалось бы значительное время для обработки, а сеть такого объема едва ли похожа на мозг. «В программе DYSTAL, однако, силы связей не сравниваются с фиксированным значением: скорее они достигают динамического равновесия, при котором увеличение и уменьшение силы связи в наборе репрезентаций паттерна равны, и в итоге не происходит никаких "весовых" изменений» (Alkon, 1989). Эта система сопоставима с долговременной памятью человека в том, что постоянные воспоминания, сформировавшись, большей частью становятся необратимыми. Как только эти устойчивые паттерны усвоены, они требуют меньше ресурсов компьютера, чем другие, небиологические сети.
Распознавание более сложных форм подчиняется той же самой логике, что и распознавание простых форм, но, как правило, оно требует более сложных процессоров. Эта тема будет рассмотрена далее.
В качестве примера распознавания других паттернов обратимся к идентификации треугольника. На рис. 16.5 изображено несколько треугольников, каждый из которых человек может с легкостью опознать и классифицировать. Если прототип «треугольности», хранимый в программе компьютера, соответствует «правильной» матрице треугольника А, то треугольники В и С, если их правильно повернуть и скорректировать по величине, можно будет легко распознать; однако треугольники D и E вызывают проблемы, особенно Е — их можно идентифицировать только в результате «хорошего гештальта», но не по тому признаку, что они состоят из трех прямых линий.
Рис. 16.5. «Хорошие» (A-D) и «проблематичные» (E) треугольники. Первые отличаются только по величине, ориентации и отношению сторон; у последних нет обычных прямолинейных сторон, но их все же можно опознать как треугольники
Наша способность немедленно распознавать каждую из этих фигур как треугольник объясняется обширным опытом восприятия других треугольных объектов; абстрактное представление о треугольности достаточно широко, чтобы позволить нам опознать эти треугольники именно как треугольники, хотя раньше мы их никогда не видели. Может ли компьютер выучить это понятие? Возможно, но такой механизм поиска будет более сложным, чем единичная операция сопоставления, такая, как в машине, считывающей номер с чека. Вместо этого стоило бы подумать о программе поиска, распознающей детали треугольника. Тогда такие детали, или атрибуты, как углы, линии, форма, количество объектов и т. д., хранились бы в компьютерной памяти, точно так же, как в нашей памяти хранится каталог этих атрибутов треугольника.
Компьютерное распознавание сложных форм применяется на практике в области распознавания лиц. Предположим, что ваше лицо имеет уникальные признаки, такие же, как отпечатки пальцев. Компьютерная система, которая может сканировать лицо человека и найти полное соответствие с ним, могла бы очень помочь в работе полиции. Она также оказалась бы полезной для идентификации чеков и в системах безопасности промышленных объектов и офисов. Представьте, что каждое утро на работе вас приветствует компьютер, который просит: «Пожалуйста, расположите ваше лицо так, чтобы я мог его увидеть», — а после его сканирования и открытия двери говорит: «Здравствуйте, госпожа Джуэль, вам звонил В. М. Бич... и, между прочим, с днем рождения». Хотя вы можете воспринять это как еще одно вторжение в вашу личную жизнь, вероятно, что довольно скоро нам придется смириться с такими устройствами.
Исследование идентификации лиц было проведено специалистами по компьютерам Томасом Поджо и Роберто Брунелли в Массачусетском технологическом институте. Суть программы состояла в определении и математическом анализе существенных признаков лиц, таких как ширина носа, расстояние между глазами и подбородком и т. д. Были выявлены шестнадцать признаков (рис. 16.6).
Рис. 16.6. Сравнение лиц. Чтобы это лицо соответствовало лицу в памяти компьютера, для установления сходства собраны и используются в формуле шестнадцать таких ключевых признаков, как глаза, нос и размеры подбородка. Данная формула основана на измерении евклидового расстояния в шестнадцатимерном пространстве. Эту работу ведут в Массачусетском технологическом институте Р. Брунелли и Т. Поджо
Если бы лица не менялись, было бы достаточно простой модели сравнения с эталоном; однако наши лица никогда не бывают одинаковыми. Поэтому программа должна найти близкое сходство между вашим лицом сегодня и вашим лицом на прошлой неделе, но при этом не быть слишком снисходительной, чтобы пропустить самозванца. Программа делает это путем геометрического сравнения различных аспектов признаков и обещает быть намного более надежной, чем идентификация лиц, осуществляемая людьми. Такое устройство могло бы помочь разгадать некоторые фотографические тайны, неожиданно возникающие время от времени (например, находка очень ранней фотографии человека, который может быть (или не быть?) Авраамом Линкольном).
Может ли этот человек быть Авраамом Линкольном?
Эта сделанная в начале XIX века фотография молодого человека, похожего на Линкольна, но он ли это? Компьютерный анализ лицевых признаков может помочь дать ответ на этот вопрос.
Из нашего обсуждения распознавания объекта (см. главу 4) мы знаем, что восприятие паттернов человеком связано не только с наблюдением объекта и последующим сопоставлением этого образа с эталоном в мозге (подобно тому, как компьютерные коды вертикальных полос сравниваются с соответствующими паттернами). Вполне возможно, что оно происходит на основе ранее сохраненных признаков, которые при объединении образуют прототип. Новые или менее знакомые стимулы распознаются дольше старых или знакомых паттернов, потому что совпадений между паттерном и хранящейся в памяти информацией обнаруживается гораздо меньше. Компьютеры не имеют ограничений на объем хранящейся информации — практически нет предела объема памяти компьютеров, — поэтому при написании программ часто предполагалось использование большого хранилища информации и механизмов поиска при сравнении образов восприятия с воспоминаниями. В «реальной жизни» мы узнаем людей, места и даже слова без особых усилий не потому, что каждый раз, когда мы видим эти объекты, то сохраняем эти образы отдельно друг от друга, а потому, что сохраняем абстракцию, связанную с этим классом стимулов. Так, когда вы узнаете свои спальню, подушку и ботинки, это происходит потому, что мозг сохранил «идеальные», а не фотографические образы.
Синха и Поджо (Sinha & Poggio, 1997) продемонстрировали важность формы головы при распознавании лиц людьми и компьютерами. Мы знаем друг друга, потому что знакомы месяцы и годы. Лицевые характеристики хранятся в памяти, и, когда мы видим человека, у которого присутствуют все признаки его лица-прототипа, мы сразу узнаем «оригинал». Этот процесс мало чем отличается от описанного в эксперименте Солсо и Мак-Карти опыта с лицами-прототипами (см. главу 4). В эксперименте Синха и Поджо предъявлялись лица, показанные на рис. 16.7.
Рис. 16.7. Вы можете быстро идентифицировать эту известную пару? Вы уверены? Объяснения в тексте
На первый взгляд эта пара напоминает бывшего президента Билла Клинтона и вице-президента Альберта Гора, но в действительности лицо на заднем плане составлено из основных признаков лица президента Клинтона — его глаз, носа и рта, — добавленных к образу Гора — его волосам, ушам и телу. Вероятно, эта иллюзия сначала ввела вас в заблуждение потому, что у вас была «установка»: эти люди образуют «пару». Даже положение, занимаемое на рисунке каждым из изображенных, повлияло на ваше восприятие, а затем вы увидели волосы Гора, его тело, его осанку и быстро приняли решение. Таким образом, на распознавание паттерна оказывает большое влияние прошлое восприятие, которое в случае узнавших Гора оказалось неэффективным. Из исследований, проведенных Поджо и его коллегами, можно сделать два вывода. С одной стороны, можно разработать программы, которые распознают объекты и лица лучше, чем люди (и такие устройства полезны в работе правоохранительных органов). С другой стороны, можно создать программу научения так, чтобы компьютер мог методом проб и ошибок научиться распознавать объекты и лица намного лучше, чем люди.
Системы, которые работают как люди-эксперты, называют экспертными системами. По существу, экспертная система — это искусственный специалист, который решает проблемы в области своей компетенции. Экспертные системы были разработаны, чтобы решать задачи в медицине, юриспруденции, аэродинамике, шахматах и освободить людей от несметного числа рядовых процедур, которые обычно надоедают людям или в некоторых случаях могут быть слишком трудны для решения людьми (см. только что обсуждавшуюся тему идентификации лиц). Эти системы хорошо подчиняются правилам. Они могут «обдумывать» только одну проблему. Экспертная система в медицине может быть незнакома с гражданскими правонарушениями, но она может поставить довольно точный диагноз тринадцатилетней девочке с высокой температурой, болью в животе и повышением уровня лейкоцитов в крови. Одна такая программа, неудачно названная Puff[108], является экспертной системой, разработанной для диагностики болезней легких, например рака легких; ученые заявляют, что точность ее работы приблизительно равна 89%, — близко к точности диагноза, поставленного опытными врачами. Эти системы особенно популярны в промышленности, армии и в исследованиях космоса. Они довольно хорошо справляются со своей работой. Кроме того, они не бастуют и не требуют больше денег, не возражают, чтобы их разбили вдребезги, не требуют средств для поддержания жизни и их очень любят тупицы.
Психологи считают язык основным проявлением когнитивных процессов. Он больше, чем все другие виды человеческого поведения, отражает мышление, восприятие, память, решение задач, интеллект и научение. И ввиду его важности для основных психологических принципов язык представляет большой интерес для специалистов по ИИ.
Артур Кларк в наиболее полном виде — как обмен мнениями между Дейвом (человеком) и фантастическим компьютером Хэлом — предвосхитил связь способности к языку и сферы решения задач с искусственным интеллектом:
— Я хочу сделать это сам, Хэл, — сказал он, — пожалуйста, передай мне управление.
— Слушай, Дейв, у тебя еще куча работы. Я предлагаю, чтобы ты оставил это мне.
— Хэл, переключи анабиоз на ручное управление.
— Насколько я могу судить по обертонам твоего голоса, Дейв, ты серьезно расстроен. Почему бы тебе не принять таблетку от стресса и не отдохнуть немного?
— Хэл, этим кораблем командую я. Я приказываю тебе разблокировать ручное управление анабиозом.
— Извини, Дейв, но, согласно специальной подпрограмме С1435бис-4, цитирую: «Если экипаж мертв или недееспособен, бортовой компьютер должен принять управление на себя», конец цитаты. Следовательно, я должен признать твою власть недействительной, поскольку ты не в состоянии исполнять обязанности разумно.
Насколько близко мы подошли к тому, чтобы, пусть пока лишь в лабораториях ИИ, сделать эту фантастику реальностью?
Ниже приведена иллюстрация «думающей машины» Джонатана Свифта из «Путешествий Гулливера». Свифт язвительно предположил, что книги и другую литературу можно писать, поворачивая соответствующие ручки. Некоторые «современные программы для сочинительства» генерируют научную фантастику, которая воспринимается как настоящая литература. См. журнал Omni для примеров.
Полные энтузиазма первые исследователи искусственного интеллекта быстро приняли вызов, брошенный задачей Тюринга, и написали программы, разработанные для продуцирования ответов на реальные вопросы, которые были бы неотличимы от ответов человека. Теперь некоторые из этих программ могут показаться несколько наивными, но наука часто развивается именно таким образом.
ELIZA. Одна из первых «разговаривающих» компьютерных программ ELIZA (ЭЛИЗА)[109] была написана Джозефом Вейценбаумом (Weizenbaum, 1966). С момента создания первоначальной программы появилось несколько ее переработанных вариантов. В одной конкретной программе под названием «ДОКТОР ЭЛИЗА» играла роль, сходную с ролью психиатра. В следующем примере высказывания ЭЛИЗЫ выделены заглавными буквами:
Все люди похожи.
ЧЕМ ЖЕ?
Они вечно надоедают нам то тем, то другим.
НЕ МОГЛИ БЫ ВЫ ПРИВЕСТИ КОНКРЕТНЫЙ ПРИМЕР?
Ну, мой приятель заставил меня прийти сюда.
ВАШ ПРИЯТЕЛЬ ЗАСТАВИЛ ВАС ПРИЙТИ СЮДА?
Он говорит, что я почти все время подавлен.
МНЕ ЖАЛЬ СЛЫШАТЬ, ЧТО ВЫ ПОДАВЛЕНЫ.
Это правда, я чувствую себя несчастным.
ВЫ ПОЛАГАЕТЕ. ЧТО ПРИХОД СЮДА ПОМОЖЕТ ВАМ ПЕРЕСТАТЬ БЫТЬ НЕСЧАСТНЫМ?
Мне нужна какая-то помощь, это точно.
Кому-то может показаться, что эта беседа вполне могла бы являться частью диалога психиатра-человека и его пациента. Но давайте оценим этот разговор критически. Реакции компьютера в нем довольно стереотипны. Например, он запрограммирован отвечать на определенные ключевые слова фразой, являющейся всего лишь преобразованием первоначальной фразы. Так, когда пациент произносит ключевые слова: «Я (есть)...», ЭЛИЗА отвечает выражением: «Мне жаль слышать, что вы...» Если ключевых слов не обнаружено, компьютер отвечает бессодержательным замечанием или в некоторых случаях преобразованием предыдущей фразы. То, что за отсутствием лучшего слова мы называем пониманием, включает человеческие знания об ощущениях, склонностях, групповой динамике и т. д. У ЭЛИЗЫ этого нет.
PARRY. Какая получилась бы беседа, если поменять роли, то есть если бы психиатр разговаривал с компьютерной моделью пациента? Колби и его коллеги (Colby et al., 1972) смоделировали такого пациента, назвав свою программу PARRY (ПАРРИ)[110], поскольку она имитировала ответы параноидного пациента. Параноика они выбрали потому, что существует определенное теоретическое представление об этой болезни и о процессе паранойи, а различие между ответами нормальных людей и психотиков велико; исследователи могли использовать суждения экспертов для оценки отличимости ответов компьютерной модели от ответов человека. Колби с коллегами подвергли компьютер тесту Тюринга, попросив группу психиатров провести интервью с ПАРРИ при помощи дистанционно печатаемых сообщений. Психиатров просили оценить степень «паранойи» в общей сумме ответов.
Результаты показывают, что в очень специализированной обстановке эта модель «неотличима» от реального пациента. Конечно, можно справедливо утверждать, что условия этого эксперимента были созданы искусственно, что действительная диагностика паранойи включает множество интервью лицом к лицу с пациентом и что если бы эксперты знали реальную суть задачи, они строили бы беседу по-другому. Хотя Колби с коллегами успешно запрограммировали компьютер отвечать довольно похоже на параноидного пациента и эта программа прошла своего рода тест Тюринга, она очень далека от совершенной модели, способной генерировать и понимать язык.
NETtalk. Совершенно иной тип основанной на нервной сети программы под названием NETtalk разработали Седжновски, работавший тогда в Гарвардской медицинской школе, и Розенберг из Принстонского университета (см. Heppenheimer, 1988; Sejnowski, 1987). Программа NETtalk читает и произносит буквы (рис. 16.8). Модель, имитирующая нервную сеть, состоит из нескольких сотен единиц («нейронов») и тысяч связей между ними. NETtalk «читает вслух», преобразовывая буквы в фонемы — элементарные единицы речевых звуков. Эта система подобно другим, о которых мы уже говорили, имеет три слоя: входной, в котором каждая единица соответствует букве; выходной, единицы которого представляют 55 фонем английского языка; и слой скрытых единиц, в котором каждая из единиц имеет обладающую определенным весом связь с каждой входной и выходной единицей. NETtalk читает, рассматривая одну за другой каждую букву и просматривая три буквы с обеих сторон для получения информации о контексте. Так, буква е в словах net, neglect и red может обозначать различные звуки. Каждый раз, когда программа NETtalk читает слово, она сравнивает его произношение с правильным произношением и затем регулирует вес его связей, чтобы исправить любые ошибки.
Рис. 16.8. Программа NETtalk читает вслух: она переводит буквы в фонемы. Каждая единица-буква посылает сигналы через имеющий определенный вес связи ко всем «скрытым» единицам; если общий сигнал, достигающий скрытой единицы, превышает некоторый порог, единица генерирует разряд, посылая сигналы к единицам-фонемам. Информация на выходе — фонема, которая получает самый сильный общий сигнал. Когда «преподаватель» говорит программе NETtalk, что она допустила ошибку — здесь она только что прочитала m вместо n, — она исправляет ошибку, регулируя все веса связей согласно определенному алгоритму научения. Источник: Heppenheimer, 1988
После нескольких попыток NETtalk заметно улучшает свою работу. Седжновски сообщает:
Мы оставили ее работать на всю ночь. Сначала она выдавала непрерывный поток бессмысленных звуков. Это были лишь предположения; она еще не научилась связывать фонемы с буквами. Со временем она стала распознавать согласные и гласные. Затем она обнаружила, что между словами были пробелы. Теперь поток звука разбивался на короткие порывы, разделенные этими пробелами. На исходе ночи она читала довольно понятно, правильно произнося приблизительно 92% букв (цит. по: Heppenheimer, 1988).
Практическое значение этих систем очевидно; менее очевиден, но в конечном счете более важен концептуальный прорыв, обеспеченный моделями нейронных сетей.
Терри Седжновски. Разработанные им нейронные сети содержали скрытый слой, который соответствует промежуточным нейронам
Как признают Седжновски и другие исследователи, в разговоре между машиной и человеком большое значение имеет контекст. Теперь мы рассмотрим другую важную проблему — проблему значения и искусственного интеллекта.
Несмотря на то что некоторые из фраз этого компьютера достаточно хороши, чтобы обманывать кого-то некоторое время, он не способен обманывать всех и постоянно. Компьютеры терпят неудачу не из-за недостатка памяти на слова — она почти неограниченна, и не из-за недостаточной способности генерировать значимые предложения — она весьма обширна, и не из-за плохого произношения букв — оно вполне приемлемо, а из-за того, что они недостаточно понимают используемый язык.
На ранних этапах развития ИИ многие думали, что компьютеры смогут оказать значительную помощь при переводе с языка на язык. Просто загрузить в компьютер словарные эквиваленты (например, necklace = «ожерелье», cloth = «сукно», pocketbook = «записная книжка», pink = «розовый» и т. д.), ввести один язык и получить на выходе другой. Однако, даже если делать перевод один к одному в контексте синтаксической информации, результаты получаются довольно странные. Например, когда пассаж из Библии (возможно, апокрифический) The spirit is willing, but the flesh is weak («Стремится дух, да плоть слаба») перевели на русский язык, а затем обратно на английский, то получилось следующее: «Вино было приятным, но мясо протухло».
Опыт использования подобных примитивных программ перевода и развитие психолингвистики изменили наше представление о языке. В предыдущем примере русские и английские слова были эквивалентны и синтаксис в обоих языках правилен. Но смысл двух предложений получился разным. Любой язык ограничен различными правилами, определяющими последовательность грамматических компонентов и значение всей последовательности. Сложные отношения внутри языка требуют тщательного анализа. Компьютерный анализ процессов естественного языка выражается в разработке систем, способных «понимать» язык. Были созданы довольно сложные «понимающие» программы, основанные на концептуальной базе языка. Эти программы могли анализировать как контекст рассуждения, так и значение слов, а в некоторых случаях и «знания о мире» (Т. Виноград). Анализатор синтаксиса определяет наиболее вероятный синтаксический разбор и интерпретацию предложения.
Способность первых языковых систем подражать человеческому разговору была ограничена в связи с недостатком знаний о мире и неспособностью делать выводы. В речи людей то, что не говорится, столь же важно для эффективного сообщения, как и то, что произносится вслух. В разумной человеческой деятельности присутствуют все виды умозаключений — и не только при обработке языка, но и при других видах деятельности, таких как зрительное восприятие. Нам не обязательно видеть частично скрытый объект полностью, чтобы заключить, что он существует целиком. Даже частичных и вторичных признаков достаточно для запуска целой серии ответных реакций: если я иду через лес, зная, что в нем водятся ядовитые змеи, то звука шуршащих листьев достаточно, чтобы я замер на месте.
Еще один аспект понимания привлек внимание исследователей ИИ — это понятие об «убеждениях». Рассмотрим следующий пример:
Вчера я вернулся домой после 2 часов ночи.
Ну, приятель, и задала же мне жена!
Будет справедливо заключить, что большинство людей понимают — то, что задала эта жена своему мужу, вовсе не было задачкой на вычитание. Ничего, что этот вывод может быть абсолютно неверен. (Например, муж мог работать допоздна в своей лаборатории и только что открыть средство от рака, которое принесло бы его семье славу и деньги; или он мог прийти домой слишком рано!) Мы говорим о том, что большинство людей понимают из этой простой истории и чего не понимают компьютерные программы. Чтобы программа поняла эту историю, нужна не только обширная память на идиомы (а иначе как понять выражение «задала мне»), но также некоторое представление о приходах и уходах мужей и о том, каковы убеждения и отношения жен к таким выходкам.
Системы непрерывного распознавания речи (НРР) — это программы, которые распознают и регистрируют естественную речь. Внешне система НРР кажется достаточно простой для конструирования. В конце концов, большинство людей и некоторые животные распознают и регистрируют определенный тип речи. Однако эта задача крайне сложна по упомянутым выше причинам. Рассмотрим хотя бы проблему, связанную с омофонами, — словами, которые звучат одинаково, но имеют различное значение, например arm («рука») — конечность, прикрепленная к торсу, и arm («оружие») — то, что вы производите, чтобы защитить себя от полуночного злоумышленника. В предложении: Jeff armed himself in the event of an emergency («Джеф вооружился на крайний случай») слово armed означает, что Джеф обзавелся определенным видом оружия. Однако, если вы знаете Джефа, а также то, что в результате несчастного случая он потерял обе руки и теперь пользуется протезами, которые он надевает в крайнем случае, например при пожаре, вы так же знаете, что armed означает, что он надел свою искусственную руку. Как бы система НРР разобралась с этим паттерном речи? Большинство программ работает на основе статистической вероятности и ограниченного синтаксического контекста и, таким образом, неверно истолковали бы смысл предложения. Однако постепенно создаются все более сложные программы, которые учитывают контекст и задействуют «знания о мире».
Исследования на переднем крае НРР связаны с программами перевода, упомянутыми выше. Эти новые программы не просто осуществляют перевод путем «грубого поиска и сравнения», а способны к непрерывному распознаванию речи с использованием полного словаря, переводу на другие языки и синтезу речи с высокой степенью точности. Это означает, что человек может говорить по-английски, например в «телефон» (или микрофон, связанный с компьютером); английская речь переводится в текст; текст переводится на другой язык, например французский; синтезируется речь на втором языке; и в результате мы получаем устную версию переведенного сообщения. Эта удивительно практичная программа уже находится на стадии экспериментальной проверки (см. Kurzweil, 1999), и коммерческий продукт, как ожидается, появится на рынке в начале этого десятилетия.
В процессе разумного общения с человеком NETtalk и CSR используют знания о мире, и то же самое делают другие программы, в спектр деятельности которых включены те или иные формы человеческого понимания. Среди наиболее известных и наиболее спорных — программа понимания языка, разработанная в Йельском университете Роджером Шенком. Разработки Шенка преследовали несколько целей, включая создание программы, способной понимать письменный текст, кратко излагать его суть, переводить его на другой язык и отвечать на вопросы по его содержанию. Шенк и его коллеги скоро обнаружили, что люди понимают гораздо больше, чем просто ряды слов естественного языка. Он иллюстрирует этот момент следующим рассказом: «Джон пошел в ресторан. Он заказал сэндвич. Официант принес его быстро, поэтому он дал ему большие чаевые». Вопрос: съел ли Джон сэндвич? Заплатил ли он за него?
Когда я говорю вам: «Я был в Венеции прошлым летом», — вы можете, в свою очередь, задать мне много вопросов более или менее по существу: потратил ли я сколько-то денег? Летел ли я самолетом? Или плыл на корабле? Говорил ли я с кем-нибудь? Заходил ли я в ресторан? Видел ли я других людей в Венеции? Говорят ли они по-итальянски? Носят ли они одежду? Есть ли у них ногти? Сколько? Чтобы «разумная» машина понимала язык, она должна уметь при обработке языка делать разумные выводы, как это делают обычные люди. Основная идея Шенка близка принципу обработки «сверху вниз», подробно обсуждающемуся в этой книге.
Одной из трудностей, с которой исследователь столкнулся при разработке программы обработки языка, была неоднозначность естественных языков. Шенк (Schank, 1981) приводит следующий пример:
Я ударил Фреда по носу.
Я ударил Фреда в парке.
Чтобы правильно проанализировать эти предложения, нужно знать гораздо больше, чем просто синтаксические и семантические правила. Читатель должен что-то знать о том, где может находиться человек, а также владеть другой концептуальной информацией о человеческом поведении и общей информацией о мире.
Литература по решению задач и играм в рамках ИИ, возможно, более обширна, чем по любому другому психологическому вопросу. Одна из причин, почему многие специалисты по ИИ интересуются решением задач, состоит в том, что этот термин, грубо говоря, синонимичен мышлению, которое в своем наиболее сложном виде является исключительно атрибутом человека. Этот факт, а также то, что машины с ИИ способны выполнять процедуры решения задач, привели к бурному развитию методов и теории в этой области.
Вычисления были одним из первых примеров использования машин для решения задач. В 1642 году Паскаль (тогда ему было 19 лет) продемонстрировал, что при помощи изобретенного им механического вычислителя некоторые математические задачи можно решить точнее и быстрее, чем это делают люди вручную. В контексте современного ИИ решение задач означает гораздо больше, чем механические вычисления; оно охватывает широкий диапазон от решения сложных головоломок до доказательства теорем, заучивания успешных операций и различных игр.
Легко спроектировать компьютер, который может решить определенную задачу. Однако написать программу, которая достаточно универсальна, чтобы решать различные задачи, довольно трудно. А создание программы, способной адаптироваться и научиться решать совершенно разные задачи, пока невозможно. Но цель многих современных специалистов в области искусственного интеллекта состоит в том, чтобы спроектировать обучающуюся программу, которая будет решать задачи. На элементарном уровне такие самообучающиеся программы могли бы научиться определять, какие клиенты будут благонадежными пользователями кредитных карточек, а с какими лучше не связываться (см. рис. 16.9). На более продвинутом уровне находятся программы компьютерного зрения, над созданием которых работает Абу-Мустафа (Abu-Mostafa, 1995); они предназначены для опознавания объектов даже в случаях, когда объект-мишень изменяет направление или ориентацию.
Рис. 16.9. Обучение машины включает наладку внутренних параметров системы, при которой устанавливаются связи между входными данными и желаемым результатом. Например, система, дающая санкцию на предоставление кредита, обучалась бы связывать личные данные претендентов с их репутацией как должников. В действительности в процессе обучения «настраиваются шкалы», пока машина не сможет повторять отношения ввода-вывода в пробных примерах
Как учатся машины? Логический ответ — на основе «опыта», но, конечно, это почти ничего не говорит нам о механизмах, которые изменяют работу компьютера. Многие специалисты в области искусственного интеллекта подходят к решению этой проблемы с математической точки зрения, в рамках которой поведение машины рассматривается как функция, связывающая входные величины (например, характер решаемой задачи) с соответствующими выходными величинами (действия или решения). Один из способов решить эту задачу — рассматривать обучение машины просто как «поиск правильного положения ручек управления». Некоторые программы учатся, изучая примеры, как в случае задачи, приведенной на рис. 16.10.
Рис. 16.10. Вы можете решить эту задачу? Эти объекты были рассортированы на два класса, на что указывают серые или черные рамки. По какому признаку они различаются? Компьютеры, запрограммированные обучаться на примерах, часто сталкиваются с подобными загадками. Использование машиной подсказок делает обучение более быстрым и легким. Подсказку, которая поможет решить эту задачу, см. на рис. 16.11
Прервитесь на минуту, чтобы увидеть, сможете ли вы найти признак, который отличает один класс объектов от другого. Обратите внимание на то, что ваше решение, связанное с формированием понятия, может сосредоточиться на смысловых отношениях, но как тогда связаны старинный штопор, часы и кролик Банки? Это трудная задача, и все же вы, как и компьютер, испытаете озарение, когда увидите подсказку на рис. 16.11.
Рис. 16.11. Зрительная подсказка, которая помогает и машинам, и людям в решении задачи на рис. 16.10. Нарисованная ось дает понять, что у верхних шести объектов отсутствует зеркальная симметрия, имеющаяся у нижних трех объектов. Этот признак отличает объекты в черных и серых рамках
Машина «учится», имитируя функции-мишени и поэтапно совершенствуя свои действия, все больше приближаясь к цели, пока не достигнет ее. Было создано несколько успешных программ, действующих по этому принципу, включая основанные на нейронной сети (см. Hinton, 1992).
В основе многих работ по ИИ лежит важное различение между двумя методами решения задач. Один метод называется алгоритмическим, а другой — эвристическим. Алгоритмы обычно определяются как процедуры, гарантирующие решение задач данного типа; эвристика есть набор эмпирических правил или стратегий, которые в итоге действуют подобно правилу большого пальца. Различие между этими методами можно проиллюстрировать на примере шахматной задачи. Шахматы для компьютера — это игра, в которой во всякий данный момент у каждого игрока существует ограниченное количество ходов. И на каждый из возможных ходов противник может ответить также ограниченным набором ходов. Для практических целей количество этих перестановок конечно, то есть игра должна закончиться выигрышем (поражением) или вничью. На рис. 16.12 вы видите часть разветвленного дерева ходов, возможных в шахматной партии.
Рис. 16.12. Часть дерева вероятностей для шахматной игры
Конечно, нельзя изобразить возможные ходы для всей партии, поскольку такая диаграмма содержит около 10120 различных путей. Чтобы представить себе это огромное число возможных ходов, вообразите пространство, необходимое для отображения всех этих перестановок. Если все возможные пути закодировать в виде мельчайших точек, они многократно заполнят все библиотеки мира! Тем не менее алгоритмический поиск, при котором исследуются все варианты, неизбежно привел бы к ряду вариантов игры с выигрышем, проигрышем или ничьей. Не только люди, но даже самые сложные компьютеры из всех, которые только можно вообразить, неспособны воспользоваться этим методом. Вместо него и люди и компьютеры используют эвристические методы поиска, при которых важной является стратегия игры, — например, атака на ферзя, контроль над центром доски, блокирование главных фигур противника, обмен с получением преимущества в позиции или фигурах и т. д.
Насколько хорошо компьютер может играть в шахматы? Как мы видели, лучший компьютер и программа Deep Blue выиграли у Гарри Каспарова, которого многие считают лучшим игроком всех времен. Теперь существует сколько угодно компьютеров, которые могут выиграть у кого угодно, кроме лучших игроков, один из таких компьютеров — мой собственный Pentium, и можно смело предположить, что и у вас есть такой же. Чем полезно наблюдение за машиной, обучающейся играть в шахматы? Прежде всего мы можем узнать, что на основе анализа паттернов машина способна делать только грубые суждения о том, какие признаки важны. Компьютеру не хватает именно проницательности, однако он компенсирует это способностью к быстрой и объемной математической деятельности типа «поиск и сравнение». Человеческая способность извлекать значимые признаки из чрезвычайно сложного мира сенсорной информации, чтобы формировать абстракции этих признаков, преобразовывать эти абстракции в ассоциативные структуры более высокого уровня и строить сложные когнитивные планы, в то же время согласуя эти внутренние действия с внешней реальностью, может быть лишь приблизительно реализована в компьютере. Но даже эта обширная способность к поиску недостаточна, чтобы предусмотреть все возможные случайности, поэтому развитие стратегий игры — важная часть современных программ.
За три года до конца XX столетия случилось «невозможное». Deep Blue, самый быстрый в мире играющий в шахматы компьютер, созданный Чанг-Джен Таном в IBM, выиграл у обладателя титула чемпиона мира по шахматам Гарри Каспарова. Deep Blue смог победить, потому что был способен искать до 200 млн шахматных позиций в секунду. Но он выиграл также и потому, что мог лучше «продумать» стратегию. Машины следующего поколения, вероятно, будут способны учиться на собственном опыте и улучшать свои результаты за короткий период, как это делают люди, только быстрее и лучше.
Выше мы описывали, как при помощи оптимального сканера, работающего с компьютером, можно было бы разобрать смысл простого паттерна методом сравнения матриц. Обсуждая анализ паттернов, мы выяснили, что паттерны сложны и что модель распознавания паттернов человеком, основанная только на сопоставлении матриц, неспособна имитировать разнообразие, сложность и экономичность, характерные для человеческой способности к распознаванию паттернов при кратком предъявлении.
Если для распознавания каждого из разнообразных паттернов, встречающихся в повседневной жизни, потребовалась бы отдельная матрица, они переполнили бы память даже самого большого компьютера. Но давайте выберем для сопоставления матриц умеренно простой паттерн — что-нибудь среднее между опознанием вашей бабушки и считыванием стоимости фунта масла (код напечатан на упаковке). В шахматах мы имеем схожие паттерны: простая сетка 8x8 попеременно окрашенных клеток; ходы четко определяются (например, ладья может ходить на любое количество клеток по вертикали или горизонтали при условии, что на ее пути нет других фигур, пешка может ходить на одно поле вперед, за исключением... и т. д.); ходы можно выбирать путем грубого поиска, а количество перестановок конечно, хотя и огромно. При условии очень большого объема хранения и такого же запаса времени можно для каждого хода определить вероятность, с которой он приближает выигрыш. Компьютеры изучают потрясающее количество возможных ходов, однако модель, которая будет просчитывать все ходы, построить технически невозможно; кроме того, это не говорит ничего о том, как играют в шахматы люди и, что более важно, как при этом воспринимаются, кодируются, преобразуются и приводятся в действие сложные паттерны.
На недавнем заседании Конгресса по эволюционному вычислению 2000 года Дэвид Фогель и Кумар Челлапилла продемонстрировали компьютерную программу, которую они назвали нейронной сетью, способную к самообучению. Ведь и вы могли бы научиться игре типа шашек, если бы вам объяснили основные правила игры, а затем предоставили возможность овладевать игрой самостоятельно, обдумывая различные стратегии. Такая эволюционирующая программа превосходно играет в шашки, она легко победила почти всех соперников. Но для нашего обсуждения компьютерного моделирования нервных процессов человека особенно интересно, что эта программа подражает интегрирующим функциям человеческих нейронов. Мы знаем, что человеческие нейроны работают посредством структур типа «интегрируй и генерируй разряд», в которых нейрон складывает все электрические стимулы, которые он получает от других нейронов. Если общая сумма выше определенного порога, он генерирует разряд и стимулирует другие нейроны. Этот основной принцип фундаментален для научения и реакций человека. Программа, обучающаяся играть в шашки, работает по тому же принципу. Кроме того, учитывая достаточное количество времени, программа может улучшаться, что может оказаться полезным в космическом путешествии, где интеллектуальные машины будут способны «поумнеть» в течение продолжительных полетов. Интеллект роботов имеет большое значение и представляет собой новый рубеж в исследованиях искусственного интеллекта.
Из экспериментов Чейза и Де Грота (см. главу 4) мы знаем, что даже начинающие игроки в шахматы выделяют информацию о положении конкретных фигур и затем сосредоточиваются на разработке стратегии вокруг ключевых фигур и ходов. Поэтому, чтобы шахматная машина могла играть в шахматы как человек, она должна уметь анализировать паттерн и быстро абстрагировать из фигур и их позиций информацию об относительной важности более крупных единиц информации.
Кроме шахмат люди могут бросить вызов компьютеру в большом количестве других компьютерных игр, включая триктрак, бридж, шашки, го, покер и «Эрудит». Все они есть в Интернете и ожидают, чтобы сообразительные люди вроде вас испытали их.
Возможно, вы думаете, что есть некоторые области человеческой деятельности, которые защищены от вторжения искусственного интеллекта. Вы можете утверждать, что различные виды искусств — поэзия, музыка и изобразительное искусство — являются проявлениями исключительно человеческого гения и они не будут затронуты вторжением электронных зондов. Однако в каждой из этих областей была проведена значительная работа. Сначала рассмотрим поэзию.
Поэзия. Компьютеры создали несколько вполне удачных стихотворений, похожих на стихи, сочиненные людьми. Одна такая программа была разработана Курцвейлом и названа «Кибернетический поэт Рея Курцвейла» (Ray Kurzweil's Cybernetic Poet — RKCP)[112]. Эта программа использует методы моделирования языка, основанные на материале стихотворений, которые она «читала». Ей дают образец (чем более объемный, тем лучше) стихов какого-нибудь поэта, и на их основе она создает модель языка, в которой копируются стиль, паттерны ритма и структура стихотворения автора[113]. Оцените это хокку (японское лирическое стихотворение), написанное «Кибернетическим поэтом Рея Курцвейла» после того, как он «прочитал» стихи Джона Китса и Уэнди Деннис.
Ты разбил мне душу,
сок вечности,
дух моих губ.
А это стихотворение написано после «чтения» стихов Рея Курцвейла, Роберта Фроста и Уэнди Деннис.
Я думаю, что я разрушусь.
Мир на этом странном звуке
только для меня и для Бога,
для меня в моем сердце?
И жизнь плачет
из-за кровоточащего сердца
изгибающихся ветвей,
таковы их пути,
изгибающихся ветвей,
таковы пути бриза
знают, что мы были там.
Что вы думаете об этих стихах? Пройдут ли они тест Тюринга?
Музыка. Если возможно овладеть поэтическими схемами и подражать им, то можно ли сделать то же самое с музыкальными темами? Было создано несколько успешных программ, которые написали несколько музыкальных пьес, получивших весьма высокие оценки слушателей. Авторство одной из этих программ принадлежит преподавателю музыки из Орегонского университета Стиву Ларсоноу, который выбрал три композиции — Иоганна Себастьяна Баха, свою собственную и компьютера, — чтобы исполнить их перед аудиторией. В результате, что несколько смутило Ларсона, слушатели оценили его собственную композицию как написанную компьютером, в то время как сгенерированная машиной музыка, называвшаяся «Эксперименты с музыкальным интеллектом» (Experiments in Musical Intelligence — EMI), была оценена как настоящая музыка Баха[114]. По крайней мере генерируемая машиной музыка может на какое-то время ввести в заблуждение некоторых людей. Другая программа под названием Improvisor («Импровизатор») была написана Полом Ходжсоном, джазовым саксофонистом из Англии. Эта программа может подражать целому ряду стилей от Баха до манеры таких джазовых музыкантов, как Луи Армстронг и Чарли Паркер.
В настоящее время генерируемая машиной музыка, очевидно, убедительна. Слабое место этих программ — их неспособность создать музыку, которая могла бы вводить слушателей в заблуждение надолго, особенно профессиональных музыкантов, которые чувствительны к нюансам отдельных музыкальных стилей. Тогда как новичок может быть убежден, что созданная машиной музыка была написана Моцартом, ценитель искусства Моцарта при достаточно хорошем знакомстве с этим произведением способен выявить искусственного Моцарта. Человек может заметить, что «это звучит похоже на Моцарта, но так, как будто в этот день он "встал не с той ноги". Конечно, возможно, что в будущем программы будут не только генерировать композиции, подражая Моцарту, но пойдут дальше талантливого молодого австрийца и создадут «супермоцартовские» композиции... музыку, которая воплотила бы в себе апофеоз гения этого композитора. (Что касается меня, то маловероятно, чтобы какая-либо написанная компьютером музыка затронула струны моей души так же, как «Волшебная флейта» Моцарта или «Иисус, радость людей» (Jesu, Joy of Man's Desiring) Баха. Но в то же время я жду сюрпризов.)
Возможно, музыкальные программы будут совершенствоваться до такой степени, что настоящая Элла Фицджеральд и запрограммированная Элла будут неразличимы. Будет ли нам лучше или хуже от смешения настоящего и искусственного — вопрос, над которым стоит задуматься не только философам и специалистам по этике, но и всем нам. Колокол звонит по тебе.
Изобразительное искусство. Появления машинного видеоискусства ожидали в течение десятилетий, и некоторые из первоначальных программ автоматизированного проектирования (машинный дизайн) облегчили труд в области архитектурного и промышленного дизайна. Эти программы значительно отличаются от программ, создающих произведения искусства, таких как программы, спроектированные за последнюю четверть века Гарольдом Коуэном. Его компьютеризованный робот под названием «Аарон», оборудованный приспособлением для рисования, писал картины, которые напоминают настоящую живопись, и кто скажет, что это не «настоящее» искусство? Образец искусства Коэна, или нам следует говорить «искусства "Аарона"», приведен на рис. 16.13.
Рис. 16.13. Картины, написанные машиной. Источник. Рей Курцвейл «Век одухотворенных машин»
Механические приспособления для получения этих рисунков довольно просты. Маленький мобильный робот бегает по холсту, рисуя объект. Однако основой программы является информация о многих аспектах художественного творчества, включая композицию, рисунок, перспективу, стиль и цвет. Художественный мир, который время от времени может быть крайне критичным и столь же либеральным, дал добро на экспонирование некоторых произведений Коуэна в таких музеях, как галерея «Тейт» в Лондоне, Музей Стеделийк в Амстердаме и Музей современного искусства в Сан-Франциско.
Во всех приведенных выше примерах связи между искусственным интеллектом и искусством окончательным критерием приемлемости является оценка людей. Если стихотворение, музыкальное произведение или картина, по мнению людей, достаточно похожи на работу человека, то они заслуживают высокой эстетической оценки. В противном случае это «неудачный день» творца, то есть это близкое подобие, но явная подделка. Нам не хватает объективных критериев в искусстве, и пока мы не определим более утилитарно вкусы, пристрастия и предпочтения, поэзия, музыка и изобразительное искусство (так же, как многие другие воплощения человеческого гения) останутся в руках и умах лишь органических вычислительных устройств.
Роботы (устройства, «способные выполнять человеческую работу или ведущие себя подобно человеку») воплощают в себе большую часть рассмотренной выше географии ИИ — моделирование распознавания паттернов, памяти, обработки языка и решения задач. (Современные размышления на эту тему см. в статье Минского «Унаследуют ли роботы Землю?», написанной в 1994 году.)
В фольклоре и художественных произведениях преобладает восхищение возможностями гуманоидов, действия которых имитируют человеческое поведение. Этот интерес выразился в таких историях, как «Ученик волшебника», «Пиноккио» и «Франкенштейн», рассказах о «големах» и кентаврах и персонажах вроде Робота Робби, R2D2 и С3РО («Звездные войны») и Хэла («Одиссея 2001»). С пришествием современной инженерной технологии и когнитивной психологии роботология вышла из области мифов и научной фантастики и выросла до статуса очень серьезного научного предприятия. Пионерская работа была проделана британскими учеными Россом Эшли и В. Греем Уолтером. Эшли разработал и построил электронную цепь, способную поддерживать желаемый гомеостаз, или состояние внутреннего равновесия. Уолтер добавил к устройствам гомеостатического типа подвижность, чтобы они могли искать свет ниже определенной яркости, избегать света ярче этого уровня и, если света нет, бродить вокруг, так сказать, «в поисках света». Эти машины-«тропизмы» имитировали только рудиментарные свойства живых организмов, проявляющиеся у насекомых, растений или простейших животных. Следующий по эволюционной линии робот был собран в университете Джона Хопкинса и стал известен под именем Зверюги Хопкинса. Он мог двигаться за счет своей собственной энергии и был полностью самостоятелен. Он ориентировался при помощи сонара, а его перцептивная система состояла из набора фотоэлементов, масок, линз и цепей, спроектированных для обнаружения единственной вещи: крышки электрической розетки. Когда он ее видел, он пытался вступить с ней в контакт с помощью руки, имевшей форму штепселя.
Роботология быстро развивалась в 1960-х годах в связи с исследованием космоса и необходимостью разрабатывать весьма сложные механические устройства для выполнения конкретных задач. Аппарат, приземлившийся на Марсе и способный провести ряд сложных химических анализов, есть результат этих разработок. (Некоторые из роботов — это чисто механические устройства, только отдаленно связанные с узким определением ИИ, использованным в данной главе.)
Некоторые из ранних прототипов космических роботов были разработаны в лаборатории ИИ Стэнфордского университета, у входа в которую стоят знаки, предупреждающие посетителей лаборатории о том, что перед ними могут появиться роботы-транспортные средства. К наиболее интересным из разработанных здесь роботов (1968 год) относится передвижное радиоуправляемое транспортное средство, названное «Шейки» (Shakey)[115], которое обладало бортовыми перцептивными устройствами и способностями к решению задач. «Шейки» был оборудован телевизионной камерой, измерителем расстояния и тактильным датчиком «кошачий ус». Вся афферентная и сенсорная информация передавалась в компьютер, содержавший множество программ для анализа афферентной информации и планирования последствия действий, направленных на манипулирование окружением робота. Все оборудование размещалось на мототележке, которая могла двигаться в любом направлении.
Перцептивная система состояла из телекамеры, редуцировавшей картинки в контурные изображения, а затем — в значимые зоны или объекты сцены. Решатель задач был типа программы доказательства теорем и позволял «Шейки» выполнять простые задания.
«Шейки» сменил робот следующего поколения, «Флэйки» (Flakey). «Флэйки» — это передвижное устройство трех футов высотой с видеокамерой, установленной в его верхней части. Получив команду идти к офису, для чего необходимо пройти через пять дверей по залу, Флэйки покорно катится к заданному месту. Некоторые из наиболее совершенных роботов созданы NASA. Эти машины — несколько специализированные устройства, используемые для сбора и анализа образцов почвы на соседних планетах, выполнения ремонтных работ на космических станциях и проведения научных экспериментов и наблюдений в опасных для человека условиях.
Грандиозные планы 1970-х, которые начались с разработки многофункциональных роботов, открыли дорогу более практичным проектам, подразумевающим копирование относительно простых человеческих процессов. На этом пути лидирующее положение занимает деловое сообщество — многие трудоемкие или опасные функции можно передать роботам.
В XX столетии в результате успехов бихевиоризма, который привнес свои методы и объективный подход в исследования человеческого разума и поведения, психология получила наконец научное обоснование. Из-за причин, упомянутых в главе 1, бихевиоризм уступил дорогу когнитивной психологии, которая сосредоточилась на внутренних репрезентациях, что значительно расширило возможности психологии. По моему мнению, в настоящее время в когнитивной психологии, так же как в психологии вообще, происходят существенные изменения. Эти изменения вызваны успехами в двух областях: нейрокогнитологии, о которой мы говорили на протяжении всей этой книге, и искусственном интеллекте[116]. В первом случае мы начинаем постигать физиологические основы человеческого познания, а во втором случае перед нами стоит задача определить атрибуты и ограничения человеческого понимания и интеллекта. И вполне возможно, что в этом столетии появятся неорганические приспособления, интеллектуальные способности которых намного превзойдут наши.
Рей Курцвейл в своей смелой книге «Век одухотворенных машин» (Kurzweil, 1999) и Билл Гейтс в своей провидческой книге «Дорога вперед» (The Road Ahead) (Gates, 1996) отмечают постепенное увеличение в течение XX столетия скорости работы компьютеров (измеряемой в тысячах долларов в секунду). В первой половине XX столетия скорость удваивалась каждые три года; между 1950 и 1966 годами она удваивалось каждые два года; а теперь она удваивается каждый год, что указывает на экспоненциальный рост, предсказанный Гордоном Муром, соучредителем компании «Интел»: в 1965 году он отметил, что мощность компьютерного чипа будет удваиваться каждый год. Хотя Мур и не предполагал, что такой рост будет длиться вечно — есть определенный предел, диктуемый физическими законами, — скорость роста мощности компьютеров за прошлые 40 лет удваивалась примерно каждые 18 месяцев. Эту скорость развития называют законом Мура. Если мощность компьютеров продолжит увеличиваться и в последующие несколько десятилетий, а у нас есть веские причины полагать, что так оно и будет, то, даже если экспоненциальная скорость роста замедлится, в итоге возможности будущих машин приблизятся к возможностям мозга человека. Некоторые (Kurzweil, 1999) предсказывают, что потенциал компьютеров приблизится к возможностям человеческого мозга уже к 2020 году и заметно опередит его к концу столетия. (См. рис. 16.14 для прогноза развития компьютеров в течение XXI века.)
Рис. 16.14. Экспоненциальный рост скорости вычислений, 1900-2100 годы (Kurzweil, 1999)
Чтобы осуществилось это фантастическое предсказание и искусственный мозг заработал подобно человеческому (только быстрее), необходима не только скорость вычислений. Требуется также способность к приобретению информации, которую в этой главе я называл знанием о мире. Каждый из пяти видов чувствительности человека каждый день обнаруживает и обрабатывает миллионы битов информации. Эти биты различным образом смешиваются с имеющимися знаниями в довольно сложную сеть, которая позволяет каждому из нас разумно реагировать на новые стимулы окружения в борьбе за выживание. Последний компонент, необходимый для искусственного мозга, — формулы, управляющие работой органического мозга. Это чрезвычайно сложный вопрос, и точно не известно, из чего состоят рабочие коды; к данным свойствам относятся потенциал самоорганизации информации в возможных сетях, способность к рекурсивному поиску и способность учиться и приспосабливаться к внешним и внутренним сигналам. Альтернативная программа должна объединить компьютерные биты в органический мозг[117], и в этом направлении уже достигнуты некоторые успехи (см. Barinaga, 1999, о превращении мыслей в действия).
Реализуя фантастические мечты исследователей искусственного интеллекта, мы должны учитывать некоторые фундаментальные особенности структурных компонентов мозга и компьютера, вычислительной мощности и компьютерного моделирования. Ранее мы узнали, что в человеческом мозге содержится около 100 млрд нейронов и каждый нейрон связан с другими нейронами приблизительно 1000 связей (окончательно их число все еще неизвестно). Это приблизительно 100 трлн параллельных связей, которые повышают возможности мозга. Однако органический мозг реагирует медленно, выполняя около 200 вычислений в секунду. Если мы перемножим эти числа (100 трлн связей, производящих 200 вычислений в секунду), мы получим 20 млн млрд вычислений в секунду. Вот так работает ваш мозг каждую секунду. Насколько близки компьютеры к этой скорости вычислений?
Лучший компьютер с объемной параллельной нервной сетью, как следует из написанного выше, способен выполнять 2 млрд вычислений в секунду. Мозг на основе кремния отличается от органического мозга тем, что обрабатывает информацию намного быстрее. Если вычислительная способность машин в будущем будет увеличиваться согласно закону Мура, то к 2020 году существующие системы увеличат свою мощность приблизительно в 23 раза, что приведет к увеличению скорости до 20 млн млрд вычислений в секунду. Сравните это число со способностями человеческого мозга.
В заключение я хочу сказать об искусственном интеллекте и компьютерном моделировании следующее. Есть огромная концептуальная преграда между типами действий, выполняемых человеческим мозгом и искусственным мозгом. Как говорилось ранее, возможно, нам удастся создать кантату Баха, полотно Ван Гога или стихотворение Э. Э. Каммингза, которые пройдут тест Тюринга. Вероятно, можно даже создать вышеупомянутые произведения, которые будут оценены людьми как квинтэссенция творчества художника — что-то вроде эстетического прототипа для каждого художника, а не просто «копии художника». Но для этого произведенные человеком образцы должны быть изучены и поняты неорганической машиной. Сам человек обеспечивает лишь программу. Даже если мыслящие программы в будущем превзойдут человеческое мышление, именно люди будут снабжать информацией компьютеры и приводить в действии новые мыслящие машины. Возможно, было бы разумно поместить в новый мозг некую схему, которая сможет все объяснять нам в простых человеческих понятиях, или на нашу долю останутся лишь функции обслуживания, а не интеллектуальные функции.
В этой главе мы обсуждали компьютерное познание в сравнении с человеческим и анализировали чрезвычайно сложную задачу, поставленную исследователями, пытающимися копировать деятельность человека с помощью машин. В этом заключительном разделе я хотел бы предположить, что способ, которым исследователи (включая когнитивных психологов) изучают поведение, вероятно, значительно изменится за следующие несколько лет благодаря использованию компьютеров, которым помогают программы искусственного интеллекта.
Мы уже видели, насколько широко распространены компьютеры практически в каждой области человеческой деятельности, и эта тенденция, вероятно, сохранится. Вычисления, необходимые для решения различных задач: от космического путешествия до маршрутов мусоровозов и генетических исследований, были бы невозможны без современного быстродействующего компьютера. В будущем наверняка появятся более продвинутые системы с большим объемом памяти и большей скоростью обработки. Возможно, существующие системы будут заменены радикально новыми (такими, как «японское пятое измерение», которое делает акцент на обработке знаний). В будущем нас ждут не менее впечатляющие открытия, чем те, свидетелями которых мы уже стали.
Одна из проблем, интересующих ученых, — это способ сохранения и кодировки информации. Нам доступно огромное количество научной информации в электронном формате (например, PsycLIT) в дополнение к более привычной форме: книги и статьи. В ближайшем будущем электронный формат будет использоваться повсеместно, включая психологию, что позволит пользователю получать доступ к полному содержанию статьи или книги. Кроме того, информация из других областей науки и многих других источников будет собрана в огромной сети, включающей спутниковые ретрансляционные станции, и станет доступной большинству из нас. Эта сеть будет оказывать большое влияние на научные исследования.
Но что делать ученым с таким большим объемом данных? Существует опасность возникновения переизбытка информации, и мы не будем понимать, что все это значит и что с этим делать. Банки данных необходимы каждому человеку, приступающему к написанию книги, например по когнитивной психологии, которая охватывает широкий диапазон тем. Авторы таких работ могут за несколько секунд получить доступ к статьям на тему, скажем, умственных образов у детей. Хотя эти базы данных удобны, они также ставят перед нами проблему, заключающуюся в том, что способность людей хранить и обрабатывать информацию ограничена. Мы рискуем быть погребенными под лавиной информации. Если это произойдет, вероятно, появится какая-нибудь программа, которая сможет обрабатывать информацию разумно, то есть понимая ее. (Искусственный интеллект выживет, что следует из самого его названия.) Если такая программа искусственного интеллекта будет создана, она сможет сообщать нам, какие исследования уже проведены, чтобы мы могли избежать лишней работы; она также сможет сказать нам, что нужно сделать, чтобы с пользой потратить наше драгоценное время. Кроме того, «суперпонимающий компьютер» сможет не только выявлять пробелы человеческого знания, но и заполнить их, проводя «исследования» или делая логические выводы на основе своей колоссальной базы данных (см. Solso, 1986, 1987b, 1994). По-видимому, полученные в результате сведения помогут ответить на древние вопросы о том, кто мы, откуда мы пришли и каково наше будущее. Пусть все мы проживем достаточно долго, чтобы узнать ответы на некоторые из этих вопросов, но не настолько долго, чтобы узнать все. Лучше путешествовать, чем вдруг оказаться в конце пути.
1. Искусственный интеллект сопряжен с любым результатом работы компьютера, который можно было бы счесть разумным, если бы его произвел человек.
2. В ИИ существует дихотомия (Сирл) между «жесткой» позицией, согласно которой, путем надлежащего программирования можно создать разум, способный к пониманию, и «мягкой» позицией, предполагающей, что ИИ есть эвристический инструмент для изучения человеческого познания.
3. ИИ ставит философские вопросы, связанные с намерением, мышлением и пониманием. В упражнениях, разработанных для демонстрации неразличимости человека и машины и их функциональной эквивалентности (например, тест Тюринга и задача «китайская комната»), некоторые ученые усматривают упущение такого важного фактора, как произвольность, которой обладает человек и не обладает машина.
4. Возросла способность машин, обрабатывающих информацию по аналогии с человеческим познанием, распознавать сложные стимулы; если в первых моделях применялось наложение эталонных матриц, то новые подходы опираются на анализ структурных деталей и их взаимосвязей.
5. Компьютерным программам, способным «понимать» естественный язык, нужны как минимум: семантические и синтаксические правила; база знаний о мире и о социальном контексте; методы обработки неоднозначностей, имеющихся в обычно употребляемом языке.
6. Программы искусственного интеллекта, предназначенные для решения задач (например, шахматные компьютеры), используют две принципиальные стратегии: алгоритмические процедуры, гарантирующие решение путем перебора всех возможных вариантов, и эвристические процедуры, основанные на выборе стратегии и разложении сложных задач на более легко решаемые подзадачи. 7. Уже созданы программы искусственного интеллекта, которые сносно пишут стихи, музыку и картины.
В будущем искусственный интеллект и нейрокогнитология (в сочетании с генной инженерией), вероятно, значительно изменят когнитивную психологию, а также всю психологию. Компьютерный мозг с вычислительной мощностью человеческого мозга может появиться к 2020 году.
Теме искусственного интеллекта посвящено множество работ. Общие обзоры предлагаются в книгах Таука «Компьютеры и здравый смысл» (Computers and Common Sense) (имеется в мягкой обложке) и Аптера «Компьютерная имитация поведения» (Computer Simulation of Behavior). Хорошо написан и интересен для специалистов научный отчет Рафаэла «Мыслящий компьютер» (The Thinking Computer). Также рекомендую «Вычисления и познание: основания когнитивной науки» (Computation and Cognition: Toward a Foundation for Cognitive Science) Пилишина, «Компьютер и разум» (The Computer and the Mind) Джонсона-Лэрда, «Следы памяти в мозге» (Memory Traces in the Brian) Алкона, «Искусственный интеллект: суть идеи» (Artificial Intelligence: The Very Idea) Хоуланда и «Искусственный интеллект в психологии: междисциплинарные эссе» (Artificial Intelligence in Psychology: Interdisciplinary Essays) Бодена. Как упоминалось ранее, хорошо читается биография Алана Тюринга, написанная Эндрю Ходжезом.
Апрельский номер журнала Byte за 1985 год в значительной степени посвящен искусственному интеллекту, и, хотя он несколько устарел, рекомендуем вам прекрасные статьи Минского, Шенка и Ханта, Дж. Андерсона и Рейзера, Уинстона и других, посвященные все еще современным темам. Книги «Вопросы метамагии: поиски сущности разума и материи» (Metamagical Themas: Questing for the Essence of Mind and Matter) и «Гедель, Эшер, Бах: эта бесконечная гирлянда» (Godel, Escher, Bach: An Eternal Golden Braid) Дугласа Хофштадтера необходимо прочесть всем, кто интересуется искусственным интеллектом и смежными вопросами; кроме того, они хорошо написаны. Также рекомендую книгу Гарднера «Новая наука о разуме» (The Mind's New Science) для обсуждения искусственного интеллекта и многих других тем, затронутых в этой книге. Некоторые интересные специальные проблемы рассматриваются в сборнике «Искусственный и человеческий интеллект» (Artificial and Human Intelligence) под редакцией Элиторна и Банерджи. Наконец, настоятельно рекомендую книгу «Век одухотворенных машин» (The Age of Spiritual Machines) Рея Курцвейла.