Высокочастотные колебания неврологи называют "гамма" волнами. Причина в том, что Ганс Бергер, изобретатель оригинального аппарата ЭЭГ, назвал большие медленные волны, которые он мог видеть на глаз на своем некачественном оборудовании, "альфа" волнами, а все остальное - "бета"; ученые, которые пришли после него, просто последовали его примеру, давая новым частотам, которые они находили, новые греческие буквы. Гамма-волны, хотя и быстрые, обычно невелики - или, говоря техническим языком, "низкоамплитудные". Их наличие, которое можно обнаружить с помощью современного электроэнцефалографа или электрода в мозге, ассоциируется с бдительным и внимательным умом.
В 2005 году Копелл и его коллеги придумали объяснение тому, как гамма-колебания могут помочь мозгу сосредоточиться. Их теория основана на том, что нейроны, представляющие информацию, на которую вы обращаете внимание, должны получить преимущество в колебаниях. Подумайте о попытке прослушать телефонный звонок посреди шумной комнаты. Здесь сигнал, на который вы обращаете внимание, - голос на другом конце линии - конкурирует со всеми отвлекающими звуками в комнате. В модели Копелла голос представлен одной группой возбуждающих клеток, а фоновая болтовня - другой. Обе эти группы посылают связи в общий пул тормозных нейронов и получают от него ответные связи.
Важно отметить, что нейроны, представляющие голос, поскольку они являются объектом внимания, получают немного больше входного сигнала, чем "фоновые" нейроны. Это означает, что они срабатывают первыми и более энергично. Если эти "голосовые" нейроны сработают в унисон, они - через свои связи с тормозными клетками - вызовут большое, резкое усиление тормозного возбуждения клеток. Эта волна торможения отключит клетки, представляющие как голос, так и фоновый шум. Таким образом, фоновые нейроны не получают шанса сработать и, следовательно, не могут помешать звучанию голоса. Как будто голосовые нейроны, срабатывая первыми, протискиваются в дверь и затем захлопывают ее перед фоновыми нейронами. И пока голосовые нейроны продолжают получать дополнительный вход, этот процесс будет повторяться снова и снова, создавая колебания. Фоновые нейроны будут вынуждены каждый раз молчать. В результате единственным оставшимся сигналом будет чистый звук голоса в телефоне.
Не ограничиваясь этой ролью во внимании, неврологи придумали бесчисленное множество других способов, как колебания могут помочь мозгу. Среди них - использование в навигации, памяти и движении. Предполагается, что колебания также улучшают связь между областями мозга и помогают организовать нейроны в отдельно функционирующие группы. Кроме того, существует множество теорий о том, как осцилляции нарушают работу мозга при таких заболеваниях, как шизофрения, биполярное расстройство и аутизм.
Из-за вездесущности колебаний может показаться, что их важность не вызывает сомнений, но это далеко не так. Хотя для колебаний было придумано несколько различных ролей, многие ученые по-прежнему настроены скептически.
Частично эта проблема возникает на самом первом этапе: как измеряются колебания. Вместо того чтобы записывать данные с множества нейронов одновременно, многие исследователи, интересующиеся осцилляциями, используют косвенный показатель, получаемый из жидкости, которая окружает нейроны. В частности, когда нейроны получают много входного сигнала, состав ионов в этой жидкости меняется, и это может быть использовано в качестве косвенного показателя того, насколько активна популяция. Но связь между потоками ионов в этой жидкости и реальной активностью нейронов сложна и не до конца понятна. Поэтому сложно определить, происходят ли наблюдаемые колебания на самом деле.
Ученых также могут подтолкнуть имеющиеся в их распоряжении инструменты. ЭЭГ существует уже сто лет, и с ее помощью легко обнаружить колебания даже у человека; эксперименты можно провести за полдня на желающих (обычно студентах). Как уже говорилось, аналогичная легкость и привычность относится и к математическим инструментам анализа осцилляций. Это может заставить исследователей с большей вероятностью искать эти мозговые волны, даже в тех случаях, когда они могут дать не самые лучшие ответы. Перефразируя старую пословицу, можно сказать, что когда молоток - это самый простой инструмент, который вы можете использовать, вы начинаете искать гвозди.
Другой вопрос - влияние, особенно когда речь идет о быстрых колебаниях, таких как гамма. Если в одном состоянии мозга гамма-волны сильнее, чем в другом, это означает, что в этом состоянии большее количество нейронов срабатывает как часть волны, а не спорадически, сами по себе. Но когда эти волны приходят так быстро, принадлежность к одной из них может заставить нейрон сработать лишь на несколько миллисекунд раньше или позже. Может ли такая временная точность иметь значение? Или все, что имеет значение, - это общее количество произведенных спайков? Многие изящные гипотезы о том, как осцилляции могут помочь, не были проверены напрямую - и могут быть довольно сложными для проверки, - поэтому ответы на них неизвестны.
Как сказал нейробиолог Крис Мур в интервью Science Daily в 2019 году: "Гамма-ритмы были огромной темой для споров... Некоторые очень уважаемые нейробиологи считают гамма-ритмы волшебными, объединяющими часами, которые выравнивают сигналы между областями мозга. Есть и другие, не менее уважаемые нейробиологи, которые, красясь, считают гамма-ритмы выхлопными газами вычислений: Они появляются, когда двигатель работает, но они абсолютно не важны".
При движении автомобиля могут выделяться выхлопные газы, но они не являются непосредственно тем, что заставляет его ехать. Точно так же сети нейронов могут производить колебания при выполнении вычислений, но являются ли эти колебания тем, что производит вычисления, еще предстоит выяснить.
Как было показано, взаимодействие между возбуждающими и тормозящими клетками может создать зоопарк различных паттернов стрельбы. Противостояние этих двух сил имеет как преимущества, так и риски. Это дает сети способность реагировать молниеносно и генерировать плавные ритмы, необходимые для сна. В то же время это ставит мозг в опасную близость к припадкам и создает буквальный хаос. Разобраться в такой многогранной системе может быть непросто. К счастью, разнообразные математические методы, разработанные для физики, метеорологии и понимания колебаний, помогли укротить дикую природу нейронного огня.
Глава 6. Этапы развития зрения.
Неокогнитрон и конволюционные нейронные сети
Проект "Летнее зрение" - это попытка эффективно использовать наших летних сотрудников для построения значительной части зрительной системы. Конкретная задача была выбрана отчасти потому, что ее можно разделить на подпроблемы, которые позволят людям работать независимо и при этом участвовать в создании достаточно сложной системы, чтобы стать настоящей вехой в развитии "распознавания образов".
Vision Memo No. 100 из группы искусственного интеллекта Массачусетского технологического института, 1966 г.
Лето 1966 года должно было стать летом, когда группа профессоров Массачусетского технологического института решила проблему искусственного зрения. В качестве "летних работников", которых они планировали эффективно использовать для этого проекта, выступала группа из дюжины или около того студентов-бакалавров университета. В своей записке, излагающей план проекта, профессора указали несколько конкретных навыков, которые должна была выполнять компьютерная система, разрабатываемая студентами. Она должна уметь определять различные текстуры и освещение на изображении, обозначать части изображения как передний план, а части как фон, и идентифицировать любые объекты. Один из профессоров якобы описал цели более упрощенно: "Подключить камеру к компьютеру и заставить компьютер описать то, что он видит".
Цели этого проекта не были достигнуты тем летом. Ни следующим. И многие последующие. Более того, некоторые из основных вопросов, поднятых в описании летнего проекта, остаются открытыми проблемами и по сей день. Спесь, проявленная в этом меморандуме, не удивительна для своего времени. Как уже говорилось в главе 3, 1960-е годы ознаменовались бурным ростом вычислительных возможностей и, в свою очередь, наивными надеждами на автоматизацию даже самых сложных задач. Компьютеры теперь могли делать все, что от них требовалось, нужно было только знать, о чем просить. А если речь идет о чем-то столь простом и непосредственном, как зрение, насколько это сложно?
Ответ очень сложен. Процесс обработки зрительного сигнала - восприятия света глазами и осмысления отраженного в нем внешнего мира - чрезвычайно сложен. Распространенные поговорки вроде "прямо перед глазами" или "на виду", которые используются для обозначения легкости зрения, обманчивы. Они затушевывают значительные трудности, с которыми сталкивается мозг при восприятии даже самых простых зрительных объектов. Любое чувство легкости, которое мы испытываем в отношении зрения, - это иллюзия, с трудом завоеванная миллионами лет эволюции.
Проблема зрения - это проблема обратной инженерии. В задней части глаза, в сетчатке, широкий плоский лист клеток, называемых фоторецепторами. Эти клетки чувствительны к свету. Каждая из них указывает на наличие или отсутствие (и, возможно, длину волны) света, попадающего на нее в каждый момент времени, посылая сигнал в виде электрической активности. Эта двумерная мерцающая карта клеточной активности - единственная информация, на основе которой мозг может воссоздать трехмерный мир перед собой.
Даже такое простое дело, как поиск стула в комнате, представляет собой технически сложную задачу. Стулья могут быть самых разных форм и цветов. Они также могут находиться рядом или далеко, что делает их отражение на сетчатке глаза больше или меньше. Светло в комнате или темно? С какого направления падает свет? Кресло повернуто к вам или от вас? Все эти факторы влияют на то, как именно фотоны света попадают на сетчатку. Но триллионы различных световых картин в итоге могут означать одно и то же: стул на месте. Зрительная система каким-то образом находит способ решить эту проблему сопоставления многих и одного менее чем за десятую долю секунды.
В то время, когда студенты Массачусетского технологического института работали над тем, чтобы подарить зрение компьютерам, физиологи использовали свои собственные инструменты, чтобы разгадать тайны зрения. Началось все с регистрации нейронной активности сетчатки глаза, а затем нейроны перешли к нейронам всего мозга. Поскольку, по оценкам, 30 процентов коры головного мозга приматов играет ту или иную роль в обработке зрительных сигналов, это было немалым делом.2В середине XX века многие ученые, проводившие эти эксперименты, базировались в Бостоне (многие в самом Массачусетском технологическом институте или чуть севернее, в Гарварде), и у них быстро накапливался большой объем данных, которые нужно было как-то осмыслить.
Возможно, дело в физической близости. Возможно, это было молчаливое признание огромной задачи, которую каждый из них поставил перед собой. Возможно, на первых порах сообщества были слишком малы, чтобы держаться в тени. Какова бы ни была причина, неврологи и компьютерные ученые долгое время сотрудничали в попытках понять фундаментальные вопросы зрения. Изучение зрения - того, как можно найти закономерности в световых точках, - наполнено прямым влиянием биологического на искусственное и наоборот. Гармония, возможно, не была постоянной: когда компьютерная наука начала использовать методы, которые были полезны, но не напоминали мозг, области разошлись. А когда нейробиологи вникали в мельчайшие детали клеток, химических веществ и белков, обеспечивающих биологическое зрение, компьютерщики в основном отворачивались. Но последствия взаимного влияния по-прежнему неоспоримы и хорошо видны в самых современных моделях и технологиях.
* * *
Первые попытки автоматизировать зрение появились еще до появления современных компьютеров. Хотя они были реализованы в виде механических приспособлений, некоторые идеи, лежавшие в основе этих машин, подготовили поле для последующего появления компьютерного зрения. Одной из таких идей был подбор шаблонов.
В 1920-х годах Эмануэль Гольдберг, русский химик и инженер, решил проблему, с которой столкнулись банки и другие офисы при поиске документов файловых системах. В то время документы хранились на микрофильмах - полосках 35-миллиметровой пленки, содержащих крошечные изображения документов, которые можно было проецировать на большой экран для чтения. Порядок расположения документов на пленке был мало связан с их содержанием, поэтому поиск нужного документа - например, аннулированного чека конкретного клиента банка - был связан с неструктурированным поиском. Чтобы автоматизировать этот процесс, Голдберг прибег к грубой форме "обработки изображений".
Согласно плану Голдберга, кассиры, вносящие новый чек в систему учета, должны были пометить его специальным символом, указывающим на его содержание. Например, три черные точки в ряду означали, что имя клиента начинается с буквы "А", три черные точки в треугольнике - что с буквы "Б" и так далее. Теперь, если кассир хотел найти последний чек, предъявленный, например, мистером Беркширом, ему нужно было просто найти чеки, помеченные треугольником. Таким образом, шаблон треугольника был шаблоном, и задача машины Голдберга состояла в том, чтобы соответствовать ему.
Физически эти шаблоны имели форму карточек с пробитыми в них отверстиями. Так, при поиске документов мистера Беркшира кассир брал карточку с тремя отверстиями в форме треугольника и помещал ее между лентой микрофильмов и лампочкой. Затем каждый документ на ленте автоматически подтягивался к карточке, в результате чего свет проникал через отверстия на карточке, а затем и через саму пленку. Фотоэлемент, расположенный за пленкой, фиксировал любой проходящий свет и сигнализировал об этом остальным частям машины. Для большинства документов свет проникал через пленку, так как символы на пленке не совпадали с отверстиями на карте. Но когда появлялся нужный документ, свет, проникающий через карточку, полностью блокировался узором из черных точек на пленке. Эти мини-затмения означали, что свет не попадает на фотоэлемент, и это сигнализировало остальным частям машины и кассиру, что совпадение найдено.
Подход Голдберга требовал, чтобы кассиры заранее знали, какой именно символ они ищут, и имели карту, соответствующую ему. Несмотря на свою грубость, этот стиль подбора шаблонов стал доминирующим подходом на протяжении большей части истории искусственного зрения. Когда на сцене появились компьютеры, форма шаблонов перешла из физической в цифровую.
В компьютере изображение представлено в виде сетки значений пикселей (см. рис. 14). Каждое значение пикселя - это число, указывающее на интенсивность цвета в крошечной квадратной области изображения, которую оно представляет.3 В цифровом мире шаблон - это тоже просто сетка чисел, определяющая нужный шаблон. Так, шаблон для трех точек в форме треугольника может представлять собой сетку, состоящую в основном из нулей, за исключением трех точно расположенных пикселей со значением 1. В машине Голдберга роль света, проходящего через карточку-шаблон, в компьютере была заменена математической операцией: умножением. Если значение каждого пикселя на изображении умножить на значение в том же месте шаблона, результат может сказать нам, совпадает ли изображение.
Рисунок 14
Допустим, мы ищем улыбающееся лицо на черно-белом изображении (где черные пиксели имеют значение один, а белые - ноль). Имея шаблон лица, мы можем сравнить его с изображением путем умножения. Если на изображении действительно изображено искомое лицо, то значения, составляющие шаблон, будут очень похожи на значения на изображении. Поэтому нули в шаблоне будут умножены на нули в изображении, а единицы в шаблоне - на единицы в изображении. Сложив все полученные в результате умножения значения, мы получим количество черных пикселей, одинаковых в шаблоне и на изображении, которых в случае совпадения будет много. Если на полученном нами изображении будет хмурое лицо, то некоторые пиксели вокруг рта на изображении не будут совпадать с шаблоном. Там нули в шаблоне будут умножены на единицы в изображении, и наоборот. Поскольку произведение в этих местах пикселей будет равно нулю, сумма по всему изображению не будет такой большой. Таким образом, простая сумма произведений дает представление о том, насколько изображение соответствует шаблону.
Этот метод нашел широкое применение в самых разных отраслях. Шаблоны использовались для подсчета численности толпы путем поиска лиц на фотографии. Известные географические объекты также находили на спутниковых снимках с помощью шаблонов. Можно также отслеживать количество и модели автомобилей, проезжающих через перекресток. При подборе шаблонов нам нужно только определить, что мы хотим получить, а умножение подскажет, совпадает ли это.
* * *
Представьте себе стадион - такой же, как тот, где вы смотрите футбольный матч, - но на этом стадионе вместо кричащих болельщиков трибуны заполнены кричащими демонами. И кричат они не о футболистах на поле, а скорее об образе. Точнее, у каждого из этих демонов есть своя любимая буква алфавита, и когда он видит на поле что-то похожее на эту букву, он кричит. Чем громче крик, тем больше изображение на поле похоже на любимую букву демона. На небосклоне находится еще один демон. Этот демон не смотрит на поле и не кричит, а просто наблюдает за всеми остальными демонами на стадионе. Он находит демона, который кричит громче всех, и определяет, что изображение на поле должно быть любимой буквой этого демона.
Именно так Оливер Селфридж описал процесс подбора шаблонов на конференции 1958 года. Селфридж был математиком, компьютерщиком и помощником директора Линкольн-лабс в Массачусетском технологическом институте, исследовательского центра, занимавшегося вопросами применения технологий в сфере национальной безопасности. Сам Селфридж опубликовал не так много работ. Он также так и не закончил свою докторскую диссертацию (однако в итоге он написал несколько детских книг по адресу ; предположительно, в них было меньше демонов). Несмотря на отсутствие академических результатов, его идеи все же проникли в научное сообщество, во многом благодаря кругам, в которых он вращался. Получив степень бакалавра математики в Массачусетском технологическом институте в возрасте всего 19 лет, Селфридж получил консультацию в своей докторской работе от выдающегося математика Норберта Винера и поддерживал с ним связь. Селфридж также продолжал руководить Марвином Мински, выдающимся исследователем искусственного интеллекта из главы 3. А будучи аспирантом, Селфридж дружил с Уорреном Маккалохом и некоторое время жил с Уолтером Питтсом (вы наверняка помните эту пару нейробиотиков из главы 3). Селфриджу было полезно дать своим идеям повариться в этом социальном рагу из выдающихся ученых.
Чтобы сопоставить уникальную аналогию Селфриджа с концепцией подбора шаблонов, нужно просто представить, что каждый демон держит в руках свою сетку чисел, которая представляет собой форму его буквы. Они перемножают свою сетку с изображением, суммируют эти продукты (как описано выше) и кричат с громкостью, определяемой этой суммой. Селфридж не дает подробного объяснения, почему он решил дать такое демоническое описание визуальной обработки. Единственное, что он говорит по этому поводу, - это: "Мы не собираемся извиняться за частое использование антропоморфной или биоморфной терминологии. Они кажутся полезными словами для описания наших понятий".
Большая часть представлений в презентации Селфриджа была связана с тем, что подход к подбору шаблонов несовершенен. Демоны, каждый из которых по отдельности проверял, есть ли в поле зрения его любимая буква, были не очень эффективны. Каждый из них выполнял свои совершенно отдельные вычисления, но так не должно было быть. Многие фигуры, которые демон может искать в поисках своей буквы, используются и другими демонами. Например, и демон, предпочитающий букву "А", и демон, предпочитающий букву "Н", будут искать горизонтальную полоску. Так почему бы не ввести отдельную группу демонов, чьи шаблоны и крики соответствуют более базовым характеристикам изображения, таким как горизонтальные полосы, вертикальные линии, наклонные линии, точки и т. д. Тогда буквенные демоны будут просто слушать этих демонов, а не смотреть на сами изображения, и решать, как сильно кричать, в зависимости от того, кричат ли об основных формах их буквы.
Снизу вверх Селфридж определил новый стиль стадиона, который содержал три типа демонов: "вычислительные" (те, что смотрят на изображение и кричат об основных формах), "когнитивные" (те, что слушают вычислительных демонов и кричат о буквах) и "решающие" (те, что слушают когнитивных демонов и решают, какая буква присутствует). Селфридж дал название всей модели в целом - этой стопке вопящих демонов - Пандемониум5.
Если не принимать во внимание гнусную номенклатуру, интуиция Селфриджа в отношении обработки визуальной информации оказалась весьма проницательной. Хотя концептуально прост, подбор шаблонов практически сложен. Количество необходимых шаблонов растет с увеличением числа объектов, которые вы хотите обнаружить. Если каждое изображение нужно сравнивать с каждым фильтром, то вычислений будет очень много. Шаблоны также должны более или менее точно соответствовать изображению. Но из-за огромного количества различных световых картин, которые один и тот же объект может создавать на сетчатке глаза или объективе камеры, практически невозможно определить, как должен выглядеть каждый пиксель изображения при наличии того или иного объекта. Поэтому шаблоны очень сложно разрабатывать для любых, кроме самых простых, паттернов.
Эти проблемы делают подбор шаблонов сложной задачей как для искусственных зрительных систем, так и для мозга. Однако идеи, представленные в Pandemonium, представляют собой более распределенный подход, поскольку признаки, обнаруженные вычислительными демонами, являются общими для всех когнитивных демонов. Подход также является иерархическим. То есть Pandemonium разбивает проблему зрения на два этапа: сначала ищем простые вещи, затем - более сложные.
Вместе эти свойства делают систему в целом более гибкой. Например, если Pandemonium настроен на распознавание букв первой половины алфавита, то он вполне сможет распознать и остальные. Это связано с тем, что низкоуровневые вычислительные демоны уже знают, из каких базовых форм состоят буквы. Когнитивному демону новой буквы нужно будет просто понять, как правильно слушать демонов ниже него. Таким образом, элементарные признаки работают как словарь - или набор строительных блоков, - которые можно комбинировать и рекомбинировать для обнаружения дополнительных сложных паттернов. Без такой иерархической структуры и совместного использования низкоуровневых признаков базовый подход к подбору шаблонов должен был бы создавать новый шаблон для каждой буквы с нуля.
Дизайн Pandemonium вызывает некоторые вопросы. Например, как каждый вычислительный демон узнает, о какой базовой форме ему кричать? И как когнитивные демоны узнают, кого им следует слушать? Селфридж предлагает, чтобы система узнавала ответы на эти вопросы методом проб и ошибок. Если, например, изменение того, как демон, предпочитающий "А", слушает тех, кто ниже его по рангу, помогает ему лучше обнаруживать "А", то сохраните эти изменения; в противном случае не делайте этого и попробуйте что-нибудь новое. Или, если добавление вычислительного демона, который будет кричать о новом низкоуровневом паттерне, сделает всю систему лучше в обнаружении букв, то этот новый демон останется; в противном случае он уйдет. Конечно, это сложный процесс, и его работа не гарантирована, но когда он происходит, то создается желаемый эффект - система автоматически подстраивается под тип объектов, которые ей нужно обнаружить. Например, штрихи, из которых состоят символы японского алфавита, отличаются от штрихов английского алфавита. Самообучающаяся система обнаружит различные базовые паттерны для каждого из них. Не нужно никаких предварительных или специальных знаний, просто дайте модели попробовать справиться с задачей.
Ученый-компьютерщик Леонард Ур был настолько впечатлен идеями Селфриджа и его коллег, что захотел распространить их работу в более широком масштабе. В 1963 году он написал в журнале Psychological Bulletin, обращаясь к аудитории психологов, о том, каких успехов добились компьютерные ученые в области зрения. В своей статье "Компьютеры "распознавания образов" как модели восприятия формы" он указывает, что модели того времени "фактически уже были в состоянии предложить физиологические и психологические эксперименты" и даже предупреждает, что "было бы прискорбно, если бы психологи не играли никакой роли в этом теоретическом развитии своей собственной науки". Статья является конкретным доказательством того, что эти две области всегда были взаимосвязаны. Но такие явные публичные призывы к сотрудничеству не всегда были нужны. Иногда было достаточно личных отношений.
Джером Леттвин был неврологом и психиатром из Чикаго, штат Иллинойс. Он также был другом Селфриджа, в молодости жил с ним и Питтсом в одном доме. По собственному признанию, Леттвин был "тучным неряхой" и хотел стать поэтом, но уступил желанию матери и стал врачом. Самое бунтарское, что ему удалось, - это время от времени бросать медицинскую практику, чтобы заняться научными исследованиями.
Вдохновленный работой своего друга и бывшего сожителя, Леттвин в конце 1950-х годов отправился на поиски нейронов, реагирующих на низкоуровневые характеристики - то есть на те вещи, о которых кричат демоны вычислений. Животным, которое он выбрал для изучения, была лягушка. Лягушки используют зрение в основном для быстрой рефлекторной реакции на добычу или хищника, и поэтому их зрительная система относительно проста.
Внутри сетчатки отдельные фоторецепторы, воспринимающие свет, передают свою информацию другой группе клеток, называемой ганглиозными клетками. Каждый фоторецептор соединяется со многими ганглиозными клетками, и каждая ганглиозная клетка получает входные сигналы от многих фоторецепторов. Но, что очень важно, все эти сигналы поступают из определенной ограниченной области пространства. Поэтому ганглиозная клетка реагирует только на свет, который попадает на сетчатку в определенном месте - и у каждой клетки есть свое собственное предпочтительное место.
На тот момент предполагалось, что ганглиозные клетки не выполняют особых вычислений. Их считали в основном ретрансляторами - они просто отправляли информацию об активности фоторецепторов в мозг, как почтальон. Такая картина укладывалась в рамки шаблонно-согласованного представления о визуальной обработке. Если роль мозга заключается в сравнении визуальной информации, поступающей от глаза, с набором хранящихся в памяти шаблонов, то он не хотел бы, чтобы эта информация каким-либо образом искажалась ганглиозными клетками. Но если ганглиозные клетки являются частью иерархии, где каждый уровень играет небольшую роль в конечном обнаружении сложных объектов, то они должны быть специализированы для обнаружения полезных элементарных визуальных паттернов. Таким образом, вместо того чтобы передавать информацию дословно, они должны активно ее обрабатывать и перерабатывать.
Записывая активность этих ганглиозных клеток и демонстрируя лягушке всевозможные движущиеся объекты и узоры, Леттвин обнаружил, что гипотеза иерархии верна. Более того, в работе 1959 года "Что глаз лягушки говорит мозгу лягушки" он и его соавторы описали четыре различных типа ганглиозных клеток, которые реагировали на разные простые паттерны. Одни реагировали на быстрые крупные движения, другие - на превращение света в темноту, третьи - на изогнутые объекты, которые дрожали. Эти различные категории реакций доказывали, что ганглиозные клетки были специально созданы для обнаружения различных элементарных паттернов. Эти результаты не только соответствовали представлениям Селфриджа о низкоуровневых детекторах признаков, но и подтверждали идею о том, что эти признаки специфичны для типа объектов, которые система должна обнаружить. Например, последний класс клеток лучше всего реагировал, когда небольшой темный объект быстро перемещался по фиксированному фону . Описав их в статье, Леттвин заметил: "Можно ли лучше описать систему для обнаружения доступной ошибки?
Интуиция Селфриджа оказалась верной. После находки Леттвина на лягушках сообщество стало воспринимать зрительную систему больше как стопку кричащих демонов и меньше как хранилище карточек с шаблонами.
* * *
Примерно в то же время, что и работа Леттвина, два доктора из Медицинской школы Университета Джона Хопкинса в Балтиморе исследовали зрение у кошек. Зрительная система кошки больше похожа на нашу, чем на лягушачью. Перед ней стоят сложные задачи, связанные с отслеживанием добычи и навигацией в окружающей среде, и, как следствие, она более сложна. Таким образом, работа кошачьей зрительной системы охватывает множество областей мозга, и в центре внимания врачей Дэвида Хьюбела и Торстена Визеля оказалась первичная зрительная кора. Эта область в задней части мозга представляет собой один из ранних этапов обработки зрительной информации у млекопитающих; она получает информацию от другой области мозга - таламуса, который получает информацию от самой сетчатки.
В предыдущих работах изучалось поведение нейронов в таламусе и сетчатке кошек. Эти клетки, как правило, лучше всего реагируют на простые точки: либо небольшая светлая область, окруженная темной, либо небольшая темная область, окруженная светом. При этом, как и в случае с лягушкой, каждый нейрон имеет определенное местоположение точки, в котором она должна находиться, чтобы реагировать.
Хьюбел и Визель имели доступ к оборудованию для создания точек в разных местах, чтобы исследовать такие реакции сетчатки. Именно это оборудование они использовали, даже когда исследовали области мозга, расположенные далеко за пределами сетчатки. Метод отображения точек включал в себя скольжение небольшой стеклянной или металлической пластины с различными вырезанными узорами по экрану перед глазом. Хьюбел и Визель использовали его, чтобы показывать слайд за слайдом точек своим подопытным кошкам, измеряя активность нейронов в их первичной зрительной коре. Но точки просто не действовали на этот нейрон - клетка не издавала ни звука в ответ на слайды. Затем экспериментаторы заметили нечто странное: иногда нейрон реагировал - не на слайды, а на их смену. Когда одна пластина выдвигалась, а другая задвигалась, тень от края стекла проходила по сетчатке глаза кошки. Это создавало движущуюся линию, которая надежно возбуждала нейрон в первичной зрительной коре. Одно из самых знаковых открытий в нейронауке произошло почти случайно.
Спустя десятилетия, размышляя о случайности этого открытия, Хьюбел заметил: "На определенной ранней стадии развития науки степень неряшливости может быть огромным преимуществом". Но этот этап быстро прошел. К 1960 году они с Визелем переехали в Бостон, чтобы помочь основать отделение нейробиологии в Гарвардском университете, и приступили к многолетнему тщательному изучению реакций нейронов в зрительной системе.
Развивая свою счастливую случайность, Хьюбел и Визель углубились в изучение того, как работает эта реакция на движущиеся линии. Одним из их первых открытий стало то, что нейроны в первичной зрительной коре имеют не только предпочтительную ориентацию, но и предпочтительное местоположение. Нейрон не будет реагировать на любую линию, которая появляется в его любимом месте. Нейроны, предпочитающие горизонтальную ориентацию, требуют горизонтальной линии, нейроны, предпочитающие вертикальную ориентацию, требуют вертикальных линий, нейроны, предпочитающие 30-градусный наклон, требуют 30-градусных наклонных линий, и так далее, и так далее. Чтобы понять, что это значит, вы можете держать ручку горизонтально перед лицом и двигать ею вверх-вниз. Вы только что возбудили группу нейронов в первичной зрительной коре. Наклоните ручку в другую сторону - и вы возбудите другую группу нейронов (теперь вы можете бесплатно проводить целенаправленную стимуляцию мозга в домашних условиях).
Поняв, что такое ориентация, Хьюбел и Визель открыли алфавит, используемый кошачьим мозгом для представления изображений. У мух есть детекторы жучков, а у кошек (и других млекопитающих) - детекторы линий. Однако они не ограничились наблюдением за этими реакциями, а пошли дальше и задались вопросом, как нейроны в первичной зрительной коре могли получить такие реакции. Ведь клетки, от которых они получают входные сигналы - клетки в таламусе - реагируют на точки, а не на линии. Так откуда же взялось предпочтение линий?
Решение заключалось в предположении, что нейроны в коре получают идеально подобранный набор входных сигналов от таламуса. Линия, конечно, не что иное, как набор правильно расположенных точек. Поэтому входные сигналы для нейрона в первичной зрительной коре должны поступать от множества нейронов таламуса, каждый из которых представляет точку в ряду точек. Таким образом, первичный зрительный нейрон будет срабатывать чаще всего, когда линия охватывает все эти точки (см. рис. 15). Подобно когнитивные демоны прислушиваются к крикам демонов, которые ищут части своего письма, нейроны в первичной зрительной коре прислушиваются к активности нейронов в таламусе, составляющих предпочитаемую ими линию
Хьюбел и Визель заметили и другой тип нейронов: те, которые также имели предпочтительную ориентацию, но не были столь строги к расположению. Эти нейроны реагировали, если линия появлялась в области, которая была примерно в четыре раза больше, чем у других нейронов, которые они регистрировали. Как эти нейроны могли так реагировать? Ответ, опять же, заключается в том, что они получают правильные входные сигналы. В частности, "сложный" нейрон - так Хьюбел и Визель обозначили эти клетки - просто нуждался во входе от группы обычных (или "простых") нейронов. Все эти простые клетки должны иметь одинаковые предпочтительные ориентации, но немного отличаться по предпочтительному расположению. Таким образом, сложная клетка наследует ориентационные предпочтения своих входов, но имеет пространственное предпочтение, которое больше, чем у любого из них. Такая пространственная гибкость очень важна. Если мы хотим знать, находится ли перед нами буква "А", небольшое колебание в точном расположении ее линий не должно иметь значения. Сложные ячейки построены таким образом, чтобы отбрасывать дрожание.
Рисунок 15
Открытие сложных клеток позволило получить дополнительный кусочек головоломки, объясняющей, как точки света становятся объектами восприятия. В дополнение к распознаванию признаков, осуществляемому простыми клетками, к списку вычислений, выполняемых зрительной системой, добавилось объединение входных сигналов в пространстве. За всю работу по изучению этой системы Хьюбел и Визель были удостоены Нобелевской премии в 1981 году. В своей нобелевской лекции Хьюбел четко сформулировал их цели: "Наша идея изначально заключалась в том, чтобы подчеркнуть тенденцию к увеличению сложности по мере продвижения по центру зрительного тракта и возможность учета поведения клетки в терминах ее входов "7.Этот подход, хотя и был простым, достаточно хорошо отражал многие основные свойства зрительного тракта.
* * *
На другом конце света - в японской национальной организации общественного вещания NHK, расположенной в Токио, - Кунихико Фукусима услышал о простых свойствах зрительной системы. Фукусима был инженером и сотрудником исследовательского отдела NHK.Поскольку NHK была вещательной компанией (и транслировала визуальные и аудиосигналы в глаза и уши людей), в ее штате также были группы нейрофизиологов и психологов, которые изучали, как сенсорные сигналы воспринимаются мозгом. Эти три группы - психологи, физиологи и инженеры - регулярно встречались, чтобы поделиться результатами работы в своих областях. Однажды коллега Фукусимы решил представить работу Хьюбела и Визеля.
Когда Фукусима увидел это четкое описание роли нейронов в зрительной системе, он задался целью реализовать те же функции в компьютерной модели. В качестве входного сигнала в его модели использовались изображения простых белых узоров на черном фоне. Чтобы приблизить работу таламуса, был создан лист искусственных нейронов, которые реагировали на белые точки на изображении. Это служило способом передачи информации об изображении в сеть. Отсюда нужно было рассчитать входные данные для простых клеток.
Для этого Фукусима использовала стандартный подход, заключающийся в создании сетки чисел, представляющих собой обнаруживаемый образец, который в случае простой клетки представляет собой линию с определенной ориентацией. В инженерной терминологии такая сетка чисел называется фильтром. Чтобы имитировать пространственные предпочтения простых клеток, Фукусима применил этот фильтр отдельно к каждому месту на изображении. В частности, активность одной простой клетки рассчитывалась как сумма активности таламуса в одном месте, умноженная на фильтр. Продвижение фильтра по всему изображению создавало набор простых клеток с одинаковой предпочтительной ориентацией, но разным предпочтительным расположением. Этот процесс известен в математике как свертка.
Создав несколько фильтров, каждый из которых представлял собой линию с разной ориентацией, и свернув каждый из них с изображением, Фукусима создал целую популяцию простых клеток, каждая из которых имела свою предпочтительную ориентацию и местоположение, как и мозг. Для сложных клеток он просто дал им сильные сигналы от горстки простых клеток, которые все представляли одну и ту же ориентацию в соседних местах. Таким образом, они будут активны, если ориентация появится в любом из этих мест.
Эта первая версия модели Фукусимы была практически прямым переводом физиологических данных Хьюбела и Визеля в математику и компьютерный код - и, в некотором роде, она работала. Она могла выполнять некоторые простые визуальные задачи, например, находить изогнутые линии на черно-белом изображении, но это была далеко не полноценная зрительная система, и Фукусима знал это. Как он позже рассказывал в интервью, после публикации этой работы в конце 1960-х годов Фукусима терпеливо ждал, что же откроют Хьюбел и Визель дальше; он хотел узнать, что делают более поздние стадии обработки зрительных сигналов, чтобы добавить их в свою модель.
Но знаменитая пара физиологов так и не предоставила эту информацию. После первоначальной работы по каталогизации типов клеток Хьюбел и Визель исследовали реакции клеток в других зрительных областях, но так и не смогли дать столь же чистое описание, как для первичной зрительной коры. В конце концов они перешли к изучению того, как развивается зрительная система у молодых животных.
Не имея сценария, предоставленного биологией, Фукусима должен был импровизировать. Решение, которое он придумал, заключалось в том, чтобы взять имеющуюся у него структуру - простые клетки, проецирующиеся на сложные клетки, - и повторить ее. Укладка простых и сложных клеток друг на друга снова и снова создает расширенную иерархию, через которую может проходить визуальная информация. В частности, это означает, что после начального слоя сложных клеток второй круг "простых" клеток. Этот второй слой простых клеток будет следить не за простыми особенностями изображения, а за простыми "особенностями" в деятельности сложных клеток, от которых они получают информацию. Они по-прежнему использовали бы фильтры и свертки, но только применительно к активности нейронов, расположенных ниже их. Затем эти простые клетки посылают входные сигналы своим собственным сложным клеткам, которые реагируют на те же особенности в чуть большей области пространства - и затем весь процесс начинается снова.
Простые клетки ищут закономерности; сложные клетки прощают небольшое смещение этих закономерностей. Простые, сложные; простые, сложные. Снова и снова. Повторение этого риффа приводит к появлению клеток, которые реагируют на все виды паттернов. Например, чтобы простая клетка второго уровня отреагировала на букву "L", ей достаточно получить сигнал от сложной клетки с горизонтальным предпочтением в одном месте и от сложной клетки с вертикальным предпочтением в месте чуть выше и левее ее. Тогда простая клетка третьего уровня сможет легко реагировать на прямоугольник, получая входные данные от двух соответствующим образом расположенных "L"-клеток. Продвигаясь все дальше и дальше по цепочке, клетки начинают реагировать на более крупные и сложные паттерны, включая целые фигуры, объекты и даже сцены.
Единственная проблема, связанная с расширением выводов Хьюбела и Визеля таким образом, заключалась в том, что Фукусима на самом деле не знал, как клетки в разных слоях должны соединяться друг с другом. Необходимо было заполнить фильтры - сетки чисел, которые определяли бы, как реагируют простые клетки в каждом конкретном слое. Но как? Для этого Фукусима взял страницу из книги Селфриджа "Пандемониум" и обратился к обучению.
Вместо того чтобы использовать метод проб и ошибок, предложенный Селфриджем, Фукусима использовала вариант обучения, который не требует знания правильных ответов. В этой форме обучения модели просто показывают серию изображений, не сообщая, что на них изображено. Активность всех искусственных нейронов рассчитывается в ответ на каждое изображение, и связи между нейронами меняются в зависимости от того, насколько они активны (это может напомнить вам о гебистском стиле обучения). Например, если нейрон был очень активен в ответ на определенное изображение, то связи с его очень активными входами будут укрепляться. В результате этот нейрон будет сильно реагировать на это и подобные изображения в будущем. Таким образом, нейроны реагируют на определенные формы, и разные нейроны расходятся, чтобы иметь разные реакции. Таким образом, сеть способна улавливать разнообразные паттерны во входных изображениях.
В итоге модель Фукусимы состояла из трех слоев простых и сложных клеток и обучалась с помощью сгенерированных компьютером изображений цифр от нуля до четырех. Он назвал эту сеть "Неокогнитрон" и опубликовал результаты ее работы в журнале Biological Cybernetics в 1980 году.
В своих оригинальных работах Хьюбел и Визель подчеркивали, что их система классификации и номенклатура не должны восприниматься как евангелие. Мозг устроен очень сложно, и разделение нейронов всего на две категории никак не может отразить все разнообразие реакций и функций. Просто для удобства и целесообразности общения они действовали именно таким образом. Однако Фукусима добился успеха, сделав именно то, от чего предостерегали Хьюбел и Визель: он свел всю сложность зрительной системы мозга к двум очень простым вычислениям. Он принял эти описания за истинные или достаточно истинные и даже расширил их за пределы того, что они должны были описывать
Эта практика - разрушения и последующего расширения, стряхивания листьев с дерева и использования их для строительства дома - это то, что, как известно всем теоретикам и инженерам, необходимо для достижения прогресса. Фукусима хотел создать функционирующую зрительную систему в компьютере. Хьюбел и Визель дали описание зрительной системы мозга в первом приближении. Иногда первого приближения бывает достаточно.
* * *
В 1987 году, как и в любой другой год, жители Буффало, штат Нью-Йорк, отправляли через местное почтовое отделение бесчисленные счета, поздравительные открытки и письма. Жители города не знали, что, когда они вписывали в конверт пятизначный почтовый индекс получателя, этот почерк будет увековечен - оцифрован и сохранен на компьютерах по всей стране на долгие годы. Он станет частью базы данных для исследователей, пытающихся научить компьютеры читать человеческий почерк и, в свою очередь, произвести революцию в искусственном зрении.
Некоторые из исследователей, работавших над этим проектом, находились в Bell Labs, исследовательской компании, принадлежащей телекоммуникационной компании AT&T, расположенной в пригороде Нью-Джерси. Среди группы, состоящей в основном из физиков, был 28-летний французский компьютерщик по имени Янн ЛеКун. ЛеКун читал о Фукусиме и его Neocognitron и понял, что простая повторяющаяся архитектура этой модели может решить многие сложные проблемы зрения.
Однако ЛеКун также понимал, что необходимо изменить способ обучения модели связям. В частности, он хотел вернуться к подходу Селфриджа и предоставить модели доступ к изображениям, сопряженным с правильными метками о том, какая цифра на них изображена. Поэтому он изменил некоторые математические детали модели, чтобы сделать ее пригодной для другого типа обучения. При таком типе обучения, если модель неправильно классифицирует изображение (например, обозначает двойку как шестерку), все связи в модели - эти сетки чисел, определяющие, какие паттерны ищутся, - обновляются таким образом, чтобы снизить вероятность неправильной классификации этого изображения в будущем. Таким образом, модель учится тому, какие паттерны важны для идентификации цифр. Это может показаться знакомым, потому что ЛеКун использовал алгоритм обратного распространения, описанный в главе 3. Проделайте это с большим количеством изображений, и модель в целом станет довольно хорошо классифицировать изображения рукописных цифр, даже те, которые она никогда раньше не видела.
ЛеКун и его коллеги-исследователи представили впечатляющие результаты работы своей модели, обученной на тысячах цифр Буффало, в 1989 году. Так родилась "конволюционная нейронная сеть" - название, данное этому стилю модели.
Как и подходы, основанные на подборе шаблонов, которые появились до них, конволюционные нейронные сети нашли применение в реальном мире. В 1997 году эти сети стали основной частью программного обеспечения, разработанного компанией AT&T для автоматизации обработки чеков в банках Америки. К 2000 году, по оценкам, от 10 до 20 процентов чеков в Америке обрабатывались с помощью этого программного обеспечения. Очаровательный пример того, как наука исполняет свое предназначение, - мечта Голдберга об оснащении банков синтетическими визуальными системами сбылась спустя 70 лет после изобретения микрофильмирующей машины
Метод обучения сверточных нейронных сетей требователен к данным, и модель может быть настолько хороша, насколько хороша та информация, которая в нее поступает. Поэтому не менее важно получить правильную модель, чем правильные данные. Именно поэтому так важно было собрать реальные образцы реальных цифр, написанных реальными людьми. Исследователи Bell Lab могли бы поступить так же, как Фукусима, и создать компьютерные изображения цифр. Но они вряд ли смогли бы передать все разнообразие, нюансы и небрежность написания цифр в реальной жизни. Письма, прошедшие через почтовое отделение в Буффало, содержали около 10 000 примеров настоящего, человеческого почерка, что дало модели все необходимое для настоящего обучения. Убедившись в важности реальных данных, компьютерщики стали собирать их еще больше. Вскоре после набора Buffalo был собран набор данных, содержащий в шесть раз больше цифр и названный MNIST. Удивительно, но этот набор данных по-прежнему остается одним из наиболее часто используемых для быстрого тестирования новых моделей и алгоритмов искусственного зрения. Цифры для MNIST были написаны школьниками из Мэриленда и участниками переписи населения США. И хотя авторам было сказано, для чего используются их цифры в данном случае, они почти наверняка не ожидали, что их почерк будет использоваться компьютерными учеными спустя 30 лет.
Испытания конволюционных нейронных сетей не остановились на цифрах, но при переходе к более сложным изображениям они столкнулись с трудностями. В начале 2000-х годов сети, подобные сетям ЛеКуна, были обучены на другом наборе данных из 60 000 изображений, на этот раз состоящих из объектов. Изображения были маленькими и зернистыми - всего 32x32 пикселя - и могли представлять собой самолеты, автомобили, птиц, кошек, оленей, собак, лягушек, лошадей, корабли или грузовики. Хотя для нас эта задача оставалась простой, для сетей она серьезно усложнилась. Вся неоднозначность, присущая распознаванию трехмерного мира на основе двухмерных данных, проявляется, когда используются реальные изображения реальных объектов. Те же модели, которые научились распознавать цифры, с трудом справлялись с этими более реалистичными изображениями. Этот подход к искусственному зрению, похожий на мозговой, не справлялся с базовой визуальной обработкой, которую мозг выполняет каждый день.
Однако в 2012 году ситуация изменилась, когда Алекс Крижевский, Илья Суцкевер и Джеффри Хинтон из Университета Торонто с помощью конволюционной нейронной сети победили в крупном конкурсе по распознаванию изображений ImageNet Large Scale Visual Recognition Challenge. Конкурс заключался в маркировке изображений - больших (224x224 пикселя), реальных фотографий, сделанных людьми по всему миру и взятых с таких сайтов, как Flickr, - на предмет их принадлежности к одной из тысячи возможных категорий объектов. В этом очень убедительном тесте на визуальные способности конволюционная нейронная сеть дала 62 процента правильных ответов, опередив алгоритм, занявший второе место, на 10 процентных пунктов.
Как команда из Торонто добилась таких успехов? Они открыли новые вычисления, необходимые для зрения? Нашли ли они волшебную технику, помогающую модели лучше изучать свои связи? Правда в данном случае гораздо банальнее. Разница между этой конволюционной нейронной сетью и теми, что были до нее, заключалась в основном в размере. Сеть команды из Торонто насчитывала в общей сложности более 650 000 искусственных нейронов - примерно в 80 раз больше, чем сеть ЛеКуна, распознающая цифры. Эта сеть была настолько велика, что потребовались некоторые хитроумные инженерные решения, чтобы поместить модель в память компьютерных чипов, которые использовались для ее работы. Модель была велика и в другом отношении. Все эти нейроны означали, что для обучения связей между ними требовалось гораздо больше данных. Модель обучалась на 1,2 миллионах помеченных изображений, собранных профессором информатики Фей-Фей Ли в рамках базы данных ImageNet.
В 2012 году наступил переломный год для конволюционных нейронных сетей. Хотя технически достижения команды из Торонто были всего лишь количественным скачком - увеличением числа нейронов и изображений, - ошеломляющее повышение производительности качественно изменило ситуацию в этой области. Увидев, на что они способны, исследователи начали изучать конволюционные нейронные сети и пытаться сделать их еще лучше. Обычно это происходило в том же направлении: они становились больше, но были найдены и важные изменения в их структуре и способах обучения.
К 2015 году конволюционная нейронная сеть достигла уровня производительности, ожидаемого от человека в соревновании по классификации изображений (что на самом деле не является 100-процентным показателем: некоторые изображения могут быть запутанными). И теперь конволюционные нейронные сети составляют основу практически любого программного обеспечения для обработки изображений: распознавание лиц в социальных сетях, обнаружение пешеходов в самоуправляемых автомобилях и даже автоматическая диагностика заболеваний по рентгеновским снимкам. В забавном случае конволюционные нейронные сети даже использовались неврологами для автоматического определения местоположения нейронов на снимках тканей мозга. Искусственные нейронные сети теперь смотрят на настоящие.
Похоже, инженеры сделали разумный ход, обратившись к мозгу за вдохновением для создания визуальной системы. Внимание Фукусимы к функциям нейронов - и сведение этих функций к простым операциям - принесло свои плоды. Но когда он делал первые шаги в разработке этих моделей, вычислительных ресурсов и данных для их создания просто не было. Спустя десятилетия следующее поколение инженеров подхватило проект и довело его до конца. В результате современные конволюционные нейронные сети наконец-то могут решать многие задачи, которые изначально ставились в летнем проекте Массачусетского технологического института в 1966 году.
Но так же, как "Пандемониум" Селфриджа помог вдохновить нейробиологов-визуалистов, отношения между конволюционными нейронными сетями и мозгом не ограничиваются только одним путем. Неврологи получают выгоду от усилий, которые компьютерные ученые прилагают к созданию моделей, способных решать реальные визуальные задачи. Это связано с тем, что большие, тщательно обученные конволюционные нейронные сети не только хорошо распознают объекты на изображениях, но и предсказывают, как мозг будет реагировать на эти изображения.
* * *
Обработка зрительных сигналов начинается в первичной зрительной коре - именно там Хьюбел и Визель делали свои записи, - но после этого в процесс вовлекается множество областей. Первичная зрительная кора посылает связи во (вы уже догадались) вторичную зрительную кору. И после еще нескольких пересылок информация попадает в височную кору, расположенную сразу за висками.
Височная кора головного мозга уже давно связана с распознаванием объектов. Еще в 1930-х годах исследователи заметили, что повреждение этой области мозга приводит к странному поведению. Пациенты с повреждением височной коры плохо решают, на какие вещи важно обратить внимание, и поэтому легко отвлекаются. Они также не проявляют нормальной эмоциональной реакции на изображения; они могут видеть картины, которые большинству людей показались бы ужасающими, и почти не моргать. А когда они хотят изучить предметы, они могут не смотреть на них, а класть их в рот.
Понимание этой области мозга уточнялось десятилетиями тщательного наблюдения за пациентами или животными с поражениями мозга и, в конечном счете, путем регистрации активности ее нейронов. Это привело к выводу, что подчасть височной коры - "нижняя" часть в нижней части, также называемая "ИТ", - является основным местом для понимания объектов. У людей с повреждением ИТ в основном нормальное поведение и зрение, но есть более специфическая проблема - они не могут правильно называть или распознавать объекты; например, они могут не узнавать лица друзей или путать идентичность предметов, которые кажутся похожими.
Соответственно, нейроны в этой области реагируют на объекты. Некоторые нейроны имеют четкие предпочтения: один может реагировать на часы, другой - на дом, третий - на банан и т. д. Но другие клетки менее предсказуемы. Они могут предпочитать части объектов или одинаково реагировать на два разных объекта, имеющих некоторые общие черты. Некоторым клеткам также важен угол, под которым виден объект: возможно, они больше всего реагируют, если объект виден прямо, но другие клетки более снисходительны и реагируют на объект практически под любым углом. Некоторым важен размер и расположение объекта, другим - нет. В общем, ИТ - это целый мешок нейронов, заинтересованных в объектах. Хотя их не всегда легко интерпретировать, такие реакции, ориентированные на объекты, делают ИТ похожим на вершину иерархии зрительных процессов, последнюю остановку на экспрессе зрительной системы.
Неврологи десятилетиями пытались понять, как именно ИТ проявляет такие реакции. Часто они шли по стопам Фукусимы и строили модели со стопками простых и сложных клеток, надеясь, что эти вычисления будут имитировать те, которые приводят к активности ИТ, и сделают эту активность абсолютно предсказуемой. Этот подход в определенной степени сработал, но, как и в случае с "Неокогнитроном", модели были маленькими и обучались своим связям на основе небольшого набора маленьких изображений. Чтобы добиться реального прогресса, нейробиологам нужно было увеличить масштаб своих моделей так же, как это делали компьютерные ученые.
В 2014 году две отдельные группы ученых - одна под руководством Николауса Кригескорте Кембриджского университета и Джеймса ДиКарло из Массачусетского технологического института - именно так и поступили. Они показывали реальные и разнообразные изображения объектов испытуемым (людям и обезьянам) и регистрировали активность различных областей их зрительной системы, когда они рассматривали их. Они также показали те же изображения большой конволюционной нейронной сети, обученной классифицировать реальные изображения. Обе группы пришли к выводу, что эти компьютерные модели очень хорошо приближены к биологическому зрению. В частности, они показали, что если вы хотите угадать, как нейрон в ИТ отреагирует на конкретное изображение, то лучше всего - лучше, чем любой из предыдущих опробованных нейробиологами методов, - посмотреть, как на него отреагируют искусственные нейроны в сети. В частности, нейроны в последнем слое сети лучше всего предсказывали активность нейронов ИТ. Более того, нейроны предпоследнего слоя лучше всего предсказывали активность нейронов в V4 - области, которая обеспечивает вход в ИТ. Казалось, что конволюционная нейронная сеть имитирует зрительную иерархию мозга.
Показав столь поразительное соответствие между моделью и мозгом, это исследование положило начало революции в изучении биологического зрения. Оно показало, что нейробиологи в целом находятся на правильном пути, начатом Леттвином, Хьюбелом и Визелем, но им нужно быть больше и смелее. Если они хотели получить модель, которая могла бы объяснить, как животные видят объекты, то сама модель должна была быть способна видеть объекты.
Однако этот путь символизировал отказ от принципов, которые так дороги некоторым теоретикам: стремление к элегантности, простоте и эффективности моделей. Нет ничего элегантного или эффективного в 650 000 искусственных нейронов, соединенных между собой тем способом, который они нашли для работы. По сравнению с некоторыми из самых любимых и красивых уравнений в науке, эти сети - громоздкие, неприглядные чудовища. Но, в конце концов, они работают - и нет никакой гарантии, что что-то более элегантное будет работать.
Работа Селфриджа подтолкнула биологов к рассмотрению зрительной системы как иерархической системы, а эксперименты, проведенные в результате, заложили основу для разработки конволюционных нейронных сетей. Эти семена были взращены в компьютерной науке, и в итоге сотрудничество принесло плоды обеим сторонам. В целом, стремление к созданию искусственных систем, способных решать реальные визуальные задачи в реальном мире, подтолкнуло изучение биологического зрения в направлениях, в которых оно, возможно, не продвинулось бы самостоятельно. Инженерам и компьютерщикам всегда было приятно иметь в своем распоряжении зрительную систему мозга - не только для вдохновения, но и для доказательства того, что эта сложная проблема решаема. Эта взаимная признательность и влияние делают историю изучения зрения уникально переплетенной.
Глава 7. Взлом нейронного кода. Теория информации и эффективное кодирование
В то время как сердце перекачивает кровь, а легкие осуществляют газообмен, печень перерабатывает и накапливает химические вещества, а почки выводят их из крови, нервная система обрабатывает информацию.
Целью встречи 1968 года программы Neurosciences Researchбыло обсудить, как отдельные нейроны и группы нейронов обрабатывают информацию. Резюме встречи, написанное нейробиологами Теодором Баллоком и Дональдом Перкелем, не требует каких-либо жестких и быстрых выводов. Но оно описывает широкий мир возможностей для представления, преобразования, передачи и хранения информации в мозге, обобщая состояние дел в этой области.
Как следует из цитаты из их резюме, приписывать роль обработки информации мозгу кажется столь же естественным, как и говорить, что сердце перекачивает кровь. Еще до того, как в двадцатом веке слово "информация" вошло в повседневный лексикон, ученые неявно говорили об информации, которую передают нервы, часто на языке "сообщений" и "сигналов". Например, в лекции для сотрудников больницы, прочитанной в 1892 году, объясняется, что: "Существуют волокна, которые передают сообщения от различных частей тела к мозгу", и что некоторые из этих волокон "несут особые виды сообщений, как, например, нервы, связанные с органами особого чувства, которые были названы воротами знаний". В том же ключе в публикации 1870 года описывается срабатывание двигательных нейронов как "сообщение воли мышцам" и даже говорится о том, что нервная система приравнивается к доминирующей в то время технологии передачи информации - телеграфу.
Но исследования того, как нервная система представляет информацию, всерьез начались примерно за 40 лет до доклада Буллока и Перкела, с работ Эдгара Адриана в начале XX века.
Адриан во многих отношениях являл собой образ чопорного и правильного человека, занимающегося наукой. К моменту его рождения в Лондоне в 1889 году его семья проживала в Англии уже более 300 лет - в ее роду были хирург XVI века, несколько преподобных и членов правительства. Когда он был студентом, его блестящие способности регулярно отмечались его учителями. Помимо медицины во время учебы в университете, он проявлял способности к искусству, в частности к живописи и рисунку. Будучи преподавателем в Кембридже, он проводил долгие часы в лаборатории и в аудитории. В своей карьере физиолога он добился несомненного успеха. В возрасте 42 лет он стал лауреатом Нобелевской премии, а в 1955 году королева Елизавета II пожаловала ему титул, и он стал лордом Адрианом.
Но за этими официальными наградами и почестями скрывался беспокойный и хаотичный человек. Адриан был любителем острых ощущений, ему нравилось лазить по горам и гонять на быстрых машинах. Он с удовольствием проводил эксперименты над собой, в том числе, чтобы измерить мышечную активность. Известно, что он играл в замысловатые прятки с сокурсниками в долинах Озерного края Англии. Как профессор он был столь же неуловим. Он избегал незапланированных встреч, прячась в своей лаборатории, и заставлял всех любознательных студентов пытаться поймать его, когда он ехал домой на велосипеде. Он был темпераментным, и когда ему нужно было подумать, он устраивался на полке в темном шкафу. Его товарищи по лаборатории и семья описывали его движения как быстрые, отрывистые и почти постоянные. Его мысли были такими же стремительными. На протяжении своей карьеры он изучал множество различных вопросов у самых разных животных: зрение, боль, осязание и управление мышцами у лягушек, кошек, обезьян и многих других.
Эта неспособность сохранять неподвижность, физическую или умственную, возможно, стала залогом его успеха. Благодаря своим разнообразным исследованиям активности отдельных нервов он смог найти некоторые общие принципы, которые легли в основу нашего понимания нервной системы в целом. В своей книге 1928 года "Основа ощущений" Адриан объясняет свои выводы и эксперименты, которые позволили ему к ним прийти. Страницы книги пестрят разговорами о "сигналах", "сообщениях" и даже "информации", и все это вперемешку с анатомическими подробностями нервной системы и техническими проблемами, связанными с фиксацией ее активности. Это была смесь экспериментальных достижений и концептуальных идей, которые будут влиять на эту область в течение десятилетий.
В главе 3 Адриан рассказывает об эксперименте, в котором он добавляет вес к мышце лягушки, чтобы посмотреть, как отреагируют рецепторы "растяжения", отслеживающие положение мышцы. Адриан записывал показания нервов, по которым сигнал от рецепторов поступает в спинной мозг. Примение в различные грузы, Адриан подвел итог своим выводам: "Сенсорный сигнал, который поступает в центральную нервную систему при растяжении мышцы... состоит из последовательности импульсов знакомого типа. Частота повторения импульсов зависит от силы стимула, но размер каждого импульса не меняется". Этот вывод - что размер, форма или длительность потенциала действия, испускаемого этими сенсорными нейронами, не меняется, независимо от того, насколько тяжелым или легким является вес, приложенный к мышце, - Адриан назвал принципом "все или ничего".
Примеры "все или ничего" в природе нейронных импульсов повторяются на протяжении всей книги. У разных видов, для разных нервов, несущих разные сообщения, история всегда одна и та же. Потенциалы действия не меняются в зависимости от сигнала, который они передают, но их частота может меняться. Таким образом, импульсы нейрона похожи на армию муравьев - каждый из них максимально идентичен, а их сила обусловлена главным образом их численностью.
Если природа отдельного потенциала действия одинакова вне зависимости от силы или слабости вызвавшего его сенсорного стимула, то одно можно сказать наверняка: размер потенциала действия не несет информации. Благодаря вкладу Адриана физиологи теперь могли смело приступать к поиску того, где именно в нервах находится информация и как она передается.
Оставалась только одна проблема: что такое информация? Кровь, которую перекачивает сердце, и газы, которыми обмениваются легкие, - это реальные, физические субстанции. Они наблюдаемы, осязаемы и измеряемы. В то время как мы часто используем это слово, "информация" на самом деле является довольно расплывчатым и неуловимым понятием. Точное определение этого слова не так-то просто в голову большинству людей; к сожалению, оно относится к лагерю "узнаешь, когда увидишь". Не имея возможности взвесить информацию так же, как мы взвешиваем жидкости или газы, какие надежды могут быть у ученых на количественное понимание главной цели мозга?
Однако в период между выходом книги Адриана и докладом Перкела и Баллока было найдено количественное определение информации. Оно родилось в ходе научной борьбы во время Второй мировой войны и в дальнейшем неожиданно изменило мир. Его применение в изучении мозга порой было столь же трудновыполнимым, сколь и очевидным.
* * *
Клод Шеннон начал работать в Bell Labs по контракту, предоставленному американскими военными. Шел 1941 год, и Национальному комитету оборонных исследований требовались ученые, работающие над технологиями военного времени. Серьезность работы не заглушала игривых наклонностей Шеннона. Ему нравилось жонглировать, и во время работы в Bell Labs было известно, что он жонглирует по кампусу, катаясь на одноколесном велосипеде.
Шеннон родился в небольшом городке на американском Среднем Западе и рос, следуя за своим любопытством к науке, математике и инженерии, куда бы оно его ни привело. В детстве он играл с радиодеталями и любил решать числовые головоломки. Став взрослым, он создал математическую теорию жонглирования и фрисби, работающее на пламени. Ему нравилось играть в шахматы и строить машины, которые могли бы играть в шахматы. Постоянно занимаясь мастерингом, он создал множество гаджетов, некоторые из которых были более продуктивными, чем другие. Например на своем рабочем столе в Bell Labs,, он держал "Ultimate Machine": коробку с выключателем, который, если его включить, заставлял механическую руку протягиваться и выключать его.1
Для получения степени магистра Шеннон написал 72-страничную диссертацию под названием "Символический анализ релейных и коммутационных схем", которая произвела революцию в электротехнике. Для получения степени доктора философии он обратил свой математический взор к биологии, работая над "Алгеброй для теоретической генетики". Но его темой в Bell Labs была криптография. Как надежно закодировать сообщения, которые будут передаваться по земле, воздуху и воде, - естественная тема для военных. Bell Labs была центром исследований в области криптографии и даже принимала у себя знаменитого взломщика кодов Алана Тьюринга во время работы Шеннона.
Вся эта работа над кодами и сообщениями заставила Шеннона задуматься о концепции коммуникации в широком смысле. Во время войны он предложил метод математического понимания передачи сообщений. Однако из-за необходимой секретности исследований в области криптографии его идеи были засекречены. В 1948 году Шеннон наконец смог опубликовать свою работу, и "Математическая теория коммуникации" стала основополагающим документом новой области - теории информации.
В работе Шеннона описывается очень общая система связи, состоящая из пяти простых частей. Первая - это источник информации, который производит сообщение, которое будет отправлено. Далее следует передатчик, который отвечает за кодирование сообщения в форму, которая может быть передана по третьему компоненту каналу. На другом конце канала приемник декодирует информацию в исходную форму, и она отправляется в конечный пункт назначения (Рисунок 16).
В этой системе носитель сообщения не имеет значения. Это могут быть песни на радиоволнах, слова на телеграфе или изображения через Интернет. Как говорит Шеннон, компоненты его модели передачи информации "в достаточной степени идеализированы по сравнению с их физическими аналогами". Это возможно потому, что во всех этих случаях фундаментальная проблема коммуникации остается неизменной. Это проблема "точного или приблизительного воспроизведения в одной точке сообщения, выбранного в другой точке".
Рисунок 16
Имея в виду эту простую систему связи, Шеннон стремился формализовать изучение передачи информации. Но чтобы математически подойти к вопросу о том, как передается информация, ему сначала нужно было дать математическое определение информации. Опираясь на предыдущие работы, Шеннон обсуждает, какими желательными свойствами должна обладать мера информации. Некоторые из них имеют практическое значение: например, информация не должна быть отрицательной, а ее определение должно быть легко поддаваться математической обработке. Но реальное ограничение возникло из-за необходимости отразить интуицию, связанную с информацией: ее зависимость от кода.
Представьте себе школу, где все ученики носят униформу. Видя, как ученик каждый день появляется в одном и том же наряде, можно получить очень мало информации о его настроении, характере или погоде. С другой стороны, в школе, где нет униформы, выбор одежды способен передать всю эту информацию и даже больше. Например, если кто-то интересуется текущей температурой воздуха, то, увидев ученика в сарафане, а не в свитере, он может надолго развеять это любопытство. Таким образом, одежду можно использовать как код - это передаваемый набор символов, который передает смысл.
Причина, по которой студенты в униформе не могут нести эту информацию, заключается в том, что код требует вариантов. В словаре кода должно быть несколько символов (в данном случае - несколько нарядов в гардеробе студента), каждый из которых имеет свое собственное значение, чтобы любой из символов имел смысл.
Но важно не только количество символов в коде, но и то, как они используются. Допустим, у студента есть два варианта одежды: джинсы и футболка или костюм. Если студент в 99 процентах случаев носит джинсы и футболку, то из этого выбора гардероба можно извлечь не так уж много информации. Вам даже не нужно видеть студента, чтобы быть почти уверенным в том, что он одет - это, по сути, униформа. Но один день из ста, когда они появляются в костюме, говорит вам о чем-то важном. Он дает вам понять, что этот день какой-то особенный. Это говорит о том, что чем реже используется символ, тем больше информации он содержит. Обычные символы, с другой стороны, не могут передать много информации.
Шеннон хотел отразить эту связь между использованием символа и его информационным содержанием. Поэтому он определил информативность символа в терминах вероятности его появления. В частности, чтобы количество информации уменьшалось по мере увеличения вероятности появления символа, он сделал информацию символа зависящей от обратной величины его вероятности. Поскольку обратная величина числа - это просто единица, деленная на это число, большая вероятность означает меньшую "обратную вероятность". Таким образом, чем чаще используется символ, тем ниже его информативность. Наконец, чтобы удовлетворить другие математические требования, он взял логарифм этого значения.
Логарифм, или "логарифм", определяется по основанию. Например, чтобы вычислить логарифм числа по основанию 10, нужно спросить: "До какой степени нужно увеличить 10, чтобы получить это число? Логарифм 100 по основанию 10 (записывается как log10100) равен 2, потому что 10 в степени 2 (т. е. 10x10) равно 100. Таким образом, логарифм 1000 равен 3. А логарифмическая линейка от 100 до 1000 равна 2 и 3.
Шеннон решил использовать основание два для своего определения информации. Поэтому, чтобы вычислить информацию, содержащуюся в символе, нужно спросить: "До какой степени нужно возвести в степень два, чтобы получить обратную величину вероятности символа? Если взять наряд нашего студента - джинсы и футболку - как символ, который появляется с вероятностью 0,99, то его информативность равна log2(1/0,99), что составляет примерно 0,014. Костюм, который появляется с вероятностью 0,01, напротив, имеет информационное содержание log2(1/0,01) или примерно 6,64. Опять же, чем ниже вероятность, тем выше информация2.
Но Шеннона интересовала не только информация, содержащаяся в одном символе, - он хотел изучить информационное содержание кода. Код определяется набором символов и частотой использования каждого из них. Поэтому Шеннон определил общую информацию в коде как сумму информации всех его символов. Важно, что эта сумма взвешена - то есть информация каждого символа умножается на частоту использования этого символа.
Согласно этому определению, общий объем информации, содержащейся в одежде студента, составит 0,99 x 0,014 (от джинсов и футболки) + 0,01 x 6,64 (от костюма) = 0,081. Это можно считать средним количеством информации, которое мы получаем каждый день, видя наряд студента. Если бы студент решил носить джинсы 80 процентов времени, а костюм - 20 процентов, его код был бы другим. И среднее содержание информации было бы выше: 0,80 x log2(1/0,80) + 0,20 x log2(1/0,20) = 0,72.
Шеннон дал название средней скорости передачи информации в коде. Он назвал ее энтропией. Официально он объяснил это тем, что его определение информации связано с понятием энтропии в физике, где она служит мерой беспорядка. С другой стороны, Шеннон, как известно, утверждал - возможно, в шутку, - что ему посоветовали назвать свою новую меру энтропией, потому что "никто не понимает энтропию", и поэтому Шеннон, скорее всего, всегда будет выигрывать споры о своей теории.
Энтропия Шеннона отражает фундаментальный компромисс, присущий максимизации информации. Редкие вещи несут наибольшую информацию, поэтому вы хотите, чтобы их было как можно больше в вашем коде. Но чем чаще вы используете редкий символ, тем менее редким он становится. Эта борьба полностью определяет уравнение для энтропии: уменьшение вероятности символа приводит к увеличению логарифма его обратной величины - положительный вклад в информацию. Но затем это число умножается на ту же самую вероятность: это означает, что уменьшение вероятности символа приводит к уменьшению его вклада в информацию. Таким образом, чтобы максимизировать энтропию, мы должны сделать редкие символы настолько распространенными, насколько это возможно, но не более распространенными.
Использование Шенноном логарифма с основанием два делает единицей информации бит. Бит - это сокращение от двоичного разряда, и, хотя в работе Шеннона впервые встречается это слово, не он его придумал (Шеннон приписывает эту честь своему коллеге из Bell Labs Джону Тьюки). У бита как единицы информации есть полезная и интуитивно понятная интерпретация. В частности, среднее количество битов в символе равно количеству вопросов "да-нет", которые нужно задать, чтобы получить этот объем информации.
Например, попробуйте выяснить время года, в которое родился человек. Вы можете начать с вопроса: "Это переходное время года?". Если они ответят "да", вы можете спросить: "Сейчас весна?". Если они ответят "да", вы получите ответ; если "нет", у вас все равно будет ответ: осень. Если они ответили "нет" на первый вопрос, вы можете пойти противоположным путем - спросить, не родились ли они летом, и т. д. Независимо от ответа, чтобы получить его, нужно задать два вопроса "да" или "нет". Уравнение энтропии Шеннона согласуется с этим. Если предположить, что люди с одинаковой вероятностью рождаются в каждый сезон, то каждый из этих "символов" сезона будет использоваться в 25 процентах случаев. Таким образом, информация в каждом символе равна log2(1/0,25). Таким образом, среднее количество бит на символ равно двум - столько же, сколько и количество вопросов.
Часть разработки хорошей системы связи заключается в создании кода, который содержит много информации на один символ. Чтобы максимизировать среднюю информацию, которую предоставляет символ в коде, нам нужно максимизировать энтропию кода. Но, как мы видели, определение энтропии имеет внутреннее противоречие. Чтобы максимизировать ее, редкие символы должны быть нормой. Как лучше всего удовлетворить это, казалось бы, парадоксальное требование? На этот непростой вопрос, как оказалось, есть простой ответ. Чтобы максимизировать энтропию кода, каждый из его символов должен использоваться одинаково часто. У вас пять символов? Используйте каждый из них пятую часть времени. Сто символов? Вероятность использования каждого из них должна составлять 1/100 часть. Если сделать каждый символ одинаково вероятным, это уравновесит компромисс между редким и обычным общением.
Более того, чем больше символов в коде, тем лучше. Код с двумя символами, каждый из которых используется половину времени, имеет энтропию в один бит на символ (это имеет смысл в соответствии с нашим интуитивным определением бита: если представить, что один символ означает "да", а другой - "нет", то каждый символ отвечает на один вопрос "да" или "нет"). С другой стороны, код с 64 символами, каждый из которых используется одинаково, имеет энтропию шесть бит на символ.
Как бы ни был важен хороший код, кодирование - это только начало пути сообщения. В концепции связи Шеннона, после того как информация закодирована, ее еще нужно отправить по каналу к месту назначения. Именно здесь абстрактные цели передачи сообщений сталкиваются с физическими ограничениями материи и материалов.
Рассмотрим телеграф. Телеграф передает сообщения с помощью коротких импульсов электрического тока, проходящих по проводам. Сочетания коротких точек и длинных тире определяют алфавит. Например, в американской азбуке Морзе точка и тире обозначают букву "А", а две точки и тире - "U". Физические ограничения и несовершенство проводов, по которым передавались эти сообщения, особенно на большие расстояния или под океанами, накладывали ограничения на скорость передачи информации. Телеграфисты, набиравшие текст слишком быстро, рисковали столкнуть точки и тире вместе, создав нечленораздельный "боров Морзе", который был бы бесполезен для его получателя. На практике операторы могли безопасно отправлять в среднем около 100 писем в минуту.
Чтобы создать практическую меру скорости передачи информации, Шеннон объединил присущую коду скорость передачи информации с физической скоростью передачи по каналу, по которому он передается. Например, код, содержащий пять битов информации на символ и передаваемый по каналу, который может передавать 10 символов в минуту, будет иметь общую скорость передачи информации 50 битов в минуту. Максимальная скорость, с которой информация может быть передана по каналу без ошибок, называется пропускной способностью канала.
Публикация Шеннона позволила придать четкую структуру понятию, которое, как известно, было туманным. Таким образом, она заложила основу для растущей объективизации информации в последующие десятилетия. Однако непосредственное влияние работы Шеннона на обработку информации в реальном мире было незначительным. В более двух десятилетий, чтобыпоявилась технология , благодаря которой передача, хранение и обработка информации стали неотъемлемой частью повседневной жизни. А инженерам потребовалось время, чтобы понять, как использовать теорию Шеннона для практического применения в этих устройствах. Влияние теории информации на биологию, однако, проявилось гораздо быстрее.
* * *
Первое применение теории информации в биологии стало результатом войны. Генри Квастлер, австрийский врач, жил и работал в США во время Второй мировой войны. Его реакция на разработку атомной бомбы была ужасом - и действием. Он оставил частную практику и начал заниматься исследованиями медицинских и генетических последствий применения атомных бомб. Но ему нужен был способ количественной оценки того, как информация, закодированная в организме, изменяется под воздействием радиации. Эти формулы - просто находка, просто великолепно! Теперь я могу продолжать", - сказал Квастлер, узнав о теории Шеннона. В 1949 году - всего через год после публикации работы Шеннона - он написал работу под названием "Информационное содержание и коэффициент ошибок живых существ". Она положила начало изучению информации в биологии.
Нейронаука не замедлила последовать за ними. В 1952 году Уоррен Маккалох и физик Дональд Маккей опубликовали работу "Предельная информационная емкость нейронного звена". В этой работе они вывели наиболее оптимистичную, по их мнению, оценку того, сколько информации может нести один нейрон. Основываясь на среднем времени, необходимом для возникновения потенциала действия, минимальном времени между импульсами и других физиологических факторах, Маккей и Маккалох рассчитали верхнюю границу в 2 900 бит в секунду.
Маккей и Маккалох поспешили подчеркнуть, что это не означает, что нейроны действительно передают такой объем информации, а только то, что при наилучших обстоятельствах они могли бы это сделать. После их статьи последовало множество других публикаций, каждая из которых была направлена на выяснение истинной способности мозга к кодированию. Эта область была настолько переполнена попытками, что в 1967 году нейробиолог Ричард Стайн написал статью, в которой одновременно признал привлекательность теории информации для количественной оценки нервной передачи, но также посетовал на "огромные расхождения", которые возникли в результате ее применения. Действительно, в работах, последовавших за работами Маккея и Маккалоха, оценки варьировались от более высоких, чем их значение - 4000 бит в секунду на нейрон, - до значительно более низких, до одной трети бита в секунду.
Такое разнообразие отчасти объясняется различиями в представлениях о том, как части и паттерны нервной деятельности должны быть отображены на формальные компоненты теории информации Шеннона. Самый большой вопрос заключался в том, как определить символ. Какие аспекты нервной активности действительно несут информацию, а какие являются случайными? Что, по сути, представляет собой нейронный код?
Первоначальный вывод Адриана о том, что важна не высота спайка, по-прежнему оставался верным. Но даже при таком ограничении вариантов было множество. Начиная с базовой единицы - потенциала действия, ученые все равно смогли разработать множество мыслимых кодов. Маккей и Маккалох начали с того, что представили нейронный код состоящим всего из двух символов: спайк или не спайк. В каждый момент времени нейрон посылал тот или иной символ. Но, подсчитав информативность такого кода, Маккей и Маккалох поняли, что могут добиться большего. Если в качестве кода время между спайками, то нейрон сможет передавать гораздо больше информации. При такой схеме кодирования 20-миллисекундный промежуток между двумя всплесками будет означать нечто иное, чем 10-миллисекундный. Такая схема создает гораздо больше возможных символов, и именно с помощью этого стиля кодирования они получили оценку в 2 900 бит в секунду.
Стайн, пытаясь навести порядок в какофонии предлагаемых в то время кодов, остановился на третьем варианте нейронного кодирования - том, который предложил сам Адриан. Адриан, установив, что потенциалы действия не меняются при изменении стимула, утверждал, что: "Фактически, единственный способ, которым можно заставить сообщение меняться, - это изменение общего числа импульсов и частоты их повторения". Такой стиль кодирования - когда символом служит количество импульсов, произведенных за определенный промежуток времени, - известен как кодирование на основе частоты или скорости. В своей работе 1967 года Штейн доказывает существование кода, основанного на частоте, и подчеркивает его преимущества, включая более высокую устойчивость к ошибкам.
Но споры о том, что такое истинный нейронный код, не закончились со Стайном в 1967 году. Не закончились они и на встрече Буллока и Перкеля по кодированию информации в мозге годом позже. Фактически, в своем отчете об этой встрече Буллок и Перкель включили приложение, в котором излагаются десятки возможных нейронных кодов и способы их реализации.
По правде говоря, неврологи продолжают спорить и бороться за нейронный код и по сей день. Они проводят конференции, посвященные теме "Взлом нейронного кода". Они пишут статьи с такими названиями, как "В поисках нейронного кода", "Время для нового нейронного кода?" и даже "Существует ли нейронный код?". Они продолжают находить веские доказательства в пользу оригинального кодирования Адриана на основе скорости, но также и некоторые против него. Идентификация нейронного кода сейчас может показаться более отдаленной целью, чем когда Маккей и Маккалох писали свои первые размышления на эту тему.
В целом, некоторые признаки кодирования на основе скорости можно обнаружить в большинстве областей мозга. Нейроны, посылающие информацию от глаз, меняют частоту срабатывания в зависимости от интенсивности света. Нейроны, кодирующие обоняние, стреляют пропорционально концентрации предпочитаемого запаха. И, как показал Адриан, рецепторы в мышцах и рецепторы в коже стреляют сильнее, когда на них оказывается большее давление. Но самые убедительные доказательства существования других схем кодирования получены при решении сенсорных задач, требующих очень специфических решений.
Например, при локализации источника звука важно точно рассчитать время. Из-за расстояния между двумя ушами звук, идущий с левой или правой стороны, попадает в одно ухо чуть раньше, чем в другое. Этот разрыв между временем поступления звука в каждое ухо - иногда он составляет всего несколько миллионных долей секунды - дает ключ к разгадке того, откуда исходит звук. За этот расчет отвечает медиальная верхняя олива (MSO) - крошечное скопление клеток, расположенное прямо между двумя ушами.
Нейронная схема, которая может это осуществить, была предложена психологом Ллойдом Джеффрессом в 1948 году и с тех пор подтверждена множеством экспериментов. Модель Джеффресса начинается с того, что информация поступает от каждого уха в виде временного кода - то есть точное время спайков имеет значение. В МСО клетки, получающие входные сигналы от каждого уха, сравнивают относительное время этих двух входов. Например, одна клетка может быть настроена на обнаружение звуков, поступающих в оба уха одновременно. Для этого сигналы от каждого уха должны пройти одинаковое количество времени, чтобы достичь этой клетки MSO. Эта клетка срабатывает, когда получает два входных сигнала одновременно, и такой ответ указывает на то, что звук попал в оба уха одновременно (см. рис. 17).
Однако клетка, расположенная рядом с этой, получает несколько асимметричные сигналы. То есть нервному волокну из одного уха нужно пройти немного дальше, чтобы достичь этой клетки, чем нерву из другого уха. Из-за этого один из временных сигналов задерживается. От того, насколько длинный путь проходит сигнал, зависит, сколько дополнительного времени он займет. Допустим, сигналу от левого уха требуется дополнительные 100 микросекунд, чтобы достичь этой клетки МСО. Тогда единственная возможность для этой клетки получить два сигнала одновременно - это если звук попадет в левое ухо за 100 микросекунд до того, как он попадет в правое. Поэтому реакция этой клетки (которая, как и у другой клетки, возникает только тогда, когда она получает два входа одновременно) будет сигнализировать о разнице в 100 микросекунд.
Продолжая эту схему, следующая клетка может отреагировать на 200-микросекундную разницу, следующая за ней - на 300 микросекунд и так далее. В общей сложности клетки в MSO образуют карту, в одном конце которые сигнализируют о коротком времени прибытия, а на другом - о длинном. Таким образом, временной код преобразуется в пространственный: положение активного нейрона на этой карте несет информацию об источнике звука.
Рисунок 17
На вопрос о том, почему нейронный код является такой загадкой, наиболее вероятный ответ - как и на многие другие вопросы о мозге - заключается в том, что он сложен. Некоторые нейроны, в некоторых областях мозга, при определенных обстоятельствах, могут использовать код, основанный на скорости. Другие нейроны, в другое время и в другом месте, могут использовать код, основанный на синхронизации всплесков, или время между всплесками, или вообще какой-то другой код. В результате жажда взломать нейронный код, скорее всего, никогда не будет утолена. Мозг, похоже, говорит на слишком многих языках.
* * *
Эволюция не снабдила нервную систему единым нейронным кодом и не облегчила ученым по поиску множества символов, которые она использует. Но, по мнению британского нейробиолога Хораса Барлоу, эволюция, к счастью, дала один сильный путеводный свет для нашего понимания схемы кодирования мозга. Барлоу известен как один из основателей гипотезы эффективного кодирования - идеи о том, что независимо от того, какой код использует мозг, он всегда эффективно кодирует информацию.
Барлоу был стажером лорда Адриана. Он работал с ним - когда мог найти его - будучи студентом Кембриджа в 1947 году. Барлоу всегда проявлял интерес к физике и математике, но, руководствуясь соображениями практичности, выбрал медицину.5 Однако на протяжении всей учебы он понимал, как влияние более количественных предметов может определять вопросы в биологии. Эту черту он считал контрастной по отношению к своему наставнику: "Адриан совсем не был теоретиком; его позиция заключалась в том, что у нас есть средства для записи информации с нервных волокон, и мы должны просто посмотреть, что произойдет".
Быстро увлекшись уравнениями Шеннона, когда они появились, Барлоу сделал несколько ранних вкладов в изучение информации в мозге. Однако Барлоу не просто считал биты в секунду, а использовал теорию информации более глубоко. Законы информации, в некоторых отношениях, являются такими же фундаментальными и ограничивающими биологию, как и законы физики. С точки зрения Барлоу, эти уравнения могут не просто описывать мозг как он есть, но и объяснять, как он появился. Но настолько уверенным в важности этих уравнений для нейронауки, Барлоу сравнил попытку изучить мозг, не сосредоточившись на обработке информации , с попыткой понять крыло, не зная, что птицы летают
Барлоу пришел к своей гипотезе эффективного кодирования, объединив размышления о теории информации с наблюдениями за биологией. Если мозг развивался в рамках ограничений теории информации - а эволюция, как правило, находит довольно удачные решения, - то логично заключить, что мозг неплохо справляется с кодированием информации. Безопасный ход здесь - предположить, что нервная система эффективна", - писал Барлоу в работе 1961 года. Если это так, то любая загадка о том, почему нейроны реагируют так, как они реагируют, может быть решена, если предположить, что они действуют эффективно".
Но как выглядит эффективное кодирование информации? Для этого Барлоу сосредоточился на понятии избыточности. В концепции Шеннона под "избыточностью" понимается величина разрыва между максимально возможной энтропией, которую может иметь данный набор символов, и энтропией, которую он имеет на самом деле. Например, если в коде есть два символа и один из них используется в 90 процентах случаев, а другой - только в 10 процентах, его энтропия не так высока, как могла бы быть. Посылать один и тот же символ девять раз из десяти - это избыточно. Как мы видели ранее, код с самой высокой энтропией использовал бы каждый из этих символов 50 процентов времени и имел бы избыточность, равную нулю. Барлоу считал, что эффективный мозг уменьшает избыточность настолько, насколько это возможно.
Причина в том, что избыточность - это пустая трата ресурсов. Английский язык, как выяснилось, невероятно избыточен. Ярким примером этого является буква "q", за которой почти всегда следует "u"."u" добавляет мало информации, если вообще добавляет, после того как мы увидели "q", и поэтому является избыточной. Избыточность английского языка означает, что теоретически мы могли бы передать тот же объем информации с помощью гораздо меньшего количества букв. На самом деле, в своей оригинальной работе 1948 года Шеннон оценил избыточность письменного английского языка примерно в 50 процентов. Вот почему, например, люди все еще могут читать слова, которые они произносят.6
В нервной системе избыточность может проявляться в том, что несколько нейронов говорят одно и то же. Представьте, что один нейрон представляет букву "q", а другой - букву "u". Таким образом, при виде буквы "qu" срабатывают оба нейрона. Но если эти две буквы часто встречаются в мире, мозг будет эффективнее использовать только один нейрон, чтобы реагировать на них.
Почему важно, эффективно ли мозг кодирует информацию? Одна из причин - энергетические затраты. Каждый раз, когда нейрон выпускает импульс, баланс заряженных частиц внутри и снаружи клетки нарушается. Восстановление этого баланса требует энергии: маленьким насосам в клеточной мембране приходится выбрасывать из клетки ионы натрия и втягивать обратно ионы калия. Образование нейротрансмиттеров и их выведение из клетки с каждым импульсом также требует затрат. В общей сложности, по оценкам, до трех четвертей энергетического бюджета мозга уходит на отправку и прием сигналов. А мозг, потребляющий 20 процентов энергии организма и составляющий всего 2 процента от его веса, является самым энергозатратным органом. При таких высоких затратах энергии мозгу имеет смысл быть экономным в использовании своих шипов
Но чтобы знать, как эффективно отправлять информацию, мозг должен знать, какую информацию ему обычно нужно отправлять. В частности, мозг должен каким-то образом определить, когда информация, которую он получает из мира, является избыточной. Тогда он может просто не посылать ее дальше. Это позволит сохранить эффективность нейронного кода. Обладает ли нервная система способностью отслеживать статистику получаемой информации и приводить свою схему кодирования в соответствие с окружающим миром? Одно из открытий лорда Адриана - адаптация - говорит о том, что да.
В своих экспериментах с рецепторами растяжения мышц Адриан заметил, что "при постоянном раздражителе частота разрядов постепенно снижается". В частности, при сохранении постоянного веса, приложенного к мышце, частота разрядов нерва снижалась примерно наполовину в течение 10 секунд. Адриан назвал это явление "адаптацией" и определил его как "снижение возбудимости под действием стимула". Заметив этот эффект в нескольких своих экспериментах, он посвятил ему целую главу в своей книге 1928 года.
С тех пор адаптация была обнаружена во всей нервной системе. Например, "эффект водопада" - это зрительная иллюзия, когда при виде движения в одном направлении неподвижные объекты кажутся движущимися в противоположном направлении. Он назван так потому, что может возникнуть после того, как вы посмотрите на нисходящее движение водопада. Считается, что этот эффект является результатом адаптации клеток, представляющих исходное направление движения: когда эти клетки замолчали в результате адаптации, наше восприятие смещено из-за срабатывания клеток, представляющих противоположное направление.
В своей работе 1972 года Барлоу утверждает, что адаптация - это средство повышения эффективности: "Если сенсорные сообщения должны занимать место, пропорциональное их информационной ценности, то должны существовать механизмы, позволяющие уменьшить величину представления паттернов, которые постоянно присутствуют, и, предположительно, именно это лежит в основе адаптивных эффектов".
Другими словами - точнее, словами теории информации, - если один и тот же символ передается по каналу снова и снова, его присутствие больше не несет информации. Поэтому имеет смысл прекратить его передачу. Именно так и поступают нейроны: они перестают посылать импульсы, когда видят один и тот же стимул снова и снова.
С тех пор как Барлоу сделал заявление о том, что клетки должны адаптировать свои реакции к получаемым сигналам, были разработаны методы отслеживания того, как нейроны кодируют информацию, которые позволяют проводить более прямые и тонкие проверки этой гипотезы. Например, в 2001 году специалист по вычислительной нейробиологии Эдриенн Фэйрхолл вместе с коллегами из Исследовательского института NEC в Принстоне, штат Нью-Джерси, исследовали адаптивные способности зрительных нейронов у мух.
В ходе эксперимента исследователи показывали мухам на экране полоску, движущуюся вправо и влево. Сначала движение полосы было неустойчивым. В один момент она могла очень быстро двигаться влево, а в другой - так же быстро вправо, или оставаться в этом направлении, или совсем замедлиться. В общем, диапазон возможных скоростей был велик. После нескольких секунд такого хаоса бар успокоился. Его движение стало более сдержанным, он никогда не двигался слишком быстро ни в одном из направлений. В ходе эксперимента брусок несколько раз менял периоды хаотичного и спокойного движения.
Изучая активность нейронов, реагирующих на движение, исследователи обнаружили, что зрительная система быстро адаптирует свой код к информации о движении, которую она получает в данный момент. В частности, чтобы быть эффективным кодировщиком, нейрон всегда должен работать с максимальной скоростью при самом быстром движении и с минимальной - при самом медленном. Если рассматривать разные скорости работы как разные символы в нейронном коде, то такое распределение скорости работы гарантирует, что все эти символы будут использоваться примерно одинаково. Это максимизирует энтропию кода.
Проблема в том, что самое быстрое движение в период спокойствия гораздо медленнее, чем самое быстрое движение в более неустойчивый период. Это означает, что одна и та же скорость должна соответствовать двум разным темпам стрельбы в зависимости от того, в каком контексте она проявляется. Как ни странно, именно это и наблюдали Фэрхолл и его коллеги. В спокойный период, когда бар двигался с наибольшей скоростью, нейрон выстреливал более 100 шипиков в секунду. В то время как во время нестабильного периода, когда скорость движения была такой же, нейрон выстреливал всего 60 раз в секунду. Чтобы нейрон снова заработал со скоростью 100 импульсов в секунду в период нестабильности, бар должен был двигаться в 10 раз быстрее.
Кроме того, исследователи смогли определить количество информации, которую несет спайк до и после переключения между этими двумя типами движения. Во время хаотичного периода количество информации составляло около 1,5 бита на зубец. Сразу после перехода к спокойному движению она упала до 0,8 бита на зубец: нейрон, еще не адаптировавшийся к новому набору движений, оказался неэффективным кодировщиком. Однако всего через долю секунды после начала более спокойного движения количество бит на зубец снова выросло до 1,5. Нейрону потребовалось совсем немного времени, чтобы проследить за диапазоном скоростей, которые он видит, и соответствующим образом адаптировать свои импульсы. Этот эксперимент показывает, что, как и предполагает теория эффективного кодирования Барлоу, адаптация обеспечивает эффективное кодирование всех типов информации.
Неврологи также считают, что мозг устроен таким образом, чтобы создавать эффективные коды на гораздо более длительных временных интервалах, чем секунды и минуты сенсорного опыта. В процессе эволюции и развития организм имеет возможность изучить окружающую среду и адаптировать свой нейронный код к тому, что для него наиболее важно. Предполагая, что определенная область мозга лучше всего приспособлена к максимально эффективному представлению нужной информации, ученые пытаются перестроить эволюционный процесс.
Например, 30 000 нервов, отходящих от человеческого уха, реагируют на разные типы звуков. Одни нейроны предпочитают короткие всплески высокочастотных звуков, другие - низкочастотных. Одни лучше всего реагируют, когда тихий звук становится громче, другие - когда громкий звук становится тише, а третьи - когда тихий звук становится громче, а затем снова тише. В целом, каждое нервное волокно имеет сложную схему тона и громкости, которая наилучшим образом способствует его возбуждению.
Ученые в основном знают, как волокна приводят к таким реакциям. Крошечные волоски, соединенные с клетками в внутреннего уха, двигаются в ответ на звуки. Каждая клетка реагирует на разные звуки в зависимости от того, где она находится в маленькой спиралевидной мембране. Нервные волокна, выходящие из уха, получают сигналы от этих волосковых клеток. Каждое волокно комбинирует звуки по-своему, создавая свой уникальный, комбинированный профиль реакции.
Однако менее понятно, почему волокна отвечают именно так. Именно здесь могут помочь идеи из теории информации.
Если мозг действительно сокращает избыточность, как предполагает Барлоу, то одновременно должно быть активно лишь небольшое количество нейронов. Неврологи называют такую активность "разреженной".8 В 2002 году нейробиолог-вычислитель Майкл Левики задался вопросом, могут ли свойства реакции слуховых нервов быть результатом применения мозгом разреженного кода - кода, специально разработанного для звуков, которые животное должно обрабатывать.
Чтобы ответить на этот вопрос, ему пришлось собрать коллекцию различных природных звуков. Один набор звуков был взят с компакт-диска с вокализами животных тропических лесов, таких как летучие мыши, ламантины и мартышки; другой представлял собой компиляцию "фоновых" шумов, таких как хруст листьев и щелканье веток; а третий был взят из базы данных человеческих голосов, читающих английские предложения.
Затем Левицки использовал алгоритм для разложения сложных звуков на словарь коротких звуковых паттернов. Целью алгоритма было найти наилучшее разложение - то есть такое, которое может воссоздать каждый полный, естественный звук, используя как можно меньше коротких звуковых паттернов. Таким образом, алгоритм искал разреженный код. Если слуховая система мозга эволюционировала для редкого кодирования естественных звуков, то звуковые паттерны, предпочитаемые слуховыми нервами, должны совпадать с теми, которые были найдены алгоритмом.
Левики обнаружил, что при создании словаря из одних только звуков животных получаются звуковые шаблоны, которые не соответствуют биологическим. В частности, шаблоны, созданные алгоритмом, были слишком простыми - они представляли собой чистые тона, а не сложное сочетание тонов и громкости, которое предпочитают слуховые нервы людей и животных. Однако, если применить алгоритм к смеси шумов животных и фоновых звуков, то он полностью совпал с биологическими данными. Это говорит о том, что схема кодирования слуховой системы действительно соответствует этим звукам окружающей среды, что позволяет ей эффективно их кодировать. Более того, Левицки обнаружил, что словарь, составленный из человеческой речи, также воспроизводит звуковые профили, предпочитаемые биологией. Левицки воспринял это как доказательство теории о том, что человеческая речь эволюционировала, чтобы наилучшим образом использовать существующую схему кодирования слуховой системы.9
* * *
В 1959 году Барлоу представил свои идеи о свойствах мозга, связанных с обработкой информации, группе исследователей сенсорных, собравшихся в Массачусетском технологическом институте. Когда материалы этой встречи были переведены на русский язык для советской аудитории, вклад Барлоу был заметно вырезан. Оказалось, что у Советов были проблемы с использованием теории информации для понимания мозга. Считавшаяся частью "буржуазной лженауки" кибернетики, она противоречила официальной советской философии, уравнивая человека с машиной. Советские лидеры - и порой напуганные ученые под их руководством - открыто критиковали это отношение как глупый продукт американского капитализма.
Несмотря на уникальные политические мотивы, советское разоблачение было далеко не единственной критикой теории информации в биологии. В 1956 году в короткой статье под названием "Бандвагон" предостерегалось от чрезмерно бурного применения теории информации в таких областях, как психология, лингвистика, экономика и биология. Редко когда за один раз раскрывается более нескольких секретов природы. Наше несколько искусственное процветание может рухнуть в одночасье, когда мы поймем, что использование нескольких захватывающих слов, таких как информация, энтропия, избыточность, не решает всех наших проблем". Эта статья была написана самим Шенноном всего через восемь лет после того, как он открыл миру теорию информации.
Опасения по поводу того, насколько точна аналогия между системой Шеннона и мозгом, исходили даже от самих ученых, проводящих аналогию. В статье 2000 года Барлоу предупредил, что "мозг использует информацию не так, как принято в технике связи". А Перкел и Баллок в своем оригинальном докладе не стали полностью придерживаться определения информации, данного Шенноном, а, скорее рассматривали концепцию "кодирования" в мозге как метафору, которая может иметь разную степень полезности.
Осторожность оправдана. Особенно сложной частью системы Шеннона, которую можно перенести на мозг, является декодер. В простой системе связи получатель получает закодированное сообщение по каналу и просто меняет процесс кодирования на обратный, чтобы декодировать его. Например, получатель телеграфного сообщения использует ту же справочную таблицу, что и отправитель, чтобы знать, как преобразовать точки и тире обратно в буквы. Однако система в мозге вряд ли будет такой симметричной. Потому что единственными "декодерами" в мозге являются другие нейроны, и что они делают с полученным сигналом, можно только догадываться.
Возьмем, к примеру, кодирование в сетчатке глаза. Когда обнаруживается фотон света, некоторые клетки сетчатки ("включенные" клетки) кодируют это увеличением частоты своего огня, в то время как другой набор клеток ("выключенные" клетки) кодирует это уменьшением своего огня. Если это совместное изменение скорости стрельбы вверх-вниз является символом, который сетчатка обозначает приход фотона, мы можем предположить, что это также символ, который "декодируется" последующими областями мозга. Однако, похоже, это не так.
В 2019 году группа исследователей из Финляндии генетически модифицировала клетки сетчатки мыши. В частности, они сделали "включенные" клетки менее чувствительными к фотонам. Теперь при попадании фотона "выключенные" клетки все равно снижают свою активность, а "включенные" могут ее повысить, а могут и не повысить. Вопрос заключался в том, к какому набору клеток будет прислушиваться мозг? "выключенные" клетки расшифровывали информацию о фотоне. Однако животные, похоже, не использовали ее. Если оценить способность животных обнаруживать слабый свет, то окажется, что мозг считывает активность только "включенных" клеток. Если эти клетки не сигнализировали о том, что фотон обнаружен, животное не реагировало. По мнению ученых, это означает, что мозг, по крайней мере в данном случае, не декодирует всю закодированную информацию. Он игнорирует сигналы, которые посылают "выключенные" клетки. Поэтому, пишут авторы, "на пределе чувствительности зрения принципы декодирования мозга не приводят к оптимальному решению, предсказанному теорией информации". То, что ученые могут обнаружить сигнал в пиках, еще не означает, что он имеет значение для мозга.
Этому есть много причин. Одна из них заключается в том, что мозг - это машина, обрабатывающая информацию. То есть его задача - не просто воспроизводить передаваемые по нему сообщения, а преобразовывать их в действия для животного. Он выполняет вычисления над информацией, а не просто передает ее. Поэтому ожидания о том, как работает мозг, основанные исключительно на системе связи Шеннона, упускают эту важнейшую цель. Тот факт, что мозг не может оптимально передавать информацию, не обязательно указывает на недостатки в его конструкции. Просто он был создан для чего-то другого.
Нельзя было ожидать, что теория информации, придуманная как язык для создания инженерных систем связи, идеально подойдет для нервной системы. Мозг - это не просто телефонная линия. Тем не менее отдельные участки мозга занимаются этой базовой задачей - общением. Нервы действительно посылают сигналы. И делают они это с помощью некоего кода, основанного на частоте спайков, времени спайков или спайков. Поэтому взглянуть на мозг с точки зрения теории информации - вполне разумное начинание, которое принесло множество открытий и идей. Однако если смотреть слишком долго, в аналогии появляются трещины. Это и есть причина для настороженности. Таким образом, как метафора, отношения между коммуникационной системой и мозгом наиболее плодотворны, если не переусердствовать.
Глава 8. Движение в низких измерениях
. Кинетика, кинематика и снижение размерности
В середине 1990-х годов редактор местной газеты в Хьюстоне, штат Техас, обратился в Медицинский колледж Бэйлора в надежде получить помощь в решении проблемы, связанной с его левой рукой. В течение последних нескольких недель пальцы этой руки были слабыми, а кончики пальцев онемели. Мужчина, заядлый курильщик и любитель выпить, показался врачам вполне здоровым. Увидев онемение, врачи сначала искали защемление нерва в запястье. Ничего не обнаружив, они проверили спинной мозг, подозревая, что виной тому может быть поражение спинномозговых нервов. Когда и это дало отрицательный результат, врачи пошли дальше и провели сканирование мозга. Они обнаружили опухоль размером с крупную виноградину, расположенную в правой части морщинистой поверхности мозга мужчины. Она находилась на полпути между правым виском и макушкой головы, в центре области, известной как моторная кора.