Действительно, компьютер официально превзошел шахматного гроссмейстера-человека в печально известном матче 1997 года между Гарри Каспаровым и суперкомпьютером Deep Blue компании IBM. Но го - не просто более сложная игра, чем шахматы. По правде говоря, ее правила порождают настолько обширное пространство возможностей, что сетка клеток доски размером девятнадцать на девятнадцать может быть выстроена в конфигурации 10 на 360 - число настолько гигантское, что оно не просто превышает количество частиц во Вселенной, но и на много-много порядков больше. Люди эффективно играют в эту игру, развивая интуицию в течение всей жизни, сокращая функционально бесконечное меню вариантов на каждом шагу до чего-то управляемого. Но даже передовому ИИ не хватает когнитивной глубины, чтобы повторить эту способность.
Тем не менее, у нас были основания для несерьезного оптимизма. Хотя объем вычислений, необходимых для поиска оптимального хода в го, действительно огромен, в игре все же есть что-то принципиально аккуратное. Она подчиняется конечному набору правил, и победитель - камни той стороны, которая претендует на наибольшую территорию на доске, - определяется четко и объективно. По меркам "лунных выстрелов" го была одной из самых простых. Но, по правде говоря, это все равно был лунный выстрел.
"Но даже если он победит, - добавил Сильвио, - пройдет немало времени, прежде чем он станет готовить лазанью лучше, чем люди".
Одним ответом он представил современный ИИ в перспективе и одновременно заставил меня проголодаться.
AlphaGo действительно победил, и мир сошел с ума. Внимание мировых СМИ было приковано к этому событию, особенно в Азии, где оно вызвало абсолютный ажиотаж. Для меня же самым большим показателем стало личное.
"飞飞,我的老同学们问我你知道AI下围棋是怎么回事吗?"- "Фэй-Фэй, мои друзья спрашивают меня: ты знаешь, что происходит с ИИ в игре Го?" - гласило следующее из бесконечных сообщений в WeChat, которые мой отец стал пересылать от друзей за границей. "他们听说我女儿是AI教授,都在问我呢!"- "Они слышали, что моя дочь - профессор ИИ, поэтому они все спрашивают меня об этом!". Заголовки - это одно, но когда сеть китайских бабушек и дедушек моих родителей стала частью разговора, это был признак того, что мир действительно меняется.
Это было время переломных моментов, но даже самые драматические прорывы были нам знакомы, поскольку являлись выражением технологий, которым мы посвятили свою жизнь. Такие истории, как ResNet и AlphaGo, вдохновляли на разговоры и дебаты и побуждали нас идти еще дальше в наших собственных исследованиях. Даже я не смог удержаться от использования любимого термина Кремниевой долины, поскольку осознал, что новая эра ИИ - это не просто явление: это, как говорится, "срыв".
Маленький красный диванчик в моем кабинете, где зародилось множество проектов, определивших репутацию нашей лаборатории, становился местом, где я регулярно умолял молодых исследователей оставить в своих исследованиях место для основополагающих текстов, на которых строилась наша наука. Я заметил, сначала с досадой, а потом и с беспокойством, как постоянно ими пренебрегают, когда все ускоряющиеся достижения современности привлекают внимание к более актуальным источникам информации.
"Ребята, я вас умоляю - пожалуйста, не скачивайте каждый день последние препринты с arXiv. Прочитайте книгу Рассела и Норвига. Прочитайте Минского, Маккарти и Винограда. Читайте Хартли и Зиссермана. Читайте Палмера. Читайте их благодаря их возрасту, а не вопреки ему. Это вечные вещи. Это важно".
arXiv (произносится как "архив") - это онлайновое хранилище научных статей в таких областях, как физика и инженерия, которые еще не опубликованы, но доступны любопытствующим в ранней, неотредактированной форме, известной как "препринт". Этот ресурс был неотъемлемой частью университетской культуры на протяжении десятилетий, но в последние годы он стал незаменимым помощником для того, чтобы оставаться в курсе событий в области, которая развивалась так быстро, что казалось, что все меняется с каждой неделей, а иногда и за одну ночь. Если ждать несколько месяцев, пока пройдет процесс рецензирования, было слишком накладно, то стоит ли удивляться, что учебники, написанные несколько лет назад, а то и целые поколения назад, уходят на второй план?
Это было только начало отвлекающих факторов, которые боролись за внимание моих студентов. В то время как технологические гиганты охотились за собственными командами специалистов по искусственному интеллекту, обещая шестизначные, а иногда и более, стартовые зарплаты, а также щедрые пакеты акций. Один за другим пионеры машинного обучения покидали Стэнфорд, а к середине десятилетия в меню появились даже постдоки. В одном особенно дерзком эпизоде Uber переманила рекордные сорок робототехников из Университета Карнеги-Меллона - практически уничтожив факультет в процессе - в надежде запустить собственный самоуправляемый автомобиль. Мне и моим коллегам было достаточно тяжело наблюдать за этим. Но для моих студентов, молодых, жаждущих и все еще развивающих свое собственное чувство идентичности, это, казалось, в корне искажало их представление о том, для чего нужно образование. В конце концов, эта тенденция достигла своего пика - во всяком случае, для меня - с особенно личным сюрпризом.
"Ты действительно отказываешься от них? Андрей, это одна из лучших школ в мире!"
"Я знаю. Но я не могу это пропустить. В этом есть что-то особенное".
Андрей защитил докторскую диссертацию и отправился на самый, наверное, плодородный рынок труда в истории ИИ, даже для начинающего профессора. Но, несмотря на предложение факультета из Принстона - , за которое любой из наших сверстников был бы готов покончить с карьерой, - он решил покинуть академические круги, чтобы присоединиться к частной исследовательской лаборатории, о которой никто никогда не слышал.
OpenAI - детище магнатов Кремниевой долины Сэма Альтмана, Элона Маска и генерального директора LinkedIn Рида Хоффмана, созданное с поразительными первоначальными инвестициями в миллиард долларов. Это было свидетельством того, насколько серьезно Кремниевая долина отнеслась к внезапному росту ИИ и как стремились ее светила закрепиться в ней. Андрею предстояло присоединиться к основной команде инженеров.
Вскоре после запуска OpenAI я столкнулся с несколькими его основателями на местной встрече. Один из них поднял бокал и произнес тост, который находился на грани между приветствием и предупреждением: "Каждый, кто занимается исследованиями в области ИИ, должен серьезно задуматься о своей роли в академической среде в будущем". Тост, произнесенный без малейшего намека на смех, был ледяным в своей ясности: будущее ИИ будет написано теми, у кого есть корпоративные ресурсы. У меня был соблазн насмехаться, к чему меня приучили годы работы в академических кругах. Но я не стал этого делать. Честно говоря, я даже не был уверен, что не согласен.
К чему все это приведет, можно было только догадываться. Наша область пережила больше взлетов и падений, чем большинство других; термин "зима ИИ" свидетельствует о ее богатой истории больших ожиданий и фальстартов. Но сейчас все было иначе. По мере того как анализ все большего числа экспертов обретал форму, все большее признание в технологической, финансовой и других сферах получал термин: "Четвертая промышленная революция". Даже если принять во внимание обычную гиперболизацию, которой сопровождаются подобные фразы, он звучал достаточно правдиво, и лица, принимающие решения, принимали его близко к сердцу. Движимые искренним энтузиазмом, давлением извне или каким-то сочетанием того и другого, руководители Кремниевой долины делали более быстрые, смелые и, в некоторых случаях, более безрассудные шаги, чем когда-либо. Нам всем предстояло узнать, к чему приведет эта философия.
"Обезьяна", ради всего святого.
Это был ярлык, автоматически сгенерированный сервисом размещения изображений Flickr компании Yahoo в мае 2015 года для портрета Уильяма, пятидесятишестилетнего чернокожего мужчины , запечатленного в монохроме. Реакция была быстрой и вызвала заслуженный гнев, и это был лишь первый промах в череде ошибок новой технологии. В ходе запущенного проекта Flickr также пометил фотографию ворот в концлагере Дахау "спортзалом для джунглей" и снова применил слово "обезьяна" к белой женщине с цветной пудрой на лице. И дело не только в Yahoo: в июне Google столкнулся с аналогичным спором, когда его сервис Google Photos неправильно обозначил пару чернокожих подростков как "горилл". За считанные недели нехитрая история успеха классификации изображений стала гораздо сложнее.
Даже тем, кто не работает в соответствующих компаниях, трудно было не почувствовать себя виноватым. То, что эти казусы не были злонамеренными, утешало слабо, поскольку проблема, которую они выявили, была, если можно так выразиться, еще более тревожной: последствия недостаточно разнообразных наборов данных, включая ImageNet, усугубленные плохо проверенными алгоритмами и сомнительным принятием решений. Когда интернет представляет картину повседневной жизни преимущественно белых, западных и часто мужских людей, мы остаемся с технологией, которая пытается понять всех остальных.
Это был неизбежный результат того, что журналист и комментатор Джек Кларк назвал проблемой ИИ "Море чуваков": отсутствие представительства в технологической отрасли привело к непреднамеренной предвзятости алгоритмов, которые плохо работают с небелыми и немужскими пользователями. Статья Кларка, опубликованная в Bloomberg в 2016 году, стала первым вкладом в растущий диалог, обеспокоенный тем, что потенциал ИИ делать хорошие вещи - поддерживать инвалидов, отслеживать вырубку лесов и защищать человеческую жизнь любым новым способом - сопровождается таким же потенциалом делать плохие вещи.
Я вспомнил годы, которые мы потратили на сборку ImageNet, и то, что даже в самых творческих и импровизационных ситуациях мы были в значительной степени невежественны по отношению к подобным вопросам. За десять лет до этого взрыв контента, организованный Googles и Wikipedias мира, казалось, предлагал окно в человеческую жизнь, как она есть на самом деле, в отличие от провинциальных проблесков, которые можно найти в старых средствах массовой информации, таких как телевизионные сети и газеты. И в каком-то смысле, конечно, так оно и было. Но какими бы яркими они ни казались и какими бы восторженными ни были наши ожидания, картина все равно была далеко не полной.
Эта проблема давно назрела, но диалог не мог успокоить моего внутреннего инженера. Хотя однобокие наборы данных явно были большой частью проблемы, существовало бесчисленное множество других факторов, заслуживающих нашего внимания. Что насчет моделей? Не скрываются ли в архитектуре алгоритмов, отвыкших от всех этих данных, необнаруженные слабые места? Как насчет методов обучения, облегчающих процесс тренировки? Вопросов было больше, чем ответов, и это соотношение, похоже, становилось все более перекошенным.
Эти вопросы не давали покоя и Ольге. Будучи двумя из относительно немногих женщин в подавляющем большинстве мужских областей, мы много общались в течение многих лет, сравнивая обескураживающе похожие заметки о том, как быть женщиной в ИИ. Однако к середине десятилетия ей надоело, и она решила либо что-то с этим сделать, либо уйти из академии. Она выбрала первое, и мы решили сделать это вместе.
Понимая, что проблемы представительства обычно начинаются за несколько лет до того, как они осознаются, мы открыли SAIL для специально отобранного класса девочек из девятых и десятых классов. Последовавший за этим двухнедельный краш-курс по ИИ, несмотря на свою интенсивность, продемонстрировал всем присутствующим, что требуется на удивление мало, чтобы убедить исторически исключенных людей в том, что они тоже принадлежат к этой группе. Идея оказалась настолько популярной, что превратилась в национальную некоммерческую организацию, распространившуюся на кампусы по всей Северной Америке и расширившую свою миссию. Вскоре мы стали предлагать подобные курсы другим маргинализированным группам, включая цветных и экономически неблагополучных студентов.
Всего через несколько лет инициатива получила официальное название AI4ALL и даже привлекла определенный капитал: в финансировании приняли участие Pivotal Ventures Мелинды Френч Гейтс и основатель Nvidia Дженсен Хуанг. Это был маленький шаг на пути, на который , вероятно, уйдет несколько поколений, но это было начало. И это было желанное, пусть и скромное, успокоение, когда мы наблюдали за тем, как индустрия гонится за будущим этой технологии с гораздо большим энтузиазмом, чем за самоанализом.
Однако наблюдение за тем, как такие компании, как Yahoo и Google, получают мучительные уроки в режиме реального времени, в то время как весь мир наблюдает и осуждает их, напомнило нам, что недостаточно просто инвестировать в следующее поколение и надеяться на лучшее. Ольга, получившая предложение стать профессором в Принстоне и принявшая его, занялась расширением программы исследований своей новой лаборатории, перейдя от механики машинного восприятия к более широкому вопросу справедливости в вычислениях, включая особый акцент на "дебиасинге": формальной, математически строгой попытке количественно оценить и нейтрализовать предвзятость, скрывающуюся в наших данных. С такими людьми, как Ольга, которые предлагают такие социально сознательные идеи, моя надежда на будущее начала расти.
Я всем сердцем верил в ценность этой технологии, начиная с ее потенциала пролить новый свет на тайны интеллекта и заканчивая реальной пользой, которую я видел в работе с Арни в больницах. Но цена даже минутной самоуверенности стремительно росла. Хуже того, эту цену заплатят другие, вероятно, самые уязвимые из нас. ИИ вышел из лаборатории и в значительной степени вышел из-под нашего контроля; хотя вихрь новых идей, новых лиц и новых институтов был бодрящим, было так же много новых опасений. Даже обещание коммерческих инвестиций в эту сферу, казавшееся находкой для таких исследователей, как мы, наводняло все вокруг с такой силой, что это больше походило на дерзость, зловещую и чреватую, чем на удачу.
Слова продолжали терпеть неудачу. "Феномен" был слишком пассивным. "Разрушение" - слишком нагло. "Революция" - слишком самодовольно. Современный ИИ представал перед нами как головоломка, кусочки которой имели острые края. Тем не менее, как ни тревожно было это осознавать, растущее чувство опасности было именно тем, что ученые должны ценить. Оно разжигало во мне другую форму любопытства, некомфортную, но убедительную. Мне просто нужен был способ увидеть это вблизи.
"Пока результаты обнадеживают. В наших тестах поиск нейронной архитектуры позволил создать классификаторы, обученные на ImageNet, которые превзошли свои человеческие аналоги - причем все самостоятельно".
Шел 2018 год, и я сидел за дальним концом длинного конференц-стола в Google Brain, одной из самых известных исследовательских организаций компании в области ИИ, расположенной в самом сердце штаб-квартиры - Googleplex в Маунтин-Вью, штат Калифорния. Речь шла об особенно захватывающей разработке, которая уже несколько месяцев вызывала шум по всему кампусу: "поиск нейронной архитектуры", попытка автоматизировать оптимизацию архитектуры нейронной сети.
Поведение таких моделей определяется целым рядом параметров, определяющих компромисс между скоростью и точностью, памятью и эффективностью, а также другими аспектами. Настроить один или два параметра по отдельности достаточно просто, но найти способ сбалансировать все эти параметры - задача, которая часто не под силу человеку, и даже эксперты с трудом справляются с тем, чтобы настроить все как надо. Удобство, которое обеспечит автоматизация, - цель, безусловно, достойная, и, кроме того, она может сделать ИИ более доступным для растущего сообщества нетехнических пользователей, которые смогут использовать его для построения собственных моделей без руководства экспертов. Кроме того, было что-то поэтическое в том, что модели машинного обучения разрабатывают модели машинного обучения и быстро становятся лучше нас.
Но за всю эту мощь приходилось платить. Обучение даже одной модели все еще было дорогостоящим для всех лабораторий и компаний, кроме самых финансируемых, а поиск нейронной архитектуры предполагал обучение тысяч моделей. Это была впечатляющая инновация, но очень дорогая в вычислительном плане. Этот вопрос стал одним из основных предметов обсуждения на встрече.
"На каком оборудовании это работает?" - спросил один из исследователей.
"В любой момент времени мы тестируем сто различных конфигураций, каждая из которых обучает восемь моделей с немного отличающимися характеристиками . В общей сложности одновременно обучается восемьсот моделей, для каждой из которых выделяется свой графический процессор".
"Итак, мы рассматриваем около..."
"Восемьсот, да".
Восемьсот графических процессоров. Это было головокружительное увеличение, учитывая, что в 2012 году AlexNet потребовалось всего два, чтобы изменить мир. И дальше цифры становились все более внушительными. Если вспомнить бюджет моей лаборатории, что самые мощные GPU Nvidia стоят около 1000 долларов (что объясняло, почему у нас самих их было едва ли больше дюжины), то минимальные расходы на подобные исследования теперь составляли почти миллион долларов. Конечно, это не считая времени и персонала, необходимых для объединения в сеть такого количества высокопроизводительных процессоров и поддержания приемлемого температурного режима при круглосуточном кипении кремния. Не учитывается и местоположение. С точки зрения физического пространства и астрономического энергопотребления такая сеть точно не годится для среднего гаража или спальни. Даже университетские лаборатории, подобные моей, с трудом смогли бы создать нечто подобное. Я откинулся на спинку стула и оглядел комнату, гадая, находит ли кто-нибудь еще это столь же огорчительным, как я.
В 2016 году мне предстоял двадцатиодномесячный академический отпуск, и мой почтовый ящик был завален сообщениями об ухаживаниях от таких компаний, как Nvidia, Uber и Google. Я сохранил хорошо отточенный инстинкт отвергать их сразу, но все чаще ловил себя на том, что сначала задерживаюсь на мгновение. Возможно, в этом больше смысла, чем раньше, подумал я со вздохом. Я имею в виду, совсем немного.
Я должен был признать, что идея работы в частном секторе уже не казалась мне такой чуждой, как раньше. Коллеги, которых я не мог сосчитать, сами перешли на эту работу, и даже мои студенты делали перерывы в учебе для высокооплачиваемой работы в технологических фирмах по всему миру - и не всегда возвращались обратно. Теперь, когда многое меняется так быстро, мне пришлось задуматься, не изжила ли себя моя неприязнь к тому, чтобы делать все как раньше, . Я хотел увидеть, как выглядит современный ИИ за пределами Стэнфорда и страниц научных журналов. Возможно, это был шанс сделать именно это, по крайней мере на некоторое время.
Поразмыслив, я решил занять должность главного научного сотрудника по искусственному интеллекту в Google Cloud. Несмотря на то что Google была давно известной компанией, ее недавно сформированное подразделение облачных вычислений существовало всего год или около того, и мне представился шанс помочь построить что-то с нуля. Кроме того, я была знакома с недавно назначенным генеральным директором компании Дайаной Грин - одной из немногих женщин, покоривших Кремниевую долину в качестве соучредителя гиганта в области виртуализации VMware, - и рассчитывала работать вместе с ней в отрасли с таким перекошенным гендерным балансом.
Это не было похоже на подозрительно позолоченную должность на Уолл-стрит, которую мне предложили, когда я был студентом, или на быстрое место в McKinsey, над которым я мучился в Калтехе. Я больше не мог притворяться, что работа в частном секторе - это циничная взятка за отказ от лаборатории. В эти дни это было приглашение возглавить еще более крупную лабораторию. Возможности, превосходящие все, что я когда-либо себе представлял. Высокопроизводительные вычисления любого масштаба. Команды докторов наук на порядки больше, чем те, что я мог собрать в Стэнфорде. И, что самое удивительное, доступ к данным в таких объемах, о которых я и не мечтал. Конечно, моя работа будет определяться дорожной картой продуктов компании, по крайней мере косвенно, но эти продукты всегда были ниже фундаментальных исследований, которые делали их возможными.
Самое главное - Google Cloud означало, что я увижу не один пример применения искусственного интеллекта, а тысячи. Поскольку облачные сервисы нашли свое место практически во всех отраслях, которые только можно себе представить, такие поставщики, как Google, стали присутствовать во всех из них. Это был шанс увидеть, где используется искусственный интеллект и данные, на основе которых он работает, - в производстве, сельском хозяйстве, страховании, транспорте и логистике, розничной торговле, финансовых услугах и даже в правительстве. Это был уровень масштаба и разнообразия, превосходящий все, что может предложить университет, и все это одновременно.
Потребовалось некоторое время, чтобы обговорить детали, тем более что я не планировал полностью покидать Стэнфорд даже на время академического отпуска. Я продолжал бы проводить один день в неделю в кампусе, что позволило бы мне быть в курсе дел лаборатории и встречаться со студентами. Логистика, безусловно, будет сложной задачей. Но я уже принял решение.
Ничто из того, что я видел за все годы учебы в университете, не подготовило меня к тому, что ждало меня за кулисами Google Cloud. Технологическая индустрия не просто соответствовала своей репутации богатства, власти и амбиций, но и значительно превосходила ее. Все, что я видел, было больше, быстрее, изящнее и сложнее, чем то, к чему я привык.
Одно только изобилие еды поражало воображение. В комнатах отдыха было больше закусок, напитков и профессионального оборудования для приготовления эспрессо, чем в Стэнфорде или Принстоне, а практически в каждом здании Google такая комната была на каждом этаже. И все это еще до того, как я попал в кафетерии.
Далее последовали технологии. После стольких лет, проведенных в нервотрепке из-за нестабильных проекторов и неудачных продуктов для видеоконференций 2000-х годов, совещания в Google были похожи на что-то из научной фантастики. Современная система телеприсутствия была встроена в каждую комнату, от залов заседаний, рассчитанных на пятьдесят человек, до кабинок размером со шкаф для одного, и все активировалось одним нажатием на сенсорный экран.
А еще был талант - просто поразительная глубина таланта. Я не мог не покраснеть, вспоминая два изнурительных года, которые ушли на то, чтобы привлечь трех коллег для помощи в создании окружающего интеллекта для больниц. Здесь же в первый день меня ждала команда из пятнадцати человек, готовая к работе. И это было только начало - всего за восемнадцать месяцев мы выросли в двадцать раз. Доктора наук с блестящими дипломами, казалось, были повсюду, и это укрепляло ощущение, что все возможно. Каким бы ни было будущее ИИ, Google Cloud стал для меня окном в мир, который мчался к нему так быстро, как только мог.
Мои пятницы в Стэнфорде только подчеркивали это сравнение, поскольку слух о моей новой должности распространился, и запросы на стажировку стали ежедневным явлением. В какой-то степени это было понятно, поскольку мои студенты (и иногда профессора) просто делали все возможное, чтобы наладить связи. Однако меня беспокоило то, что все без исключения разговоры на эту тему заканчивались одним и тем же: что наиболее интересные для них исследования невозможны вне частной лаборатории. Даже в таком месте, как Стэнфорд, бюджеты просто не были достаточно большими. Часто они даже не были близки к этому. Корпоративные исследования были не просто более прибыльным вариантом, но и все чаще единственным.
И наконец, были данные - товар, на котором основывался весь бренд Google. ImageNet стал моим первым взглядом на потенциал данных в достаточно большом масштабе, и почти все мои исследования с тех пор строились на этой идее. Десятилетия моделей автомобилей с Джоном, кипы фотографий в паре с описаниями с Андреем, целая страна из изображений Street View и записей Бюро переписи населения с Тимнитом - объемы данных продолжали расти, а вместе с ними росли и возможности ИИ. Теперь меня окружало не только неописуемое изобилие, но и категории, о которых я раньше даже не подозревал: данные от сельскохозяйственных предприятий, стремящихся лучше понять растения и почву, данные от клиентов из медиаиндустрии, желающих упорядочить свои библиотеки контента, данные от производителей, работающих над сокращением дефектов продукции, и многое другое.
По мере того как тянулись месяцы, я ходил туда-сюда, балансируя между двумя учреждениями, которые лучше всего подходят для того, чтобы внести свой вклад в будущее ИИ. Оба были полны талантов, творчества и видения. Оба имели глубокие корни в истории науки и техники. К ним даже можно было добраться по одной и той же автостраде, расположенной всего в нескольких выездах на 101-е шоссе. Но только у одной из них, похоже, хватало ресурсов для адаптации, поскольку барьеры на пути к успеху росли, как гора, возвышающаяся над горизонтом, а ее пик был намного выше облаков.
Мои мысли постоянно возвращались к тем восьмистам графическим процессорам, пробивающим себе дорогу через вычислительную нагрузку, которую профессор и ее студенты даже не могли себе представить. Так много транзисторов. Столько тепла. Столько денег. Слово "головоломка" не передавало того ужаса, который я начинал испытывать.
ИИ становился привилегией. Исключительно эксклюзивной.
Еще со времен ImageNet было ясно, что масштаб важен, но в последние годы это понятие приобрело почти религиозное значение. Средства массовой информации были перенасыщены стоковыми фотографиями серверных помещений размером с городской квартал и бесконечными разговорами о "больших данных", укрепляя идею масштаба как своего рода магического катализатора, призрака в машине, который отделял старую эру ИИ от бездыханного, фантастического будущего. И хотя анализ мог стать немного упрощенным, он не был ошибочным. Никто не мог отрицать, что нейронные сети действительно процветали в эпоху изобилия: ошеломляющие объемы данных, массивные многоуровневые архитектуры и акры взаимосвязанного кремния действительно привели к историческим изменениям.
Что это означало для науки? Что это говорит о наших усилиях как мыслителей, если секрет нашей работы может быть сведен к чему-то столь голому, количественному? К тому, что в конечном итоге кажется грубой силой? Если идеи, которые, казалось бы, проваливались при слишком малом количестве слоев, или слишком малом количестве обучающих примеров, или слишком малом количестве GPU, внезапно оживали, когда их количество просто достаточно увеличивалось, какие уроки мы должны были извлечь о внутренней работе наших алгоритмов? Все чаще и чаще мы обнаруживали, что наблюдаем за ИИ эмпирически, как будто он возникает сам по себе. Как будто ИИ - это нечто, что нужно сначала определить, а потом понять, а не разрабатывать на основе первых принципов.
Характер наших отношений с искусственным интеллектом менялся, и это было интригующей перспективой для ученого. Но с моего нового места работы в Google Cloud, откуда с высоты птичьего полета открывается вид на мир, все больше зависящий от технологий на всех уровнях, сидеть сложа руки и удивляться тому, что все это происходит, было роскошью, которую мы не могли себе позволить. Все, что могло делать это новое поколение ИИ - хорошее или плохое, ожидаемое или иное, - было осложнено отсутствием прозрачности, присущей его конструкции. Тайна была вплетена в саму структуру нейронной сети - некоего колоссального множества крошечных, тонко взвешенных единиц принятия решений, бессмысленных по отдельности, ошеломляюще мощных при организации в самых больших масштабах и, таким образом, практически не поддающихся человеческому пониманию. Хотя мы могли говорить о них в некотором теоретическом, отстраненном смысле - что они могут делать, какие данные им нужны для этого и каков общий диапазон их характеристик после обучения, - что именно они делают внутри, от одного обращения к другому, было совершенно непрозрачно.
Особенно тревожным следствием этого факта стало появление угрозы, известной как "атаки противника", при которых исходные данные подготавливаются с единственной целью - запутать алгоритм машинного обучения, чтобы добиться неинтуитивных и даже разрушительных целей. Например, фотография, на которой, казалось бы, изображено нечто однозначное - жираф на фоне голубого неба, - может быть изменена с помощью тонких колебаний цветов отдельных пикселей, которые, хотя и незаметны для человека, вызовут каскад сбоев в нейронной сети. При правильной настройке результат может превратить правильную классификацию, например "жираф", в дико неправильную, например "книжная полка" или "карманные часы", при этом исходное изображение останется неизменным. Но если над зрелищем, когда передовые технологии спотыкаются о фотографии дикой природы, можно только хихикать, то атака противника, призванная обмануть самодвижущийся автомобиль и заставить его неправильно классифицировать знак "Стоп", не говоря уже о ребенке на пешеходном переходе, вряд ли покажется смешной.
Конечно, не исключено, что в этом может помочь более глубокая инженерия. Новое, обнадеживающее направление исследований, известное как "объяснимый ИИ", или просто "объяснимость", стремилось свести почти магические рассуждения нейронных сетей к форме, которую человек мог бы тщательно изучить и понять. Но это направление находилось в зачаточном состоянии, и не было никакой уверенности в том, что оно когда-нибудь достигнет тех высот, на которые рассчитывали его сторонники. Тем временем модели, которые она должна была осветить, распространялись по всему миру.
Даже полностью объяснимый ИИ будет лишь первым шагом; встраивания в уравнение безопасности и прозрачности после факта, каким бы изощренным оно ни было, будет недостаточно. Следующее поколение ИИ должно быть разработано с принципиально иным отношением с самого начала. Энтузиазм - это хороший первый шаг, но настоящий прогресс в решении таких сложных и негламурных задач требует благоговения, которого в Кремниевой долине, похоже, просто не было.
Академики давно знали о негативном потенциале ИИ в таких вопросах, как отсутствие прозрачности, подверженность предвзятости и негативному влиянию, и тому подобное, но, учитывая ограниченный масштаб наших исследований, риски всегда были теоретическими. Даже окружающий интеллект - самая значительная работа, которую когда-либо проводила моя лаборатория, - имел бы достаточно возможностей столкнуться с этими подводными камнями, поскольку наше волнение всегда было сдержано клиническими правилами. Но теперь, когда у руля стояли компании с рыночной капитализацией, приближающейся к триллиону долларов, темп работы радикально ускорился. Готовы мы к этому или нет, но эти проблемы нужно было решать со скоростью бизнеса.
Как бы ни пугала каждая из этих проблем в отдельности, они указывали на будущее, которое будет характеризоваться меньшим надзором, большим неравенством и, при неправильном подходе, возможно, даже неким надвигающимся цифровым авторитаризмом. Было неловко размышлять об этом, прогуливаясь по коридорам одной из крупнейших компаний мира, особенно если учесть искренность и добрые намерения моих коллег. Это были институциональные, а не личные проблемы, и отсутствие очевидных злодеев с закрученными усами только еще больше запутывало проблему.
Я вспомнил о своей работе с Арни и о том, как трудно было внедрить небольшие, сделанные вручную прототипы всего в нескольких больницах. Инновации в мире здравоохранения, отличающемся повышенной осторожностью, внедрялись постепенно, и хотя этот факт иногда разочаровывал, он же и успокаивал. Я задался вопросом, не является ли этот пример примером, которому стоит следовать более широко.
Кремниевую долину никогда не обвиняли в отсутствии высокомерия, но эра искусственного интеллекта вознесла корпоративное бахвальство на новую высоту, даже когда наше понимание его подводных камней , казалось, росло. Руководители компаний по всему миру выступали с программными речами, которые варьировались от провидческих до неуклюжих и откровенно оскорбительных, обещая автомобили, которые скоро будут ездить сами, виртуозные алгоритмы обнаружения опухолей и сквозную автоматизацию на заводах. Что касается судеб людей, которых эти достижения вытеснят с рабочих мест, - водителей такси, дальнобойщиков, рабочих сборочных линий и даже врачей-рентгенологов, - то настроения корпораций, похоже, находились где-то между полусерьезными разговорами о "переквалификации" и тонко завуалированным безразличием.
Но как бы ни отталкивали общественность слова руководителей компаний и самопровозглашенных футуристов, растущее внедрение технологии давало людям еще больше причин бояться ИИ. Это была эпоха вех, и приближалась самая мрачная из всех, которые только можно себе представить. Впервые в истории нашей области будет пролита кровь.
Элейн Херцберг погибла, когда прототип самодвижущегося автомобиля, тестируемый группой перспективных технологий Uber, сбил ее, когда она толкала велосипед по дороге в Темпе, штат Аризона. Менее чем через три года после того, как Uber организовала отток преподавателей с кафедры робототехники Карнеги-Меллона, амбиции компании в области самодвижения стали объектом общественного презрения. Если теперь частые столкновения ИИ с предрассудками вызывали у меня и моих коллег тошноту, то ощущения, которые мы испытывали сейчас, не поддавались описанию. Хотя было легко обвинить Uber - и без того печально известный бренд по причинам, не имеющим никакого отношения к технологиям, - было совершенно ясно, что это далеко не последняя подобная история.
Действительно, вскоре были получены дополнительные уроки. Серия расследований ProPublica 2016 года зафиксировала широкое использование предвзятого искусственного интеллекта для помощи кредиторам в обработке заявок на получение займов и даже для помощи судьям в принятии решений об условно-досрочном освобождении. Аналогичные репортажи выявили сомнительное использование технологии для отбора кандидатов на работу еще до собеседования с людьми, часто с непреднамеренным (но не удивительным) дискриминационным эффектом. Смерть Элейн Херцберг справедливо вызвала отказ от инициативы Uber по созданию самодвижущихся автомобилей и поставила крест на всей сфере, но такие быстрые исправления были бы невозможны для этих более тонких, более институциональных форм вреда. Это были почти безмолвные проблемы, действующие в гораздо больших масштабах и с гораздо меньшим надзором. Ожидать такого же уровня общественного возмущения было нереально. Но осведомленность росла, и СМИ понимали, что при освещении ИИ нельзя игнорировать такие вопросы, как предвзятость, справедливость и конфиденциальность.
По мере того как я начинал осознавать этот новый ландшафт - неподотчетные алгоритмы, целые сообщества, которым отказано в справедливом отношении, и оборванные человеческие жизни, - я пришел к выводу, что простые ярлыки больше не подходят. Даже фразы вроде "вышел из-под контроля" казались эвфемистическими. ИИ - это не феномен, не нарушение, не загадка, не привилегия. Мы находились в присутствии силы природы. Что-то настолько большое, мощное и капризное, что оно может разрушить так же легко, как и вдохновить. Чтобы сделать его достойным нашего доверия, потребуется гораздо больше, чем корпоративные бромиды.
Это была сложная ситуация, которая регулярно усугублялась тем, что ИИ был не единственной угрозой для общественного блага со стороны технологического мира. Параллельно происходили такие события, как скандал с Cambridge Analytica, широко распространенные опасения по поводу дезинформации во время президентских выборов 2016 года в США и растущие сообщения о плохом влиянии социальных сетей и "пузырей" фильтров в новостных лентах. Тем не менее, общий знаменатель был достаточно устойчивым. Мир просыпается к мысли о том, что данные не только ценны, но и влиятельны - даже детерминированы - в такой степени, как никогда раньше.
К 2018 году уже никто не сомневался в том, что ставки высоки. Приложения для социальных сетей, такие как Facebook и Instagram, подвергались все более пристальному вниманию, поскольку гиперперсонализированный контент, который они подавали, отточенный до тревожного состояния искусственным интеллектом для максимального "вовлечения", стал потенциальной причиной подростковой депрессии и тревожности. Amazon подверглась критике в прессе за практику работы на складах, где используется ряд инструментов наблюдения, включая браслеты для мониторинга, чтобы отслеживать производительность работников от одного момента к другому. Компания Microsoft столкнулась с критикой со стороны защитников неприкосновенности частной жизни и групп по защите гражданских свобод, когда пыталась продвинуть на рынок свою технологию распознавания лиц на основе искусственного интеллекта. Я тоже оказался в центре разногласий, когда контракт Google Cloud с Министерством обороны, известный внутри компании как Project Maven, вызвал широкие дебаты в компании. В течение нескольких месяцев напряженность выплеснулась в прессу, вновь поднимая вопросы о роли наших технологий в военных делах. Наступила техногенная вспышка, и теперь ИИ не отделить от нее.
"Мы будем ждать, прямо здесь", - сказал я.
Было 5:30 утра. Я наблюдал, как медсестра везет мою мать в операционную для очередной процедуры на открытом сердце - самой инвазивной. Остальные пожелания я произнесла под дых, по молчаливой традиции китайских семей.
Люблю тебя, мама.
Не зная, чем себя занять, я встал через несколько тоскливых минут и стал бродить по коридорам, пока не нашел тихую скамейку, подальше от шума и движения, а затем опустился на нее. Ее металлическая поверхность оказалась холоднее, чем я ожидал, и заставила меня вздрогнуть. Здесь была только я, голова, полная мыслей, с которыми я не была готова встретиться, и пустое место слева от меня, где в любой другой день могла бы сидеть моя мама. Возможно, колючая и осуждающая, но всегда рядом и всегда на моей стороне.
Прошло мгновение, и я понял, что пространство не пустое. Меня нашел отец. Он выглядел так, словно хотел что-то сказать, но не знал, как это сделать.
"Фей-Фей..." - начал он. Его тон был нехарактерно серьезным. Даже взрослым. Но я чувствовала не силу или власть. Это была уязвимость.
"Все любили моего отца, когда я был мальчиком, - сказал он в конце концов. "Особенно я. Я когда-нибудь рассказывал вам о нем? Мы не были богаты, но жили в достатке, особенно для такого маленького городка, как наш. Это было очень удачное воспитание. Я чувствовал себя... особенным".
Я не знала, что и думать об услышанном. Он так редко говорил о своем прошлом - об отсутствующем дедушке, о детстве, из которого он так и не смог вырасти, о нашей семье, помимо меня и моей матери. Но он продолжал, все глубже погружаясь в историю, которую я никогда не слышал.
Мой отец не рос со своей матерью из-за какого-то тяжелого, но неясного психологического заболевания, о котором он говорил сдержанно. Несмотря на это или, скорее, благодаря этому, его отец - мой дед - баловал его по полной программе. Мой дед не был особенно богат или влиятелен, но он занимал административную должность в таком маленьком городке, что даже намека на статус было достаточно, чтобы получить скромную привилегию или две. Это было счастливое время для моего отца, огражденное от сложностей эпохи и полное приключений, которые, как я предполагал, должен был пережить человек с его характером.
Я громко рассмеялся, когда он рассказал мне о своем любимом домашнем животном: медведе - настоящем, реальном медведе, которого он вырастил сам, пока тот не вырос до таких опасных размеров, что его пришлось отдать в зоопарк. Конечно, я не должен был удивляться: большинство мальчиков, обладающих хотя бы номинальной привилегией, мечтают использовать ее для получения образования или карьеры, но мой отец не был большинством мальчиков. Конечно, он использовал бы их, чтобы выгуливать медведя по городу на поводке. Узел в моем животе ослаб. По общепринятым меркам он был не слишком хорошим родителем, но в таких моментах все равно было что-то впечатляющее. Он действительно мог привнести тепло в любой случай.
Но история приняла другой оборот, когда на моего дедушку обрушился внезапный приступ болезни. Началось все загадочно, как это часто случалось в то время, и усугубилось их изоляцией. Они остались вдвоем в городе с такими ограниченными средствами, что адекватная медицинская помощь была практически невозможна. Мой отец был бессилен вмешаться, хотя симптомы деда - усталость, спутанность сознания и быстро пропадающий аппетит - становились все хуже и хуже.
В отсутствие должного ухода мой дед просто развалился на части, превратившись за считанные месяцы в инвалида. Мой отец мог лишь наблюдать за ним с постели, не в силах остановить его - центр его мира - от исчезновения на глазах. Когда смерть наконец наступила, она казалась бессмысленной и недостойной. Врач, прибывший слишком поздно, пытался объяснить, что крайнее недоедание усугубило состояние желудочно-кишечного тракта, в результате чего его организм не выдержал. Но объяснения мало что значили для мальчика, так внезапно оказавшегося в одиночестве. В этом не было никакого смысла.
Это был 1961 год. Моему отцу было четырнадцать лет.
Чудесным образом коллега моего дедушки вызвался вмешаться и стал законным опекуном моего отца в отсутствие живых родственников. Он устроил его в школу, обеспечил удовлетворение его основных потребностей и позаботился о том, чтобы он доучился до конца. Щедрость этого человека позволила моему отцу выжить в период, который в противном случае съел бы его заживо. Но он уже никогда не был прежним.
Когда умер мой дед, вместе с ним умерла и часть моего отца. Осталась лишь частица мальчика, единственное уцелевшее доказательство того, что мир, который он любил и потерял, когда-либо существовал. Поэтому он решил остаться таким, каким был. Даже став взрослым, получив высшее образование и став в итоге мужем и отцом, он продолжал жить жизнью того мальчика, каким он его помнил.
Однако кое-что все же прояснилось. За милыми улыбками, дурацкой игрой слов и вечным отказом от ответственности скрывалась тайная боль, не желающая заживать и кипящая по прошествии стольких лет. Она лежала в основе его единственного убеждения: капризный и жестокий мир, забравший его отца, никогда не заберет его самого. Он никогда не заберет мою мать. И никогда не заберет меня.
Тогда-то все и прояснилось. Мой отец не просто раскрывал историю моей семьи или частные причины, по которым он разделял желание моей матери сбежать. Это были слова человека, который отчаянно пытался как-то подготовить свою дочь к потере матери. Он вытаскивал на поверхность свое самое старое, глубокое горе, погребенное под десятилетиями новой жизни, чтобы мы могли вместе встретить новое горе. Он защищал меня. Столько лет я думала, что его подростковый возраст никогда не закончится, а на самом деле он закончился - слишком рано. Он всегда казался мне ребенком, застывшим во времени, но в тот момент я увидела нечто новое. Под всем этим билось отцовское сердце.
Приближался конец моего второго десятилетия работы в области ИИ, а также конец второго года работы в Google, и я никогда еще не чувствовал себя так плохо. Хаос в моей области охватывал все, включая меня. Но я также начал осознавать закономерность, которая, казалось, определяла мою жизнь. Как бы трудно ни было, что-то напоминало мне о том, что значит быть человеком посреди всего этого. Каждый раз я был благодарен.
Разговоры о профессиональной этике сложны практически в любой обстановке, но в один из дней осени 2018 года, когда я стоял в переполненном конференц-зале и пытался ответить на вопросы команды инженеров и менеджеров по продуктам, которые теперь подчинялись мне, это было особенно напряженно. После стольких потрясений - как в нашей отрасли, так и за ее пределами, от культуры до политики, - момент размышлений казался мне давно назревшим.
"Знаете, - начал я, делая длинные паузы, разделяющие мои слова, - я люблю физику почти столько, сколько себя помню. Но невозможно отделить красоту науки от чего-то вроде, скажем, Манхэттенского проекта. Это просто реальность. У ИИ есть свои козлы отпущения, будь то роботы-убийцы, повсеместная слежка или даже просто автоматизация всех восьми миллиардов людей, лишивших нас работы. Это страшные вещи, и их стоит опасаться. Но это крайности, и они, скорее всего, не произойдут завтра".
Я выдержал долгую паузу, обдумывая свои следующие слова.
"И вот тут, я полагаю, все становится по-настоящему сложным. Потому что в это время нужно учитывать еще очень многое. Много хорошего и много плохого, причем некоторые из них могут произойти уже завтра. Поэтому я надеюсь, что вы сможете оценить возможности, которые нам открываются. Мы играем роль в том, что будет дальше. Мы должны относиться к этому серьезно. Именно поэтому этические рамки так важны. Что-то, что поможет нам оценить каждый наш шаг, прежде чем мы его сделаем".
На мгновение в комнате воцарилась тишина.
"Могу я задать вопрос?" Голос принадлежал недавно нанятому научному сотруднику, сидевшему в дальнем углу комнаты. Она была блестящей и высокотехничной, недавно окончила одну из самых элитных школ мира. Но голос ее звучал робко. "Эта идея "этических рамок"..."
"Да?"
"... что это значит?"
Это был более фундаментальный вопрос, чем я ожидал, и, вероятно, именно тот, который мы все должны были задать.
Присоединяйтесь к команде, помогающей местным одиночкам найти любовь с помощью больших данных, аналитики и искусственного интеллекта! Сейчас мы принимаем на работу!
С заднего сиденья я прищурился на очередной рекламный щит на 101-м шоссе. Я начал задумываться, не является ли реальной угрозой ИИ то, что становится невозможным рекламировать что-либо, кроме ИИ. Прошло несколько месяцев после моего разговора об этике нашей работы с командой, и с тех пор этот вопрос часто приходил мне на ум. Голос моего коллеги прервал размышления.
"Эй, взгляни", - сказал он, протягивая мне несколько распечатанных страниц. "Просто некоторые тезисы от PR-команды, которые мы могли бы использовать".
Я улыбнулся, глядя вниз, но это были не те слова, которые подняли мне настроение, пока наша машина ползла сквозь очередную утреннюю пробку на южном направлении . Мы ехали в Маунтин-Вью, чтобы принять участие в ежегодной традиции, которую мне предстояло испытать во второй раз. Google привозит сотни своих летних стажеров - обширную когорту из офисов по всему миру - в Googleplex, чтобы встретиться с руководством и узнать больше о многочисленных путях развития своей карьеры. Для компании это было рекрутинговое мероприятие. Для меня же это был отдых от корпоративной жизни, который напомнил о лучших моментах работы преподавателем. Комната, полная ярких, молодых и, несомненно, перспективных мыслителей. И я могу поговорить с ними.
Обычно я с удовольствием следовал сценарию. В отличие от моего опыта свободного профессора, быть представителем Google означало отвечать перед столькими руководителями, PR-консультантами и даже юристами, что мысль о том, чтобы выйти из себя, могла быть откровенно пугающей. Мои заявления обычно представляли собой некую реконфигурацию одного и того же шаблона об искусственном интеллекте и бизнесе, который вежливо и без инцидентов доставлялся тому или иному репортеру или аудитории аналитиков. Я дошел до того, что мог практически декламировать слова по памяти.
Но это были странные времена, и что-то внутри меня жаждало перемен. Мои мысли вернулись к встрече с командой. Последний вопрос повторялся снова и снова: что именно означает "этические рамки"? В той мере, в какой я сам имел хоть какое-то представление о том, что может представлять собой это понятие, - а чем больше я об этом думал, тем больше понимал, - многое из того, что я знал об этике технологий, было счастливой случайностью нетрадиционной карьеры. Предложения Совета по институциональному надзору с Кристофом в Калтехе. Годы работы с такими людьми, как Арни, в больницах, углубленные благодаря сопровождению врачей на обходах и выслушиванию проблем медсестер. Родители дома, о которых я не переставал беспокоиться. Жизнь подростка-иммигранта.
Суровая правда заключалась в том, что в таких областях, как здравоохранение, существуют нормы, прецеденты и этические основы, которые создавались на протяжении веков, если не тысячелетий, с учетом неизбежной реальности жизни и смерти. ИИ, для сравнения, был настолько молод, что его собственный этический кодекс практически не существовал. Путь нашей области к самопониманию еще только начинался. Так что этических рамок не хватало не только Google, но и таким людям, как тот молодой инженер, задавший вопрос. Это были все мы.
Я притворялся заинтересованным в работе пиарщиков, сканируя выделенные неоном фрагменты, но я уже принял решение: к лучшему или худшему, эта речь будет без репетиций. Мне предстояло выступить перед семью сотнями самых влиятельных технических специалистов завтрашнего дня, и я решил говорить от всего сердца. Кроме того, поскольку мой отпуск подходил к концу, я чувствовал себя более чем интроспективно.
Несмотря на то, что работа в Google Cloud часто дезориентирует, я не могу не испытывать благодарности за время, проведенное в компании. Мне была предоставлена возможность, которая редко выпадает ученым: встретиться с людьми, на которых влияние исследований в моей области сказывается в самом большом масштабе, и хотя бы на мгновение посмотреть на них с их точки зрения. В течение двух лет я регулярно общался с руководителями, дизайнерами продуктов и разработчиками всех видов, как в стартапах, так и в корпорациях из списка Fortune 500, в таких отраслях, как финансовые услуги, сельское хозяйство, здравоохранение, энергетика, развлечения и транспорт. Это стало для меня уроком, более унизительным и более ясным, чем я мог себе представить, и самым непосредственным напоминанием о том, что ИИ - это уже не интеллектуальная диковинка, а поворотный пункт в жизни общества, который может изменить жизнь целых групп населения. В конце концов я понял, что ни одно учебное заведение не сможет выжить, не считаясь с этой технологией на каком-то уровне. Признаки были безошибочными. Я размышлял над тем, что видел, день за днем, неделя за неделей, месяц за месяцем, пытаясь лучше понять, с какой точкой перегиба мы столкнулись и что нужно сделать, чтобы пройти ее ответственно. Я был горд, оптимистичен и по-прежнему полон энтузиазма. Но никогда еще груз этой ответственности не казался мне таким тяжелым.
Куда бы я ни пошел, мой путь начинался со слов, которые я произносил, стоя на сцене перед этими стажерами. Я отойду от корпоративных идей, в которые погружался почти два года, и вместо этого предложу своего рода исповедь. Я планировал признать в словах, которые мне еще предстояло сформулировать, что перед нами лежит трудное будущее и что независимо от того, были ли мы студентами или профессорами, стажерами или генеральными директорами, все мы находились в темноте. Нам предстояло столкнуться с плохими новостями, понять трудные истины и столкнуться с реальной возможностью причинить вред. Но были и хорошие новости: еще не поздно встретиться с этим вместе.
Поднявшись на сцену, я почувствовал знакомых бабочек в животе. Но я утешался тем, что видел аудиторию, которую любил больше всего: студентов.
"Добрый день!" сказал я в микрофон. "Рад быть здесь".
Это были последние слова, которые я произнес в тот день по сценарию.
Я услышал в голосе матери монотонное неповиновение, как всегда - даже сейчас, спустя всего две недели после операции на открытом сердце, которая стала для нашей семьи самым близким столкновением с немыслимым. Здоровой или больной, молодой или старой - это было ее естественное состояние.
"Мы ведем этот разговор уже двадцать лет, Фей-Фей".
Я снова взглянул на экран - письмо все еще было видно. В сообщении от 7 июня 2018 года заместитель директора по персоналу Комитета по науке, космосу и технологиям Палаты представителей Конгресса США, похоже, приглашал меня дать показания. Это было пугающее предложение для человека, который никогда не занимался подобными вещами, а до слушаний, назначенных на двадцать шестое число, оставалось менее трех недель. Когда я размышлял о событиях, которые привели к настоящему моменту, - техножреце, предвзятом ИИ и многом другом, - мне казалось, что соглашаться на это предложение категорически не стоит. А зная, как сильно я нужен своей матери, признает она это или нет, становилось еще хуже. Честно говоря, я просто хотел, чтобы она приняла решение за меня, чтобы настояла на том, что сейчас безответственное время для моего отъезда. Но, как и положено, она была не в настроении предлагать короткие пути.
"Фей-Фей, помнишь, как мы приземлились в аэропорту Кеннеди? Наш первый момент в этой стране? Как это было, когда папа не пришел нас встречать?"
"Да, конечно".
"Те часы, которые мы провели у выдачи багажа, беспомощные? В ужасе? И теперь, два десятилетия спустя, вы получаете такое приглашение? Поехать в столицу этой страны? Чтобы свидетельствовать о предмете, который вы любите больше всего?"
"Да, но что, если все не так просто? Что, если они думают, что я участвую в каком-то скандале? Что если..."
"Тогда ты будешь отстаивать себя! Ты скажешь им, что двадцать лет посвятил этой стране, что твоя семья отдала все, чтобы стать ее частью, и что ты не хочешь, чтобы с тобой обращались как с чужаком!"
Если бы все это исходило от кого-нибудь другого, я бы только посмеялся. Выступать перед комитетом Конгресса с подобным тоном - это то, что большинство из нас лучше себе представить, чем сделать на самом деле. Но, зная мою маму, именно так она бы и сказала, если бы кто-то посмел усомниться в ее характере. Я подумал, не послать ли ее давать показания вместо меня.
"Подумайте о том, как отчаянно люди во всем мире жаждут подобного. Открытые слушания. Публичный диалог между лидерами и гражданами. Как вы думаете, почему мы с отцом привезли вас в эту страну?"
С ударом молотка началось слушание. Теперь пути назад не было.
"Комитет по науке, космосу и технологиям приступает к работе", - непринужденно произнесла в микрофон председатель комитета Барбара Комсток, представительница штата Вирджиния. "Доброе утро и добро пожаловать на сегодняшние слушания под названием "Искусственный интеллект - великая сила влечет за собой великую ответственность"".
По крайней мере, я понял отсылку к Человеку-пауку. Это должно было что-то значить. Тем не менее в голове плясали всевозможные невротические переживания. Тысяча пар глаз, казалось, сверлили мой затылок, пока я переосмысливал каждую деталь путешествия, которое привело меня сюда. Моя жизнь как иммигранта. Моя роль в развитии технологии, вызывающей все больше разногласий. Техношок. Все это.
Но чем больше я слушал, тем больше меня осеняло, что мои опасения по поводу этого момента были неуместны. Выступления представителей одно за другим демонстрировали вдумчивую, ищущую позицию, которая застала меня врасплох. Их голоса отражали любопытство, искренность и готовность работать с реальными идеями, какими бы сложными они ни были. Постепенно я понял, что пришел сюда не для того, чтобы меня поджаривали. У меня даже появилась возможность рассказать о состоянии моей матери и о том, какую роль оно сыграло, вдохновив меня на собственные исследования на стыке ИИ и здравоохранения. То, что, как я опасался, перерастет в конфронтацию, оказалось беседой о чем-то более простом, но глубоком: как будет выглядеть жизнь американцев в ближайшие десятилетия?
Именно в ответ на упоминание о моей матери представитель Комсток оторвалась от своих подготовленных выступлений и обратилась непосредственно ко мне, поделившись своими мыслями о проблемах, с которыми столкнутся США по мере старения населения.
Когда она уступила слово, представитель Техаса Рэнди Вебер спросил о здоровье моей матери. Я радостно заверила его, что ее состояние достаточно стабильно, чтобы я могла находиться здесь, и что она наблюдает за происходящим со своей больничной койки. "Привет, мама!" игриво вмешался представитель Комсток, в то время как представитель Вебер делился своими пожеланиями в народном стиле. Обмен мнениями был неожиданно милым, и это отодвинуло на задний план все мои страхи.
Я направил свои хорошие чувства на то, чтобы рассказать о том, каким, по моему мнению, может и должен быть ИИ. Я рассказал об опыте, который вдохновил AI4ALL, и о том, как много нового я узнал из этой программы за время ее существования. Я говорил об окружающем интеллекте и о том, насколько эта тема дорога моему сердцу. Я говорил о будущем и о том, как много, по моему мнению, может сделать ИИ для устранения пробелов в возможностях по всему миру.
Это была самая дружелюбная беседа из всех, что я когда-либо вел на эту тему. Благодаря влиянию представителя штата Иллинойс Билла Фостера, доктора физики, который до прихода в политику работал в Национальной ускорительной лаборатории имени Ферми Министерства энергетики, мы даже перешли на более ботаническую территорию. Его любознательность зарядила меня энергией и еще раз подчеркнула, насколько новым является ИИ как область исследований, на столетия моложе, чем более устоявшиеся занятия, такие как химия, биология и физика. Даже современный ИИ ближе к доньютоновской эпохе Галилея и Тихо Браге, когда явления наблюдались, каталогизировались и предсказывались, но единая модель еще не была формализована. Мы живем в захватывающий, зарождающийся момент, сказал я, все еще ожидая рассвета нашей "классической" эры.
"Я благодарю свидетелей за их показания, а членов Совета - за вопросы. Запись останется открытой в течение двух недель", - сказал представитель Вебер. "Слушания закрыты". Еще один удар молотка - и все закончилось.
Хорошо, подумал я, несколько раз моргнув, когда осознание того, что только что произошло, казалось, настигло меня. Я снова могу дышать.
Когда я шел обратно в отель, настроение столичных улиц было совершенно иным. Уровень адреналина начал снижаться, а мысли обрели более четкий ритм. Я чувствовал себя более похожим на себя. Но я все еще был без руля, не зная, за какой Северной звездой стоит следовать дальше.
Я снова включила телефон и позвонила Сильвио, не обращая внимания на почти непрерывное жужжание уведомлений. "Привет! Как она поживает? Есть новости?" спросила я.
"С твоей мамой все в порядке. Я только что позвонила медсестре, чтобы перепроверить. А как ты?"
"Я выжил, насколько я могу судить. Что вы думаете?"
"Я думаю, все прошло хорошо", - сказал он, который, вероятно, только что посмотрел больше C-SPAN, чем когда-либо в своей жизни. "Я не заметил особых нервов".
Слава Богу. Это была не только я.
"Но знаете что? Наверное, я получил неверное представление о фильмах, потому что на самом деле все это было не так уж и интересно", - добавил он с усмешкой.
Я рассмеялся громче, чем ожидал.
Когда слушание наконец осталось позади, я стал представлять себе, как все могло бы пройти по-другому. Например, оно могло бы быть гораздо длиннее, . И в нем могло бы участвовать гораздо больше свидетелей с более широким спектром знаний. Повестка дня могла бы охватить больше тем, и результаты могли бы быть представлены в большем количестве форм. Но даже такие понятия, как "дольше" и "больше", казались какими-то маленькими. Было так много интересного.
Кроме того, мы все еще находились в центре того, что казалось глобальной бурей. Каждый день, казалось, приносил новые заголовки об угрозе автоматизации для работников по всему миру. Опасения журналистов и правозащитников только усиливались по мере того, как ИИ использовался для слежки, модернизируя вековые угрозы частной жизни и достоинству личности. И несмотря на первоначальное возмущение, алгоритмическая предвзятость все еще нависала над технологией в целом, а также над проблемами репрезентативности, которые так часто с ней ассоциируются.
Я использовал много разных слов, чтобы описать это новое воплощение того, что когда-то считал исключительно наукой. "Феномен". "Нарушение". "Загадка". "Привилегия". "Сила природы". Но по мере того как я повторял свои шаги по столице, одно новое слово выходило на первый план. ИИ стал обязанностью. Для всех нас.
Я был уверен, что это вызов, который стоит принять. Глубокое обучение развивалось так быстро, что с каждым годом оно ощущалось как совершенно новая область, а его приложения становились все глубже и разнообразнее так стремительно, что даже штатным аспирантам и постдокам, не говоря уже о профессорах, было трудно угнаться за литературой. Не было конца ни возможностям, ни проблемам, которые еще оставались. Даже в такое мрачное время ИИ обладал способностью вдохновлять, как ничто другое. Для того чтобы по-настоящему решить все эти проблемы - проблемы глобального масштаба, возможности исторического масштаба и открытые вопросы, на раскрытие которых может уйти несколько поколений, - потребуется гораздо больше, чем может дать корпоративная стратегия или академическая учебная программа.
Что делает компании Кремниевой долины такими могущественными? Дело не только в их миллиардах долларов, миллиардах пользователей или даже в непостижимой вычислительной мощи и хранилищах данных, которые превосходят ресурсы академических лабораторий. Они сильны тем, что под их крышей работают тысячи уникально талантливых умов. Но они могут только использовать эти умы - они не формируют их. Я неоднократно наблюдал последствия этого: блестящие технологи, способные создать практически все, что угодно, но при возникновении вопроса об этике их работы они отводили взгляд.
Пришло время пересмотреть подход к преподаванию ИИ на всех уровнях. В ближайшие годы специалисты-практики будут нуждаться не только в технологических знаниях, но и в философии, этике и даже юриспруденции. Они должны будут видеть все то, что Арни сделал так, чтобы команда по созданию окружающего интеллекта видела, и они должны будут интегрировать его во множество предметов. Исследования тоже должны будут развиваться. А после проведенного дня я понял, что нам нужен новый подход и к политике - для начала нужно организовать обучение по этой теме для избранных чиновников, подобных тем, с которыми я только что встретился.
Многое можно было себе представить, но все это было связано воедино благодаря одному важному фактору: университету. ИИ зародился там задолго до того, как кто-то начал делать на нем деньги. Именно там до сих пор чаще всего можно почувствовать искру какого-нибудь совершенно неожиданного исследовательского прорыва. Перцептроны, нейронные сети, ImageNet и многое другое появилось именно в университетах. Все, что я хотел создать, уже было там. Нужно было только применить их на практике.
Это, в совокупности, и есть следующая Северная звезда: переосмысление ИИ с нуля как практики, ориентированной на человека. Я вижу в этом не столько изменение направления движения, сколько расширение его рамок. ИИ должен стать таким же преданным человечеству, каким он всегда был для науки. Он должен оставаться сотрудничающим и почтительным в лучших академических традициях, но не бояться противостоять реальному миру. Звездный свет, в конце концов, многогранен. Его белое сияние, будучи разгаданным, открывает все цвета, которые можно увидеть.
Глава 12. Следующая северная звезда
Было приятно вернуться.
Несмотря на нейтральные цвета и мягкое освещение, аудитория Nvidia Auditorium кипела энергией. Лекционный зал был забит до отказа, и жаждущие слушатели сидели на полу, на лестнице и у задней стены, с ноутбуками на коленях и между скрещенными ногами. Сотни других наблюдали за происходящим удаленно, в общей сложности около шестисот человек. Это была весна 2019 года и набор на курс CS231n: Convolutional Neural Networks for Visual Recognition" взорвался с момента его появления тремя годами ранее. Этот предмет быстро стал моим любимым.
Стоя у кафедры, я вспомнил, какой трепет испытывал, будучи первокурсником в Принстоне, спеша занять место в этом переполненном зале. Я вспомнил, как замирал от предвкушения, когда стихали разговоры и появлялся профессор, мгновенно покоряя класс своим, как мне казалось, сверхчеловеческим присутствием. Теперь я понимаю, насколько человечны наши ученики - возможно, они достигли больших успехов, но в то же время они уязвимы и ошибаются так, как я и представить себе не мог, будучи студентом. Тем не менее, классная комната остается для меня необычайно особенным местом, а моменты, подобные этому, просто потрясают воображение.
Для многих присутствовавших сегодня это будет первое знакомство с идеями , которые я так долго любил, и мне была оказана честь их представить. Мой опыт обучения у Боба вернулся ко мне - мистеру Сабелле, каким я его тогда знал, - и напомнил мне, какой глубокий след может оставить учитель в жизни молодого человека. Нам доверено делиться особым видом радости. Трепет знаний, прилив новых возможностей. Конечно, это чувство не может длиться долго, поскольку в конечном итоге оно осложняется карьерой, публикациями, собеседованиями, а может быть, и венчурным капиталом и прогнозами доходов. Но в такие моменты разум - это все, что имеет значение. Возможно, некоторые люди в этой комнате собирались открыть для себя что-то, за чем стоит гнаться.
И все же я должен был признать, как много изменилось с тех пор, как я в последний раз сидел за этими креслами, и как много я увидел за прошедшие годы. Конференц-залы Google. Центры обработки данных размером со склад. Больницы. Паническая прогулка по Вашингтону. ИИ по-прежнему оставался моей любимой наукой, но теперь это была уже не только наука. Кем бы ни суждено было стать этим студентам - исследователями, дизайнерами продуктов, руководителями высшего звена, политиками или кем-то еще, чего я даже не мог себе представить, - они унаследуют огромную ответственность.
"Общий знаменатель всего этого, - сказал я вслух, - будь то устранение предвзятости в наших данных или защита пациентов в больницах, - это то, как наши технологии относятся к людям. В частности, к их достоинству. Именно к этому слову я постоянно возвращаюсь. Как ИИ может, прежде всего, уважать человеческое достоинство? Из этого вытекает очень многое".
Это был не самый отрепетированный момент, и некоторым слушателям он мог показаться немного левым. Но это шло от сердца, и я знал, что это не последний раз, когда я говорю об этих проблемах.
"ИИ, ориентированный на человека", - сказал я, наконец-то озвучив термин, над которым размышлял уже несколько месяцев. "Именно так я назвал эту идею. Надеюсь, это словосочетание будет точно описывать всю мою карьеру. И я надеюсь, что она будет иметь значение для всех вас в ближайшие годы".
Как обычно бывает в первый день курса, образовалась очередь из желающих задать последующие вопросы. Но эта очередь тянулась от пюпитра в передней части комнаты до задней стены.
"Здравствуйте, профессор Ли", - спросил студент, стоящий в начале очереди. "Мне очень нравится глубокое обучение. Я прочитал все, что мог".
"Я тоже в восторге от этого! Ты выбрал отличную сферу деятельности".
"Итак, вы создали ImageNet, верно?"
"Мне много помогали, но да", - сказал я с улыбкой. Узнаваемость имени - не лучшая причина для того, чтобы заниматься наукой, но положительные отзывы всегда ценятся.
"Да, мне просто интересно, были ли у вас... ну, не знаю, какие-нибудь другие идеи с тех пор?"
Ой. Вот тебе и повышение самооценки.
В этом, конечно, и заключается очарование студентов. Они, как правило, неуклюжие собеседники, но у них есть умение перейти к делу. У меня был соблазн поделиться парой идей, над которыми работала моя лаборатория, но в последний момент я изменил курс.
"На самом деле, я думаю, что да. Все еще находится на ранних стадиях, но я настроен оптимистично. На самом деле, я говорил об этом буквально минуту назад".
"О, вы имеете в виду... человеко-ориентированный ИИ?"
"Ориентирован на человека", - ответил я со смехом. "По крайней мере, я так думаю. Над названием тоже еще работаю".
"Хм..." Студент почесал голову. "Звучит интересно, но это не то, что я ожидал услышать на подобном занятии. Наверное, это заставляет меня задуматься... какое отношение этика и общество имеют к написанию кода и прочему?"
Здание Gates Computer Science Building кажется мне одновременно величественным и скромным. Благодаря высоким потолкам и мраморным полам в его вестибюле царит эхо, как в музее, а сводчатые, размером с театр, классы отдают должное силе идей. Но лучше всего мне знакомы тесные коридоры верхних этажей, где находится моя лаборатория, а также SAIL. Теперь в этом здании, в отремонтированном крыле на первом этаже, расположилось нечто новое: штаб-квартира Стэнфордского института искусственного интеллекта, ориентированного на человека, или Стэнфордского института искусственного интеллекта (Stanford HAI).
Меня радует символизм такой явно гуманистической организации в самом сердце одного из старейших в стране факультетов информатики. Но амбиции Stanford HAI - стать центром междисциплинарного сотрудничества - не просто поэтичны, они уже воплощаются в жизнь. В любой день я обязательно встречусь с кем-нибудь вроде Дэна Хо из Стэнфордской школы права, Роба Райха, профессора политологии, Мишель Элам, профессора гуманитарных наук, или Сурии Гангули, физика-теоретика струн, ставшего вычислительным нейробиологом. Каждый из них с готовностью согласился стать частью HAI, работая непосредственно со студентами и исследователями в области ИИ, изучая пересечения между нашими областями и делясь опытом, который они приобрели за время своей карьеры и жизни. Мы даже привлекли партнеров из-за пределов кампуса, включая Эрика Бринйолфссона, известного экономиста из Массачусетского технологического института, который переехал через всю страну, чтобы помочь HAI лучше понять влияние ИИ на рабочие места, богатство и концентрацию власти в современном мире. Иногда возникает ощущение, что вся дисциплина рождается заново, причем в более яркой форме, чем я мог себе представить еще несколько лет назад.
Одно партнерство, в частности, как никакое другое, изменило мое представление о возможностях. Когда я впервые встретил Джона Этчеменди десятью годами ранее, он был проректором университета, а я, переехавший с Восточного побережья, был одержим идеей все еще незавершенного ImageNet. За прошедшие годы мы стали соседями и друзьями, и мое уважение к глубине его интеллекта как ученого только возросло. Но за долгие годы работы администратором Джон приобрел опыт работы в сфере высшего образования - хороший, плохой и откровенно кафкианский - и точно знал, что нужно сделать, чтобы воплотить в жизнь маловероятное видение HAI. Не просто говорить о человеко-ориентированном ИИ или обсуждать его достоинства, а строить его, кирпичик за кирпичиком. Поэтому, когда он согласился сотрудничать со мной в качестве содиректора Stanford HAI, я понял, что у нас есть все шансы сделать это.
Среди моих любимых достижений нашего партнерства - Национальное исследовательское облако, или NRC, - общая платформа для разработки ИИ, полностью поддерживаемая государственным финансированием и ресурсами, а не частным сектором. Ее цель - сделать исследования в области ИИ доступными для ученых, стартапов, неправительственных организаций и правительств по всему миру, чтобы наша область не была навсегда монополизирована технологическими гигантами или даже такими университетами, как наш.
За два года до этого NRC был не более чем идеей. И без Стэнфорда HAI, скорее всего, так бы оно и осталось. Но в руках более разносторонней команды, включая экспертов в области права и государственной политики, это стало миссией. Джон, в частности, задействовал весь свой карьерный потенциал, привлекая университеты по всей стране для создания коалиции, столь впечатляющей, какой я еще не видел в академических кругах, и положил начало шквалу идей, предложений, перелетов через границу и дебатов, которые вскоре превратились в полностью реализованный законодательный проект, направляющийся на Капитолийский холм. Нам еще предстоит пройти долгий путь, чтобы сделать ИИ по-настоящему инклюзивным, но такие достижения, как NRC, - это значительные шаги в правильном направлении.
В сентябре 2020 года, спустя почти десять лет после нашего первого разговора, мы с Арни опубликовали всеобъемлющий обзор наших исследований под названием "Освещение темных пространств здравоохранения с помощью Ambient Intelligence". В нем мы представили наше полное видение интеллектуальных датчиков, которые расширяют сознание врачей и медсестер, позволяя им отслеживать хаос медицинской среды с невиданными ранее масштабами и последовательностью.
В статье описывается, какую роль может сыграть окружающий интеллект в улучшении ухода за пожилыми людьми, помощи в лечении хронических заболеваний, выявлении симптомов психических расстройств, отслеживании использования хирургических инструментов в течение всей операции, поддержании гигиены врача в течение всей смены и многом другом. И эта статья была опубликована не в журнале, посвященном компьютерным наукам, искусственному интеллекту или обработке информации, а в Nature, возможно, самом известном журнале во всей науке. Это было напоминание о том, что лучшая работа часто выполняется в общем пространстве науки в целом - в глобальном сотрудничестве, которое без колебаний преодолевает границы, - а не в "пузырях" наших собственных областей.
Я гордился этой работой, но впереди меня ждал долгий путь. Всего через пару месяцев после выхода обзора Nature, в декабре, журнал The Lancet опубликовал своеобразное опровержение под названием "Этические проблемы использования окружающего интеллекта в здравоохранении". Это была откровенная и тщательно аргументированная статья, в которой не было никаких штампов и предлагалось честное, но строгое рассмотрение последствий нашей работы. По словам авторов, потенциал окружающего интеллекта для повышения качества оказания медицинской помощи был сопряжен со "спектром этических проблем", многие из которых связаны с масштабным сбором данных, новыми проблемами конфиденциальности и, с более философской точки зрения, с природой информированного согласия в среде таких иммерсивных, децентрализованных технологий мониторинга. Хотя читать критику собственной работы всегда нелегко, эта статья была именно тем видом этического дискурса, который нужен ИИ, и я со многим в ней согласился.
Ambient intelligence, скорее всего, всегда будет основой исследований моей лаборатории, и достаточно взглянуть на моих родителей, чтобы вспомнить, почему я считаю эту работу такой важной. Именно поэтому даже сейчас я посвящаю определенную часть каждого дня тому, чтобы быть в курсе последних экспериментов, испытаний и изменений в законодательстве. Но когда я размышляю о том, как быстро развивалась наша область в последние несколько лет - прорывы в распознавании объектов, создание человекоподобных описаний фотографий и даже видео, - мне становится все труднее игнорировать общую мысль: при всей изощренности этих методов они, по сути, сводятся к пассивному наблюдению. В той или иной форме каждый из них представляет собой экземпляр алгоритма, рассказывающего нам о том, что он видит. Наши модели научились наблюдать, иногда очень подробно и с поразительной точностью, но не более того. Конечно, думаю я в последнее время, что-то должно лежать за пределами этого.
"Эй, помнишь, о чем ты спросил меня пару лет назад в первый день занятий? Мне интересно, остался ли он с тобой".
Кофе-брейк закончился, и мы со студентом возвращались в лабораторию, держа в руках бумажные стаканчики с крышками.
"Вообще-то да", - улыбнувшись, напомнил он. "Я спросил вас, какое отношение этика имеет к этим вещам".
"Ну?" Я улыбнулся в ответ. "Думаете, вы нашли ответ?"
Он вздохнул, глядя на небо, краски которого потускнели, когда полдень сменился ранним вечером.
"Честно? Не совсем. И я определенно думала об этом. Как я мог не думать? В последнее время об этом говорят во всех новостях. Я даже ходила на занятия к профессору Райху".
Он имел в виду курс "Компьютеры, этика и государственная политика", созданный компьютерщиком Мехраном Сахами, ученым-политологом Джереми Вайнштейном и Робом Райхом, политологом и этиком, который до сих пор является одним из основателей HAI. Я кивнул.
"Я знаю, что все это важно на бумаге, наверное". Он сделал глоток кофе. "Но я не знаю. Послушай, Фей-Фей, мой робот до сих пор не может вытащить кусок хлеба из тостера. Работа сама по себе достаточно утомительна, понимаешь? И такое ощущение, что все публикуются без остановки. Я уже живу в страхе перед следующей конференцией и ее сроками публикации! Сколько же мозгов я должен тратить на этику того, что все еще кажется таким примитивным?"
Это был справедливый вопрос. Несмотря на невероятный прогресс ИИ за последнее десятилетие, очень многое в этой области все еще находится в зачаточном состоянии. В частности, робототехника - печально известная сложная технология, которая продолжает постепенно прогрессировать даже в эпоху повсеместного распространения глубокого обучения. В такие моменты, как этот, человекоориентированный ИИ может оказаться непростой задачей.
"Знаете, - начал я, - не так давно я был студентом. В то время отличить кошку от собаки было еще почти научной фантастикой. Затем глубокое обучение изменило все в одночасье, и наши алгоритмы стали использоваться так, что мы думали, что до этого еще десятилетия. Только подумайте, как много мы сейчас говорим о распознавании лиц. Журналисты, политики, активисты... у всех внезапно появились вопросы - и хорошие вопросы! Ведет ли все это к усилению слежки? К более предвзятым алгоритмам? Может быть, даже к оружию ИИ? И все это подкралось к нам так быстро".
Мы дошли до лаборатории. Я пронесла свой пропуск по считывающему устройству, и мы вошли в двойные двери.
"Я хочу сказать, - заключил я, - что все может измениться гораздо быстрее, чем вы думаете".
Я знал, что не убедил его. Не совсем. Но при всех своих опасениях он был достаточно заинтересован, чтобы продолжать слушать. Это было начало.
Скептицизм - обычное дело для новобранцев. Но внутри лаборатории, куда бы я ни посмотрел, можно было заметить признаки этики, ориентированной на человека. На доске с предыдущего вечера все еще виднелись записи проекта по обучению нейронных сетей на конфиденциальной информации, сохраняя при этом приватность ее владельцев, а на аналогичной доске велась работа по маскировке человеческих лиц в наборах данных изображений без ущерба для эффективности полученной модели.
Мы даже обратили критический взгляд на собственное наследие, приняв исследование, количественно определяющее предвзятость ImageNet в отношении расы, пола и сексуальности, которую мы впитали из тех миллионов фотографий, которые мы первоначально содрали из интернета. Полученные результаты послужили основанием для замены большого количества изображений альтернативными, представляющими более сбалансированную картину человеческой идентичности, а также для удаления ярлыков категорий с оскорбительным подтекстом.
Возможно, самым вдохновляющим, по крайней мере для меня, был тот факт, что наша работа никогда не была так сильно привязана к реальному миру. Если не считать злоключений одного младшего научного сотрудника с тостами, то десятилетний ренессанс машинного восприятия настолько фундаментально изменил робототехнику, что теперь ее трудно отделить от собственно ИИ. Как бы иллюстрируя это, две изящные механические руки, любовно названные Чарли и Адой, терпеливо сидели на металлической скамье в ожидании следующего упражнения. Сегодня они являются такой же неотъемлемой частью работы нашей лаборатории, как и любой алгоритм.
Тем не менее, даже самое современное оборудование - это средство достижения цели, поэтому главным принципом нашей работы остается благополучие людей, а не только эффективность процессов. Именно на этом основано наше сотрудничество с Лабораторией цифровой экономики, еще более новой исследовательской группой, организованной при Стэнфордском институте экономики, которая использует результаты опросов Бюро труда США, чтобы лучше понять, как люди оценивают свою работу - где они приветствуют удобство автоматизации, а где находят ее вторжение угрожающим или даже дегуманизирующим. Впервые я осознал это различие, работая с Арни над проектом "Окружающий интеллект": ИИ всегда должен стремиться расширить возможности человека, а не конкурировать с ним. Теперь это фундаментальная ценность нашей лаборатории.
Что именно означает эта ценность - вопрос для каждого отдельного исследователя, но примеров, радующих глаз, предостаточно. Например, одна из самых масштабных работ нашей лаборатории связана с кропотливым 3D-моделированием повседневных пространств - домов, офисов и больниц, каждый из которых имеет множество разновидностей, планировок и стилей. Это попытка погрузить наши алгоритмы в среду, в которой живут и работают люди и где интеллектуальные машины могут принести наибольшую пользу, особенно для тех, кто страдает от болезней и инвалидности. В другом проекте используются гарнитуры виртуальной реальности и перчатки с отслеживанием движений, которые позволяют исследователям демонстрировать реальные, значимые задачи, от складывания одежды до приготовления пищи, кодируя их движения в цифровом виде, чтобы создать эталоны для оценки работы роботов. В другом проекте исследуется новый подход к машинному обучению, при котором цифровые агенты создаются с учетом врожденного любопытства и помещаются в виртуальную среду, побуждающую их к игре, что является важной частью того, как дети обретают такую интуитивную связь с окружающей средой.
Каждая из этих историй представляет собой очередное изменение в том, как мы думаем о данных и чего мы от них ожидаем. Если раньше мы стремились дать нашим алгоритмам своего рода энциклопедическую осведомленность - обо всех категориях и вещах, - то теперь мы стремимся к чему-то более богатому. Более глубокого понимания пространств, моментов и даже смыслов, в которые эти вещи вложены. Расширение не только количества, но и деталей и нюансов. Новые подходы к данным, которые выходят за рамки простой курации и каталогизации и позволяют моделировать целые среды и действия, которые в них разворачиваются. Именно поэтому по мере роста гуманизма, лежащего в основе нашей работы, она сопровождается взрывом технической сложности. Формирование такого целостного представления о реальной жизни - более достоверного, чем когда-либо прежде, - потребует глубины и точности, на которые, как мне кажется, сейчас не способны даже наши самые совершенные технологии. Поэтому, повторюсь, волнение заключается в вызове. Нам снова придется развиваться.
Точная форма этой эволюции, конечно, остается загадкой, но интригующие намеки уже появляются. Среди наиболее значимых событий последних лет - растущий спектр альтернатив человеческому узкому месту в обучении модели - растущие затраты, время и даже этические проблемы, связанные с организацией достаточного количества ручного труда для подготовки наборов данных в больших и больших объемах, которые требует прогресс. Однако прогресс в том, как модели обрабатывают эти данные, в том, что касается их размера, способности работать параллельно и способности самостоятельно выявлять полезные закономерности - их "внимания", как это называется в литературе, - делает возможным обучение на наборах данных настолько больших, что в некоторых случаях они составляют значительную часть самого интернета. В случае с текстом, например, это часто означает всю Википедию, библиотеки книг и академических периодических изданий и даже истории сообщений на онлайн-форумах вроде Reddit. В результате, когда анализируется каждое слово, пробел и знак препинания, получается статистическая модель человеческого языка, настолько обширная и в то же время плотная, что она способна экстраполировать даже короткую подсказку - зародыш идеи в виде одного предложения, будь то вопрос, утверждение или строка диалога - в огромные массивы потрясающе реалистичной прозы. Полученные модели, которые теперь принято называть "большими языковыми моделями", или LLM, демонстрируют настолько беглую лингвистическую компетенцию, настолько неуловимо человеческую, что легко забыть, что читаешь не слова автора из плоти и крови.
Теперь, после стольких лет прорывов в области компьютерного зрения, LLM вызывают ренессанс в обработке естественного языка и, вполне возможно, предвещают следующую великую эпоху ИИ. Под капотом новый тип модели машинного обучения, известный как "трансформатор", который, вероятно, является самым большим эволюционным скачком в дизайне нейронных сетей со времен AlexNet в 2012 году, делает LLM возможными, воплощая в себе все необходимые качества: гигантский масштаб, возможность ускорить время обучения за счет обработки данных большими параллельными массивами и невероятно сложный механизм внимания. По любым меркам это веха, если не точка перегиба; почти сразу после публикации трансформатор продемонстрировал возможности, настолько впечатляющие, что они шокировали даже экспертов, стоявших за его созданием, и с тех пор прогресс не замедлился.
Мое первое знакомство с текстом, созданным с помощью большой языковой модели, было сюрреалистическим опытом, и оно заставило вспомнить о нашей работе с Андреем. Я вспомнил, как захватывающе было видеть, как в те дни ИИ составлял одно полное предложение - даже неуклюже сформулированное - для описания того, что он видел. Всего несколько лет спустя алгоритмы стали настолько искусными словесниками, что могут отвечать на вопросы, сочинять истории и даже объяснять шутки. Более того, зарождающийся класс "мультимодальных" сетей, обученных не только на тексте, но и на фотографиях, аудио, записанном голосе и даже видео, учится генерировать и эти медиа. Это развитие, которое на практике часто кажется опережающим на поколение или два: всего за десять лет алгоритмы прошли путь от попыток распознать содержимое фотографий до сверхчеловеческого уровня, а теперь, что удивительно, самостоятельно создают совершенно новые изображения, ничуть не хуже фотографических, но полностью синтетические и с зачастую тревожным уровнем реализма и детализации. Похоже, что эра глубокого обучения уже уступает место новой революции - наступает эра генеративного ИИ.
Но в основе этой технологии, которая даже мне порой кажется абсолютным волшебством, лежит еще один урок силы данных в больших масштабах. И, конечно, "масштаб" - это главное слово. Для сравнения: AlexNet дебютировала с сетью, состоящей из шестидесяти миллионов параметров - этого достаточно, чтобы разумно воспринимать набор данных ImageNet, по крайней мере частично. В то время как трансформаторы, достаточно большие для обучения на мире текстов, фотографий, видео и многого другого, имеют сотни миллиардов параметров. Это, конечно, создает бесконечные инженерные проблемы, но удивительно элегантную науку. Как будто эти возможности ждали нас все это время, со времен считывателя ZIP-кодов ЛеКуна, неокогнитрона Фукусимы или даже перцептрона Розенблатта. Со времен ImageNet. Все это было где-то здесь. Нужно было только сделать простую идею достаточно большой.
Однако все чаще такие объяснения кажутся простой семантикой. Большие языковые модели, даже мультимодальные, не могут быть "мыслящими" в самом прямом и великом смысле этого слова - и, чтобы мы не слишком увлекались, их склонность к абсурдным концептуальным промахам и готовность сочинять правдоподобно звучащую чепуху заставляет легко вспомнить об этом факте. Тем не менее, по мере того как они генерируют все более сложные тексты, изображения, голоса и видео - до такой степени, что все больший хор комментаторов бьет тревогу по поводу нашей способности отделить правду от фантазии, как отдельных людей, как институтов и даже как обществ, - не всегда ясно, насколько важна эта разница. Эта мысль становится особенно отрезвляющей, когда понимаешь, что все это - едва ли версия 1.0.
И так до бесконечности. Алгоритмы проявляют себя на уровне человеческой сложности. Роботы постепенно учатся ориентироваться в реальном окружении. Модели зрения обучаются не просто на фотографиях, а благодаря погружению в полностью трехмерные миры в реальном времени. ИИ, который генерирует так же бегло, как и распознает. И, поднимаясь вокруг нас, этические последствия, которые, кажется, с каждым мгновением все глубже проникают в человеческие дела. Но наука всегда была именно такой. Путешествие, которое становится все длиннее и сложнее по мере того, как оно разворачивается. Бесконечно разветвленные пути. Постоянно расширяющийся горизонт. Новые открытия, новые кризисы, новые споры. История, вечно находящаяся в первом акте.
Решение посвятить свою жизнь этой некогда малоизвестной области завело меня дальше, чем я мог себе представить. По какой-то исторической случайности я стал частью поколения, которое видело, как она превращается из академической арканы в материал для заголовков газет. Это позволило мне путешествовать по миру, сидеть за одним столом с мировыми лидерами, а в последние годы выступать на самых больших площадках, которые только существуют. Ослепительные огни, неоновые цвета, аудитория, сидящая рядами, которые, кажется, бесконечно простираются к горизонту. Это редкие привилегии, и каждая из них была неожиданной честью.
Но лаборатория остается тем местом, которое я люблю больше всего: гул флуоресцентных ламп, жесткие стулья, несвежий кофе, бесконечные щелчки и набор текста, скрип маркеров на досках. Так много произошло с тех пор, как в 2012 году появился AlexNet, с тех пор, как мы с Цзя начали работу над ImageNet в 2006 году, с тех пор, как Пьетро положил мне на стол распечатку исследования ЭЭГ Саймона Торпа. Поверьте мне. Вы захотите это прочитать. Но даже сейчас Полярная звезда светит на дорогу, которая простирается передо мной. Путешествие все еще манит. Еще так много нужно успеть.
Мне часто вспоминается моя первая встреча с Пьетро и Кристофом, когда я увидел в них гигантов. Трудно представить, что кто-то может видеть меня таким - один только мой физический рост, вероятно, дисквалифицирует меня - но в той мере, в какой я действительно обладаю некоторым авторитетом, они научили меня использовать его с пользой: как приглашение, а не как барьер. Как послание каждому студенту, готовому приложить достаточно усилий, чтобы оказаться в этом месте: если вы действительно увлечены этим делом - неважно, кто вы и откуда - ваше место здесь. Давайте строить будущее вместе.
Полдень был ярким, даже когда солнце все ниже и ниже опускалось над деревьями, а воздух был достаточно теплым, чтобы мы оставались в тени беседки. Моя мать сидела тихо, довольная, а ее внуки визжали и смеялись, гоняя футбольный мяч по лужайке. Мой отец изо всех сил старался не отставать и смеялся вместе с ними, не уступая им в темпераменте. Наконец-то он был в своей стихии - в роли дедушки, которая не требовала от него ничего, кроме игривости, которую он оттачивал всю жизнь.
Я опустил глаза на свой вибрирующий телефон и увидел сообщение от директора по политике Стэнфордской ассоциации HAI.
Национальное исследовательское облако только что прошло через Сенат
Часть большого счета
На пути к столу президента
Через минуту пришло еще одно сообщение, от Жана Сабеллы. К нему прилагалось видео. Нажав на кнопку PLAY, я наблюдал, как две пары рук с нетерпением разрывают подходящую оберточную бумагу, возбужденно крича, когда обнаружилась пара наборов "Лего" из "Звездных войн".
"Что мы скажем, ребята?" услышал я голос Жана за кадром.
"Спасибо, тетушка Фэй-Фэй и дядя Сильвио!" - радостно ответили два голоса в унисон.
Спустя два поколения ботаническое воображение Боба безошибочно передалось его внукам. Однако их неприкрытая радость подсказывала мне, что интроверсия, которая так сильно определяла его самого, прошла. Я мог представить, какую улыбку это вызвало бы на его лице.
Закрыв видео, я вернулся в групповой чат, из которого оно появилось, - продолжающийся уже год поток личных новостей от Джин, ее сына Марка и меня. Вехи. Дни рождения. Восстановление после операции по замене коленного сустава. Новая работа. Новые питомцы. Счастливые новости, печальные новости и все остальное, что наполняет годы жизни.
То, что началось с зыбкой просьбы о помощи на уроке математики в школе Парсиппани, переросло в связь, которая изменила мою жизнь иммигранта и которая теперь охватывает два побережья и три поколения. Боб был учителем, доверенным лицом и другом, а также моим спасательным кругом, когда я едва мог выразить свои мысли. Обеденный стол Сабеллов, украшенный тарелкой с домашними пирожными, всегда остается для меня величайшим уроком сострадания. А сами Сабеллы - несомненное продолжение моей собственной семьи. Я не могу представить себе жизнь без них, так же как и без своих матери и отца. Именно поэтому потеря Боба до сих пор причиняет боль, более десяти лет спустя. Но разговоры никогда не прекращались. Память о нем по-прежнему слушает, а я по-прежнему изливаю ей свое сердце.
Ни одна связь не дала мне больше знаний об этой стране. Возможно, эти уроки начались в средней школе - устремленные рассказы на уроках истории резко контрастировали с мрачной, даже жестокой реальностью иммигранта, - но они никогда не были тем, что действительно достигло меня. Даже спустя десятилетия, когда я был погружен в ту же напряженность, что и все остальные, - партийность, культурные разломы, избирательные циклы и все остальное, - мое глубочайшее понимание этой страны пришло не из новостей, не из статей какого-нибудь полемиста и даже не из учебника. Оно пришло благодаря привилегии знакомства с Сабеллами, которые являли собой пример человечности, которую я ценю в этом месте больше всего. Это дух, который, по крайней мере для меня, все еще ощущается как американский.
Я повернулась, услышав резиновый скрип открываемой раздвижной стеклянной двери. Сильвио направлялся к нам, его руки были пусты.
"Где обед?" Я спросил, наполовину дразнясь, наполовину с голодом. В основном с голодом.
"Защита была долгой", - сказал он со вздохом и нескрываемой улыбкой, зная, что я оценю его усталость не меньше, чем его радость.
Последние пару часов он провел, разбирая диссертацию своего последнего кандидата наук, оспаривая ее утверждения, выслушивая ее объяснения и, в конце концов, присуждая ей степень. Нетрудно было представить, что разбирательство затянется дольше запланированного времени; Сильвио охватила знакомая страсть, и никто из нас не мог отключиться, когда дело касалось таких вещей.
Я снова взглянул на свой телефон, на мгновение задержавшись на множестве знакомых имен, которые все еще фигурируют в моих текстовых сообщениях. В одном из недавних разговоров речь шла об Ольге и Цзя - обе сейчас преподают в Принстоне и обе остаются на переднем крае исследований в области компьютерного зрения. Ольга, в частности, является убежденным сторонником справедливости и прозрачности в области ИИ и организовала проект AI4ALL в своем новом кампусе. Было сообщение от Пьетро, который все еще преподает в Калтехе, указывающее мне на работу одного из его аспирантов, который использует компьютерное зрение для поддержки глобальных усилий по сохранению природы и устойчивости. И еще одно - от Арни, теперь уже партнера по исследованиям и друга более чем десятилетней давности, который делился последними новостями об окружающем интеллекте.
Независимо от того, буду ли я когда-нибудь чувствовать себя человеком определенного типа - китайцем, американцем, может быть, даже почетным итальянцем, - я уже давно избавился от страха, что не принадлежу себе. Люди, которых я встретил на своем пути, и доброта, которую они проявили ко мне, стали тому подтверждением. Путь иммигранта был нелегким, но я бесконечно благодарен за то, что он меня привел.
Даже история со здоровьем моей матери, растянувшаяся на столько лет, оказалась гораздо сложнее, чем простой вопрос о судьбе и несчастье. В конце концов, как долго можно откладывать неизбежное, прежде чем оно перестанет казаться таким уж неизбежным? Каким бы тяжелым ни было это путешествие, по прошествии почти трех десятилетий я вынужден признать, что по меркам невезучих семей наша была счастливой. Эти тридцать лет были тяжелыми, но это не были тридцать лет горя, потери или траура. Все эти годы мы провели вместе, и я не могу не испытывать благодарности и за это.
В последние дни я часто размышляю. Часто вспоминаются годы становления моей матери и отца: ее - запертые в культуре, которая пожирала сама себя, а его - потерянные в трагедии, из которой он так и не смог полностью выбраться. Я помню, как дрожали ее руки, когда мы садились в самолет, увозивший нас из знакомых нам жизней, и ужас, наполнявший наши желудки, когда мы ждали у выдачи багажа в аэропорту Кеннеди, одни, на мели, а ночь все не наступала. Я вспоминаю тусклую жару и гудящую, механическую атмосферу химчистки. Я думаю о том, как впервые увидел Принстон.
Оглядываясь на свою карьеру, я думаю, что опыт переезда через весь мир оставил во мне след, который я только сейчас начинаю понимать, и который продолжает влиять на мои исследования и мышление. Это заставляет вспомнить о напряжении, которое побудило мою мать, дочь политически бесправной семьи Гоминьдана, играть в азартные игры и путешествовать так далеко - и теперь, как ни удивительно, доживать свои сумерки на заднем дворе в Пало-Альто. Жизнь ученого, как и жизнь иммигранта - жизнь искателя приключений - это жизнь, в которой "дом" никогда не является четким понятием. Лучшая работа всегда происходит на границах, где идеи вечно находятся в ловушке между приходом и уходом, исследуются незнакомцами в чужих краях, внутренними и внешними одновременно. Но именно это и делает нас такими сильными. Это сохраняет уникальность наших перспектив и позволяет нам бросать вызов статус-кво.
Будущее ИИ остается глубоко неопределенным, и у нас столько же причин для оптимизма, сколько и для беспокойства. Но все это - результат чего-то более глубокого и гораздо более значимого, чем просто технология: вопрос о том, что движет нами, нашими сердцами и нашими умами, когда мы творим. Я считаю, что ответ на этот вопрос - возможно, больше, чем на любой другой, - определит наше будущее. Очень многое зависит от того, кто на него ответит. По мере того как эта область постепенно становится все более разнообразной, все более инклюзивной и все более открытой для опыта других дисциплин, я все больше верю в наши шансы ответить на него правильно.
В реальном мире есть только одна Полярная звезда - Поларис, самая яркая в созвездии Малой Урсы. Но в сознании такие навигационные ориентиры безграничны. Каждая новая цель - каждая новая одержимость - висит в темноте над горизонтом, еще один переливающийся след, манящий к себе. Вот почему я испытываю величайшую радость от осознания того, что это путешествие никогда не будет завершено. И я тоже. Всегда будет что-то новое, за чем можно погнаться. Для ученого воображение - это небо, полное северных звезд.