Самое старое изображение механического воина-андроида удалось обнаружить в 1935 году через 800 лет после его создания, это случилось при исследовании альбома архитектора Виллара де Оннекура (Villard de Honnecourt, 1195–1266). В XIII веке в Европе наметился подъем интереса к механике и даже к идее вечного двигателя, не случайно в этом же альбоме еще есть эскиз такого механизма. Самый известный из подобных рабочих альбомов, принадлежавших художникам и архитекторам, конечно же «Атлантический кодекс» Леонардо да Винчи, и в нем тоже среди тысяч рисунков. создававшихся на протяжении 40 лет, есть наброски двух автоматизированных устройств: повозки, датируемый 1478 годом, и рыцаря, относящийся к 1495.
Свою конструкцию робота-воина да Винчи разделил, как бы мы сегодня сказали, на две подсистемы: в одну входила нижняя часть тела – щиколотки, голени, колени и бедра, а в другую руки и плечи. Для управления первой подсистемой Леонардо предполагал внешний программатор, а механизм управления второй разместил непосредственно в грудной клетке. Воссозданная недавно реплика этого рыцаря находится во флорентийском музее Леонардо, а его именем названа одна из самых совершенных роботизированных хирургических систем da Vinci Surgical System. Это тоже робот, но он отнюдь не похож на андроида – робот-хирург многорук как Шива, он снабжен четырьмя руками: одна из них держит видеокамеру, передающую изображение оперируемого участка, две воспроизводят совершаемые хирургом движения, а четвертая служит для вспомогательных действий. Система da Vinci Surgical System при всей ее сложности всего лишь умный помощник оперирующего, лишенной автономии, всеми манипуляциями управляет врач, видящий в увеличенном масштабе трехмерное изображение оперируемого участка и действующий хирургическими инструментами посредством джойстиков.
Таков зримый результат изменения представления о роботах за прошедшие 500 лет – от мечты о железном человеке до робота-ассистента, узкоспециализированного на определенном приложении. Иногда, когда встречаются рекламы фильмов про андроидов типа «Терминатор», сознается впечатление, что их создатели и зрители отстали в своем развитии на полтысячи лет.
Андроиды – это частный случай автоматонов, относительно несложных механизмов, способны к воспроизведению различного рода действий, внешне они могут быть похожи на движения человека или животного, чем создается иллюзия их самостоятельного действия. Это наиболее древний вид псевдо-роботов, к ним относятся популярные сегодня выставочные и развлекательные человекоподобные устройства – они ушли недалеко от древних автоматонов, по сути своей они так же воспроизводят механические действия, как делалось в старину, но с поправкой на использование современных технологий и материалов. Столетиями до середины XIX века искусные механики радовали венценосных особ созданными ими развлекательными автоматами, которые за их изящество стоит в большей мере рассматривать как произведения искусства. Не случайно развлекательные роботы чаще можно увидеть в художественных музеях, например, в Эрмитаже, чем в музеях науки и техники.
Промышленная революция разбудила гений изобретательства, наряду с другими новациями началось строительство огромного числа механизмов, которые можно было назвать роботами, после того, как это слово вошло в оборот. Общество проявляло к ним живой интерес, в газетах и журналах того времени можно найти изрядное количество статей на тему механических существ. Различающиеся внешне, они утроены единообразно – включают в себя простейшие датчики и незатейливые сервомеханизмы, устройства для воспроизведения звуков, несложные механизмы перемещения и в редких случаях радиоуправления. Особым разнообразием отличались движители, от простых колес до нетривиальных колесных конструкций, допускающих перемещение по сложным траекториям и разного рода шагающих сооружений.
Такие роботы строились до последнего времени и даже сейчас создаются разного рода человекоподобные игрушки. О том насколько несовершенны были создания, называвшиеся роботами, свидетельствует тот факт, что в отечественную прессу попадали хваленые материалы о человекоподобных устройствах, собранных из лампочек и реле на существовавших в СССР станциях юных техников, ими были заполнены научно-популярные издания 60–70-х годов.
Среди современных автоматонов встречаются удивительно интересные конструкции, они и правда проявляют внешне почти разумное поведение. Вероятно, первым из таких роботов был FRED (Friendly Robotic Educational Device, 1984), рассчитанный на общение с подростками. Его конкурентом стал робот Topo, но это скорее исполнительный механизм, подключаемый к IBM PC или Apple Mac. Его создатели руководствовались, казалось бы, разумной идеей – обучать ребенка в процессе игры с роботом, но она провалилась. Наследником FRED в 2018 году стал социальный робот Musio, разработанный малоизвестными компаниями KDDI (Япония) и AKA (США). О нем известно, что робот обладает некоторыми способностями к распознаванию речи и изображений.
С появлением необходимых технологий возникала целая индустрия развлекательных роботов. Невероятной удачей оказался робот-игрушка Furby, похожий на Чебурашку, нарисованного выдающимся художником-мультипликатором Леонидом Шварцманом. С 1998 по 2016 год было выпущено более 40 миллионов Furby, в первой версии он снабжался простейшим магнитофоном, микрофоном и динамиком, поэтому мог «обучаться» английскому, распознавать сказанное ему и произносить несколько десятков фраз. Позже, по мере миниатюризации и усложнения электроники, его функциональность возрастала, он «научился» другим языкам, мимике и т. д. После того, как было создано мобильное приложение Furby BOOM! спрос на «живого» Furby резко упал.
В создании роботов-игрушек лидирует Японии, чему немало способствуют сохраняющиеся древние традиция: столетиями здесь изготавливали механические куклы каракури-нинге, первое слово «каракури» переводится как «механическое устройство, созданное чтобы дразнить, обмануть или удивить человека», второе слово «нинге» обозначает человека и форму, что совместно может переводиться как марионетка, а также и кукла или чучело. У японцев сложился культ таких игрушек, чему способствует фиксированное в традициях ритуальное поведение – поклоны улыбки и т. д., которые можно назвать механистическими. И, наконец, особенности местной мифологии, нашедшие свое отражение в мультфильмах-аниме.
В 2000 году началась продажа робота-щенка SONY AIBO, название которого отсылает к словосочетанию Artificial Intelligence Robot и созвучно японскому слову, переводимому как приятель. Он мог воспринимать голосовые команды, был запрограммирован на различные реакции на них, на послушание или непослушание. Несмотря на высокую цену AIBO выпускался до 2014 года. В том же году Honda выпустила робот-андроид ASIMO (Advanced Step in Innovative Mobility), способный перемещаться, распознавать лица и жесты, реагировать на голосовые команды. Вслед за Honda несколько японских корпораций выпустили свои аналоги, Sony – QRIO (Quest for cuRIOsity), Fujitsu – HOAP (Humanoid for Open Architecture Platform), Toyota – Toyota Partner Robot, Hitachi – EMIEW (Excellent Mobility and Interactive Existence as Workmate). Ни одна из этих конструкций не обладала никакими признаками интеллекта, скорее всего, все они были данью характерной для того времени маркетинговой стратегии. Развлекательные роботы дожили до нашего времени и сегодня встречаются прогнозы о развитии индустрии сексботов, для которых, можно предположить, интеллект не является главным требованием.
В 1911 году американец Адольф Вигель получил патент на замечательного по своей простоте заводного игрушечного жука (Toy Beetle), внешне производящего впечатление разумного поведения. Пущенный по прямоугольному столу в произвольном направлении он доходил до кромки, обнаруживал ее, делал нескольких циклических движений взад-вперед и находил нужное направление, шел дальше вдоль ребра столешницы, доходил следующего края, где процедура циклического поиска нового направления повторялась, и так конца завода. Секрет «разумного» поведения жука фантастически прост, внутри него были два колесика, а впереди длинный щуп. Когда щуп обнаруживал край, механизм управления колесиками реверсировал привод и вступал в действие хитроумный трюк – одно из двух колес пробуксовывало и жук поворачивался на небольшой угол по отношению к кромке, поэтому в следующем цикле он подходил к краю под иным углом и процедура повторялась. За несколько циклов вперед-назад жук был способен повернуться настолько, чтобы дальше двигаться параллельно кромке стола. Возможно, это первый пример примитивного машинного обучения.
Механическое обучение по образу и подобию Toy Beetle нашло продолжение в лишенных какого-либо интеллекта роботах, которые при этом оказались способны к прохождению лабиринтов (Maze Solving Machines). Этот класс роботов строили ученые-психологи с начала 30-х годов, видя в них модели, удобные для изучения условных рефлексов, что-то вроде не требующих пищи собачек академика Павлова. Трудно сказать насколько эти эксперименты оказались продуктивными для психологии, судя по всему не очень, в последующем от них отказались, однако создание лабиринтов (maze generation) и алгоритмов поиска выхода из них (maze solving) переросло в серьезное математическое направление. Это отдельная и чрезвычайно интересная тема. Успехи в микромашиностроении и микроэлектронике открыли возможности для конструирования и изготовления обучаемых миниатюрных роботов-мышей, способных найти выход из лабиринтов, в результате возникло массовое хобби, распространенное во многих странах, прежде всего в Великобритании и Японии, в его основе несложные правила прохождения лабиринтов.
Если в лабиринте нет отдельно стоящих стенок, образующих замкнутые маршруты (такой лабиринт называют односвязным), то его можно обойти полностью, следуя правилу «одной руки», однако при их наличии, такой лабиринт называют многосвязными, правило одной руки не работает. К каким неприятностям приводит доверие правилам прохода лабиринтов описал Джером Джером в «Трое в лодке», а автор смог убедиться в этом на своем примере, когда с уверенность Джорджа пошел в лабиринт венского парка Шенбрунн.
Впервые алгоритм прохождения любых лабиринтов был описан французским математиком Э. Люка в 1882 году, он известен как алгоритм Люка-Тремо. Его реализовал психолог Томас Росс из Университета Вашингтона, создавший Robot Rat, с тех пор этот класс роботов стали называть крысами. Предпосылками к созданию Robot Rat стали работы другого американского психолога Кларка Халла. Robot Rat не был самоцелью, тогда казалось, что, если удастся создать простейшее устройство, обладающее условным рефлексом, то из множества таких устройств можно будет собрать обучаемую систему. Успех пришел к Россу, когда он объединил свои усилия с коллегой Стивеном Смитом, их трехколесный Robot Rat длиной 31 см и шириной 22 см имел электромеханическую логику, позволявшую ему находить выходы из сложных ситуаций и обучаться в процессе прохождения лабиринта. После нескольких попыток он мог проходить лабиринт без ошибок. В 1935 году Robot Rat стал сенсацией, о нем писал журнал Time, Scientific American и другие.
Самым известным покорителем лабиринтов стал робот Тезей, созданный Клодом Шенноном в 1950 году. Собственно Тезей был деревянной мышкой с магнитом, а вся логическая схема и управляющая головка с мощными магнитами была расположена под поверхностью лабиринта. Первый вариант Тезея Шеннон сделал собственными руками, он был необычайно мастеровит, но более совершенные экземпляры Тезея были исполнены профессионалами из Bell Labs. Детище Шеннона, как и Robot Rat, стало сенсацией, оно попало на страницы Popular Science, Time, Life и массы других изданий. Современники придавали Тезею гораздо большее значение, чем автор, который рассматривал его как своего рода шутку – хак, как называют подобные вещи в родном ему МТИ, в тамошнем музее их множество. Надо заметить, что Шеннон вообще отличался эксцентричностью, например, он был фанатом жонглирования, создавал странные, никому не нужны механизмы. В 1992 году он сказал «Я никогда не соотносил свои увлечения с тем, что они дают миру, я провел много времени, занимаясь совершенно бесполезными вещами. Я делал разного рода игры и игрушки, даже машины для игры в шахматы и сборки кубика Рубика, ходули с газовыми пружинами и еще бог знает что». Сейчас то, что осталось от Тезея является одним из самых ценных экспонатов в музее МТИ.
В 70-е годы с появлением доступных управляющих мини-компьютеров роботы-крысы стали шире использоваться в исследованиях по экспериментальной психологии, но за границы лабораторий они не вышли, их количество исчислялось единицами. Настоящая революция произошла с появлением встраиваемых микропроцессоров, микроприводов и батарей достаточной емкости, открылась возможность для нового хобби – создания микророботов, проходящих лабиринты. В 1978 году прошли первые соревнования среди роботов-крыс, они привлекли свыше 6000 участников, а призовой фонд составил 250 тыс. долл. Этот класс роботов называют мicromouse, существует сообщество создателей Micromouse Online, где публикуются материалы по конструированию, графики соревнований и многое другое. В последнее время появилась родственная категория роботов, проходящих на скорость размеченную трассу (line follower robot), в качестве разметки может быть использована контрастная линия в видимом свете или нанесенная магнитными чернилами. Одним из наиболее популярных соревнований среди роботов стал Чемпионат мира по футболу среди Robot Soccer World Cup (RoboCup).
В 60-е годы в МТИ и в Стэнфорде начались попытки создания роботов с претензиями на AI, соответственно в этих университетах сложились две различные школы робототехники. Фантазийному представлению о человекоподобном роботе в большей мере соответствует робот Shakey, который создавался в период с 1966 по 1972 в Стэнфодском исследовательском центре AI (Artificial Intelligence Center of Stanford Research Institute). Позже центр был переименован в SRI International, утеряв при этом буквы AI, что символично. По утверждению статьи в Wikipedia, Shakey стал «первым мобильным роботом общего назначения, способным оценивать свои действия». Увы, слишком сильно сказано, поскольку к этому оказался не способен не только Shakey, в истории робототехники не найдется ни второго, ни последующих роботов, наделенных такими способностями. Конечно же, ничего этот робот оценивать не мог, но «мы любим его не за это». Спустя полвека Shakey был признан важнейшим научно-инженерным достижением. Если отбросить сомнительное утверждение о его способности к самооценке, то во всем остальном он действительно стал прообразом многого из того, что делается в робототехнике, в том числе и с точки зрения системной архитектуры, и использования компьютерного зрения, и методов навигации, и другого.
Для своего времени Shakey невероятно совершенен, он был снабжен телевизионной камерой и «кошачьими усами» в качестве датчика для обнаружения объектов, находился на связи по радиоканалу со своим внешним мозгом – поначалу это был компьютер SDS-940 с памятью 64 Kбайт, а потом более мощный PDP-10 увеличенной до 192 Kбайт памятью. По размеру памяти можно понять насколько он был умственно ограничен. Вычислительная часть программного обеспечения писалась на FORTRAN, а сам Shakey «понимал» команды на языке Lisp, предложенном Джоном Маккарти в 1958 году. Наработки, сделанные в процессе создания Shakey, сослужили свою службу при создании роботов Centibots, использованных позже в экспериментах, связанных с исследованиями роевого интеллекта, о чем ниже.
Но главным достижением создателей Shakey оказался не сам робот, а сопутствовавшие исследования, по их результатам было получено более 2000 патентов и опубликовано свыше 5000 статей. После первой неудачной попытки научить робота сборке телевизора создание интеллектуального робота перестало рассматриваться как самоцель, фокус сместился на создание роботов-помощников. Не случайно на торжественной церемонии в связи с помещением Shakey в Компьютерный музей в Маунт-Вью Нильс Нильсон, один из его создателей и соавтор известной книги по AI сказал: «Нынешние роботы гораздо совершеннее, у них мощные системы управления, но они по-прежнему не понимают того, что делают», чем опроверг утверждение из Wikipedia. Вслед за Shakey появилось огромное количество различных устройств, претендующих на признание их роботами, но ни одно из них не обладает признаками собственного сознания и целеполагания».
Альтернатиную массачусетскую школу робототехники называют поведенческой (Behavior-based robotics, BBR), она ставит целью создание хотя и простых, но обладающих способностью к адаптации в окружающей среде и к выполнению относительно несложных повторяющихся действий роботов. Действия систем, построенных на принципе BBR, ближе к рефлекторному поведению животных, особенно насекомых, – они делают попытку, чаще всего обнаруживают ошибку, вносят коррекцию и повторяют в цикле действие с обнаружением ошибки до тех пор, пока не достигнут желаемого результата. По сути оно представляют собой усовершенствованную версию описанного выше Toy Beetle.
Отцом концепции BBR обычно называют австралийца Родни Брукса, проработавшего более 20 лет в MIT Computer Science and Artificial Intelligence Laboratory с середины 90-х, а на протяжении последних 10 лет он возглавлял это исследовательское учреждение. Свое профессиональное кредо он выразил в статье «Слоны не играют в шахматы» (Elephants Don't Play Chess, 1990), в ней Брукс пишет, что под роботом он понимает машину, способную делать что-то полезное для человека: «Для того, чтобы робот мог делать повседневную работу в общей с человеком среде, его когнитивные способности должны быть основаны на сенсомоторном взаимодействии с этой средой, где критически важной является координация между датчиками и исполнительными органами».
В минимальной форме основную идею BBR, как это ни покажется странным, можно реализовать средствами механики. В XIX веке были созданы игрушки, воспроизводящие ее. А первый электронный BBR-робот в 1949 году создал англо-американский нейрофизиолог и психиатр Грей Уолтер (Grey Walter, 1910–1977). Он назвал его машиной соображающей (machina speculatrix) с двойным собственным именем Elmer Elsie (ELectroMEchanical Robot, Light-Sensitive), которое переводится как электромеханический робот, чувствительный к свету. По внешнему виду и по скорости передвижения робот напоминал черепашку, наделенную способностью к фототропизму, то есть к движению на свет. Добавив к Elmer Elsie несколько логических цепей Уолтер сделал машину обучаемую (machina docilis) CORA, она могла обучаться условным рефлексам по И. П. Павлову. Непосредственными преемниками Elmer Elsie стали роботы BEAM (Biology, Electronics, Aesthetics, Mechanics), использующие простые аналоговые цепи вместо микропроцессоров, что обеспечивает им простоту и надежность при выполнении определенного задания.
Близкие по смыслу исследования проводил Валентино Брайтенберг (Valentino Braitenberg, 1926–2011), итальянский кибернетик, возглавлявший отделение биологической кибернетики в Институте Макса Планка (Тюбенген, Германия). Он автор книги «Тележки: эксперименты в синтетической психологии» (Vehicles: Experiments in Synthetic Psychology). Движение тележки Брайтенберга (Braitenberg vehicle) контролировалось простейшими аналоговыми устройствами, обычно с фотоэлементами, однако при этом возникало впечатление сложного или даже интеллектуального поведения.
Одним из немногих успешных производителей BBR-роботов была и остается компания iRobot, она начала с разного рода роботов-уборщиков, но, получив контракт от DARPA, занялась и роботами военного назначения. Известность получил робот PackBot, использовавшийся при разминировании, после катастрофы на АЭС Фукусима, но недавно этот бизнес был продан специализированной компании.
Телеробототехника (Telerobotics) объединяет разнообразные технологии, требуемые для создания дистанционно управляемых роботов, то есть исполнительных устройств, связанных с оператором по кабелю или по различным беспроводным сетям от Bluetooth и Wi-Fi до Deep Space Network (Сеть дальней космической связи НАСА). Совокупность технологий включает телеуправление (teleoperation), а если работа ведется удаленно, то высококачественные системы видеосвязи и, скорее всего, в будущем телеприсутствие (telepresence), то есть удаленное участие оператора.
Первые системы с элементами телеуправления впервые были внедрены в морских торпедах, которые как вид противокорабельного оружия появились непосредственно после изобретения паровой машины, практически одновременно с первым пароходом Роберта Фултона. В 80-х годах XIX успехи в электротехнике позволили нескольким американским инженерам снабдить их дистанционным управлением по кабелю, чему способствовало изобретение в те же годы и там же в Америке безынерционной катушки для спиннинга. Несмотря на свое видимое несовершенство этот способ передачи управляющего сигнала сохранялся до последнего времени в противотанковых ракетных комплексах (ПТРК).
Увлечение телероботами (telerobot) началось в 1898 году, когда Никола Тесла показал управляемый по радио кораблик, совершавший предписанные ему маневры в бассейне на Мэдисон-сквер-гарден в центре Нью-Йорка. Своим творением Тесла хотел показать возможности управления по радио, но его вечный соперник Томас Эдисон был более практичен, он продемонстрировал торпеду, управляемую с берега по кабелю, она предназначалась для защиты портов, а совместно с компанией US Electrical Supply Company предложил небольшие радиоуправляемые устройства, служащие для подрыва крупных плавающих мин.
Модель Теслы представляла собой полутораметровый кораблик со всем необходимым оборудованием (двигатель, радиоприёмник, связанный с приводами, винт и руль), оператор мог дистанционно изменять направление движения и скорость. По своим возможностям он напоминает современные радиоуправляемые модели, сегодня они никого не удивляют, их можно купить в магазинах игрушек. Пресса упорно связывала изобретение Теслы с новыми типами вооружения, но он никогда не работал на войну, мечтал о создании умных машин, обладающих собственным разумом, он называл это own mind.
Тесла был пацифистом, поэтому дальше модели он не пошел, а слава отца военных телероботов досталась тому, кто превратил радиоуправление в оружие – Арчибальду Лоу (Archibald Low, 1888–1956), английскому инженеру, исследователю и автору более чем 40 книг. Лоу, изобретатель-универсал, до начала Первой мировой войны, когда ему исполнилось 26 лет, успел придумать множество новинок, в том числе новые альтернативные двигатели внутреннего сгорания и газовые турбины и даже автоматизированную машинку для варки яиц, но его самым удивительным изобретением был прообраз телевидения, о нем писали все британские газеты.
На Первой мировой, или Великой войне, как говорят англичане, Лоу служил в Военно-воздушных силах, где занимался разработкой методов дистанционного управления атакующим самолетом, но из соображений скрытности было объявлено, что предметом разработки служит летающая мишень – самолет Ruston Proctor AT. В нем многое было сделано впервые, в том числе запуск с катапульты со сжатым воздухом, установленной на грузовике, и использование гироскопа для стабилизации полета. Этот прибор был изобретен Элмером Сперри (Elmer Sperry 1860–1930), в 1908 году он получил патент на гирокомпас, который мог заменить собой морской магнитный компас, а Лоу пошел дальше, включив его в контур управления летательным аппаратом. Изобретения Лоу опередили свое время, но выполнены на кустарном уровне, поэтому оказались недооцененными английским правительством, немцы понимали их опасность, ими были предприняты две неудачные попытки убийства Лоу. В последующем автопилоты, превращающие самолеты в своего рода роботы, стали непременным атрибутом авиации. В 1947 году на самолете US Air Force C-54 был совершен трансатлантический перелет полностью под управлением автопилота, включая взлёт и посадку. Заметим, что это было задолго до появления термина Artificial Intellect.
Термин телеприсутствие как название для своей мечты предложил Марвин Минский в 1980 году, вложив в него явный привкус любимой им фантастической литературы, воплотить эту мечту удалось в 1992 году в проекте Virtual Fixtures (Виртуальный каркас), разработанном в лаборатории ВВС США по проекту Virtual Fixtures (виртуальные приспособления). В то время еще не было нынешних технологий виртуальной и дополненной реальности, поэтому пришлось использовать некоторые искусственные приемы, но общие принципы, выработанные тогда, сохранились, в том числе внешний стереоскопический дисплей и экзоскелет, повторяющий движения человека и оказывающий сопротивление при движениях, обеспечивающий обратную связь. Проектом Fixtures руководил Луис Розенберг (Louis Rosenberg, 1969), защитивший диссертацию в Стэнфорде, создатель нескольких небольших, но чрезвычайно активных компаний и к тому же автор произведений в популярном в США литературном жанре графического романа. До массового практического внедрения телеприсутствия еще далеко, сейчас так обычно называют стационарные или мобильные устройства, поддерживающие телеконференции, своего рода автоматизированные телевизионные операторы.
Главным стимулом к созданию современных телероботов стала необходимость выполнения действий подконтрольно человеку там, где он не может находиться. Первый из известных случаев использования телеробота связан с подъемом водородной бомбы, затонувшей в Средиземном море близ испанского города Паломарес. В 1966 году при заправке в воздухе потерпел крушение стратегический бомбардировщика В-52, все четыре находившиеся на борту бомбы приземлились на парашютах, но одна из них упала в воду и затонула на глубине около 600 метров. Под давлением негативного общественного резонанса на этот инцидент во всем мире и опасаясь действий потенциального противника, США приложили колоссальные усилия для поиска бомбы, собрав флотилию из нескольких десятков кораблей. Использовались самые передовые научные методы и технологии, в том числе теория байесовского поиска. С тех пор она является широко используемым приложением байесовской статистики для поиска потерянных объектов, например, затонувших кораблей. Теория байесовского поиска включена в состав программного обеспечения для планирования спасательных операций CASP (Computer Assisted Search Program), используемого Службой береговой охраны США, ВВС США и Гражданским аэронавигационным патрулем США.
Для эвакуации бомбы был использован подводный спасательный транспортер CURV–I (Cable-controlled Undersea Recovery Vehicle), созданный в начале 60-х для подъема затонувших торпед, ему удалось захватить бомбу, после чего был поднят вместе с ней на поверхность, находку немедленно представили журналистам. Так впервые фотографии термоядерного оружия попали в прессу.
Одно из самых многочисленных семейств телероботов образуют космические зонды. Приоритет в этой области принадлежит СССР, начало положила автоматическая станция для изучения Луны «Луна-9» (1966). В 1971 году на Луну был доставлен «Луноход-1», способный к передвижению по поверхности Луны. «Луноход-1» мог управляться как дистанционно, так и служить самоходным роботом. Предполагалось запустить серию таких машин: «Луноход-0» должен был стать первым еще в 1969 году, но помешал неудачный старт ракеты-носителя. Вторым попавшим на Луну стал «Луноход-2» (1973), а запуск «Лунохода-3», намеченный на 1977 год, не состоялся.
«Луноход» мог двигаться с двумя различными скоростями в двух режимах: в ручном и в автоматическом по программе. Управление осуществлялось группой операторов из Центра управления, находившегося в Крыму. Дистанционное управление осуществлялось с использованием ЭВМ «Минск-22», не предназначенной для работы в реальном времени, имевшей память на магнитных сердечниках 64 Кбайт и внешнюю память на магнитной ленте. Можно представить сложность управления, если запаздывание радиосигнала составляет около 2 секунд, а передача одного кадра длилась порядка 10 секунд.
Потребности космической программы привели к созданию ленинградского Центрального НИИ робототехники и технической кибернетики (ЦНИИ РТК), под руководством Евгения Ивановича Юревича, он автор термина «робототехника». «Мой грех, – говорит он, – я его придумал. В мире используется более короткий термин роботика, но мне было нужно стандарт выпустить, я предложил слово по аналогии с радиотехника, теплотехника». В ЦНИИ РТК было создано семейство дистанционно управляемых роботов-разведчиков (колесные РР-1, РР-2, РР-3 и гусеничные – РР-Г1, РР-Г2), снабженные подвижными телевизионными камерами, гамма-локаторами и дозиметрической аппаратурой. Роботы успешно трудились на ликвидации последтсвий катастрофы на ЧАЭС в условиях самых интенсивных ионизирующих излучений с мощностью до 20000 рентген в час, где не выдерживали другие роботы, как закупленные за рубежом, так и отечественные. На станцию также было поставлено несколько тяжелых роботов типа РП,ТР-А1 (с автономным питанием и радиоуправлением) и ТР. Модульный принцип их построения позволил в течение 2 месяцев разработать, изготовить и поставить на ЧАЭС более 15 различных машин, собранных из ранее отработанных унифицированных модулей.
Самые известные сегодня телероботы – это летающие дроны, слово drone переводится как трутень. Многочисленные попытки создать автономные и телеуправляемые боевые и разведывательные летательные аппараты начались еще во время Второй мировой войны и продолжились в последующие десятилетия, это были секретные и полусекретные разработки. Как название для летающего телеробота слово «дрон» впервые встречается в 1946 году, в журнале Popular Science: «Эти радиоуправляемые летательные аппараты имеют большой потенциал для гражданского и военного применения. Когда-нибудь корабль-матка поведет за собой боевые самолеты через континенты. Вооруженный атомными бомбами флот, состоящий из дронов, управляемых из матки, сможет нанести точные удары по выбранным целям». Военные разработки продолжались на протяжении последующих пятидесяти лет, по ту и по другую сторону железного занавеса было создано немалое количество конструкций, но без особого успеха, они в большей степени представляют интерес для истории авиации, чем для AI. Радикальные перемены начались, когда идеей создания боевых дронов озаботились израильские военные.
Необходимость в создании израильских беспилотных летательных аппаратов БПЛА (Unmanned Aerial Vehicle, UAV) была вызвана поставкой советских радиолокационных станций в Египет и, как следствие, увеличением потерь израильской авиации. За неимением необходимых собственных аппаратов была закуплена партия американских беспилотных самолетов-мишеней Chukar, их оборудовали фотокамерами, превратили в разведчиков и переименовали в Telem. Под этим именем они успешно применялись в Войне Судного дня для поиска расположения батарей ЗРК Египта и Сирии. После окончания войны, БПЛА были модернизированы – фотокамеры были заменены на видеокамеры. Telem отлично зарекомендовали себя во время Войны Судного дня в 1973 году, хотя большая часть из них была уничтожена.
Успешное применение адаптированных для разведывательных целей самолетов-мишеней подтолкнуло Израиль к созданию оригинальных специальных БПЛА, этим занялась государственная корпорация (Israel Aerospace Industries, IAI). Она производит широкий спектр авиационной техники, но в мире более всего известна как один из ведущих в мире разработчиков и производителей БПЛА, некоторые из них не имеют аналогов в мировой практике авиастроения. Ее первые БПЛА Scout и Tadiran Mastiff были разработаны в 1970-х годах, представлены публике на Парижском авиасалоне в 1979 году. Сегодня продукция IAI поставляются в целый ряд стран, в том числе и в Россию.
Настоящим роботом можно назвать такие БПЛА, которые впервые созданы израильтянином Абрахамом Каремом в своем гараже после того, как он переехал в США. Он смог реализовать одно из основных преимуществ дрона – возможность пребывать в полете несколько суток и даже более. В 1994 году созданный им ударный Predator, вошедший в последующем историю в связи с успехами в антитеррористических операциях, совершил свой первый полет. Английский журнал The Economist назвал Карема человеком, изменившим представление об оружии.
Наряду с военными приложениями дронов растут и гражданские. В целом отрасль, связанная с БПЛА, представляет собой наиболее быстроразвивающийся сегмент робототехники, в нем заняты десятки стран, в 2019 году размер бизнеса составил уже 12 млрд долл. при ежегодном росте около 20 %, и судя по всему, в ближайшем будущем будет только еще расти.
Еще одним направлением роботостроения стало изучение и моделирование поведенческих особенностей сообществ простых существ, точнее, их удивительную способность к децентрализованному принятию решений. Такие сообщества представляют пример природного синергетического эффекта, когда совокупная способность больше суммы способностей отдельных частей. В данном случае из примитивного поведения единичной особи образуется коллективный интеллект, или интеллект роя (Swarm Intelligence, SI), он обеспечивает принятие таких решений, которые по своей сложности заведомо недоступны одной отдельно взятой особи. Кто не наблюдал за поведением муравьев или необыкновенными пируэтами птичьих или рыбьих стай и не поражался согласованности их действий и не задавался вопросом, чем обеспечена их координация?
Поведение насекомых объясняется эффектом стигмергии, т. е. спонтанного непрямого взаимодействия, термин переводится с греческого как «расставление меток». Оставляя свои метки одни живые существа стимулируют или подавляют действия других членов сообщества, чем обеспечивается самоорганизация. Классическим примером стигмергии, служит обозначение своей территории кошками, собаками и другими зверями. Она же позволяет образовывать сложные внешне разумные сообщества из простых живых существ, причем без какого-либо планирования, контроля, или даже прямой связи между индивидами. Понятие «стигмергия» в приложении к самоорганизации насекомых и птиц было введено в 1959 году французским зоологом Пьером-Полем в процессе исследования «разумного» поведения муравьев, но раскрыть секреты, лежащие в основе согласованного поведения удалось исследователю из Стэнфордского университета Деборе Гордон в начале 90-х годов. Она изучала механизм SI на примере деятельности муравьев-термитов, каждый из которых не обладает каким-либо интеллектом, но их колония в целом действует весьма разумно. Выяснилось, что SI образуется посредством обмена несколькими байтами между членами такого сообщества, их оказывается достаточно для организации целесообразного децентрализованного коллективного поведения. Последовавшие в конце прошлого века исследования показали, что примерно на тех же принципах основано коллективное поведение пчелиных семей, птичьих стай и даже человеческих сообществ.
Первые опыты практического применения SI для оптимизационных приложений датируются серединой девяностых годов прошлого века, SI открывает принципиально новые возможности в области анализа данных. За время использования SI в оптимизационных задачах были созданы десятки различных подходов, из этого разнообразия можно выделить три основных типа алгоритмов: муравьиный алгоритм (Ant Colony Optimization, ACO), метод оптимизации роем частиц (Particle Swarm Optimization, PSO) и пчелиный алгоритм (Bee Colony Optimization, BCO).
• Муравьиный алгоритм (ACO). В начале 90-х Марко Дориго, ученый из Брюссельского свободного университета, первым применил математические процедуры, основанные на SI, для решения таких задач как организация грузоперевозок, управление авиалиниями, координация действий боевых роботов. Дориго – автор алгоритмов метаэвристической (metaheuristic – «поиск за пределами») оптимизации, базирующейся на подражании муравьиной колонии, которая оказалась эффективной для нахождения приближенных решений задач, сводящихся к задаче коммивояжера. Суть подхода заключается в анализе и использовании модели поведения муравьев, ищущих пути от колонии к источнику питания. Первая версия алгоритма, предложенная Дориго в 1992 году, была направлена на поиск оптимального пути в графе. Сущность ACO чрезвычайно проста – алгоритм имитирует действие феромонов, биологически активных веществ, выделяемых животными и специфически влияющих на поведение других особей. Выделяя феромоны, насекомые подают разные сигналы, например, так они обозначают метками пройденный ими путь, по этим меткам муравей может найти путь обратно в муравейник или метки показывают дорогу другим к найденной добыче. Простой эксперимент – на отмеченном пути от муравейника к источнику пищи поставлен барьер, причем так, что обход с одной стороны длиннее, чем с другой, в изменившейся ситуации сначала выбор направления обхода будет случайным, но потом окажется, что с той стороны, где путь короче, плотность потока муравьев больше, поскольку насекомые выделяют больше фермента и сильнее привлекают в нужную сторону оставшихся. Через какое-то время колония будет пользоваться только коротким путем. Примерно так же решаются и более сложные задачи – например, распределение работы по добыче еды и ремонту муравейника. Система моделирования Ant Colony System, предложенная Дориго, имитирует эту схему на графах, в ней могут видоизменяться способы распространения и восприятия «феромонов».
• Метод оптимизации роем частиц (PSO) возник из попыток объяснить синхронное перемещение птичьих или рыбьих стай, он был предложен психологом Джеймом Кеннеди и инженером Расселом Эберхартом, которые в 1995 году выпустили книгу Swarm Intelligence. В основе их метода лежит эволюционный алгоритм (Evolutionary Algorithm, EA), имитирующий социальное поведение особей в стае. Совокупное поведение всей стаи складывается из поведения каждой отдельной особи, которое лишено малейших признаков антагонизма и даже несет на себе оттенок альтруизма. Эти особенности поведения особей позволяют сложиться своего рода кооперации, где за счет возможных небольших ущербов для каждого выигрывает вся популяция в целом. Средствами SI моделируются виртуальные стаи, состоящие из условных организмов – частиц, существование которых состоит в перемещении в многомерном пространстве решений. Изменение положения отдельной частицы, точно так как особи в рое живых существ, определяется не только стремлением к конкуренции за доступные ей ресурсы, но одновременно примитивным альтруизмом, выражающемся в координации собственного поведения с поведением и соседей с возможным ущербом для себя. Каждая частица может менять свое положение и скорость в пространстве поиска ресурсов, она стремится занять оптимальный для себя участок в пространства решений, но так, чтобы улучшая собственное положение в минимальной степени затрагивать интересы соседних частиц.
• Пчелиный алгоритм BCO имеет более чем десятилетнюю историю, в отличие от ACO и PSO здесь воспроизводится более сложная иерархическая система отношений, состоящая из особей с разным статусом: матка, рабочие пчелы и трутни. Для практических исследований в области интеллекта роя используются простейшие роботы. В 2003 исследовательская группа из нескольких университетов, возглавляемая Стэнфордским исследовательским центром (SRI International, SRI) построила специальный рой из 100 роботов Centibots, в задачу которого входил поиск объектов в заданном регионе. Из этих исследований выросло новое направление, именуемой групповой робототехникой, ставящее своей целью координированную работу систем, которые состоят из большого числа в основном простых физических роботов.
Еще совсем недавно проблемы интеллекта роя интересовали зоопсихологов и энтомологов, а также академических исследователей AI. Но успехи микроэлектроники и микромеханики открыли возможность для создания искусственных существ, из которых можно создавать нечто подобное рою, и это немедленно привлекло к себе внимание тех, кто создает новые типы вооружения. В 2019 году правительства Великобритании и США заявили о своем намерении созывать эскадрильи из роботов, построенные по принципу роя (swarm squadrons). Они будут состоять из небольших по размеру взаимодействующих между собой БПЛА, от прежнего поколения их принципиально отличает способность к самоорганизации. Каждый из роботов является самостоятельным агентом, но совместно они объединены общей целью примерно так, как футболисты на поле. Пока эти технологии находятся на уровне экспериментов.
Упомянутый выше Луис Розенберг основал компанию Unanimous A. I., название которой можно перевести как единодушный AI, он использует подходы, основанные на интеллекте роя для усиления суммарного интеллекта группы людей. Розенбергу удалось сделать целый ряд успешных прогнозов, в том числе предсказать победу Дональда Трампа на выборах в 2016 году. За это в том же году он был удостоен награды «Человек года в AI», (AI Person of the Year) а его компания получила приз за лучшее приложение AI (Best Consumer Application of AI),
C 20-годов прошлого века и до тех пор, пока не были созданы первые промышленные роботы, промышленная автоматизация была ограничена поточными линиями для производства массовых простых изделий и станками с числовым программным управлением для более единичных. «Дедушкой промышленных роботов» признан американский изобретатель Джордж Девол (George Devol, 1912–2011). Ранее созданные им машины и механизмы не получали признания, но в 1954 году ему улыбнулась удача: он получил патент на устройство, снабженное рукой-манипулятором и поэтому отличающееся от станков-автоматов большей универсальностью. Для названия этой машины он избрал несуществующее слово Unimate наподобие Kodak, предложенному Джорджем Истманом для своей компании. В патенте он описал Unimate как машину, способную быть использованной в разнообразных циклически повторяющихся приложениях. В первых вариантах управление было незамысловатым, собранным из имевшихся на рынке радиодеталей и вакуумных ламп, но вскоре совместно с изобретателем и предпринимателем Джозефом Энгельбергером (Joseph Engelberger, 1925–2015) Девол организовал компанию Unimation и начал промышленное производство.
Успех Unimation, продававшей свои Unimate тысячами, способствовал возникновению новой отрасли станкостроения. Показательно, что одной из первых купивших лицензию была японская компания Kawasaki, позже ставшая лидером этого направления. Вдохновленные возможностями Unimate рукой заинтересовались теоретики AI, среди них Марвин Минский. В начале 70-х при его участии была создана рука Tentacle (переводится как усик, щупальце), Снабженная видеокамерой и управляемая компьютером Tentacle могла собирать конструкции из детских кубиков, но большого успеха с ней Минский не добился, он быстро остыл к своей руке, тем не менее работа над ней стимулировала его на создание книги «Сообщество Разума» (The Society of Mind,1986).
Виктор Шейнман (Victor Scheinman, 1942–2016) из Стэнфордской лаборатории AI (Stanford Artificial Intelligence Laboratory) начал с нескольких не слишком удачных образцов механических рук (Rancho arm, Orm arm), настоящим достижением стала Stanford Hydraulic Arm, которой управлял большой и весьма дорогой компьютер PDP-6. Две следующие руки Gold arm и Blue arm уже вполне соответствовали потребностям индустрии, в бизнесе Шейнман оказался успешен, он одним из первых стэнфордских аспирантов сумел создать собственную компанию и коммерциализировать свои изобретения. Ему повезло, вовремя подоспели управляющие миникомпьютеры, которые позволяли снабдить руку эффективным, но не слишком дорогим управлением. Для этой цели удачно подошла модель LSI-11 легендарной компании DEC, в отличие от других компьютеров серии PDP, она была построена на 8-ми (!) разрядном процессоре 6502 компании MOS Technology и, разумеется, при его производительности ни о каком AI не могло быть и речи, но ее хватало для нормальной работы на производстве. Наибольший успех выпал на долю семейства роботизированных рук PUMA (Programmable Universal Manipulation Arm), разработанных Шейнманом по заказу Дженерал Моторс. Эта рука выпускалась тысячными тиражами, ее наивысшее достижение – успешная операция с помощью робота PUMA-560 на головном мозге.
На этом, собственно говоря, научная история промышленных роботов заканчивается и начинается индустриальная, ее события в основном развернулись в Японии, ставшей практически монополистом в этом направлении.
Роботы могут быть не только самостоятельными механизмами, но и составными частями системы человек-машина, расширяющими возможности человека – это экзоскелеты, манипуляторы и короботы. Из этих трех категорий раньше других появились экзоскелеты, название переводится как «внешний скелет». Экзоскелеты могут быть активными, то есть исполнительными механизмами снабженными собственным источником энергии, или пассивными, использующими только энергию человека.
Признанным автором первого экзоскелета был российский изобретатель и это тот редкий случай, когда нет нужды бороться за приоритет. Николай Александрович Ягн (1849–1905) назвал его эластипедом. Он родом из чешских немцев, учился в Петровско-Разумовской земледельческой академии, изобрел множество различных устройств, в том числе регулятор для автоматического наполнения парового котла и поддержания в нем уровня воды и даже новый тип подводной лодки. Венец его карьеры эластипед – приспособление для облегчения ходьбы, он представлял собой систему пружин, которые закреплялись на теле человека, автор рассматривал его как средство для скоростного перемещения пехоты. Однако военным трудно было представить скачущих на пружинах пехотинцев, поэтому изобретение осталось на бумаге. Сегодня эта идея реализована в джоли-джамперах – небольших развлекательных ходулях с изогнутой рессорой, позволяющей прыгать на высоту до 2 метров. Современные активные экзоскелеты снабжаются автономными источниками энергии, различными приводами и исполнительными механизмами, усиливающими человеческие конечности и снимающими нагрузку с позвоночника. Их распространению в промышленности и в военном деле мешает нерешенность проблемы источника энергии, надежды связывают с водородными элементами. Кроме полных экзоскелетов, существуют и частичные – это протезы конечностей.
Появление манипуляторов связывают с необходимостью дистанционной работы с радиоактивными материалами: потребовались устройства, воспроизводящие действия человека в изолированном от него помещении. Сначала для этой цели использовались простые механические пантографы, но в конце 40-х в Аргонной лаборатории, которой руководил Энрико Ферми, были разработаны электромеханические манипуляторы с сервоприводами и обратной связью.
Новейшим и наиболее перспективным из трех направлений являются коботы, или коллаборативные роботы (cobots) – это почти автономные роботы, участвующие в трудовом процессе совместно с человеком. Они делят с человеком общее рабочее место, в этом их принципиальное отличие от промышленных роботов, функционирующих по определению в изолированном от человека пространстве. Из соображений безопасности здесь ключевой проблемой является взаимодействие человека с роботом, причем речь идет не о фантазийном, азимовском, а о совершенно реальном. Одно из основных правил – энергия, питающая робота, всегда под контролем человека.
Изобретателями коботов стали профессора Эдвард Колгейт (Edward Colgate) и Майкл Пешкин (Michael Peshkin) из не слишком известного в России Северо-Западного университета (Northwestern University) в Эванстоне, штат Иллинойс. На самом же деле, этот университет в списке 20 лучших университетов мира. Ученые усомнились в сложившемся представлении о роботе, как о чем-то обязательно автономном и в 1997 году получили патент на «устройство и метод прямого физического взаимодействия между человеком и универсальным манипулятором, управляемым компьютером». Это содружество открывает фантастические возможности, коммерциализация коботов произошла практически мгновенно, первые серийные продукты были выпущены уже в 2004 году. Коботы могут облегчить деятельность человека на рутинных операция (логистика, упаковка), обеспечить большую точность и качество в металлообработке, они могут быть включены в системы автоматизации проектирования и производства CAD/CAM и в многое другое. Уже сейчас разрабатывается семейство Cobot-Air которое позволить принципиально изменить процедуры обслуживания самолетов, оно будет включать как колесные машины, так и летающие дроны для обслуживания верхней части фюзеляжа.
Рынок коботов является одним из самых быстрорастущих, в 2020 году он составит примерно 1 млрд долл. и ближайшее десятилетие предполагается ежегодный рост 30–50 %.
До появления нынешних мультимедийных средств казалось, что роботы могут иметь только материальное воплощение для занятия физическим трудом. Но с появлением разнообразных устройств, поддерживающих человеко-машинный интерфейс, с одной стороны, с другой, с возрастанием роли данных в современной экономике, изменилось представление о труде. Умственный труд оказался не менее важен, чем физический и, как следствие, оказалось насущным создание виртуальных роботов для автоматизации такого труда. Виртуальные роботы, не рассматриваются в качестве замены человеческого интеллекта, а как средство для его расширения (Augmented AI, AuI). Это направление роботизации находится на начальном уровне развития, пока самыми распространенными приложениями, относимыми к роботам, остаются речевые технологии (conversation-based technology). В их числе разговорные роботы чатботы (chatbot), речевые агенты (conversational agent) и виртуальные помощники (virtual assistant). В порядке возрастания сложности они могут быть упорядочены:
• Чатбот, действует в режиме один вопрос – один ответ (single-turn exchanges), например, «Гугл, какая гора самая высокая на Земле?»
• Речевой агент, вступает в диалог с пользователем, стремясь понять его проблему. Такой агент обучен задавать заранее подготовленные вопросы, чтобы выйти на возникающую проблему и по возможности ее решить, например, при обращении в банк: «Моя карта не срабатывает».
• Виртуальный помощник, настраивается на индивидуальные запросы клиента, пользуется накопленной о нем информацией, по мере взаимодействия с клиентом обучается и повышает качество ответов. Он может напомнить расписание полетов или список дел.
Создание виртуальных роботов требует решения двух проблем. Одна в большей мере формальная или техническая, она делится на две составляющие: распознавание и воспроизведение речи, задачи из этой категории уже имеют более или менее удовлетворительные решения. Другая категория – то есть содержательная – «понимание» обращений пользователя и формирование ответов.
Свою историю речевые боты ведут от программы ELIZA, написанной в 1966 году профессором МТИ Джозефом Вейцбаумом. Качественно новый шаг через 30 лет совершил Ричард Уоллес (1960), создатель виртуального собеседника «Искусственное лингвистическое интернет-компьютерное существо» A. L. I. C. E. (Artificial Linguistic Internet Computer Entity). Уоллес создал AIML язык разметки для AI по образу и подобию XML.
Между ELIZA и современными речевыми технологиями возник разрыв на несколько десятилетий, в первую очередь он был обусловлен отсутствием необходимых средств для распознавания речи (Automatic speech recognition, ASR) и воспроизведения голоса (Speech synthesis). Первая из этих задач оказалась чрезвычайно наукоемкой и потребовала более полувека работы большого числа специалистов. Нетрудно догадаться, что в ее решении были заинтересованы многочисленные спецслужбы разных государств, начало деятельности в этом направлении описано в «Круге первом» А. И. Солженицына. На речевой ввод возлагались огромные надежды – еще в 1977 году Билл Гейтс заявил, что через десять лет клавиатуры станут не нужны, компьютеры смогут понимать человеческую речь. В 1987 году он оказался скромнее, выразив убеждение в том, что через пять лет большая часть интернет-запросов будет совершаться с помощью речи, а не клавиатуры. И это предсказание тоже не сбылось, и в 2021 году клавиатура не исчезла и она успешно используется для запросов.
Для создания чатботов нужны еще средства распознавания речи, работы в этом направлении начались еще в 50-е годы, первые шаги в этом направлении были сделаны в процессе совместной работы лабораторий из нескольких университетов по программе автоматической транскрипции речи (Robust Automatic Transcription of Speech, RATS), спонсированной DARPA. Она завершилась созданием Harpy System, способной распознавать речь примерно на уровне трехлетнего ребенка. В последующем продолжались многочисленные эксперименты и исследования, но конца 90-х годов трудно было говорить о практической реализации технологий распознавания речи.
Решающий прорыв в этом направлении был сделан Google в 2001 году с изобретением Google Voice Search, использовавшем вычислительные мощности больших ЦОДов, хранящих сотни миллиардов речевых образцов.
Попытки распознавания, основанные на физике и статистике, главным образом на скрытых Марковских цепях были полезны, но не привели к конечному результату. Для коммерческих приложений требуется распознавание речи, а не идентификация говорящего, то есть система должна с равным успехом понимать речь разных людей с разными особенностями голосов. Решение такой задачи требует сочетания двух подходов – акустического и лингвистического, оно не может быть получено без методов машинного обучения. Только в середине прошлого десятилетия появились комплексные продукты от Google и Apple. Существующие системы ASR относятся к классу гибридных, в них сочетаются три модели – акустическая (acoustic), языковая (language) и модель произнесения (pronunciation), каждая из них обучается независимо от других и весь процесс в целом оказывается сложным и долгим. На смену этой парадигме идет следующая, где одна модель включают всё – End-to-end (E2E) ASR.
Отрадно отметить, что в области ASR, не уступая зарубежным компаниям работает Центр Речевых Технологий ЦРТ (ныне он куплен «Сбером»), его продукт CHiME Speech Separation and Recognition Challenge (CHiME-6) признан лучшим в своем классе на международном конкурсе в 2020 году.
Speech synthesis, в большей мере инженерная и прикладная задача, начиная с пятидесятых воспроизведением голоса занимались математики и инженеры в интересах военных спецслужб. Результатом стал класс приборов – вокодеров, превращающих живой звук в сигнал, который можно сжать или закодировать, чтобы уменьшить полосу пропускания и затруднить декодирование, а затем воспроизвести с тем или иным качеством. Успехи в этом деле привели к тому, что сегодня вся музыкальная индустрия основывается на новом поколении вокодеров, способных превратить убогое хрипение в хит.
Ни один фантаст не мог предположить создание киберфизических систем (Cyber-Physical System, CPS) – продукта конвергенции встроенных систем с AI. Этот термин возник в 2006 году при подготовке семинара, посвященного будущему встроенных систем в Национальном научном фонде США, его устроители пытались пересмотреть роль встроенных систем с учетом перспектив в области AI. И это им удалось – они уловили общую тенденцию и уже через пару лет прогресс в этом классе систем был признан одним из наиболее важных направлений технического развития в США, а чуть позже и в Европе. Администрация президента Барака Обамы включила киберфизические системы в приоритетный список инноваций. Реальные подвижки в CPS начались во втором десятилетии XXI века с подъемом третьей волны AI. В 2013 году Брюсселе состоялась специальная конференция Cyber-Physical Systems: Uplifting Europe's innovation capacity, посвященная киберфизическим системам и их роли в инновационном процессе, где было подтверждено, что развитие CPS служит важнейшим фактором для подъема европейской экономики.
Предшественниками CPS можно считать встроенные системы реального времени, распределенные вычислительные системы, автоматизированные системы управления техническими процессами и объектами, беспроводные сенсорные сети. CPS – это системы, состоящие из различных природных объектов, искусственных подсистем и управляющих контроллеров, позволяющих представить такое образование как единое целое. В CPS обеспечивается тесная связь и координация между вычислительными и физическими ресурсами. Область действия CPS распространяется на робототехнику, транспорт, энергетику, управление промышленными процессами и крупными инфраструктурами. Создание полноценных систем CPS в перспективе приведет примерно к таким же изменениям во взаимодействии с физическим миром, как те, к которым привела в свое время Сеть.
Можно выделить несколько основных предпосылок, сделавших CPS возможными. Первая – рост числа устройств со встроенными процессорами и средствами хранения данных: сенсорные сети, работающие во всех протяженных технических инфраструктурах; медицинское оборудование; умные дома и т. д. Вторая – интеграция, позволяющая достигнуть наибольшего эффекта путем объединения отдельных компонентов в большие системы, такие как Интернет вещей, и умная среда обитания (Smart Building Environment). Третья – ограничение когнитивных способностей человека, они не позволяют ему справиться с объемом информации, требуемой для принятия решений, поэтому какую-то часть действий нужно передать CFS, частично выведя человека из контура управления (human out of loop) и предать ее AI. В то же время в ряде случаев CPS могут усилить аналитические способности человека, поэтому есть потребность в создании интерактивных систем нового уровня, сохраняющих человека в контуре управления (human in the loop). Появление технологий AI позволяет решить обе эти проблемы.
Область приложения CPS естественным образом разбивается на следующие основные сегменты: умное производство, умные сети и услуги, умные здания и инфраструктуры, умный транспорт.
Главная составляющая умного производства (Smart Manufacturing, SM) – это управляющий им производственный интеллект (Manufacturing Intelligence, MI). Еще совсем недавно под MI понимали только программное обеспечение, превращающее данные в знания, необходимые для менеджмента, а сейчас MI видится шире – как совокупность всех возможных средств автоматизации управления на основе AI в сочетании с робототехникой, аддитивными и другими современными технологиями.
Умное производство состоит из умных машин (Smart Machines), отличающихся от современных мультифункциональностью, малыми габаритами, возможностью адаптации к потребностям пользователей, реализуемой путем сбора нужной функциональности в одной машине. Такие машины самоуправляемы – они могут оценивать состояние окружающей среды, обнаруживать и исправлять ошибки – например, реагировать на износ оборудования. SM позволяет оптимизировать все производство прежде всего за счет создания единой системы, в которой машины могут обмениваться данными между собой в режиме реального времени: обмен между оборудованием, расположенным непосредственно на производственных площадях и в логистической цепочке, включая бизнес-системы, поставщиков и потребителей; передача сведений о своем состоянии обслуживающему персоналу. При этом производственное оборудование, получая сведения об изменившихся требованиях, может само вносить корректировки в технологический процесс.
Системы класса CPS объединяют гетерогенные компоненты в единую систему с применением многочисленных контуров управления, состоящих из датчиков, управляющих компьютеров и исполнительных органов. Такая цельность SM отличает их от современного производства, нацеленного на массовое воспроизведение тех или иных физических объектов без полноценной функциональной интеграции. Нынешние промышленные роботы имеют ограниченное применение – их более широкому распространению мешают высокая собственная стоимость и сложность настройки, оправдываемые при выполнении повторяемых операций. Ручной труд остается, поэтому из-за желания снизить стоимость заводы переводятся в слаборазвитые страны, что приводит к разрыву цикла проектирование-производство с неизбежным снижением качества.
Современная жизнь находится в зависимости от сетей, предназначенных для передачи энергии, данных и т. п., ставших частью цивилизации, поэтому следующая задача CPS заключается в создании более эффективных умных сетей (Smart Grids). Максимально возможное снабжение их датчиками для сбора данных и обработка этих данных позволят предложить оптимальные решения, обеспечивающие экономическую эффективность, непрерывность снабжения, экологическую безопасность и защиту от террористических атак.
Национальная энергосистема – это система систем, состоящая из множества компаний, каждая из которых располагает теми или иными ресурсами от электростанций до счетчиков в домах потребителей. Уникальная особенность электрических сетей заключается в их полной зависимости от потребителей, текущее потребление почти полностью определяет вырабатываемую мощность, попытки сохранять и накапливать выработанную энергию немногочисленны, поскольку пока еще слишком сложны и дороги. Можно представить себе, какой объем информации нужно обработать для получения оптимального решения, учитывающего рыночные факторы, количество и качество производимой энергии (электричество, как любой товар, имеет собственные параметры качества – напряжение, частоту, форму кривой электрического тока), состояние линий передачи и многое другое. Очевидно, что принятие решений без AI невозможно.
Современные технологии строительства позволяют создавать умные сооружения (Smart Buildings), конструкции с минимальным или вообще нулевым потреблением энергии (Net-Zero Energy, NZE). Но они нуждаются в постоянном мониторинге, они должны быть подключены к умным сетям и соответствующим образом управляться средствами CPS с тем, чтобы наиболее целесообразно использовать предоставляемые внешним миром ресурсы и услуги. Объединение данных, полученных из разных источников, позволяет достичь режимов эксплуатации, близких к оптимальным.
Кроме того, основная задача для сооружений состоит в мониторинге их собственной конструкции и факторов внешней среды, которые на них воздействуют. Например, традиционно контроль за мостами сводится к периодической проверке их состояния без учета сейсмических, температурных, ветровых и других воздействий, поэтому их строили с колоссальным запасом, но даже при этом периодически происходят разного рода неприятности. Сегодня появилась возможность снабдить сооружения датчиками и передавать телеметрию в пункты контроля. Включение в контур управления CPS позволит не только безопасно эксплуатировать существующие сооружения и продлевать их жизненный цикл, но и создавать качественно новые конструкции.
Умные транспортные системы (Smart Transportation) оборудованы различными компьютеризированными встроенными системами управления на разных уровнях. Практически решены задачи связи транспортного средства с системами обслуживания и дистанционного доступа человека к различного рода транспортным услугам. Снабженные AI CPS обеспечат создание полноценной связанной системы, включающей связь между машинами (Vehicle-to-Vehicle, V2V) и между машиной и внешней окружающей ее инфраструктурой (Vehicle-to-Infrastructure, V2I). В целом V2I играют координирующую и кооперирующую роль, обеспечивая сбор информации из разного рода источников и распределяя ее между группами автомобилей или отдельными автомобилями – например, сообщают водителям рекомендуемые параметры (дистанцию, скорость), с тем чтобы все участники движения перемещались быстрее и безопаснее.