Автор: Илья Щуров Voyager
Человек, попадающий на CeBIT, оказывается в страшном водовороте торговых марок, стендов, презентаций, розыгрышей, лотерей и прочих элементов большого шоу. Если этот человек имеет несчастье быть еще и журналистом, к вышеперечисленным бедам добавляются разнообразные пресс-конференции, специальные мероприятия, горы пресс-релизов и другие «профессиональные заболевания». Ну а если журналиста интересуют не только и не столько мэйнстримные направления, сколько инновационные проекты, не укладывающиеся в общие рыночные тренды и веяния технологической моды, от ощущения хаоса происходящего ему уже не избавиться. А посему, не претендуя на анализ, классификацию и упорядочивание собранных материалов, расскажу о наиболее запомнившихся сюжетах из «Парка будущего», расположившегося в павильоне №9. Так, как они представляются посетителям выставки, — то есть в более или менее случайном порядке.
Овеянная ореолом «не вполне легальности», аббревиатура P2P на одном из стендов девятого павильона сразу привлекла мое внимание. Однако, как показал допрос с пристрастием, исследовательская группа KOM из университета Дармштадта рассматривает пиринговые сети не как источник пиратской музыки, а как интересную концепцию предоставления сервисов, обладающую многими преимуществами перед традиционной клиент-серверной моделью. Впрочем, недостатков у нее тоже хватает, и один из главных эта группа и попыталась исправить. Исследователи представили концепцию своеобразных виртуальных денег, предназначенных для использования в пиринговых сетях. Известно, что жадные и эгоистичные пользователи, не желающие делиться своими файлами (или другими ресурсами), но активно использующие ресурсы других участников, — проблема любого пирингового обмена. Для ее решения была предложена система, позволяющая устроить «рыночные отношения» в пиринге: если один участник хочет получить какую-то услугу от другого (например, скачать файл, хранящийся на его компьютере), он должен передать ему взамен некоторое количество «жетонов» (token). Зарабатывать токены можно, предоставляя другим пользователям свои ресурсы. При этом используется хитрая криптографическая схема (так называемая пороговая криптография), не позволяющая участнику ни «печатать» свои жетоны, ни использовать одну и ту же «денежку» многократно. Преимущества такого подхода: полная децентрализованность (нет ни центра эмиссии, ни центра контроля за хождением «валюты») и глобальность (токен, полученный одним участником от другого может быть обменян на «неиспользованный», который передается третьему, а от того — четвертому; это отличает данную разработку, например, от системы кредитов в сети ED2K, которые нельзя передавать третьим лицам). Обрадованный такими возможностями, я уже хотел было предложить разработчикам сделать настоящую систему цифровой наличности на основе их технологии, но это оказалось не очень хорошей идеей: надежность в данном случае основана на контроле действий одних участников другими, поэтому от анонимности, совершенно необходимой при операциях с настоящими деньгами, здесь не осталось и следа.
Болея в молодые годы научно-фантастическим графоманством, я как-то описывал космический корабль, понимавший своего капитана буквально с одного взгляда. В девятом павильоне было представлено несколько разработок, позволяющих управлять курсором с помощью взгляда — отличаются они технической реализацией и степенью (не)удобства использования. В одной из «революционных разработок» для достижения взаимопонимания с компьютером человеку приходилось фиксировать голову в некоем механизме, в других использовались более интеллектуальные алгоритмы, отслеживающие направление взгляда по изображению с веб-камеры или ИК-сенсоров. Шведская компания Tobii даже показала прототип компьютера, вовсе лишенного мышки и клавиатуры — их заменила одна-единственная кнопка и система отслеживания взгляда. (На мой вопрос о том, нельзя ли убрать и кнопку и, скажем, для клика подмигивать одним глазом, разработчики ответили, что сделать-то это нетрудно, только вот общаться с компьютером с помощью перемигивания вам быстро надоест.) Правда, для более или менее комфортной работы пришлось написать специальный софт с адаптированным интерфейсом (большими кнопками, по которым трудно «промахнуться», рис. 1). Технология кажется перспективной, но вряд ли она в ближайшее время вытеснит банальную мышку. Несмотря на все усилия разработчиков, пользоваться подобным интерфейсом все же непросто — курсор скачет по экрану с бешеной скоростью и далеко не всегда указывает куда нужно. Тем не менее людям с ограниченной подвижностью такая разработка очень пригодится.
Еще одна сфера применения подобных систем — анализ поведения человека. Знание о том, на каких элементах картинки внимание надолго задерживается, а какие остаются незамеченными в силу психологии восприятия, наверняка будет полезным дизайнерам рекламы. А мечущийся в поисках нужного пункта меню взгляд укажет на ошибки юзабилити, допущенные при создании корпоративного сайта или сложной программы.
Еще одна разработка в области интерфейсов — очередная вариация на тему управления компьютером с помощью мысли, на сей раз от института Фраунгофера (проект называется Berlin Brain-Computer Interface, рис. 2). Подобные экспонаты представляются регулярно, но, по словам Сергея Леонова, на прошлогодней CeBIT посмотреть на аналогичную разработку в действии он так и не смог — не было «нужного специалиста». В этот раз все работало без сучка без задоринки: окруженные любопытной толпой, перед большим экраном неподвижно сидели два человека в специальных шлемах со множеством электродов и проводов, а на экране постепенно появлялись осмысленные предложения.
Конечно, о «мысленной диктовке» речь пока не идет, и набор текста представляет собой совсем не тривиальную операцию — на экране крутится стрелка-курсор, и оператор должен мысленным усилием остановить ее в тот момент, когда она указывает на нужную букву или группу букв. Как и в других подобных разработках, система снимает электроэнцефалограмму, а для ее обработки (и это главная особенность проекта) используется самообучающийся алгоритм, подстраивающийся под конкретного человека и позволяющий относительно быстро освоить «мысленный язык». В качестве «клика» может восприниматься импульс, подающийся перед совершением какого-то движения, причем он будет воспринят и расшифрован с опережением самого действия. Используя этот факт, разработчики даже планируют применить свои достижения для повышения безопасности на дорогах, ведь «читая мысли», автомобиль сможет затормозить быстрее, чем человек успеет надавить на педаль. Впрочем, в надежности подобной системы я несколько сомневаюсь: всевозможные самообучающиеся программы распознавания образов (по сути, здесь решается близкая задача) дают сбои гораздо чаще, чем можно допустить в столь ответственном деле, как управление автомобилем.
Несколько исследовательских проектов, представленных в девятом павильоне, были посвящены анализу связей между разными текстами. Группа Commetrix показала интересный софт, визуализирующий устройство различных сетевых сообществ на основе анализа переписки в почтовых конференциях, общения на чатах, форумах и других онлайновых коммуникационных площадках (рис. 3). Этот продукт позволяет не только наглядно представить себе социальную сеть (в том числе и в динамике), но и понять, кто из участников наиболее активен и важен для работы сообщества, а также узнать много других подробностей жизни сообщества. Свои разработки компания предлагает внедрять как с чисто научными, так и с вполне прагматичными целями: например, для анализа сообществ клиентов или собственных сотрудников.
Другая близкая по духу разработка принадлежит институту Фраунгофера. Программа под названием SWAPit анализирует самые разные текстовые документы, находит между ними незаметные невооруженным взглядом связи и отображает результаты в визуальной форме. В качестве возможных сфер применения разработчики называют анализ патентной ситуации в той или иной области, исследование состояния рынка и многие другие задачи, в которых требуется обрабатывать большие объемы разнородных текстов. На выставке, например, был проведен анализ спортивной прессы с целью получения выводов о состоянии спортсменов и их шансов на победу. В связи с полным отсутствием знаний в данной области оценить результаты по достоинству я не смог. Но выглядит прикольно.
Несколько любопытных проектов были посвящены близкой мне теме е-обучения (e-learning) — использованию информационных технологий в образовании. Забавной показалась разработка, позволяющая использовать LCD-проектор в качестве школьной доски, то есть рисовать по проектируемому изображению специальной ручкой как обычным мелом (рис. 4).
Запомнился также оригинальный проект LeActiveMath, предназначенный для автоматического создания математических пособий на заданную тему. Система представляет собой базу данных, содержащую кусочки текста (определения, формулировки, доказательства и т. д.), вместе со всеми связями между ними. В зависимости от запроса она может сгенерировать как краткую «шпаргалку» по какому-то вопросу, содержащую только определения и основные факты, так и подробный учебник или задачник. При этом, попросив, например, рассказать про дифференцирование функции, ученик получит и всю вспомогательную информацию вплоть до определения бинарного отношения (конечно, это поведение тоже регулируется). Программа предназначена и для создания книг преподавателями, и для самостоятельного использования студентами.
Во время демонстрации замечаю, что в списке доступных языков наравне с английским и немецким фигурирует и наш «великий и могучий». Спрашиваю: «А что, у вас есть разработчики из России?» «Да, — отвечает Кристоф Бюргард, представляющий проект, -среди участников есть и россияне, но пока переведен только интерфейс и лишь небольшая часть основного контента». Интересуюсь, кто именно с ними сотрудничает. «Один профессор со своей ученицей из какого-то университета недалеко от Москвы». Заходим на сайт проекта и действительно обнаруживаем там соотечественников из… Йошкар-Олы.
Необычное использование GPS, различных носимых сенсоров и сетевых сервисов продемонстрировали экспериментаторы из проекта MobiLife (www.ist-mobilife.org). С помощью программы Context Watcher, работающей на смартфонах Nokia Series 60, можно добавлять записи в блог, не набирая ни одной строчки текста. Система автоматически отслеживает местоположение (по GPS или идентификатору базовой станции сотовой связи), скорость перемещения (если человек идет пешком, используются специальные сенсоры в обуви), частоту сердечных сокращений, погоду «за бортом» и другие параметры и на основе анализа этих данных может составлять короткие отчеты о минувшем дне. Например, «это был тяжелый день, проведенный по большей части (80%) на CeBIT и в гостинице (15%). Я также был во Франкфурте. Максимальная скорость составляла 200 км/час» — примерно такую запись о вчерашнем дне показал мне Йохан Коолвай, представляющий проект. Записи можно автоматически иллюстрировать фотографиями, снятыми на камеру телефона, — они сами добавляются на сервер Flickr вместе с готовыми описаниями и необходимыми тегами. Помимо всего прочего, можно наблюдать за состоянием и местоположением своих друзей на глобусе Google Earth — о последней возможности я со вздохом вспоминал, когда нужно было срочно найти кого-нибудь из членов нашей «экспедиции» на CeBIT (рис. 5).
Компания Lego развлекала публику демонстрацией роботов, собранных из новой версии своего конструктора Mindstorms NXT, впервые показанного два месяца назад на выставке CES в Лос-Анджелесе. Странные существа из до боли знакомых деталек весело резвились в специально выделенном для этого «вольере», наглядно демонстрируя достижения робототехники, доступные детям от десяти лет (рис. 6). Первая версия Mindstorms была выпущена еще в 1998 году, и необходимость обновления конструктора явно назрела. Видимо, в компании провели «мозговой штурм» и выпустили NXT: он содержит еще более умный «мозг» робота (NXT intelligent brick, теперь с 32-разрядным процессором, поддержкой USB и Bluetooth), новый ультразвуковой детектор движения, систему распознавания голосовых команд и прочие улучшения. Обновился и софт для визуального «конструирования» программ — впрочем, нет никаких сомнений, что энтузиасты Mindstorms быстро научатся использовать для этих целей привычные языки программирования, типа C++ или Java.
А вот студенты из университета Саарланда решили не дожидаться выхода Mindstorms NXT и из самого обычного Lego собрали робота-бармена, принимающего заказы на естественном языке (рис. 7). Впрочем, основное достижение молодых конструкторов — не сам робот, а диалоговый модуль, определяющий возможные вопросы, ответы и реакции Мико (так зовут пластмассового бармена) на разные команды. Принимая заказ, он последовательно спрашивает у своих «клиентов», какие ингредиенты нужно смешивать и в каких пропорциях, а по окончании процесса интересуется, нужно ли взбалтывать получившийся коктейль. Возможно, что подобная система в будущем заменит надоедливые автоответчики в call-центрах, не отличающиеся особой интеллектуальностью.
Еще один популярный сюжет Future Parc — технология дополненной (augmented) реальности, позволяющая взглянуть на мир глазами киборга. Ничего сложного в этом нет: достаточно надеть специальные очки со встроенным проектором, который накладывает на реальную видимую картинку дополнительный слой, генерируемый компьютером. Например, институт Фраунгофера демонстрировал макет крыла, глядя на который можно было в реальном времени наблюдать за изменением огибающих его потоков воздуха. Экспонат на аналогичную тему от Siemens представляет собой модель завода, который можно было отремонтировать без специальных знаний о его устройстве, руководствуясь лишь визуальными подсказками. Разработчики с гордостью отмечают, что их технология распознавания образов не нуждается в специальных маркерах на объектах, адаптируясь практически к любым условиям (рис. 8).
А наиболее близкой к домашнему хозяйству можно назвать совместную разработку итальянской Mobile Solutions и финской VTT. Небольшое Java-приложение позволяет использовать камеру мобильного телефона, например, чтобы посмотреть, как будет выглядеть новый диван в вашей комнате. Из списка выбирается подходящая модель, затем «фиксируется» в нужной точке комнаты — и далее камеру можно свободно перемещать в пространстве — изображение модели накладывается на реальную картинку с камеры и трансформируется в соответствии с законами оптики.
Разнообразные трехмерные мониторы приезжают на CeBIT ежегодно. В этот раз, как и раньше, чтобы увидеть трехмерную картинку, нужно было либо надевать специальные очки (чаще всего разработчики не мудрствуют и используют классические красно-синие стекла), либо оказаться в правильной точке перед экраном (конечно, любоваться трехмерным изображением вдвоем — затруднительно).
Некоторый прогресс, впрочем, тоже есть: появились мониторы, отслеживающие положение глаз зрителя и соответствующим образом подстраивающие картинку (правда, и в этом случае смотреть ее вдвоем трудновато, но, по крайней мере, нет жесткой привязки к месту). Ну а институт Фраунгофера и здесь отличился, выпустив необычный цилиндрический трехмерный монитор: вокруг него можно ходить, рассматривая изображение с разных сторон (рис. 9). В очки в данном случае, помимо всего прочего, встроен индикатор положения, ориентируясь по которому система разворачивает модель, показывая зрителю «правильную» сторону. По традиции разработчики пророчат своему детищу перспективное будущее в рекламной и развлекательной индустрии. Остается только убедить прохожих, желающих полюбоваться на трехмерный рекламный биллборд, в необходимости надеть цветные очки…