Цифровой журнал «Компьютерра» № 115 - читать бесплатно онлайн полную версию книги автора Коллектив Авторов (Голубятня-Онлайн) #4

Голубятня-Онлайн

Голубятня: Гешефт прислонившихся Сергей Голубицкий

Опубликовано 02 апреля 2012 года

Сегодня нужно было отыскать адрес человечка в gmail.com. Человечек мне его дал, но то ли записал неправильно, то ли я почерк разобрать не смог, но письма к нему не доходят.

Что может быть проще, чем найти адрес электронной почты человека в 2012 году? Я вам скажу, что может быть проще: не найти этот адрес! Вернее, почти нереально его найти. Насколько это печально, насколько не соответствует духу времени и даже оскорбляет его, вы даже представить не можете.

Гуглю что-нибудь вроде «how to find person’s email in gmail.com» и получаю длинный список, типа, нужных линков. Кликаю на одном из первых — Yahoo! Answers: если полагаться на название, должно быть пристойно.

Читаю первую рекомендацию (вернее ответ на вопрос о поиске электронной почты): «Если вам нужно получить электронный адрес, лучше спросить его/ee владельца. Если вы пытаетесь узнать адрес человека, то можно спросить у друзей или родственников, но если ваши усилия не дадут результата, лучше оставить поиски, потому что все равно ничего найти не получится — ведь адрес электронной почты — это очень личный и конфиденциальный вебсайт».

Ну то есть, что писал полный идиот, наркоман или ребенок лет 5, это понятно сразу. Забавно, по каким критериям Yahoo! отбирает лучшие ответы и размещает их в самом начале списка? Не удивительно, что эта компания ходит по рукам аки микроб.

Смотрю советы дальше: «Воспользуйтесь http://find-email.find-people-info.com!» или еще «http://www.emailseekeronline.com, мне очень помогло. Надеюсь, поможет и вам». Ну и так далее.

Не тратьте времени на проверку линков: все они ведут в мерзкие разводиловки, вымогающие деньги: вводите имя и фамилия человека, портал делает вид, что что-то ищет (раз в неделю дебильные скрипты также вот ищут вирусы на моем Маке и через минуту-другую выдают сообщение: «Ваш PC заражен 69 троянами и 24 вирусами! Срочно отправьте СМС для получения регистрационного ключа лучшей антивирусной программы!»), и находит. Мне нашел целых 89 электронных адресов для людей с нужным мне именем и фамилией. Желаете посмотреть? Не вопрос: 23 доллара 40 центов аж за годовую подписку на их говносервис или 14 долларов 95 центов для одноразового доступа к 89 найденным адресам!

На самом деле мы сталкиваемся здесь с двумя катастрофическими ситуациями одновременно. Во-первых, это дикий анахронизм закрытого доступа к электронной почте в наше время. Сегодня у 90 % людей есть аккаунт в Фэйсбуке, Твиттере, или какой-то другой социальной сети. Любой номер телефона, любой наземный адрес узнается за четыре минуты — либо в бумажных справочниках, либо в онлайн-сервисах (бесплатных, разумеется!). И только электронная почта почему-то считается страшно конфиденциальной информацией. Конфиденциальной для всех людей, кроме спамеров! Эти последние играючи и беспроблемно покупают оптом ваши электронные адреса у онлайн-коммерсантов, а затем заваливают вас своим рекламным мусором.

Реверс информационной катастрофы — это несметные полчища бездарных и никчемных существ, которые коммерциализируют все, что только шевелится. И уровень анахронизма в этом явлении значительно выше, чем в случае с наложением грифа секретности на электронную почту.

Любой бизнес на самых ранних стадиях пытается эксплуатировать информационный вакуум. Это для бизнеса нормально. В 90е годы, кажется, все 100 процентов гешефт-активности в СНГ строилось вокруг коммерциализации массового незнания всего и вся. За углом продается по 10 рублей, но люди еще не знают? Отлично: открываем ИЧП по продаже тех же товаров по 15 рублей: получил деньги у покупателя — сбегал за угол — купил дешевле — принес товар — оставил себе маржу.

Это универсальная схема всеобщего обогащения первых 10 лет послесоветского беспредела. По ней работали все: покупали нефть, лекарства, сталь, мазут, азот в одном месте, продавали в другом месте. Тем, кто либо не знал, где лежит дешевле, либо боялся туда соваться, либо его туда не пускали.

Я помню свою первую сделку в 1992 году: купил две машины шампанского. Прямо с завода — по личному распоряжению директора (с улицы шампанское купить на том же заводе было невозможно в принципе — все партии были официально распроданы на 5 лет вперед).

Мы вывезли «шипучку» и даже не довезли ее до склада: на полпути по предварительной договоренности товар перегрузили в машины двух гастрономов, которые с радостью купили все под чистую по цене в три с половиной раза превышающую отпускную на заводе.

Два дня работы — 350 процентов прибыли. Вернее, 175, потому что вечером пришел бандит Ованес, друг директора завода шампанских вид, который любезно дал нам наводку, и забрал 50 % выручки. За труды.

Гешефты на информационном вакууме — это признак первобытной недоразвитости экономических отношений. Он понятен в 90х годах в России. Но что делает это убожество в 2012 году в интернете?! Причем не в Рунете, а в его самом развитом американском секторе? Ведь интернет — это символ информации, главное назначение интернета — предоставлять информацию. Ан нет, сидят жучки-долгоносики и пилят свою жалкую таньгу, продавая адреса электронной почты!

Мое недоумение, впрочем, длилось лишь пару минут. Объяснение мнимого парадокса нашлось в человеческой психологии, для которой интернет — лишь мимолетная декорация, ибо сама психология сохраняет закостеневшие формы в неизменном виде тысячелетиями.

Подавляющее число людей на земле полностью лишено пассионарности. Они не способны генерировать никакого собственного содержания ни в чем — лишь пассивно воспринимать извне посылаемые им импульсы. Фраза эта — общее место.

Зато следующая нетривиальна: меньшинство, которое принято считать пассионарным, на самом деле, опять же, в подавляющей своей массе полностью лишено креативности. То есть, скажем, если только 10 процентов людей способны заниматься бизнесом, работать на самих себя, отвечать за свои слова и дела, всячески рисковать и «брать на себя» в самом широком смысле слова, то из этих 10 процентов 90 процентов лишены умения создавать что-то новое, генерировать оригинальные идеи и т.п.

Удел этих 90 % (из ранее отобранных 10 %) — заниматься псевдо арбитражем, то есть: покупать за углом дешевле (либо вообще брать бесплатно, как это случается в интернете) и продавать дороже тем, кто не в теме (не знает, что за углом дешевле)!

Всё — больше ничего! В риаллайфе псевдо арбитраж цветет липовым цветом от розничной торговли — самой массовой и популярной формы деловой активности в мире — до несметных стад жучков-посредников (квартирные брокеры и проч.). В интернете модель фальшивого арбитража воплощена в торговлю информационным вакуумом. Самое страшное: эти псевдо пассионарные ничтожества хорошо друг друга сканируют, потому быстро осознают общность интересов и весьма эффективно выводят из открытого доступа все больше и больше информации! Главный парадокс интернета: из года в год ценной и полезной информации в нем становится все меньше, а мусора — все больше.

Эта тенденция — результат жизнедеятельности псевдо бизнесменов, которые, как я сказал, по сговору между собой выводят банальную информацию вроде адресов электронной почты из открытого доступа, а затем продают ее за 23 доллара 40 центов!

Процесс этот я назвал гешефтом прислонившихся, использовав одну из метафор Галковского, который описал жизненную потребность большинства людей постоянно к кому-нибудь прислоняться, чтобы сосать из него соки, пока это возможно и дозволительно.

Софт-аппендикс сегодня — забавное мобильное приложение SpinCam. Я пользуюсь им на айфоне, но поскольку практически все из AppStore сегодня портируется в GoogleStore, не сомневаюсь, что аналог найдется и для Андроида:

Смысл SpinCam: вы находите какой-то потрясающий объект (танцующая барышня, архитектурное сооружение, дебильный памятник), запускаете приложение, нажимаете кнопку и начинаете обходить объект по кругу. Программа следит за скоростью сканирования и подает сигналы, если вы движетесь слишком медленно или быстро.

На выходе вы получаете круговую панораму, которую очень прикольно разглядывать. Вы можете оставить свое творение в локальной папке, а можете загрузить в социальную сеть SpinCam, в которой хранятся тысячи и тысячи забавнейших образцов человеческой радости. Поймал себя на том, что мне интереснее рассматривать чужие галереи круговых панорам, чем создавать собственные :)

К оглавлению

Голубятня: Ударим графематикой по графомании! Сергей Голубицкий

Опубликовано 05 апреля 2012 года

Писатель: Я писатель!

Читатель: А по-моему, ты говно!

(Писатель стоит несколько минут, потрясённый этой новой идеей, и падает замертво. Его выносят.)

Даниил Хармс

Культур-повидлианствовать сегодня будем в пандан софтверному аппендиксу. В смысле, что не традиционный не пришей-к-красной-армии-рукав, а одно вытекает из другого, да и связано напрямую.

Разговор пойдет о разработке наших ученых-соотечественников, бороздящих ниву на стыке самых перспективных отраслей знания: структурно-прикладной лингвистики и компьютерных технологий.

Если с компьютерами вопросов, обычно, не возникает, то роль лингвиста почему-то в общественном сознании откровенно не дотягивает до заслуженного места. В лучшем случае, обывателю приходит в голову: переводчик какой-то! Если на пике славы, то — Гоблин. Больше ничего. Неужели придется дожидаться эпохи «Stargate» (помните еще культовый фильм Роланда Эммериха?), чтобы понять, что лингвист — это главный пророк нашей цивилизации (астролог, Дельфийский оракул и компьютерный томограф в одном флаконе!)?

Эк меня понесло! Короче говоря, один из разработчиков, Дмитрий Силницкий, зная о моих слабостях в сфере интерпретации смыслов и дата-майнинга, прислал на тестирование демо-версию совершенно уникального движка, который выполняет сравнительный анализ текстов по авторскому стилю и жанру.

При этом движок понятия не имеет о существовании автора имярек, да и вообще не догадывается о смысле слов и денотатах в принципе. Основа движка - графематический анализ, оперирующий лишь цепочками языковых символов - знаками, буквами и словоформами!

Для хотя бы приблизительного объяснения этого монстра позволю небольшую цитату из теоретического сопровождения разработок (текст Игоря Ножова из РГГУ):

«Основная цель графематического блока получить выборку полных словоформ из массива текстов базы данных. Графематический анализ работает с внешним представлением текста и использует таблицу стоп-слов. В этой таблице хранятся цифры, спецсимволы и частотные слова языка, нерелевантные для поиска по текстам.

Графематический анализ выполняет три функции:

1. отсечение стоп-слов в тексте;

2. разбиение данных на три потока;

3. индексация каждого потока.

Единицей графематического анализа является цепочка символов, выделенная с двух сторон пробелами. Выделенная цепочка символов подвергается последовательной обработке эвристическими правилами: отсечь знаки пунктуации, проверить присутствие гласных внутри цепочки, чередование верхнего и нижнего регистров и т.д. В зависимости от результатов обработки полученная цепочка символов направляется в один из трех потоков данных:

- цифровые и символьные комплексы (‘кг’, ‘ст.’, ’12.01.99’);

- аббревиатуры — названия государств, организаций, предприятий (‘СССР’, ‘ЮНЕСКО’, ‘ДорСтройСервис’);

- полные словоформы»

В результате столь необычного и внешне совершенно схоластического анализа мы получаем более, чем осмысленные результаты. Именно созерцание практических результатов произвело на меня неизгладимое впечатление.

Я получил демо-версии аналитического движка для двух баз данных. Первая — англоязычная — проводила стилистический и жанровый анализ относительно хоть и скромной, но вполне репрезентативного массива данных, насчитывающего 2995 авторов и 6266 произведений. Вторая — русскоязычная — чисто номинальная — лишь 700 книг авторов, выражающих мысли на великом и могучем.

Естественно я начал тестирование с себя любимого: ввел в анализатор текст книги «Как зовут вашего бога». На выходе получил такой результат:

Как видите графематический анализатор опознал мой стиль почти с абсолютной точностью — коэффициент корреляции 95,84 %! Далее идет Вильгельм Адам (кто это?) и много всяких незнакомых товарищей — вплоть до Ильфа и Петрова (62,70 %) и Михаила Веллера (42,66%).

Проверим теперь анализатор на коротких текстах — ввожу «Дело русских медведей», то есть одну из последних Голубятен:

Забавно, не правда ли? Корреляция с самим собой пропала, что не удивительно: на 5 тысячах знаков никакой глубины ожидать не приходится. Зато всплыли чужие ассоциации. Так мой сегодняшний стиль демонстрирует самый высокий коэффициент стилистической и жанровой корреляции с Михаилом Веллером (55,76 %). Далее следует Вячеслав Алексеев (это кто?), Хорхе Луис Борхес (я старался!), Шарль Бодлер (откуда анализатор знает про моего самого любимого поэта?!) и т.д. Даже обожаемый Аутагава Рюноскэ присутствует в первой десятке корреляции!

Тысяча чертей: но ведь это же не в бровь, а в самый глаз!

Как и полагается, честному смекалкину, советского замеса, я тут же захотелось всунуть лом между приводной цепью и шестернями анализатора, поэтому скормил ему голубятню образца 2004 года («Лингвистический анализ одного отстойника: призраки ФИДО в XXI веке»)!

Опять нет прямой корреляции с автором, но подтвердился Веллер на первом месте. И Рюноскэ. Зато исчез Бодлер (старею?).

Признаюсь, результат сразил меня наповал. Понимаете, в чем дело: я же очень хорошо знаю креативные импульсы, наполняющие мои тексты. Меняется рациональное осмысление письма, его техника, приемы, стилистические фигуры и уловки, но стилистическую основу изменить нельзя — она сидит глубоко в подсознании! И там у меня — кладезь морализма, детского идеализма, романтизма, замешанного на трагичном восприятии жизни. Рюноскэ и Бодлер — очень точное описание моих чувств, преломленных через создаваемые тексты. Плюс - l’art naif на уровне семантики, синтаксиса, подбора метафор.

Все эти довольно своеобразные жанровые и стилистические особенности моих текстов, отделенных друг от друга 9 годами, графематический анализатор уловил поразительным образом! Не зная ни имен, ни культурологических контекстов автора! Не говоря уже о консистентности стиля и жанра во времени (9 лет дистанции все-таки!). Потрясающе!

Ради чистоты эксперимента подверг жанрово-стилистическому анализу текст Михаила Веллера («Легенды Арбата»):

Текст большой, поэтому анализатор безупречно определяет первым в списке самого автора! Забавно, что Сергей Михайлович Голубицкий числится в корреляционном списке Веллера под номером 11 (44,26 %)! Вот она — диалектика взаимовлияния :)

Теперь — Юрий Бондарев («Берег»):

И тот же результат — первым в списке корреляций — сам автор (78,48 %), далее следуют Александр Абрамов, Василий Аксенов, Стругацкие, Акунин.

Дмитрий Силницкий со товарищи трезво отдают себе отчет о непомерной работе, которая предстоит до того, чтобы придать концепту сколько-нибудь практический (не говоря о товарном!) вид. Самое, однако, главное, что уже сейчас четко вырисовываются как минимум несколько аспектов применения этой разработки: во-первых, на основе графематического анализатора можно создать платформу для продвижения неизвестных авторов и разработать систему книжных рекомендаций; во-вторых, можно построить интеллектуальный журнал типа ZITE, который будет задействовать совершенно иные критерии для кастомизации потребительского контента (жанрово-стилистические — и это мне кажется будет посильнее Фауста Гете на фоне современного чисто тематического — «топики» и «лайки» — подхода); в-третьих, можно будет разработать самые разнообразные системы для тестирования и типизирования личности.

И это — лишь на поверхности. Лингвистические методы анализа действительности столь обширны и универсальны, что навскидку даже затрудняюсь обозначить хоть приблизительно глобальные сферы применения. Психологическая (и психиатрическая) терапия? Извольте! Дата-майнинг стратегического назначения? Не вопрос! Банальная информационная разведка? You bet! Полиграф? Да вот он — уже тут! Ну и так далее.

Короче говоря, я радуюсь, что так много жизни пульсирует вокруг и не все еще потеряно!

К оглавлению