Що таке Веб 2.0 - читать бесплатно онлайн полную версию книги автора Тім О'Рейлі (Дані

Дані — це наступний Intel Inside

Опубліковано 20.10.2005 р. (джерело)

Всі сучасні інтернет-застосування зав'язані на бази даних: пошукач від Google, каталог (і пошукач) від Yahoo!, склад товарів на Amazon, картотека товарів і продавців на ebay, карти Mapquest, каталоги Napster. Хел Веріан торік навіть сказав, що «SQL — це новий HTML». Компаніям епохи Веба 2.0 важливо уміти працювати з БД. Так важливо, що деколи ми називаємо нові застосування не software, а рo ware.

Все це підводить нас до головного питання: хто володіє даними?

Очевидно — і тому є безліч прикладів, — що в епоху інтернету той, хто володіє БД, володіє і ринком, а значить, отримує левову частку прибутку. Монополія на реєстрацію доменних імен, надана американським урядом компанії Network Solutions (пізніше куплена Verisign), була однією з перших по-справжньому грошових операцій в Інтернеті. І якщо зберегти ринкову перевагу, контролюючи API, все важче, контроль над важливими джерелами даних забезпечити куди простіше. Особливо якщо ці джерела дорого відтворити (або вони були наповлені за допомогою користувачів сервісу).

Подивіться на копірайти на картах від MapQuest, maps.yahoo.com, maps.msn.com або maps.google.com. Скрізь буде позначка «Maps copyright Navteq, Teleatlas» або «Images copyright Digital Globe» (це новий постачальник супутникових зображень). Обидві компанії неабияк вклалися в свої БД. (Тільки Navteq, як то кажуть, витратила на створення БД з назвами вулиць і маршрутами 750 млн. доларів. Digital Globe довелося розлучитися з 500 млн. доларів, щоб запустити власний супутник, який робить знімки з вищою роздільною здатністю, ніж урядові сателіти.) Navteq дійшла до того, що почала ліпити свій логотип на автомобілі, які оснащені системами навігації, - майже як колись Intel зі своїм Intel Inside.

Дані, поза сумнівом, і є єдиний важливий компонент подібних застосувань, тоді як сам софтвер здебільшого поставляється у відкритому вигляді, а навіть якщо і ні — все одно цілком доступний.

Давайте на прикладі високо конкурентного ринку веб-картографії подивимося, як нерозуміння важливості володіння ключовими даними може погіршити конкурентоспроможність. Першою на ринку веб-карт була Mapquest в 1995 році, за нею прийшла Yahoo!, потім — Microsoft, а недавно до них приєднався і Google, — при цьому всі компанії, ліцензують у постачальників інформації, по суті, одні і ті ж дані.

Візьмемо протилежний приклад: Amazon. Спочатку його БД була побудована на регістрі коду ISBN від R.r.bowker. Бази конкурентів, відповідно, не мали істотних відмінностей. Але на відміну від Mapquest, Amazon без втоми доповнював дані, додаючи інформацію, надану видавцем, — обкладинки, зміст і навіть фрагменти з книг. Що важливіше, Amazon привернув користувачів для написання анотацій, і тепер саме Amazon — а зовсім не Bowker — є головним джерелом бібліографічної інформації для філологів і бібліотекарів, не кажучи вже про простих смертних. Також в Amazon був розроблений унікальний ідентифікатор ASIN, покриття якого ширше, ніж у ISBN.

В загальному, Amazon наздогнав і перегнав своїх постачальників інформації.

Уявіть, що так само поступила б Mapquest: привернула б користувачів до анотування карт та маршрутів і навіть до створення нових інформаційних шарів. Боротися з такою компанією конкурентам, у яких в наявності тільки оригінальні дані, що ліцензіюють, було б куди важче.

Власне цим зараз займається Google. Google Maps — це експеримент по створенню конкуренції між постачальниками даних і розробниками додатків. Спрощена модель програмування від Google привела до появи безлічі додаткових сервісів, які побудовані на поєднанні функціональності Google Maps з іншими даними, доступними в інтернеті. Так, наприклад, housingmaps.com дозволяє накладати на карти від Google рієлторські оголошення від Craigslist. На виході у нас виходить нове інтерактивне застосування, чудовий приклад змішування технологій.

У даний момент подібні гібриди в основному є іноваційними експериментами, долею хакерів. Але і підприємницька активність не за горами. Та вже можна бачити як мінімум один клас таких розробників — адже сам Google «відвів» роль джерела даних від Navteq, перетворивши себе на популярного посередника. У найближчі декілька років ми станемо свідками справжнісіньких битв між постачальниками даних і постачальниками додатків — коли обидві сторони усвідомлюють, що певна інформація може бути ключовою для побудови блоків додатків Веба 2.0.

За певні класи ключових даних — місцеположення, особисту інформацію про користувачів, календарі суспільно-значущих подій, ідентифікатори товарів і простору імен — битва вже розпочалася. Якщо відтворити набір інформації — задоволення не з дешевих, то компанія, у якої ці дані вже є, може спробувати скористатися своїм положенням і розіграти карту Intel Inside. У інших випадках переможе та фірма, чия база даних першою набере критичну масу за допомогою користувачів, — якщо, звичайно, компанія зможе обернути ці агреговані дані в системний сервіс.

До прикладу, якщо ми говоримо про мережеву ідентифікацію користувачів, то Paypal, Amazon, 1-click і мільйони користувачів систем зв'язку цілком можуть вважатися за суперників. (У цьому сенсі остання ініціатива Google, що дозволив підтверджувати акаунти на Google з телефону, виглядає як спроба розширити свою базу за рахунок телефонних систем.) З іншого боку, є такі стартапи, як Sxip, що зробили ставку на інтегровану особу і намагаються створити розподілене і просте рішення, на основі якого можна буде побудувати єдину підсистему для всього Веба 2.0. На ринку календарних довідників є EVDB, що намагається на базі wiki-подібної архітектури побудувати найбільший спільно наповнювальний календар. І хоча сьогодні ще рано робити прогнози, очевидно, що до появи додатків нового покоління приведуть ті стандарти і рішення, які дозволять ефективно обернути певні класи даних в надійні підсистеми «операційної системи інтернету».

Перш ніж йти далі, скажемо декілька слів про користувачів, які оберігають своє privacy і право на володіння інформацією як зіницю ока. У багатьох ранніх веб-додатках копірайт враховувався лише номінально. Так, права на всі перегляди, опубліковані на Amazon, належать Amazon, але компанія нікого ще не переслідувала за їх републікацію. Проте як тільки компанії зрозуміють, що контроль над даними і є їх головна конкурентна перевага, то почнуть стерегти свої дані куди відповідальніше.

Як успіх приватного софтвера привів до народження руху Free Software, так і посилення ролі приватних БД вже в наступному десятилітті приведе до народження руху за Вільну Інформацію. Ранні прояви цієї тенденції можна побачити вже зараз, в таких проектах, як Wikipedia, ліцензії Creative Commons, або в проектах програмістів типу Greasemo (дає користувачам можливість визначати, як саме відображатимуться дані на їх комп'ютерах).

Кінець циклу розробки ПЗ

Одною з головних характеристик сучасних інтернет-застосувань є те, що вони розповсюджуються у вигляді сервісу, а не товару. Це, у свою чергу, веде до фундаментальних змін в бізнес-моделях компаній-розробників.

Компанія повинна уміти управляти процесами. Мистецтву розробки додатків повинне супроводити уміння організувати щоденні операції для підтримки роботи цих застосувань. Розрив між софтвером-артефактом і софтвером-сервісом такий великий, що вже зараз не можна написати хороший продукт і забути про нього — його потрібно підтримувати щодня. Google щодня прочісує веб-сервер, щоб оновлювати свої індекси, відсікаючи пошуковий спам. Google повинен щодня обслуговувати сотні мільйонів запитів, поставляючи користувачеві не тільки якісні результати пошуку, але і контекстну рекламу. І невипадково інформація про системне адміністрування, обслуговування мереж, балансуванню навантаження і тому подібне охороняється Google, мабуть, навіть краще, ніж самі пошукові алгоритми. Google навчився автоматизувати згадані процеси, а це — ключова частина його цінової переваги перед конкурентами.

Також не випадково, що скріптові мови — Perl, Python, PHP, а зараз ще і Ruby — відіграють в житті компаній Веба 2.0 таку ж важливу роль. Перший вебмастер Sun Microsystems Хасан Шредер (Hassan Schroeder) якось назвав Perl «скотчем інтернету».

Скріптові мови (ери софтверних артефактів, що зневажаються програмістами) — це природний вибір для системних і мережевих адміністраторів, оскільки розробники створюють динамічні системи, які вимагають постійної зміни.

Користувачів потрібно сприймати як співрозробників — як, наприклад, прийнято при розробці відкритого софтвера (навіть якщо само ПЗ навряд чи буде випущено під відкритою ліцензією). Максима відкритого софтвера — «випускай релізи раніше і частіше» — тепер формулюється ще жорсткішим: «нескінченна бета-версія». Програми оновлюються щомісячно, щонеділі і навіть щодня.

Не випадково на логотипах таких проектів, як Gmail, Google Maps, Flickr, del.icio.us і т. п., слівце «beta» може висіти роками.

Відслідковування поведінки користувачів в реальному часі дозволяє бачити, які нові властивості використовуються і як вони використовуються — і це ще одна ключова складова успіху технології. Веб-розробник одного з розкручених мережевих сервісів відзначає: «ми додаємо дві-три нові властивості в різні частини сайту щодня, і якщо користувачам вони не подобаються — ми відмовляємося від цих нововведень. Якщо подобаються — упроваджуємо на всьому сайті».

Кел Хендерсон (Cal Henderson), головний розробник Flickr, недавно розповів, що новий білд Flickr з'являється кожні півгодини. Це абсолютно інша модель розробки! І хоча поки що не всі веб-додатки розробляються з такою екстремальною швидкістю, майже у всіх цикл розробки радикально відрізняється від всього, що було в епоху ПК або клієнт-серверів. З цієї причини редактори Zdnet навіть прийшли до висновку, що Microsoft не вдасться перемогти Google: «бізнес-модель Microsoft побудована на припущенні, що користувач оновлює своє комп'ютерне оточення разів в два або три роки. Google же залежить від того, що новенького виявить користувач в своєму комп'ютерному оточенні сьогодні».

Не дивлячись на те що Microsoft вже продемонструвала неймовірну здатність вчитися і врешті-решт перевершувати своїх конкурентів, немає сумнівів, що конкуренція змусить Microsoft (і — ширше — будь-яку сучасну софтверну компанію) перетворитися на компанію абсолютно іншого типу. Дійсним компаніям Веба 2.0 буде простіше, оскільки їх не тягнуть назад старі підходи (а також супутні бізнес-моделі і джерела прибутків).

Спрощення моделі програмування

Як тільки ідея веб-сервісів стала au courant, в боротьбу вступили великі компанії, що виставили складні набори веб-сервісів, які дозволяють розробляти надійні середовища програмування для розподілених застосувань.

Успіх веба багато в чому зобов'язаний тому, що велика частина теоретичних побудов, присвячених гіпертексту, була відкинута на користь простих прагматичних рішень, які і послужили основою ідеальної конструкції. RSS став, можливо, єдиним широко поширеним веб-сервісом саме тому, що він простий. А складні корпоративні набори все ще чекають свого часу.

Аmazon надає два типи веб-сервісів. Перший не відступає від формалізму SOAP (Simple Object Access Protocol), тоді як другий просто здійснює передачу XML через HTTP за допомогою спрощеного підходу, відомого як REST (Representational State Transfer). Веб-сервіси першого типу використовуються для B2b-транзакцій (наприклад, між Amazon і роздрібними партнерами), але 95 відсотків всіх операцій проводиться за допомогою REST.

То ж прагнення до простоти спостерігається і у іншого «сьогодення» веб-компаній. Візьмемо Google Maps. Простий AJAX-інтерфейс був швидко «розібраний» хакерами, які потім зуміли використовувати дані, що поставлялися, для організації нових сервісів.

Картографічні веб-сервіси були доступні і раніше: від Gis-вендорів (ESRI, наприклад) і таких компаній, як Mapquest і Microsoft Mappoint. Проте Google Maps завоював світ, завдяки своїй простоті. І якщо експериментування з даними веб-сервісов від «сьогодення» вендорів вимагало укладання контракту, то Google Maps був спроектований так, що дані можна було відразу використовувати в своїх цілях — і хакери дуже скоро навчилися це робити.

Звітси можна винести декілька важливих уроків:

• підтримуйте спрощені моделі програмування і ви отримаєте вільно-зв'язаних партнерів. Проблема корпоративних веб-сервісів в тому, що вони припускають жорстко обумовлене партнерство. У багатьох випадках це виправдано, але часто найцікавіші застосування можуть бути побудовані на вельми крихкій основі.

• думайте про синдикацію, а не про координацію. Прості веб-сервіси — як RSS або сервіси на базі REST — займаються синдикацією даних, не намагаючись контролювати, що відбувається з інформацією на іншому кінці ланцюжка. Ідея наскрізної передачі даних є одній з базових ідей самого інтернету.

• проєктуйте з урахуванням можливих переробок і поліпшень. Системи, подібні вебу, RSS і AJAX, схожі тим, що особливих перешкод для їх повторного використання не існує. Велика частина корисного софтвера знаходиться у відкритих вихідниках, а якщо і немає, то є не так вже багато способів захистити свою інтелектуальну власність. Стандартна браузерная функція «подивитися вихідник» дозволяє будь-якій людині скопіювати будь-яку веб-сторінку. RSS був спроектований для того, щоб користувач міг читати контент тоді, коли це зручно йому, а не постачальникові інформації. Найуспішніші веб-сервіси — це, як правило, такі служби, які можуть бути змінені несподіваним для їх творців чином (some rights reserved).

Іновації у зборах

Спрощення бізнесових моделей — це природня супутня обставина спрощеного програмування і спрощених зв'язків. У Web 2.0 ця властивість добре використовується. Нова служба, подібна housingmaps.com, була побудована простим миттєвим злиттям двох існуючих служб. Housingmaps.com не має бізнесової моделі (поки що) — але для багатьох невеликих послуг, Google Adsense (або, можливо, Amazon, яка пов'язана з грошовими зборами, чи обидві) забезпечує успішний проект, що включає еквівалент митної моделі.

Ці приклади інтуїтивно забеспечують другий ключовий принцип Web 2.0, до якого ми звертаємося в «іноваціях у зборах.» Коли товарних компонент дуже багато, то ви можете новим і ефективним способом створити звичайною їх збіркою нове значення. Так як революція ПК сприяла багатьом можливостям для іновацій у зборі технічних пристроїв, з компаніями подiбних Dell, які роблять науку з таких збірок, і таким чином, наносять поразку компаніям, чиї бізнесові моделі потребують іновацій у розробці пристроїв, ми допускаємо, що Web 2.0 забеспечить можливість компаніям, які конкурують, одержувати кращі результати при використанні і об'єднанні послуг, які забеспечуються іншими.

Інвестиційний тезис Web 2.0

Ризикований капіталіст Поль Кедроський (Paul Kedrosky) писав, що «ключем є знаходження дієздатних капіталовкладень, де ви не згоджуєтися із консенсусом». Досить цікаво спостерігати, як кожний аспект Web 2.0 залучає незгоду до консенсусу: кожен, хто робить наголос на триманні даних в таємниці, Flickr/Napster/ i т. д. сприяє розголосу цього. Це не тільки розходиться в думках, щоб бути неприємним (pet food! он-лайн!), це розходиться в думках, де ви можете побудувати що-небудь поза відмінностями. Flickr будує спільноту, Napster — широту збірок. Іншим способом, щоб подивитися на це, успішні компанії цілком відмовляються від чогось дорогого, але вважається критичним, щоб одержати що-небудь цінне безкоштовно це було одного разу дорого. Наприклад, Wikipedia відмовляється від центрального редагування контролю у відповідь на швидікість і широту. Napster відступив на ідеї «каталога» (всі пісні, які продавец продавав) і одержав широту. Аmazon відступив на ідеї наличия фізичного фронтону магазина, але повинна була обслуговувати цілий світ. Google відступив на великих клієнтах (початково) і добрав 80 %, чиї потреби не зустрічалися. Є щось подібне до айкідо (застосування сили вашого противника против нього ж самого) у вислові, «ви знаєте, ви правильні — абсолютно хто-небудь у всьому світі МОЖЕ обновити цю статтю. І догадуйся, що, це погана новина для вас.» — Nat Torkington