Голубятня: Дорога дьявола ведет к колибри

Автор: Сергей Голубицкий

Опубликовано 26 сентября 2011 года

Сегодня хочу рассказать читателям о самом оптимальном и быстром способе превращения сайта в электронную книгу.

Вопрос конвертации форматов с божьей помощью решился довольно давно: в продолжительной борьбе между конкурирующими контейнерами победил триумвират: PDF - FB2 - EPUB. Все остальные занимают явно маргинальное положение. Впрочем, я уже зарекся делать глобальные заявления, поэтому буду писать исключительно о себе: все собственные нужды в электронных книгах я решаю исключительно через два формата - PDF и EPUB. FB2 мне совершенно не нужен, поскольку этот формат полностью дублирует EPUB по всем своим показателям и возможностям. Не берусь утверждать, что FB2 появился на свет под влиянием EPUB, однако в любом случае можно считать формат Дмитрия Грибова (FB2) полным отечественным аналогом своего распространенного во всем мире собрата.

Возвращаемся к теме конвертации. Проблемы скачать в сети электронную книгу в каком-нибудь совершенно неприличном DOC или того страшнее DJVU и затем конвертировать книгу в один из читальных стандартов больше нет. Зато остается во всей красе проблема оперативного создания электронной книги из веб-материалов. Думаю, понятно, о чем идет речь, но на всякий случай поясняю: проблема не об отдельной странице, которую сходу можно сохранить на диск в родном HTML и затем конвертировать в какой-нибудь PDF (через опцию печати), а в целом веб-сайте со всеми его «прелестями» - многоуровневой иерархией и структурой, скриптами, всплывающими окнами и т.п.

Сложность задачи усугубляется сразу двумя моментами: «захватом» всего контента с сайта и непосредственно конвертацией «добычи». Иными словами требуется оптимальный граббер, умеющий сохранять сайт на жестком диске именно в таком виде, который окажется доступным пониманию конвертера.

При всей кажущейся пустяковости задачи на практике получается одно разочарование. Грабберы входили в обойму моих обязательных программ, кажется, со Дня №1 моей компьютерной жизни, поэтому перепробовал я, думаю, все поделки, какие только существуют на свете: Teleport Pro, HTTP Weazel, Web Wacker, Offline Explorer Pro, Black Widow, ДискоКачалка - you name it. Все это форточное наследие было скрупулезно протестировано и запротоколировано для читателей в многочисленных Голубятнях.

В прошлые годы, однако, передо мной не стояла специфическая задача создания электронной книги, поэтому грабберы (программы для захвата содержания веб-сайта) интересовали меня, в первую очередь, в плане чисто функциональной мощи: возможности выборочного копирования данных, селекция по уровню погружения в иерархию, обработка джавы и ActiveX скриптов и прочая ересь (эх, молодость!). Тогда, если не изменяет память, моим фаворитом был отечественный Offline Explorer, что впрочем уже не актуально.

С годами мне стало совершенно фиолетово, как работают настройки и что там со скриптами: важен исключительно результат. Очевидно, что мой переход на Мак оказался успешным, именно по той причине, что эта платформа заточена на дурашливый прагматизм: нажал кнопочку и компьютер сам выполняет работу, не нагружая пользователя ненужными подробностями техникалий. Ситуация еще более осложнилась, что на согласно моим текущим потребностям на выходе после захвата хотелось получать (без малейшего вмешательства ручками) данные в виде, понятном априорно конвертеру электронных книг.

Как видите, задача в итоге получилась не из тривиальных. Признаюсь, я ума не приложу, как бы ее можно было решить в условиях Windows, поскольку философия этой платформы изначально предполагает активное вмешательство пользователя непосредственно в процесс, а не результат. Боюсь даже подумать, сколько бы пришлось перелопачивать нового софта, а затем манипулировать тонкими настройками и в граббере, и в конвертере, для того чтобы добиться совместимости и желанного результата.

Теперь самое удивительное: на Маке решение проблемы было найдено за какой-то час, причем без малейшего усилия с моей стороны. Невероятно, но факт: мне не понадобилось ровным счетом ничего делать! Представьте ситуацию: запускаю граббер, вбиваю URL нужного сайта и, минуя закладку Настроек, одним кликом мыши инициирую процесс загрузки. Дальше - вообще научная фантастика: открываю конвертер, указываю файл index.html из папки, в которую был загружен на жесткий диск нужный сайт, затем нажимаю на кнопку Конвертировать в EPUB и через пару минут получаю на выходе электронную книгу, полностью готовую к чтению! Со всеми уровнями, сложными структурам и иерархиями сайта, которые в ибуксе все сводятся к простому гипертексту.

Как такое возможно?! А я вам скажу как: благодаря все той же помянутой выше философии платформы, которая в епархии Надкусана существует не в виде какого-то каприза Apple, а в виде общепринятого универсального кодекса поведения всех программистов, пишущих для Mac OS X! Встречаются, разумеется, оригиналы, которые лезут в эту экосистему с собственными представлениями о том, как нужно взаимодействовать пользователю с компьютером (в основном это все те же «ручечники», навязывающие мануальное ковыряние), но таковых в Макцарстве абсолютное меньшинство и - главное - они долго не живут, поскольку их программами никто предпочитает не пользоваться.

Так вот, общая парадигма автоматического непрозрачного выполнения поставленных задач, создает ситуации, когда разработчики совершенно, казалось бы разнопрофильного софта, думая в одинаковом ключе, создают программы идеально сочетающиеся друг с другом именно в плане желанной функциональности. На практике это выливается в чудеса, подобно описанному в сегодняшней Голубятне.

Берем граббер с дурацко-инфантильным названием Web Devil, в простеньком однооконном интерфейсе вбиваем Base URL - стартовый адрес нужного сайта и нажимает - вы не поверите - кнопку «Start»! После завершения процесса мы закрываем Web Devil (да-да, мавр уже сделал свое дело и нам больше не нужен!) и открываем Calibre (читатели знакомы с шедевром Ковинда Гайала, о котором впервые рассказал в 2008 году в бумажной Голубятне «Победа над Биби-Иби»). Указываем программе расположение на диске файла index.html и нажимает - вы не поверите - тоже только одну кнопку «Преобразовать Книги».

ВСЁ!!! Мы получили файл в формате EPUB, в котором чудесным образом целиком сохранен требуемый веб-сайт. Закидывайте его на свой PocketBook, iPad, iPhone и даже - прости господи! - андроидный коммуникатор и читайте на здоровье. Без малейшей головной боли. Без потерянных киловатт-часов мозговой и нервной энергии. Без тошнотворного ковыряния в бесчисленных «профессиональных» настройках. Клик тут и клик там. ВСЁ! Вот это и есть компьютер. Вернее, такой, каким должен быть каждый компьютер на планете, а не только 10 % рынка. Только тогда мы будем растить людей, умеющих добиваться реального результата и производить реальный продукт, а не вечных мануальщиков и ковыряльщиков, отравленных ядом философии: «Движенье всё, цель - ничто!».

Загрузка...