VII. Обработка скриптами

Вы знаете, сколько стоит молния?

Паниковский

1. Подзаголовки, пустые строки

Скрипт удаляет ненужные пустые строки (в начале и конце глав, до и после подзаголовков); разделительные пустые строки он не трогает. Также можно удалить болд и курсив из заголовков.

2. Обработка кавычек — Расстановка елочек и лапок

Запустив скрипт, вы, скорей всего, получите сообщение вроде этого:

«Курсор установлен в конец этой секции» — сообщает скрипт, и это значит, что в большинстве случаев вы видите текст, в котором нет никаких кавычек. Что же делать?

Прежде всего вооружиться терпением.

Но ведь непонятно где искать ошибку, да?

Это только кажется, все очень просто.

Жмем кнопку «Найти» на панели инструментов.

Ищем левую кавычку-«елочку», направление поиска — вверх.

Жмем «Искать далее».

Находим и видим, что нет закрывающей кавычки после названия зубной пасты — для открывающей кавычки всегда должна быть парная закрывающая. Добавляем.


Снова запускаем скрипт. Теперь он останавливается не из-за ошибки, а потому, что несовершенен — «не понимает», что в кавычках может и не быть слов. Добавьте в начало какую-нибудь букву, только не забудьте ее удалить после удачного завершения расстановки кавычек.


Следующая ошибка — «мусорная» кавычка.


Вероятно глюк ФайнРидера, распознавшего пятна на скане как кавычку.

Удаляем.


Снова запускаем скрипт, исправляем, запускаем, исправляем… методично и упорно.

И тут… О чудо, все же наши мучения закончились.


(Не забыли про z?)

После удачной расстановки кавычек стоит обратить внимание на количество кавычек первого уровня. Если их очень много, то, возможно, где-то есть «мусорные» кавычки, или кавычка пропущена, или другая ошибка.

Стоит тогда проверить все кавычки-«лапки», с начала текста.


Типичные «кавычечные» ошибки.

а) Ошибки OCR

Если сканы были не очень хорошего качества или книга была напечатана на «деревянной» бумаге, то кавычки могут не распознаться, или распознаться как другой какой-то символ (буква, знак препинания).

б) Громмотейские ашипки

Некоторые лингвистические футуристы-анархисты используют вместо кавычек другие символы — например, апострофы или угловые скобки. Такие «кавычки» скрипт, естественно, не обработает. Самые зловредные из анархолингвистов добавляют пробелы после открывающей кавычки и перед закрывающей кавычкой. Скрипт встретив такое, тут же останавливается, сообщая:


в) «Географические» ошибки

В приключенческих книжках порой сообщаются координаты того или иного места (где сундук с миллионами зарыт, понятно же). Если для секунд в координатах использован знак кавычки, то это вызовет останов работы скрипта. Кавычки и/или апострофы в координатах следует заменить специальными знаками — ′ для минут и ″ для секунд (смотри Скрипты — Символы — Спецсимволы).

г) Пропуск открывающей или закрывающей кавычки

В книгах часто не печатают две подряд идущие кавычки (например, реклама зубной пасты в нашем тест-сборнике).

д) «Исторические» ошибки

В книгах, напечатанных в начале XX века и более старых, кавычки могут быть расставлены весьма затейливо — абзацы в закавыченной цитате начинаются с кавычек, но закрывающая кавычка только в конце цитаты. Скрипт расстановки кавычек сразу же «сходит с ума» от таких книгопечатных извращений.

Пример такой расстановки кавычек — книга «Атлантида» Пьера Бенуа.

(http://www.flibusta.is/b/6177)

3. Чистка — Генеральная уборка

Скрипт заменяет дефисы на тире, удаляет лишние пробелы, и выполняет прочее, что делает текст более «красивым».

4. Чистка — Латиница в кириллице

Встречаются порой файлы, в которых слова без ошибок, но FBE все равно подчеркивает их красным, как ошибочные.

Возможно, что из-за неправильного выбора языка при распознавании некоторые русские буквы были распознаны как зарубежноязычные.

Поищем в нашем тест-сборнике…

Нет, ну и хорошо.

5. Примечания и комментарии из скобок

В некоторых файлах примечания не сделаны, они находятся в самом тексте, чаще всего в квадратных скобках. Можно попробовать поискать левую или правую квадратную скобку.

Если такие примечания найдутся, то для их автоматического преобразования в нормальные ссылки и предназначен этот скрипт.

6. Чистка — Интерактивная ликвидация разрывов абзацев

Весьма полезный скрипт для отлова разных глюков Файнридера.

Запускаем…


Настройки не изменяем, посмотрим, что он нам покажет. Жмем ОК.


Для нас главное — чтоб скрипт не насоединял там, где нам не надо (например, в стихах, если одна из строк со строчной буквы).

Поступим так.

1. Просматривая список, выбираем, что надо сделать: не трогать (например, для стихов), заменить запятую на точку, соединить через пробел, и прочее.


2. Если скрипт что-то хочет соединить, а нам это не нужно, переключаем на «Не трогать».

3. Дойдя до конца списка, вернемся к одному из случаев, когда скрипт хотел соединить то, что мы не хотели и где мы переключили на «Не трогать». Жмем там «ОК и перейти».

4. Скрипт изменит все, что мы ему разрешили изменить, и перепрыгнет к месту текста, где мы хотим что-то сделать по-своему. Делаем и снова запускаем скрипт.

5. Теперь в списке будут только случаи, которые скрипт отметил «Не трогать» и те случаи, что мы хотим изменить по-своему. Раз за разом мы переключаем все нежелательные изменения на «Не трогать» и перепрыгиваем к одному из таких фрагментов текста.

6. Наконец в списке остались только позиции, отмеченные скриптом «Не трогать». Теперь мы можем не просматривать список, просто запускать скрипт и изменять раз за разом то, что действительно нужно изменить.


Не все, что скрипт посчитает разрывами абзацев, является таковым. Но в целом его полезность несомненна.


Там, где стихи (как на первой картинке), ничего не делаем, просто кликаем на «ОК и перейти». После перескока в нужное место выделяем стихи и Вставка — Стихи.


Списки и сообщения можно выделить как цитаты. Выделяем и Вставка — Цитата.


Как и в случае с расстановкой кавычек — терпение и труд все перетрут.

7. Символы

Если в тексте должны быть какие-то специальные символы или какие-то закорючки (арабские, иврит), греческие буквы в формулах, то их можно вставить в текст, выбрав из таблиц. Смотри Символы в списке скриптов.

Загрузка...