Рис. 2.163. Окно Properties, вкладка Exclusions
Для выбора каталогов предназначена кнопка Browse, для добавления их в список – кнопка Add , для замены выбранной строки в списке – кнопка Replace (Заменить) и для удаления – Delete. Элементы заголовка
Как известно, метаданные размещаются в контейнере
. каждого HTML-файла. Поскольку они содержат всю описательную информацию о документе, поисковые системы делают особый акцент на обработке этих сведений. Открыв очередной файл, WebQA Tag считывает содержимое его заголовочной части в память. Всякий раз, когда программа встречает метатэг, она проверяет его имя, сверяет с имеющимися списками и, если он был изменен, записывает новое значение. Если метатэг был удален из списков, он не будет внесен в файл.Сначала WebQA Tag удаляет все тэги TITLE и META, а также имеющиеся пустые строки. Тэги форматируются в точности по выполненным настройкам, а затем вставляются непосредственно за открывающим тэгом
документа. Такой подход обеспечивает наглядность метаданных при открытии файла в текстовом редакторе. Для организации указанных операций предназначена вкладка HTML Head Write (Запись HTML-тэга HEAD) – см. рис. 2.164.Рис. 2.164. Окно Properties, вкладка HTML Head WriteЗдесь можно определить варианты форматирования тэгов при записи. Систематизация записываемых элементов упрощает дальнейшее обслуживание HTML-страниц. Раздел Tag Case (Регистр тэгов) позволяет установить внутренний стандарт написания тэгов и атрибутов, хотя браузеры не чувствительны к регистру букв тэгов. Допустимы три варианта:
• The existing case (Существующий регистр) – останется прежнее написание;
• All lower case – строчными буквами, например: ;
• All upper case (e.g.,) – прописными: .
В разделе Character references (Таблицы символов) можно выбрать форму представления символов в HTML-документе:
• I want to preserve the characters (Сохранить символы);
• In character references (Из таблиц символов) – для использования в коде HTML специальных наборов символов, которые начинаются со знака «&» (амперсанд) и заканчиваются знаком «;» (точка с запятой), а служат для отображения в браузере определенных знаков и символов. Например, комбинация символов > используется для обозначения знака «>» (больше чем);
• In numeric decimal value (В числовом десятичном коде) – например: é;
• In numeric hexadecimal value (В числовом шестнадцатеричном коде) – например: à.
Отметим, что функционально числовые коды соответствуют комбинациям из таблиц символов, отличие – лишь в форме представления.
Раздел Head write organization (Порядок записи заголовка) служит для дополнительной настройки расположения метатэгов и позволяет воспользоваться следующими возможностями:
• Sort metatags alphabetically (Сортировать метатэги в алфавитном порядке);
• Write the «Content-Type» metatag first (Записывать метатэг «Content-Type» первым);
• Use closing slash on metatags (Использовать в метатэгах закрывающий слэш) – например: «/>»;
• Allow this number of characters per line before the text wrap to the next line (Допустимое число символов в строке, после достижения которого переходить на следующую строку) – если задано 0, то строка не разбивается.
Создание и изменение метатэговПосле завершения сканирования каталога на локальном компьютере или FTP-сайта все найденные метатэги отображаются в виде сетки (рис. 2.165), где вы можете определить, какие файлы требуют модификации.
Рис. 2.165. Сетка метатэговДля добавления метатэга в какой-либо HTML-документ выполните следующие операции:
1. Перейдите в Сетке на вкладку, соответствующую выбранному типу файла (в данном случае – Web Pages).
2. Выберите ячейку, которую собираетесь редактировать. Если ячейка текстовая (например, для тэга "Content-Type"), введите содержание метатэга в области редактирования (в верхней части Сетки). В другом случае – как, например, для тэга Robots – щелкните по ячейке, чтобы открылось соответствующее диалоговое окно – в данном примере List of Values (Список значений) с перечнем вариантов – и выберите нужный параметр (см. рис. 2.166). Строки Сетки можно сортировать по значениям в ячейках, для чего следует дважды щелкнуть по наименованию колонки.
Рис. 2.166. Окно List of Values для тэга Robots3. Для сохранения сделанных изменений выполните команду File → Save Project (Файл → Сохранить проект) или щелкните по кнопке
Save the current project (Сохранить текущий проект).
То же самое можно выполнить с помощью Мастера тэгов. Для этого действуйте так:
1. Находясь в какой-либо ячейке Сетки, щелкните правой кнопкой мыши и выберите в контекстном меню пункт Wizard (Мастер) или выполните команду Tools → Metatag Wizard (Инструменты → Мастер метатэгов).
2. Откроется первое окно Мастера, представленное на рис. 2.167. В его поля Title, Description и Keywords загружены главные метатэги документа. Отредактируйте их, если требуется. Щелкните по кнопке Далее.
Рис. 2.167. Первое окно Мастера метатэгов4. Откроется второе окно Мастера (рис. 2.168). Отредактируйте в нем содержание других метатегов: Robots, Content-Type, Content-Language, Author, Copyright, Generator, Pragma и Refresh. Щелкните по кнопке Далее.
Рис. 2.168. Второе окно Мастера метатэгов5. В третьем, и последнем, окне Мастера (рис. 2.169) доступны для редактирования, кроме отображенных ранее, все остальные метатэги, которые могут встречаться в HTML-документах. Завершив правку, щелкните по кнопке Готово.
Рис. 2.169. Третье окно Мастера метатэговРедактирование тэгов IMG
Как отмечалось выше, для пользователей, отключивших в своем браузере вывод на экран изображений, весьма полезно добавить соответствующий картинкам альтернативный текст в атрибут ALT тэга IMG. WebQA Tag позволяет автоматически извлечь его из имени загружаемого графического файла (отсекая его расширение). Повторим еще раз, что поисковые системы также достаточно чувствительны к наличию такой информации и индексируют ее. Для автоматического добавления имен файлов изображений выполните следующие действия:
1. Выберите пункт меню Tools → Project Properties.
2. В открывшемся окне Properties перейдите на вкладку Keywords Extraction (Извлечение ключевых слов) – см. рис. 2.170.
Рис. 2.170. Окно Properties, вкладка Keywords Extraction3. В разделе Image (Изображение) установите флажок Add ALT attributes to the IMG tag (Добавлять атрибуты ALT в тэг IMG).
4. Выберите один из трех методов вставки имени файла:
• Replace existing ALT attributes (Заменять имеющиеся атрибуты ALT);
• Add only if there are no existing ALT attributes (Добавлять, если только нет атрибутов ALT);
• Append to existing ALT attributes (Дополнять имеющиеся атрибуты ALT).
5. Щелкните по кнопке OK.
При сканировании файлов программа считывает информацию о размерах вставляемой графики, то есть атрибутов WIDTH и HEIGHT тэга IMG, занося ее в соответствующие ячейки Сетки. Эти данные – отображаемые в пикселях – могут отличаться от натуральной величины изображений, содержащейся непосредственно в графическом файле. Для ее извлечения и ввода в атрибуты тэга IMG предназначены операции автоматического заполнения. Они же могут применяться для работы с атрибутом ALT. Чтобы воспользоваться этими операциями, поступайте таким образом:
1. Перейдите в Сетке на вкладку Image Tags (Тэги изображений).
2. Выделите (удерживая нажатой левую кнопку мыши) диапазон атрибутов для обработки (рис. 2.171).
Рис. 2.171. Выделен диапазон атрибутов в Сетке3. Выполните одну из трех команд:
• Edit → Autofill and Replace (Редактирование → Автоматически заполнить, заменяя);
• Edit → Autofill on Empty (Редактирование → Автоматически заполнить пустые);
• Edit → Autofill and Append (Редактирование → Автоматически заполнить, дополняя).
В нашем примере мы воспользовались командой Edit → Autofill on Empty и получили результат, представленный на рис. 2.172. Как видим, все ячейки выделенного диапазона теперь заполнены.
Рис. 2.172. Все ячейки в Сетке заполнены автоматическиЕстественно, сохраняется возможность править любую из ячеек обычным образом – в поле редактирования, – для чего предварительно следует щелкнуть по выбранной ячейке.
Если требуется изменить значение какого-либо атрибута по имеющемуся образцу, в одной из колонок (ALT, WIDTH или HEIGHT) выделяется группа ячеек – важно, чтобы образец в этой группе был вверху первым, – и выполняется одна из команд:
• Edit → Fill Down and Replace (Редактирование → Заполнить нижние, заменяя);
• Edit → Fill Down on Empty (Редактирование → Заполнить нижние пустые);
• Edit → Fill Down and Append (Редактирование → Заполнить нижние, дополняя).
Предварительный осмотр измененийПрежде чем сохранить сделанные программой изменения, рекомендуется исследовать их во избежание неожиданных сюрпризов. Для этого выполните команду View → Changes (Вид → Изменения). Откроется окно ExamDiff (Исследование различий) – см. рис. 2.173, – состоящее из двух частей: слева представлено исходное содержимое файла, а справа – оно же, но после внесения изменений.
Рис. 2.173. Окно ExamDiffПеремещения по обеим частям окна синхронизированы; фрагменты текста отмечены цветом, имеющим следующее значение:
• черный – без изменений;
• красный – удаленные;
• синий – измененные;
• зеленый – добавленные.
Чтобы оставить в окне только исправленные фрагменты, убрав остальную часть текста, щелкните по кнопке
Show Only Differences (Показывать только различия). Тогда окно ExamDiff примет вид, изображенный на рис. 2.174.
Рис. 2.174. Вид окна ExamDiff после щелчка по кнопке Show Only DifferencesДля перемещения по выделенным фрагментам предназначены кнопки
Previous Difference (Предыдущее различие) и
Next Difference (Очередное различие).
Итоговый отчетИтоговый отчет отображает информацию об используемых на страницах web-узла метаданных и позволяет оценить эффективность их использования. Для вывода его на экран выберите в навигационной панели вкладку Reports (Отчеты). В отчете (рис. 2.175) отражены следующие показатели:
Рис. 2.175. Итоговый отчет о наличии метаданных• MIME type (типы MIME) – список типов MIME, найденных при сканировании;
• # Files with metadata (Количество файлов с метаданными) – число документов каждого типа, содержащих метаданные;
• % Files with metadata (Процентное соотношение файлов с метаданными) – процентное соотношение страниц каждого типа с метаданными;
• # Files without metadata (Количество файлов с метаданными) – число документов, не содержащих метаданные;
• % Files without metadata (Процентное соотношение файлов с метаданными) – процентное соотношение страниц, не имеющих метаданных.
Программа для работы с метатэгами TagPromoter
Программа TagPromoter (http://net-promoter.com/ru/metatag/), разработанная российской компанией NetPromoter (http://net-promoter.com/ru/company/), позволяет создавать и редактировать следующие группы метатэгов:
• основные, используемые поисковыми машинами для индексации документов (Description,Keywords, Revisit-after, Robots, Distribution и Classification);
• задающие режим просмотра web-страниц (Refresh, Content-type, Content-language, Window-target);
• со вспомогательной информацией (Author, Reply-to, Copyright, Generator и Abstract);
• управляющие кэшированием (Expires, Pragma);
• ограничивающие просмотр страниц (Rating, PICS-Label);
• титульный тэг
• навигационный тэг LINK;
• комментарии.
Кроме того, реализованы дополнительные модули: генератор отчетов, FTP-загрузчик и анализатор web-страниц.
Работа начинается с создания проекта, для чего в окне программы (рис. 2.176) щелкните по кнопке New (Новый) и присвойте ему имя.
Рис. 2.176. Окно программы TagPromoterЕсли вы хотите дать описание проекта, щелкните по кнопке Project Settings (Параметры настройки проекта) и в поле Project Description (Описание проекта) введите необходимые данные. Эти сведения не требуются для работы программы и предназначены исключительно для личного пользования.
Теперь нажмите на кнопку Meta Tags (Метатэги) и задайте значения метатэгов, которые будут вставляться в ваши страницы. Для экономии времени здесь (рис. 2.177) можно воспользоваться функциями Populate from Project (Заполнить из проекта), Populate from file (Заполнить из файла) или Populate from URL (Заполнить из страницы с URL-адресом) – им соответствуют одноименные кнопки в верхней части окна.
Рис. 2.177. Окно программы TagPromoter, вкладка Meta TagsПерейдите на вкладку Save To Files (Сохранить в файлах), нажав на одноименную кнопку. На этой вкладке (см. рис. 2.178) определите перечень файлов, создав его перетаскиванием их имен в правое окно (или двойным щелчком мышью). Чтобы включить в список все файлы каталога, а также файлы из вложенных каталогов, установите флажок Include Subdirectories (Включить каталоги).
Рис. 2.178. Вкладка Save To FilesТеперь остается только нажать на кнопку Insert Tags (Вставить тэги), и программа выполнит указанную операцию. Для контроля можно подготовить отчет – нажмите на кнопку Page Analyzer (Анализатор страницы). Чтобы загрузить HTML-страницы на сервер, щелкните по кнопке FTP Uploader (FTP-загрузчик) и воспользуйтесь соответствующей вкладкой.
И, наконец, для подготовки отчетов применяйте вкладку Reports (Отчеты), которая откроется после нажатия на одноименную кнопку.
Программы для проверки правописания
Текстовый редактор Microsoft Word
С тех самых пор, как MS Word позволяет загружать для редактирования документы в формате HTML, поиск грамматических и орфографических ошибок можно осуществлять с помощью системы проверки правописания, имеющейся в программе. Однако править все же лучше в том HTML-редакторе, которым вы обычно пользуетесь, потому что HTML-код, создаваемый в Word, не отличается лаконичностью, а в последних версиях программы разработчики твердо перешли на XML.
Для проверки правописания загрузите в редактор нужный документ, выберите в главном меню пункты Сервис → Параметры, а в открывшемся окне Параметры перейдите на вкладку Правописание, как показано на рис. 2.179.
Рис. 2.179. Окно Параметры программы Microsoft Word, вкладка ПравописаниеУстановите флажки автоматически проверять орфографию и статистика удобочитаемости. Щелкните по кнопке OK.
Теперь для начала проверки выберите команду Сервис → Правописание или нажмите кнопку
Правописание. При нахождении ошибок откроется диалоговое окно, показанное на рис. 2.180, где и происходит правка. Возможно также непосредственное исправление ошибки в документе.
Рис. 2.180. Диалоговое окно ПравописаниеЕсли необходимо использовать специальные слова, которые не распознаются программой проверки орфографии, например, сокращения или собственные имена, проверить их правописание помогут один или несколько вспомогательных словарей. Специальная лексика может быть добавлена как во встроенный вспомогательный словарь, так и в пользовательский, созданный лично вами. Такие слова, в случае их правильного написания, не будут вызывать вопросов у программы проверки.
Программа CSE HTML Validator
Уже рассмотренная нами в разделе «Проверка ошибок в HTML-документах» программа CSE HTML Validator (http://www.htmlvalidator.com/) имеет мощные средства проверки орфографии различных языков. Они обеспечиваются за счет подключения дополнительных словарей, которые в изобилии можно найти на сайте разработчика (http://www.addictivesoftware.com/dicts-extern.htm). На момент написания книги там были представлены словари русского языка: общий и специализированный научный. Кроме того, пользовательский словарь офисного приложения Microsoft Word автоматически подключается к программе, если в системе установлен Microsoft Office.
Дополнительные словари требуется скопировать в специальный каталог в папке, куда установлена программа, например: C:/Program Files/HTMLValidator65/ Dictionary. Чтобы подключить их, в самой программе выполните следующие настройки:
1. Выберите пункт меню Options → Spelling Options (Опции → Опции проверки правописания). Откроется окно Spelling Options (рис. 2.181).
Рис. 2.181. Окно Spelling Options2. В разделе Options отметьте флажками необходимые возможности:
• Ignore words in UPPERCASE (Пропускать слова в верхнем регистре);
• Ignore words containing numbers (Пропускать слова, в которых содержатся цифры);
• Ignore markup languages (HTML, XML, etc) (Игнорировать языки разметки – HTML, XML и т. д.);
• Ignore Internet addresses (Пропускать адреса Internet);
• Ignore quoted lines (Игнорировать строки, заключенные в кавычки);
• Ignore abbreviations (Пропускать аббревиатуры);
• Suggest from main dictionaries only (Предлагать варианты только из основных словарей);
• Prompt on repeated word (Выдавать запрос при повторяющихся словах);
• Automatically correct DUal capitals (Автоматически исправлять две идущие подряд прописные буквы).
3. В разделе Dictionaries (Словари) отметьте словари, которые будут использоваться для проверки.
4. Если требуется ввести какое-либо слово в пользовательский словарь Microsoft Word, щелкните по кнопке Dictionaries. Откроется одноименное окно (рис. 2.182). В нем для работы с выбранным словарем воспользуйтесь одной из трех возможностей: Edit (Править), Delete (Удалить) или New (Новый).
Рис. 2.182. Окно Dictionaries5. Нажмите на кнопку OK.
Для проверки правописания во встроенном редакторе выделите необходимый фрагмент текста и выполните команду Tools → Spell Check (Инструменты → Проверка правописания). Если требуется проверить весь текст, пригодна операция Tools → Spell Check All (Инструменты → Проверка правописания во всем).
Чтобы контролировать правописание страниц не только в редакторе, но и в процессе сканирования, выполните команду Options → Validator Engine Options (Опции → Опции системы проверки). Откроется окно Validator Engine Options. Перейдите в нем на вкладку Validator 1 (рис. 2.183) и отметьте флажок Enable spell checking (Разрешить проверку правописания). Теперь по мере сканирования HTML-документов программа будет генерировать список слов с ошибками.
Рис. 2.183. Окно Dictionaries , вкладка Validator 1