Tela
Поисковая система Tela (http://tela.dux.ru/), принадлежащая компании NetLogic (http://www.netlogic.ru/), позволяет вести поиск по ключевым словам русско– и англоязычных страниц на российских серверах, а также сайтов ближнего зарубежья на украинском и белорусском языках.
Сбором информации занимается подсистема-робот, созданная на базе робота MOMspider (http://www.ics.uci.edu/pub/websoft/MOMspider/). По возможности игнорируются страницы, содержащие статистику по использованию серверов. Текущее количество собранных страниц выдается вместе с результатом поиска. Поисковая часть сервера Tela сделана на базе системы поиска freeWAIS-sf (http://ls6-www.informatik.uni-dortmund.de/ir/projects/freeWAIS-sf/) с использованием русской версии системы MorphIlias, которая осуществляет поддержку морфологии языка, что позволяет задавать ключевые слова в произвольной форме.
Поисковая система Tela не отличается масштабностью. Страница поиска Tela, показанная на рис. 3.17, позволяет задать поисковую фразу, а также перейти на страницы поиска на английском, украинском и белорусском языках.
Рис. 3.17. Страница поиска Tela
Система поддержки русского языка, с которой работает Tela, допускает указание ключевых слов в естественном запросе, в любой из возможных словоформ русского языка, даже неправильной. Например, считаются эквивалентными и, следовательно, выбираются по запросу следующие словоформы:
имя, имени … именами, именах;
марка … марок … марках;
ухо … ушей … ушах;
крюк, крючья … крюках, крючьях;
Допускается использование метасимвола «звездочка» в конце любого слова, где * означает произвольное количество любых символов (до пробела), например мед*. В этом случае подходящими считаются все слова, начинающиеся подобным образом и имеющие разные окончание. Обратите внимание, что использование метасимвола нередко дает совершенно неприемлемый результат, поэтому требуется известная аккуратность. Так, при поиске упоминаний о меди по указанному выше шаблону помимо искомых форм (медь, меди) будут найдены варианты медведь, медицина, медик, медикаменты, медитация и т. д.
Переключатель Искать позволяет выбрать одно из трех условий поиска:
• любое слово (логическое ИЛИ);
• все слова (логическое И);
• все слова рядом.
Вывод результатов осуществляется в зависимости от степени соответствия найденных документов запросу. Количество выводимых на каждой странице ссылок задается в поле Число возвращаемых документов.
На странице результатов поиска, изображенной на рис. 3.18, Tela показывает число найденных ресурсов в поле Найдено документов. Каждая запись о найденном документе сопровождена опцией предварительного просмотра (ссылка Предосмотр страницы), позволяющей до загрузки исходной страницы оценить ее содержание по имеющемуся в системе фрагменту.
Рис. 3.18. Страница результатов запроса TelaСамостоятельная регистрация ресурсов в системе Tela не предусмотрена.
Rundex
Поисковая машина Rundex (http://rundex.ru/) – это поисковая система с ограниченным объемом информационной базы. Страница поиска Rundex (рис. 3.19) позволяет задать поисковую фразу, а также сузить область поиска, выбрав опции переключателя:
• WEB-страницы;
• Книги (метапоиск);
• Рефераты (метапоиск);
• Товары в интернет-магазинах.
Рис. 3.19. Страница поиска RundexСистема ведет поиск с учетом морфологии русского языка. Слова, состоящие из одного и двух символов, игнорируются. В результатах запроса в первую очередь выдаются страницы с точным совпадением фразы, а затем – со словоформами всех введенных слов. Инструкции для роботов, записываемые в файле robots.txt, не учитываются.
Самостоятельная регистрация ресурсов в системе осуществляется на странице, перейти на которую можно по ссылке Добавить сайт (http://rundex.ru/add/).
Специализированные российские поисковые системы
Файловая поисковая система FileSearch.ru
Поисковая система FileSearch.ru (http://www.filesearch.ru/) позволяет вести поиск файлов практически во всех российских файловых архивах (на FTP-серверах, специально предназначенных для хранения и передачи файлов) и на нескольких тысячах серверов по всему миру. База поиска постоянно обновляется.
В отличие от поисковых систем общего пользования, таких как Яndex, Rambler, Апорт, Поиск@МаП. ш, которые осуществляют поиск на WWW-серверах и HTML-страницах по их содержимому, FileSearch ищет файлы на FTP-серверах по именам самих файлов и каталогов. Если вам нужна, например, какая-либо программа или игра, то на WWW-серверах вы легко найдете их описание, а с FTP-серверов сможете загрузить их в свой компьютер.
Обычно очередная переиндексация базы FileSearch производится через пять дней. Если по каким-то причинам индексирующий робот не смог получить информацию с сервера, он будет повторять попытки каждый день. А если в течение трех недель информацию о каком-либо сервере так и не удалось обновить, то он удаляется из базы поиска.
Чтобы добавить свой FTP-сервер в базу поиска, требуется прислать заявку на указанный в системе электронный адрес (ftpadd@filesearch.ru).
Для поиска можно использовать как строку обычного запроса, так и форму с расширенными возможностями, которая показана на рис. 3.20. В строке запроса следует указывать имя искомого файла или его часть. Система позволяет сузить поиск, используя следующие критерии:
• файл/каталог;
• музыка (mp3);
• изображения;
• видео;
• сервер.
Рис. 3.20. Страница расширенного поиска FileSearchОграничить поиск можно также выбором регионального расположения FTP-серверов: в России, за пределами России, во всем мире. Со страницы расширенного поиска, кроме того, допускается поиск с помощью регулярных выражений, например: по началу или концу слова, набору символов или выражений. Для поиска драйверов предназначена специальная страница (http://www.filesearch.ru/drivers/), которая позволяет выбрать категорию и производителя оборудования. Чтобы установить форму поиска FileSearch на свою страницу, вставьте в нее следующий HTML-код:
Форма реализована строго (см. рис. 3.21); она легко впишется в любой дизайн.
Рис. 3.21 Форма поиска FileSearch для вставки в собственные страницы
Поиск музыкальных файлов
Существует целый ряд сайтов, позволяющих вести поиск музыкальных файлов в различных архивах по названиям композиций, именам исполнителей и даже по текстам композиций, например:
• MP3Search.Ru (http://mp3search.ru/);
• MusicFind (http://www.musicfind.ru/);
• MP3 ПОИСК (http://mp3.holm.ru/);
• mp3Spy.ru (http://mp3spy.ru/);
• Поиск MP3 (http://mp3meta.h1.ru/);
• MP3 МЕГАПОИСК (http://mp3.num.ru/);
• MP3.RU (http://www.mp3.ru/).
Поисковые системы по ценам на электронику
Тематика поисковой системы Newman.Ru (http://search.newman.ru/) ограничена исключительно товарами и ценами московских компьютерных фирм. Предпочтение отдается первоисточникам и сайтам, содержащим систематизированную информацию (документация, описания, тесты, цены, мнения, новости, пресс-релизы). Для индексации требуется предварительная регистрация ресурса в системе. Подобный же сервис обеспечивает Компьютерная столица (http://www.stolica.ru/). А поисковая система ABC.ru (http://www.abc.ru/), кроме компьютерной тематики, предлагает поиск по всей номенклатуре московского рынка электроники.
Поиск по серверам Удмуртии UdmSearch
Поисковая система UdmSearch (http://search.udm.net/) позволяет вести поиск по серверам Удмуртии. Для индексации требуется предварительная регистрация ресурса в системе, после чего поисковый робот системы обследует все страницы сайта и вносит их в свою базу поиска.
Поисковые системы ближнего зарубежья
Перечислим поисковые системы стран ближнего зарубежья, а также приведем краткий перечень предоставляемых ими услуг.
Поисковые ресурсы Украины
UAportАдрес сайта поисковой системы UAport в Internet: http://uaport.net/.
Она представляет собой информационно-поисковую систему (ИПС), изначально ориентированную на обработку полнотекстовых и реферативных документов. Ее архитектура близка к классической модели ИПС с инвертированным индексом, что позволяет проводить быстрый интерактивный поиск информации в базах данных больших объемов. Поддерживается развитый язык запросов, позволяющий проводить поиск по базе украинских сетевых ресурсов, базе реферативных описаний Web-серверов, украинским USENET-конференциям, а также по архиву местной прессы.
SESNAАдрес сайта поисковой системы SESNA в Internet: http://uazone.net/sesna/.
Одна из ведущих украинских поисковых машин. Интерфейс на английском языке. Поиск можно осуществлять по региональной навигационной сетке либо посредством указания ключевых слов.
METAАдрес сайта в Internet: http://meta-ukraine.com/.
Украинская поисковая система META предназначена для поиска по украинским серверам, а также любым серверам с украинской тематикой. Действует с ноября 1998 года.
Поисковая система META работает по технологии, реализованной в поисковой системе Апорт. Таким образом, META наследует ряд отличительных свойств Апорта, а именно: возможность реконструкции текста, подсветку ключевых слов запроса в реферативном описании найденного ресурса, поддержку морфологии русского и английского языков.
META – полнотекстовая поисковая машина словарного типа, которая поддерживает развитый язык запросов. Уникальная ее особенность – поиск с учетом морфологии украинского языка.
СоваАдрес сайта поисковой системы Сова в Internet: http://www.sova.com.ua/.
Поиск по украинским сайтам. Кроме того, ищет музыку и картинки, а также файлы на FTP-серверах и информацию в USENET-конференциях.
Поисковые ресурсы Армении
UniartsАдрес сайта поисковой системы Uniarts в Internet: http://www.armenian.com/links.html.
Поиск по армянским сайтам. Есть возможность ограничить поиск несколькими популярными темами.
Поисковые ресурсы Киргизии
www.KYRGYZSTAN.kgАдрес сайта поисковой системы www.KYRGYZSTAN.kg в Internet: http://www.kyrgyzstan.kg/.
Поисковая система Web-ресурсов Кыргызстана. Многоуровневый каталог ресурсов киргизского сегмента Internet, возможность быстрого поиска по ключевым словам. Ведется рейтинг популярности ресурсов.
Поисковые ресурсы Латвии
DELFIАдрес русскоязычной версии поисковой системы DELFI в Internet: http://rus.delfi.lv/.
Поисковая система и многоуровневый каталог, дополнительные информационные службы.
Search Latvian WebАдрес сайта поисковой системы Search Latvian Web в Internet: http://www.search.lv/.
Поисковая система по латвийским сайтам с интегрированным одноуровневым классификатором тематических ресурсов. На английском языке.
Поисковые ресурсы Эстонии
DELFIАдрес русскоязычной версии сайта в Internet: http://rus.delfi.ee/.
Поисковая система и многоуровневый каталог, дополнительные информационные службы. Аналог одноименного латвийского ресурса.
Зарубежные поисковые системы
Прежде чем приступить к описанию возможностей зарубежных поисковых систем, следует обратить внимание на определенные трудности при поиске информации на русском языке.
Так, подавляющее большинство поисковых машин просто не воспринимает буквы кириллицы и не способно вести правильный поиск по русским ключевым словам. Вторая сложность – это изменение русских слов по родам, падежам, числам, лицам и т. д. Если с первым препятствием некоторые поисковые системы справляются, то второе является для них более серьезным, что и понятно. Однако и оно постепенно, по мере роста заинтересованности в русскоязычной аудитории, преодолевается с помощью морфологических систем.
Перечислим очень кратно лишь основные из зарубежных поисковых систем, так как их в Internet очень много.
Поисковая система AltaVista
Поисковая система AltaVista (http://www.altavista.com/), принадлежащая компании Overture Services, Inc., появилась в 1995 году и за время своего существования приобрела всемирную известность. Страница поиска AltaVista показана на рис. 3.22.
Рис. 3.22. Страница поиска AltaVistaВ результате поиска система выдает страницы, написанные на выбранном вами языке (в данном случае – на русском), как показано на рис. 3.23.
Рис. 3.23. Результаты поиска страниц на языке, выбранном пользователемК дополнительному сервису поисковой системы AltaVista можно отнести сужение области поиска до сайтов определенной страны. Чтобы воспользоваться им, щелкните по ссылке Select a country (Выберите страну), отметьте требуемый регион и нажмите на кнопку OK (рис. 3.24).
Рис. 3.24. Окно AltaVista для поиска в отдельной странеДля добавления своего сайта в систему предназначена ссылка Submit a Site (Зарегистрировать сайт) – http://www.altavista.com/addurl.
Поисковая система GO.com
Кроме AltaVista, с русским языком хорошо справляется поисковая машина GO.com (http://www.go.com/), использующая робот Infoseek. Ее возможности демонстрирует страница с результатами поиска, показанная на рис. 3.25.
Рис. 3.25. Результаты поиска по запросу на русском языке в поисковой системе GO.com
Поисковая система Excite
Поисковая система Excite (http://www.excite.com/) появилась в конце 1995 года и быстро приобрела известность.
Система способна искать ресурсы на русском языке.
Поисковая система HotBot
Поисковая система HotBot (http://www.hotbot.com/) функционирует с мая 1996 года. Сайт HotBot оснащен поисковым механизмом Inktomi. Осуществляется поиск русскоязычных ресурсов, однако он малоэффективен, так как кириллица на страницах результатов отображается кодами Unicode.
Поисковая система Lycos
Существующая с конца 1994 года поисковая система Lycos (http://www.lycos.com/), – пожалуй, старейшая из основных поисковых машин, – известна многим и имеет широкий круг пользователей.
Поиск русскоязычных ресурсов в настоящее время не выполняется.
Поисковая система Google
Поисковая система Google (http://www.google.com/, http://www.google.ru/), самая молодая из ведущих поисковых машин, быстро завоевала популярность. Ее главная страница показана на рис. 3.26.
Рис. 3.26. Главная страница поисковой системы GoogleДанная система прекрасно работает с русскоязычными ресурсами, поддерживая не только кириллический поиск, но и язык интерфейса. Страница настроек Google (ссылка Настройки, http://www.google.ru/preferences7hWu), представленная на рис. 3.27, позволяет выбрать языки интерфейса и поиска, установить количество результатов, выводимых на одной странице, и указать, не следует ли показывать их в новом окне обозревателя. Чтобы включить настройку, щелкните по кнопке Сохранить настройки.
Рис. 3.27. Форма для настройки поиска в системе GoogleКроме того, на странице Языковые инструменты (http://www.google.ru/language_tools?hl=ru) – см. рис. 3.28, – доступной с главной страницы по одноименной ссылке, есть возможность настройки языка искомых страниц и их месторасположения (по странам). Таким образом, поисковая система Google дает пользователям мощные инструменты для уточнения географии и языка поиска.
Рис. 3.28. Форма для настройки языковых инструментов поиска в системе Google