Лекция: Информационные ресурсы в глобальной сети
Интернет развивался как средство общения и удаленного доступа, поэтому первыми службами глобальной сети являются электронная почта, telnet, FTP. В дальнейшем в сети появились другие сервисы. С появлением распределенной системы гипермедиа Word Wide Web сеть Интернет стала средством массовой информации.
В настоящее время в глобальной сети размещен огромный объем информации по различным направлениям деятельности. Основной объем информационных ресурсов в виде веб-страниц или файлов в формате html находится на веб-сайтах, размещенных на Web-серверах Интернета. Просмотр веб-страниц этих сайтов осуществляется при помощи прикладных программ браузеров (обозревателей).
Кроме того, в Интернете находится много информационных ресурсов (различных типов файлов), которые размещаются на многих серверах, например на FTP-серверах (файлы компьютерных программ, технических описания), в архивах GOPHER (файлы текстов литературных произведений), в базах данных ARCHIE на ARCHIE-серверах, в WAIS-библиотеках (материалы в области исследований и информационных технологий), на серверах баз данных (информация о владельцах доменных имен) регистраторов IP-адресов и регистраторов доменных имён и т.д.
Быстрый рост объема информационных ресурсов привел к необходимости создания специальных поисковых средств: первая поисковая система Archie для поиска файлов в базах данных ARCHIE (помогает находить файлы, хранящиеся на анонимных FTP-серверах), система Gopher, система WAIS в базе данных, которых содержится индексированная информация о ресурсах сети Интернет, поисковые системы или поисковые машины, которые выполняют поиск WWW-страниц на Web-серверах.
Поисковые системы в Интернете для поиска ресурсов могут быть разделены на следующие группы:
— системы Web-поиска;
— системы поиска FTP-файлов (например, (http://www.filesearch.ru);
— системы поиска в архивах Gopher;
— системы поиска в Usenet;
— каталоги информационных ресурсов;
— порталы информационных ресурсов.
Средства поиска информационных ресурсов в Internet подразделяют на:
поисковые машины, системы поиска, которые осуществляют поиск по ключевым словам;
каталоги и порталы информационных ресурсов сети, которые имеют иерархическую структуру для навигации или быстрого поиска информации не по ключевым словам, а по директориям.
Поисковые машины
Поисковая машина – это поисковый сервер, на котором установлена специальная программа, выполняющая автоматический поиск информациионных ресурсов по ключевым словам в заголовках и тексте Web-страниц. К наиболее известным поисковым машинам относятся: Google, Yahoo, AltaVista, Hot Bot, MSN Search, Yandex, Rambler, Апорт, Мета и т.д.
Поисковые системы — это огромные базы данных слов, которые добавляются в базу при периодическом сканировании Web-страниц в пространстве Internet. При помощи программ-роботов (пауков) поисковые системы регулярно “прочесывают” ресурсы сети Internet.
Полученный информационный массив вместе с ссылкой на то, где находится нужное слово, хранится в виде индексных (отсортированных) файлов. При вводе ключевого слова в поисковую машину система обращается к своей базе файлов, выбирает информацию и выдает пользователю перечень Web-страниц, на которых имеются заданные пользователем ключевые слова.
Вследствие разницы в подходах к поиску в различных поисковых системах результаты их поиска не всегда адекватны запросу. Поэтому для получения наиболее полных результатов целесообразно пользоваться различными поисковыми системами или метапоисковыми машинами.
Метапоисковые машины — это системы, проводящие поиск на нескольких поисковых машинах одновременно, например MetaBot — Российская мета-поисковая система, которая осуществляет поиск через российские поисковики (Яндекс, Апорт, Рабмлер и т.д.), мировой метапоиск (Northernlight, All the Web, Raging), а так же смешанный FTP-метапоиск.
Каталоги и порталы информационных ресурсов
Классифицировать каталоги информационных ресурсов можно по различным критериям, например целевому назначению, по характеру содержания, национально-территориальному признаку, по сферам их использования.
Обычно на главной странице каталога информационных ресурсов размещены базовые разделы рубрикатора. Рубрикатор имеет иерархическую структуру, позволяющую наиболее точно классифицировать ресурсы по их тематической направленности.
К наиболее популярным каталогам информационных ресурсов относятся:
— DMOZ. Каталог;
— Яндекс. Каталог;
— Rambler's Top100;
— Yahoo! Directory (Yahoo! Каталог).
К наиболее популярным образовательным каталогам и порталам относятся:
— www.osvita.org.ua — «Osvita.org.ua»- украинский образовательный портал;
— www.qww.com.ua/d/nauka/50/ — Наука, Образование — Qww.com.ua — Каталог украинских сайтов
— www.edu.ru — Российское образование. Федеральный образовательный портал;
— www.allbest.ru/union/rating.cgi?c=19 — Учебные заведения — Рейтинг — Союз образовательных сайтов
— www.school.edu — Российский общеобразовательный портал