Характеристика технологии поиска в системы Internet и основные системные параметры |
13-12-2022 |

По статистическим подсчетам, только в системе Web находятся более 40 миллионов страниц информации (1997). Количество этой информации удваивается каждые 4 месяца. Таким образом, на начало 2002 года объем Web-страниц составляет около 164 миллиардов. Учитывая такой огромный объем информации, поиск нужных документов может показаться невыполнимой задачей. Но тут на помощь приходят поисковые машины и каталоги.
Поисковые машины Web пытаются создать базу данных всей системы WWW с помощью программных систем, называемых пауки.
Технология работы программ-пауков является следующей: пауки переползают от одного Web-узла к другому с помощью системы URL и "собирают" необходимую информацию для комплексной базы данных.
Если не учитывать сам факт использования системы пауков, то можно утверждать, что различные поисковые машины работают по-разному. Одни размещают в свою базу данных все слова каждой Web-страницы, а другие сначала исследуют адреса узлов, чтобы потом выбрать среди них наиболее эффективны. Успех поисковой машины зависит от способа его действия.
Удобная поисковая машина должна иметь следующие основные параметры:
Быстро выполнить поиск и предоставить пользователю информацию в реальном времени.
Содержать максимально возможное количество документов, которые необходимо отыскать.
Располагать найденную информацию в порядке важности документов в соответствии с заданным критерием поиска.
Недостаточно найти все документы, содержащие искомое слово, необходимо выделить из них те, в которых слова приводятся в необходимом контексте, и в то же время не допустить отсеивания необходимых материалов. Чтобы решить задачу, важно точно сформулировать вопрос. Только на первый взгляд кажется, что - все это просто.
Рассмотрим основные правила методологии поиска.
Проводя поиск, важно идти от общего к частному. То есть, начиная поиск с более общего понятия, двигаться вглубь, постепенно сужая круг;
а) сформулируйте вопрос так, чтобы в зону поиска попали все документы, содержащие искомое понятие;
б) старайтесь выделить особые признаки, которые присущи (или несвойственные) собственно этому документу;
в) если количество документов все еще очень велика, добавьте в вопрос временные ограничения.
Без особой необходимости не используйте в вопросе прописные буквы.
Не рекомендуется применять некоторые символы, такие как:%, $, # и т.п.. Они могут восприниматься компьютером не так, как хотелось бы пользователю.
Попав на главную страницу поисковой машины системы Internet, сначала нужно отыскать главную страницу базы данных, где документ может сохраняться.
В зарубежных поисковых системах рекомендуется составлять запрос на английском языке. Часто поиск производится системой по невидимым полям в HTML - документе. Эти поля содержат название и / или ключевые слова, эквивалентные содержанию документа.
12 |




