К вопросу об эффективности поиска конкретики в Интернете. И. А. Семёнов
Скачать книгу в различных форматах или читать онлайн на сайте.
Согласно исследованиям Berkley, объём информации в Интернете по состоянию на 2003 год оценивался в 258,85 терабайта, и это только общедоступные данные. По данным Internet World Stats, рост аудитории Интернета с 2003 по 2007 год составил 117% (на декабрь 2007 года аудитория оценивалась в 1,3 млрд человек). Ввиду высокой хаотичности информации в Интернете наиболее эффективным методом поиска является полнотекстовый поиск. Имея минимальное представление об алгоритмах работы поисковых роботов, можно оптимизировать веб-страницу таким образом, что ссылка на нее будет всплывать на первых местах по запросам, к которым она не имеет никакого отношения. Кроме того, имеется ещё одна проблема: ни одна поисковая машина не обеспечивает обратной связи с пользователем. Ленивый запрос включает параметры искомой информации, а также время, в течение которого результат будет актуален (будет интересовать пользователя). При поступлении подходящей (релевантной запросу) информации пользователь уведомляется об этом удобным для него способом.