Продвижение сайтов с использованием искусственного интеллекта. Александр Краснобаев

Чтение книги онлайн.

Читать онлайн книгу Продвижение сайтов с использованием искусственного интеллекта - Александр Краснобаев страница 2

Продвижение сайтов с использованием искусственного интеллекта - Александр Краснобаев

Скачать книгу

указанные ключевые слова и извлекает списки страниц, где они встречаются. Если в запросе несколько слов, система сравнивает списки для каждого из них и оставляет лишь URL, присутствующие во всех этих списках – то есть те страницы, где встречаются сразу все слова. В результатах поиска отображаются название страницы, дата ее создания, адрес и цитата из текста с подсвеченными искомыми словами.

      Для более детального понимания рассмотрим систему фильтрации, через которую проходят обрабатываемые страницы.

      Начальная фильтрация

      На входной стадии в распоряжении поисковика находятся триллионы адресов веб-страниц. Разумеется, реального полезного контента там значительно меньше – основную долю составляют дубли, неработающие или устаревшие ссылки и прочий «информационный мусор». Из этого пула отсеиваются сотни миллиардов более или менее адекватных адресов для последующего анализа их содержимого. Среди них есть как популярные и востребованные страницы, так и практически неизвестные широкой аудитории.

      Далее эти отобранные сотни миллиардов документов выкачиваются и фильтруются еще раз – удаляются дубли, служебные файлы, поисковый спам. Остаются десятки миллиардов URL, которые затем индексируются: разбираются на слова и заносятся в базу данных поисковой системы.

      Фильтрация при поиске

      Следующие этапы фильтрации происходят уже после получения конкретного поискового запроса от пользователя. Суть этого этапа – найти подходящие документы-кандидаты и упорядочить их по степени релевантности запросу, то есть выполнить ранжирование. Оно происходит в два приема:

      1. Черновое ранжирование: система получает из индекса списки документов со словами запроса. Это сотни тысяч или миллионы URL.

      2. Чистовое ранжирование: извлекаются дополнительные характеристики каждой страницы, и специальный алгоритм вычисляет их итоговые позиции в поисковой выдаче.

      В итоге остается лишь несколько тысяч наиболее подходящих документов, готовых к выводу в виде результатов поиска. Однако на этом процесс не заканчивается. Далее происходит финальное формирование выдачи: дополнительная сортировка, добавление данных из узкоспециализированных вертикальных поисковиков, подбор цитат со словами запроса.

      Итак, мы подробно разобрали, как именно функционирует поисковая машина, из каких этапов складывается сложный процесс обработки огромного количества данных и формирования максимально релевантной пользовательскому запросу выдачи.

      Искусственный интеллект – основа современного поиска

      Функционирование современных поисковых систем почти полностью зависит от технологий искусственного интеллекта. Понимание принципов работы искусственного интеллекта в поисковиках позволит оптимизировать ваш сайт для лучшего ранжирования в выдаче.

      Искусственный интеллект отвечает за все аспекты работы поисковых систем – от выбора

Скачать книгу