Веб-студия Александра Иванова

Avacym.Ru
Веб-студия Avacym

Несовершенство поисковых систем

Результат выдачи системы поиска по поисковому запросу пользователя представляет собой список ссылок на страницы сайтов, которые по ее мнению наиболее точно соответствуют запрашиваемой теме. Этот список упорядочен по релевантности и ранжируемости, и отображает максимально подходящие результаты по запросу пользователя.
Чтобы определить релевантность страницы для конкретного запроса, поисковые системы используют определенные алгоритмы, а также множество различных факторов ранжирования, включающих в себя такие параметры как: наличие ключевых слов на страничке, ее авторитетность, скорость загрузки, количество внешних ссылок, поведенческие факторы и многое другое.
Разделитель-статья-2

Факторы, влияющие на поисковую выдачу

Результаты выдачи по одному и тому же запросу могут существенно различаться в разных поисковых системах (далее ПС), и даже в разное время суток. Один и тот же запрос, выполненный дважды, с интервалом в 5 минут, может дать разные результаты.

Это связано с рядом следующих факторов:
• апдейты поисковой выдачи;
• изменение конкуренции по запросу;
• персонализация выдачи с учетом местонахождения, истории поиска и предпочтений пользователя;
• внесение изменений в алгоритмы ранжирования поисковиков;
• добавление новых релевантных страниц в индекс системы поиска.
Разделитель-статья-2

Как формируется результат выдачи системы поиска по конкретному поисковому запросу пользователя?

Процесс формирования результата поиска начинается с того, что поисковик анализирует поисковый запрос и выделяет из него ключевые слова и фразы.
Затем он проводит поиск по своей базе данных, где хранится множество данных о страницах различных сайтов. В первую очередь учитывается релевантность содержащейся на этих страничках информации к поисковому запросу, а также авторитетность самих ресурсов.

Система поиска учитывает такие факторы, как:
оптимизация страниц;
• теги Title (название) и Description (описание);
• заголовки и подзаголовки страничек;
• релевантность текстового контента названию, описанию и заголовку на странице;
• скорость загрузки странички;
• поведенческие факторы;
• количество ссылающихся доменов.

Также важную роль играют личные предпочтения человека, осуществляющего поиск, его географическое местонахождение, устройство, которым он в настоящий момент пользуется, и другие персонализированные параметры.

Помимо традиционных органических результатов, поисковая выдача, как правило, включает в себя различные специальные блоки и форматы: платные рекламные объявления, ответы на вопросы, изображения, видео и карты, которые помогают человеку максимально быстро найти нужную для себя информацию.

Таким образом, результат выдачи (например, Яндекс или Google), по выполненному человеком поисковому запросу - это сложный, многокомпонентный и постоянно меняющийся продукт, формируемый с учетом множества технических, коммерческих и пользовательских факторов.
Разделитель-статья-2

Почему при подготовке ответа на поисковый запрос пользователя система поиска выдает лишь список ссылок на страницы сайтов, которые по ее мнению наиболее релевантны данному запросу, при этом не выделяет конкретные абзацы или разделы с текстом ответа?

При формировании наиболее подходящих вариантов ответа на поисковый запрос, система поиска выдает лишь список ссылок на странички ресурсов (как правило, название и описание или же часть текста с встречающимися нужными ключевыми словами), потому что процесс анализа и подбора наиболее релевантного контента, является сложным и многогранным.
Чтобы определить релевантность страницы к поисковому запросу, поисковики используют алгоритмы ранжирования, анализирующие и учитывающие сотни различных факторов.
А выделение конкретных абзацев или разделов с наиболее подходящим текстом ответа требует дополнительного анализа и обработки контента веб-страницы, что существенно замедляет процесс поиска.

Это связано со следующими причинами:

• Сложность обработки поисковых запросов.
Они очень разнообразны и неоднозначны. Для того чтобы дать точный ответ, поисковой машине нужно понять контекст, намерение и ожидание человека. Это сложная задача, которую не всегда можно решить автоматически.

• Отсутствие структурированных ответов в индексе поисковиков.
Системы поиска ежемесячно анализируют и индексируют миллиарды новых страниц сайтов, однако большинство из них не содержит готовых ответов на конкретные вопросы.

• Необходимость персонализации выдачи.
Релевантность поисковой выдачи сильно зависит от контекста, местонахождения и предпочтений конкретного пользователя. Поэтому на запрос формируется не короткий и конкретизированный ответ - он может оказаться неправильным и неподходящим, а большой список (иногда до нескольких десятков тысяч) ссылок на страницы сайтов, которые, по мнению системы поиска, могут быть интересны именно этому человеку.

Однако тут напрашивается резонный вопрос. А зачем на запрос пользователя поисковой машиной готовится и показывается ему список более чем на шести страницах - это 60 позиций органической выдачи и плюс от 1 до 50 ссылок на платные рекламные объявления, в зависимости от коммерческой конкурентности запроса.
Уверен, что ниже пятидесятой позиции, предложенный поисковиком список просматривает не более 1% людей, при условии, что они чрезмерно активные, и у них есть время этим заниматься. Полагаю, что на них не следует ориентироваться, а технические возможности и ресурсы поисковой системы нацелить на подготовку емкого и конкретного ответа на запрос пользователя.

Еще один важный момент. Зачем ПС пытается подготовить объемный и развернутый ответ на запрос, который заведомо неправильный и некорректный.

Так, например, в Яндекс мною выполнен следующий запрос «Купить в Москве беременного бегемота».
На данный вопрос Яндекс нашел у себя в базах, счел их релевантными и предложил в качестве возможных вариантов ответа - 15.000 результатов! Однако ни один из них не дает ответ на данный запрос!
В данном случае, если разработчики Яндекс считают, что им удалось сделать свою ПС умной, в том числе, используя возможности нейронных сетей, ресурсы искусственного интеллекта и машинного обучения, то она должна была вывести на экран следующий текст: «По данному запросу в базе данных Яндекс информация отсутствует! Попробуйте скорректировать свой запрос».

Результаты поисковой выдачи Яндекс

Результаты поисковой выдачи Яндекс-1
Результаты поисковой выдачи Яндекс-2
• Ограничения технологий обработки естественного языка.
Современные технологии обработки естественного языка, такие как нейронные сети и машинное обучение, позволяют системам поиска лучше понимать поисковые запросы и содержание страниц сайтов. Однако они все еще имеют определенные ограничения, и не всегда могут точно определить, какая именно часть текстового контента на страничке является приемлемым ответом на запрос.
Разделитель-статья-2

Принцип работы алгоритмов поисковых систем при ранжировании страниц сайтов, и несовершенство этого процесса

Алгоритмы систем поиска являются сложными математическими моделями, которые анализируют миллиарды страниц сайтов в интернете, индексируют и заносят в свои базы, ранжируют и определяют их релевантность к поисковым запросам пользователей.
Однако, несмотря на все передовые технологии, процесс ранжирования сайтов не лишен недостатков.
Так, некоторые страницы могут быть необоснованно подняты на верхние позиции результатов выдачи из-за различных запрещенных манипуляций, таких как: переизбыток в тексте ключевых слов и фраз, закупка большого количества внешних ссылок, накрутка поведенческих факторов. Это приводит к тому, что человек может получить неверную или неполную информацию при осуществлении поиска.
Также алгоритмы поисковиков несовершенны из-за быстрого изменения трендов и интересов людей. Сайты, которые еще недавно были популярными, теряют свою актуальность и выпадают из первой сотни результатов выдачи.

На сегодня существует ряд проблем и ограничений:

• Неоднозначность поисковых запросов.
Люди могут формулировать запросы по-разному, с различным контекстом и намерениями. Автоматически понять их точные потребности бывает очень сложно.

• Ограничения технологий обработки естественного языка.
Современные алгоритмы машинного обучения все еще имеют сложности с полным пониманием смысла и контекста текстового содержимого страничек сайтов.

• Манипуляции с ранжированием.
Некоторые вебмастера обманывают ПС, используя запрещенные методы оптимизации и продвижения. Это приводит к попаданию в ТОП 5 результатов выдачи страниц, не соответствующих ожиданиям людей.

• Масштабируемость.
Поисковики ежедневно анализируют миллионы страниц, и применение ко всем из них существующих алгоритмов ранжирования является технически сложной задачей.

• Динамичность интернета.
На сайтах постоянно создаются новые, обновляются существующие и удаляются невостребованные странички, что усложняет поддержание актуальности поисковой выдачи.
Автор статьи - Александр Иванов
Несовершенство поисковых систем

Комментарии:

Интересная статья! Много новой информации о работе поисковых систем.
Григорий

Наконец-то кто-то написал об этой проблеме! Поисковые системы действительно далеки от совершенства. Они часто выдают неактуальные или недостоверные результаты, особенно при поиске информации на специализированные темы. Им необходимо постоянно совершенствовать алгоритмы, чтобы повысить качество поиска.
Вячеслав

Спасибо за статью! В будущем хочу разобраться более подробно в теме несовершенства поисковых систем.
Антон

Согласен с автором статьи, что поисковики имеют множество недостатков. Они часто выдают слишком много ненужной информации. Особенно это касается поиска по узкоспециализированным запросам. Их разработчикам нужно серьезно работать над улучшением семантического анализа и персонализации результатов.
Михаил

Впечатляющая статья! Спасибо за подробные объяснения.
Константин

После прочтения данной статьи стало понятно, почему поисковики иногда выдают не совсем то, что хотелось бы получить.
Павел

Очень актуальная статья! Я постоянно сталкиваюсь с тем, что ПС не могут найти нужную мне информацию. Особенно это касается поиска по техническим темам. Надеюсь, что разработчики будут совершенствовать алгоритмы, чтобы сделать поиск более эффективным.
Тимофей

Спасибо за познавательную статью! Буду следить за обновлениями в этой области.
Матвей

Тут будет Ваш комментарий …

Прокомментировать статью



После модерации Ваш комментарий будет опубликован на сайте!