Хоть я в сервисе недавно, но понимаю, что это нововведение ни к чему хорошему не приведет. Ввел в поиск "раскрутка сайтов". На первом месте статья автора, у которого 200% доработка !!! Я так полагаю, что приоритет у статей, в которых ключевики встречаются чаще. Но, чем больше ключевых фраз, тем хуже читаемость текста, больше воды. При этом также теряется смысл.
Я знаю, что такое релевантность и по ссылке прочитал информацию. Можно подумать, что у компьютера мозги появились и он начал понимать смысл статей, а не тупо оценивает статью по наличию ключевых фраз.
Релевантность - это не оценка статьи по наличию ключевых фраз.
"...Соответствие документа информационному запросу, определяемое неформальным путем. Одним из методов для оценки релевантности является TF-IDF-метод. Его смысл сводится к тому, что чем больше локальная частота термина (запроса) в документе (TF) и больше «редкость» (то есть чем реже он встречается в других документах) термина в коллекции (IDF), тем выше вес данного документа по отношению к термину — то есть документ будет выдаваться раньше в результатах поиска по данному термину..."
Сортировка по релевантности позволяет выбрать из всех наших статей наиболее подходящие. Если поиск с сортировкой по релевантности не дает нужных результатов, значит просто нет необходимых статей. Если это не так - покажите примеры. Если статьи плохие или некачественные - пишите в ЛПА.
Материал из Википедии :) Чтобы раскрыть эту тему, надо будет написать большую статью (понятно не в комментах). Конечно релевантность учитывает много факторов, но главный принцип - это соответствие ключевой и похожих фраз (хотя все остальные факторы в сумме могут нести больший вес). Если вы с этим не согласны, то не вижу смысла продолжать дискуссию.
Вы каждый раз забываете самое главное - коллекцию документов. Без коллекции документов релевантности не существует. И расчитывается релевантность исходя из коллекции документов.
Вы пытаетесь доказать, что релевантные документы - это плохо читаемые документы с большим количеством ключевых фраз, с большим количеством "воды" и с малым смыслом. Это не верно, вы заблуждаетесь. Изучайте матчасть.
При такой сортировке статья "Как выбрать «правильное» агентство недвижимости? Копирайтинг / 4329 символов / 4.763 у.е. (1.10 у.е. за 1000) Категория: Недвижимость / Язык: Russian — Русский / Автор: Smakota / все статьи Извещения" встречается в конце каждой странице и другие статьи при такой сортировке так же повторяются.
Сергей, мне сам принцип построения поиска очень нравится. Но нельзя ли более конкретизировать разделы в магазине? Например, статью про мебель, куда её разместить в Дом и быт или в Торговлю, а может в Моду и стиль? Это же можно сказать о дизайне. Или, например раздел Дом и быт, там все вперемешку и рецепты и стирка-уборка и много чего. Можно было бы каждый раздел разделить на подразделы.
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186