Проверка заказчиком на уникальность по отдельно выдернутым предложениям
Добрый день.
С заказчиком вышел такой разговор: "При проверке статьи целиком уникальность хорошая. При проверке же ее отдельно выдернутыми предложениями уникальность низкая, практически никакая, что говорит о низком качестве рерайта". Очень хочется услышать мнение профессионалов: может ли такое иметь место и если да, то почему так могло произойти? Является ли нормой практика проверки уникальности использованием отдельно выдернутых предложений? (статьям проводился добросовестный рерайт, размеры статей небольшие, ~1200 знаков).
Буду очень благодарна за высказанные вами мнения.
Что именно вас интересует? Должны быть уникальны не только предложения, но и их половинки так сказать. Не имеет значения, проверить предложения или выставить меньше шингл. Уникальность она никуда не испаряется и не появляется. Либо текст уникальный, либо нет. А проверять заказчик может как угодно.
В том-то и вопрос, что при проверке текста целиком Plagiatus показывает высокую уникальность, а при проверке отдельными предложениями она как-раз куда-то испаряется. Я исходила из того, что мы видим первоначально - текст уникален, затем мы имеем либо некорректные условия проверки уникальности, либо лукавство заказчика (он пока не смог сообщить мне подробности с примерами), либо я упускаю что-то важное.
К сожалению, вопрос не имеет отношения к работе Плагиатуса. Тем более без примеров текста и анализа его фрагментов. Совет - проверяйте работу только один раз, когда будете уверены в результате. Глубокой проверкой. С небольшим размером фразы (например, 4.) Один раз - чтоб не нагружать поисковые сервисы, и не получать баны.
А что, что-то изменилось от того, что я вам предоставила все скрины? Вежливо ответили:учтем и привет. А проблема не ушла, благо, я просто о ней знаю и теперь проверяю по 1000зн максимум, дабы не иметь проблем. Если верить вам лично, то программа не гарантирует уникальность, тогда скажите, для чего она вообще нужна?
Вы почему-то считаете, что раз такая проблема есть в наличии, то значит, проверяем неправильно. Я вам задавала уже вопрос, что делать, если на глубокой проверке 1500зн уник 100%, а при проверке того же текста, но разбитого надвое, уник 90 и ниже. Причем тут он уже находит такие совпадения, что это подчас целые фразы. Это нормально, по-вашему? Недавно я писала рекламный текст, проверила по 1500 тыс и отослала. Потом ввела наобум кусок 1000зн из этого же "100%" текста и все поле, без исключения, пожелтело. Как "хорошо" проверил плагиатус, аж душа порадовалась. Почему-то при использовании иных программ, по требованию заказчиков, которые уже не доверяют плагиатусу,, такого не происходит. Вам это странным не кажется? Ну найдется порядка 5-7% совпадений, но на этом все. Хоть как вводи. А зачастую одинаковые куски вводишь в плагиатус и в другую прогу, а результат разный - плагиатус мило выдает 100, без ошибок и блоков, а другая прога 95. Я в курсе, что кодировка у прог разная, как и система поиска, однако, я, по наивности видать, полагаю, что если есть совпадения, согласно настройкам, то он обязан их указать и найти, иначе на кой он вообще нужен. Тема со скринами есть в ЛПА.
"ввела другой текст и все пожелтело" - беспредметный разговор. для того что-бы беседа имела смысл и могла прийти к какому-либо выводу - требуются реальные тексты, и реальное сравнение. иначе мы беседуем о сферических конях в вакууме. используйте размер фразы 5 шингла 3 и глубокую проверку.. проверка разных фрагментов и их уникальность - и проверка текста в целом дают разные проценты - это понятно. объяснение читайте ниже http://advego.ru/blog/read/talk/293123/#comment8
инструменты для рерайтинга будут только в будущих версиях (не раньше версии для linux) .
По Вашему обращению в личную переписку я лично дал исчерпывающие ответы. Приложенные скриншоты не несут полезной информации. "Недавно я писала рекламный текст, проверила по 1500 тыс и отослала. Потом ввела наобум кусок 1000зн из этого же "100%" текста и все поле, без исключения, пожелтело"
Пожалуйста, присылайте этот текст. Ваши настройки. А так-же текст "введенный нобум" при котором "все пожелтело".
И описание того, что по Вашему мнению работает неправильно.
Проверим, потестируем.
если использована обычная проверка, то скорее всего в поисковую выборку просто не попали те фразы которые дают текст с плагиатом. попробуйте глубокую проверку на обоих текстах. либо повторные быстрые проверки.
На мой взгляд, как раз-таки вопрос относится к работе Плагиатуса. Я тоже столкнулась с тем, что даже при размере фразы 4 весь текст 100% уникальный, а когда вбиваешь по абзацам, начинает находить совпадения по 5 слов вместе (до этого проверяла глубокой проверкой). Получается, эффективнее проверять небольшими отрывками? Но ведь это намного больше работы получается!
Я подробно объяснял кому-то в личке.
Предположим в тексте 100 слов.
Не уникально первые 25.
Вывод уникальность текста: 75%
Теперь берем первые 50 слов.
Не уникально первые 25.
Вывод уникальность текста: 50%
Это синтетический пример, но принцип сохраняется и в жизни.
+ К этому - на больших текстах не учитываются разрозненные совпадения меньшие 1%, если в сравниваемом тексте не было бОльших совпадений.
На маленьком тексте разрозненные совпадения становятся большими 1% + повляются бОльшие совпадения по причине 1.
Надеюсь прояснил ситуацию.
Проверка текста маленькими кусками != проверка большого текста. Это проверка нескольких разных маленьких текстов.
Каким образом Вы планируете суммировать неуникальность фрагментов? Сложением? Делением?
А когда вы используете не глубокую, а обычную проверку - добавляется элемент
"случайности", поскольку имеем разные выборки поисковых фраз на большом тексте и фрагментах.
Спасибо за пояснения. Просто я недавно в системе, стараюсь писать самостоятельно, но на уникальность проверяю. Мне как-то оплатили работу, но в комментариях написали, что при вводе блоками есть совпадения. Вот я и стала периодически перестраховываться. По крайней мере, с Вашими пояснениями теперь можно будет адекватнее общаться с заказчиком.
Я, кстати, только вчера узнала, что некоторые ВМ проверяют уникальность кусками. Сама проэксперементировала - действительно, если проверять абзацами находит больше "избитых фраз". Ну, что же, если так требуют, будем проверять кусками.
Подниму тему, потому что не нашла подходящую для вопроса. Скажите, блокировка со стороны Яндекс или Google - это что значит? Точнее, как это понять (выдает ошибку при проверке?), как это на долго, и какой выход в этой ситуации? А с тем, что проверка целого текса и отдельных абзацев ошеломляюще разный результат дает как раз вчера столкнулась( Возможно, я сильно торможу, представитель администрации буквально разжевал все, но мне все равно не понятно, как проверять и чему верить. Общий-то текст был уникален на 98%, а по абзацам проверять начала и прям дурно сделалось. Где 82%, где 85%. Так как же все-таки работу проверять, целиком или абзацами? Дело в том, что абзацами программа намного добросовестее проверяет, а при проверке целого текста то ошибки соединения, то превышен порог ожидания и гордый стопроцентный вердикт в конце(( Собственно вопроса два. Блокировка поисковиков и рекомендуемая проверка. Мне заказчику говорить, что "Проверка текста маленькими кусками != проверка большого текста"? Нечего, мол, кусками проверять, у меня целый текст уникальный, а не по кускам?
Спасибо за содержательный ответ((( Как будто я там не побывала уже раз надцать... Ладно, с уникальностью как-нибудь на собственном опыте разберусь. Про блокировку Яндекс или Google ответьте, если не сложно. Она на какой-то промежуток времени действует или это приговор? И как увидеть, что блокировка включилась?
В ветке по работе плагиатуса эти вопросы обсуждались многократно. Пролистайте старые темы, годовой или полугодовой давности. Если мне не изменяет память, через сутки снимается. Но надо причину убирать, о чём написано в вики, поэтому я Вам и дала ссылку.
Спасибо Вам большое, гляну. Просто пока еще вынуждена часто проверять на уникальность. Вроде на 100% уверена, что избитые и шаблонные фразы не использую, а текст все равно стартует с 87-89%. Порой по 10-12 раз проверяю. Одно исправишь, другое вылезет, чего раньше Плагиатус не заметил. Поищу, в общем)
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186