Огромные расхождения между показателем уникальности в плагиатусе и онлайн (здесь уникальнее)
Уже целую неделю сталкиваюсь с таккой проблемой, что плагиатус показывает очень низкую уникальность моих текстов - от 20% до 60%. Самое интересное, что у заказчика, с которым я работаю, та же история. После нескольких прогонов через плагиатус (раз 6) появляется уникальноссть 100%. Я ей уже не доверяю, поэтому проверяю онлайн, если еще есть символы на счету. И онлайн-проверка дает результат лучше! Тексты пишу совершенно самостоятельно, рерайтов не делаю.
У меня такая же история. Онлайн выдает почти всегда очень высокий процент, но я ориентируюсь по плагиатусу (то есть по низшему значению и улучшаю его).
Проблема в том, что как бы я не переделывала текст, я получаю что-то вроде 100% на 65%, даже если онлайн вышло 100% на 100%. Заказчик возвращает мне пишет, что у него такая же низкая уникальность, потом перепроверяет несколько раз, извиняется, принимает работу. раньеш у меня бывало такое, что плагиатус выдает 100%, а онлайн-проверка - чуть ниже, а теперь картина всегда одинакова. Высокая уникальность по фразам, низкая - по словам. А через пару прогонов результат, как на сайте примерно. У нас с заказчиком одинаковые настройки, я и подумала, что дело может быт ьв них.
Да, кулинария - очень гнусная тема в плане уникальности. Тем более что многие заказчики требуют шаблонно писать составляющие - с столбик, со стандартными сокращениями, чтобы было "сливочное масло", а не "масло сливочное" и тд. И требуют уник 95%!!!:)
Текст мне написать заново несложно. Но толку не будет от этого, если я не буду знать, как адекватно проверить его на уникальность. Но раз нельзя - уберу.
Спасибо за совет. В любом случае, я могу написать его заново, но мне сложно ориентироваться, когда проверки дают такой разный результат. И, как я уже писала, у заказчика плагиатус тоже выдает очень разную уникальность. Не может же быть, что только у нас двоих так.
Сто раз уже писали - не стоит полагаться на другой плагиатус, кроме онлайновского... Я давно не трачу время на проверку через другие, проверяю только онлайн.
В заказе указано, что проверять нужно через утилиту. Заказчик не с Адвего, врядли я могу на его решение повлиять. Заказчик хороший, давно работаю с ним, проблемы начались только на этой неделе.
Прежде чем писать куда-то об "ошибках", нужно проанализировать, что именно было найдено. И только если найденные результаты некорректны, сообщать в службу поддержки.
Спасибо, но ответа на мой вопрос тут нет. Например потому, что на разных компьютерах у разных людей один и тот же текст получает разную оценку уникальности? У меня - указанную выше, а у подруги на другой улице - высокую. И онлайн - высокую. "Если в качестве неуникальных фраз выделены неизменяемые термины, названия или ключевые фразы длиннее 4 слов, то их нужно исключить из расчета.". Если я исключу ключевые фразы длиннее 4 слов из рассчета, у меня будет уникальный текст. Только раньше-то мне не приходилось этого делать - плагиатус выдавал адекватный результат с небольшим отличием от онлайн-проверки. Меня интересует, по какой причине могли возникнуть такие перемены. Я привела в пример один текст, на этой неделе у меня это уже четвертый случай, когда проверяю именно плагиатусом и получаю подобное. До этого с ним проблем не наблюдалось.
"на разных компьютерах у разных людей один и тот же текст получает разную оценку уникальности?" - потому что на разных компьютерах разные IP-адреса, разная скорость интернета и выборки вообще каждый раз разные.
"Только раньше-то мне не приходилось этого делать - плагиатус выдавал адекватный результат с небольшим отличием от онлайн-проверки." - что такое адекватный результат? Найденные совпадения есть на самом деле?
"Меня интересует, по какой причине могли возникнуть такие перемены." - какой именно результат вы считаете некорректным? Высокий у онлайн-проверки или низкий у Плагиатуса, какой именно показатель, по фразам или по словам? Обсуждать можно наличие совпадений или их отсутствие, числа обсуждать смысла нет, это результат работы программы, которые необходимо интерпретировать вручную, если возникли сомнения.
1. То есть, если я получаю результат 100%\45%, а мой заказчик - 100%\100%, то все нормально? Просто выборки разные, скорость, и т.д.? И оба результата верные? 2. Адекватный - с настоящими совпадениями, а не как, например, написал человек выше: "В информационном тексте про недвижку 1 раз упомянут губернатор. АП показал 4% совпадения с Википедией (страница про губера) и 3% с новостью про то, как Губер рыбу ловил.". 3. Я считаю некорректной такую большую разницу в показателях. Или это нормально, когда онлайн 100\100, в плагиатусе 100\29, а у заказчика, скажем, получается 97\55. Если такие расхождения - норма - в чем смысл проверки? И почему обычно у меня разница между плагиатусом и онлайн-проверкой была очень маленькой?
"-- Заказчик возвращает текст на доработку с претензией на низкое значение второго показателя уникальности (совпадения по словам). -- Проверьте в отчете проверки системой найденные совпадения и их источники - если среди них нет явных совпадений по структуре и содержанию, и вы точно знаете, что текст был написан по уникальному плану без поверхностного рерайтинга других текстов - откажитесь от доработки, а в случае необоснованного отказа в оплате обращайтесь в ЛПА по инструкции: https://advego.ru/blog/read/faq_author/1281152
Низкое значение второго показателя для узкоспециализированных текстов медицинской, юридической или кулинарной тематики - частое явление, но все же стоит лишний раз перечитать текст и постараться улучшить его содержательность, используя дополнительные источники фактов - специализированные форумы, справочники, знакомых экспертов. Как правило, более содержательные тексты получают более высокую оценку по уникальности."
2. "2. Адекватный - с настоящими совпадениями, а не как, например, написал человек выше: "В информационном тексте про недвижку 1 раз упомянут губернатор. АП показал 4% совпадения с Википедией (страница про губера) и 3% с новостью про то, как Губер рыбу ловил." - совпадения в примере настоящие, если естьп римеры ненастоящих совпадений, присылайте примеры и скриншоты в ЛПА: https://advego.ru/blog/read/feedback/
3. Смысл проверки - в поиске совпадений. Если какая-то проверка не нашла совпадений, это не значит, что их нет, и наоборот не всегда найденные совпадения стоит принимать во внимание. Всегда нужен проверять визуально. Техническая уникальность - это не длина или ширина, а какое-то усредненное значение с многими исключениями. Расхождения в результатах - это норма, а чтобы оценить качество текста, нужно провести анализ того, что вам показывает программа.
"почему обычно у меня разница между плагиатусом и онлайн-проверкой была очень маленькой?" - много факторов, которые перечислены в том числе и по ссылке выше. Какие-то работы содержат больше совпадений по словам из-за тематики, какие-то - из-за терминологии и т. д. Где-то больше стоп-слов, по которым Плагиатус находит совпадения, а онлайн-проверка их игнорирует.
Что ж, я оформила вопрос в ЛПА. Мне не кажется, что проверка одного текста на разных компьютерах в одно и то же время, выдающая настолько разные результаты, адекватна. Не может быть такого разброса. Отправила сейчас текст заказчику - говорит, что все нормально, у него 100\100, а у меня в данный момент 96\41. Много факторов, я согласна, но не должно быть таких расхождений по одному и тому же тексту. Буду ждать, что мне ответят.
Разброса нет никакого - есть результат проверки, возьмите и проанализируйте его, каждый источник, чтобы сделать вывод о фактической уникальности и качестве текста. Просто по числам нельзя ничего сказать на 100% достоверно.
В проверенном тексте о капельном поливе были найдены совпадения с текстами о капельном поливе. Текст узкоспециализированный, насыщен неизменяемыми или слабоизменяемыми терминами, и если это не оригинальное исследование, велика вероятность, что в других текстах такой же тематики будет использоваться аналогичная лексика. Об этом сказано в помощи по ссылке https://advego.ru/blog/read/faq_plagiatus/3857295/: "Низкое значение второго показателя для узкоспециализированных текстов (например, медицинской, юридической или кулинарной тематики) - частое явление".
"Ранее второй показатель в районе 50% указывал на источник заимствований." - и раньше, и сейчас показатель совпадений по словам показывал одно и то же - совпадения по словам, а не источник заимствований. Источник ли это, нужно определять визуально. Если источников не нашли, значит текст написан правильно, с использованием именно той лексики, которая применяется в данной области знаний.
Те или иные проценты - это знак. Знак низкого качества, плохой переработки или тематичности - нужно анализировать вручную. Тот факт, что уровне совпадений в 50% текст часто(!) оказывается плохим рерайтингом, говорит и о том, что иногда(!) бывают и исключения.
Программа нашла вам совпадения, вам нужно решить, что с ними делать.
Узкая специализация - это принцип, применимый к любой тематике. Не только капельный полив, а любой(!) специализированный полив, например.
Это значит, что любое погружение в тему глубже "опытных специалистов в современном мире" делает ее узкоспециализированной в той или иной мере.
Отдельно стоит вопрос тематики как таковой, уж так сложилось, что в кулинарных текстах очень ограниченный лексический корпус, как и в юриспруденции. Поэтому в таких тематиках нередко даже без особой специализации уже значительный процент лексических совпадений.
Если кому-то важен минимальный процент лексических совпадений, то стоит применять изобретательность в формулировках или набираться опыта, чтобы сделать богаче этот несколько скудный запас. В противном случае стоит работать с более простыми тематиками.
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186