Систематическое несовпадение результатов онлайновой и оффлайновой проверок Advego Plagiatus
В последнее время стали обнаруживаться значительные расхождения результатов проверок между указанными версиями: например, оффлайн даёт 96/100 или даже 98/100 - в то время как онлайн для тех же текстов и в то же самое время выдаёт 89/62 либо вообще что-то типа 88/68. Я ещё как-то могу понять расхождение в пару процентов, но вот такие результаты явно намекают на то, что алгоритмы проверок обоих версий отличаются по каким-то существенным критериям.
PS попутно: по сравнению с оффлайном, онлайновая проверка того же самого текста идёт в разы (а то и на порядок!) медленнее по времени
Лучший комментарийlaskinat написал 14.09.2017 в 15:06
1
Ваше решение понятно - но глобально это IMHO не выход. Мне кажется очевидным, что если ВСЕ перейдут на онлайн (вопрос потенциальной платности ...Ваше решение понятно - но глобально это IMHO не выход. Мне кажется очевидным, что если ВСЕ перейдут на онлайн (вопрос потенциальной платности онлайн-проверки пока вынесем за скобки ;-) то онлайновая проверка просто "мёртво встанет"
Лучший комментарий5552014 написал 14.09.2017 в 14:55
0
У меня то же самое. На "стационарную" версию забил, проверяю онлайн. Проблема перестала быть проблемой. И настраивать ничего не нужно. ...У меня то же самое. На "стационарную" версию забил, проверяю онлайн. Проблема перестала быть проблемой. И настраивать ничего не нужно.
Спасибо, я умею читать - и даже своим технократическим™ умом понимаю, что если выкину из текста "предмет жалоб" Плагиатуса в виде номера и наименования конкретного ГОСТа, то смогу как-то "объехать" проблему - но это именно что "лечение симптомов", а не болезни.
Что именно вас не устраивает? Цифры - это как раз симптомы по вашей классификации, которые вы пытаетесь "лечить". Лечить нужно причину - содержание текста. По ссылке выше указано, какие совпадения есть смысл учитывать, и что делать, чтобы уникальность с большей вероятностью была высокой.
Повышения уникальности не бывает, как бы этого ни хотелось копирайтерам. Бывает только повышение содержательности, следствием которого становится повышение уникальности. Как только копирайтер это поймет, вопрос с уникальностью отпадет сам собой.
Если задекларированные как "одинаковые" методики проверки дают на ОДНОМ тексте разницу в ~10% процентов - то это в первую очередь вопрос к методикам, IMHO.
Прочитайте еще раз пояснения по ссылке, там как раз сказано, что методики разные и расхождения результатов будут всегда, оценивать нужно визуально, что это за совпадения, независимо от инструмента и методик.
Уникальность текстов - не физическая величина, а всего лишь приблизительная оценка, пытаясь найти в приблизительной оценке точность, вы делаете ошибку. Результат каждой проверки - точное число найденных совпадений, уникальность же - что-то усредненное от нескольких (в идеале нескольких десятков) результатов с учетом смысла, конечно же. Перестаньте смотреть на цифры, начните смотреть на суть текста.
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186