Биржа копирайтинга Антиплагиат SEO-анализ текста Адвего Лингвист Проверка орфографии

Новости Адвего — Форум Адвего

боковая панель
Адвего / Новости Адвего
Сергей (advego)
Новая версия Advego Plagiatus - 1.3

[ Тема закрыта. Обсуждение актуальной версии: https://advego.com/blog/read/news/4553803 ]

Добрый день, уважаемые пользователи.

Наконец вышла новая версия Адвего Плагиатус. В версии 1.3 произошло довольно много изменений. Самое важное изменение - программа теперь ищет источники рерайта. Но обо всем по порядку.

Скачать программу можно тут: https://advego.com/plagiatus/

-- В процессе сравнения документов найденные совпадения выводятся в виде пары цифр - 10%/40%, где первая цифра означает количество найденного копипаста, исходя из размера шингла; вторая цифра - возможное количество рерайта;

-- Лог работы стал более информативным и понятным - убрано отображение неинформативных ошибок;

-- Во время работы подозрительные документы подсвечиваются красным цветом. Подозрительными документами являются такие документы, в которых найдено более 10% копипаста или 30% рерайта;

-- Результатом проверки текста является показатель уникальности текста. Теперь этот показатель состоит тоже из пары цифр - 90%/60%.

Первая цифра (уникальность) показывает количество в документе уникального текста, не копипаста. Это довольно точный показатель, который явным образом характеризует неуникальность документа. Хочу подчеркнуть, что этот показатель характеризует именно неуникальность. Т.е. если программа показывает, что уникальность документа 70%, то, значит, документ однозначно неуникален. Но если программа показывает, что уникальность документа 100%, то однозначно утверждать, что так оно и есть, невозможно (хотя вероятность этого велика). Есть ряд причин для этого, например, исходный документ, с которого осуществлялось копирование, еще не проиндексирован поисковыми машинами или документ недоступен для сравнения и прочие.

Вторая цифра (оригинальность) показывает количество в документе оригинального текста, не рерайта. При расчете итоговой "оригинальности" не учитываются найденные документы с количеством рерайта менее 30%. Проверить, являются ли такие документы источниками рерайта, можно самостоятельно. Мы рекомендуем просматривать документы, в которых найдено более 20% рерайта. Обращаем ваше внимание, показатель "оригинальности" документа носит предположительный характер, невозможно быть стопроцентно уверенным в том, что документ, который совпадает с другим на 60% по "рерайту", действительно является его источником (хотя и весьма вероятно). Возможны случаи, когда это не так. Поэтому показатель рерайта всегда нужно проверять "вручную" - просматривать глазами исходный документ, чтобы убедиться, что это действительно источник рерайта. Если итоговая "оригинальность" ниже 70%, то программа выдает предупреждение "Возможно, рерайт".

Внимание заказчиков! Если текст плохо переработан и вы нашли исходник, то можете вполне обоснованно отказать в оплате либо подать на исполнителя жалобу.

Наличие явных источников рерайтинга является объективной причиной для возврата средств за оплаченную статью с типом текста "Копирайтинг". В причине возврата нужно указывать именно найденный источник рерайтинга, а не показатель уникальности.

Наличие больше 20% значимых совпадений по словам с одним источником является объективной причиной для возврата средств за оплаченную статью с типом текста "Рерайтинг". Если же явных совпадений по содержанию и структуре нет, а совпадения по словам - просто особенность тематики, то качество текста считается высоким.

-- В результате проверки показываются следующие показатели:

- Количество проверенных документов (документов без ошибок);
- Количество всего найденных документов;
- Общее количество символов;
- Количество слов;
- Количество символов в словах;
- И, конечно, итоговая уникальность текста.

-- Найденные неуникальные фрагменты текста подсвечиваются:

- копипаст - желтым цветом;
- рерайт - голубым.

-- Появилась возможность подключиться к службе antigate - это система для автоматического распознавания "капчи". Службу можно активировать в настройках программы. Для функционирования системы вам необходимо иметь специальный ключ.

Информация о службе: http://antigate.com/
Регистрация тут: http://antigate.com/?action=regscreen

Для заказчиков из ЗС есть возможность бесплатного тестирования системы antigate. Инвайт можно получить в закрытом форуме заказчиков: https://advego.com/blog/read/master_green/1158940

-- Дефолтные настройки программы ужесточены, теперь по умолчанию размер фразы и шингла равны четырем словам (как говорят заказчики - "4/4"). Процент прерывания поиска установлен в "0" (поиск не прерывается), если вам нужен поиск до первого неуникального документа - установите этот параметр равным, к примеру, 20.

-- Ужесточены критерии оценки уникальности:

- уникальность > 95% - "очень хорошо";
- уникальность > 90% - "хорошо";
- уникальность > 80% - "плохо";
- уникальность < 80% - "очень плохо";
- рерайт > 30% - "возможно рерайт".

Лирическое отступление. Показатель уникальности в любом случае - оценочная величина. Это цифра. Цифру нужно проверять. Заказчик может требовать уникальность 95% при настройках 4/4. Однако заказчик не имеет права отказывать за уникальную(!) работу, которая по оценке Плагиатуса при настройках 4/4 уникальная на 90%, а не на 95, если это понижение уникальности обоснованно - устоявшиеся выражения, цитаты, названия и т.п.

-- Добавлена загрузка списка "плохих" документов с серверов Адвего. К примеру, страниц с результатами поиска одного поисковика, которые проиндексированы другим. Как только нам станет известно об очередном таком домене - мы его добавим в этот список, и домен будет игнорироваться про определении уникальности.

-- Добавлена лемматизация текста, для анализа изменения окончаний. Подробнее про лемматизацию: http://ru.wikipedia.org/wiki/%...B0%D1%86%D0%B8%D1%8F

-- Работоспособность:

- излишний мусор в результатах поиска;
- квадратики вместо букв на нерусскоязычных системах;
- утечки памяти;
- падения программы на некоторых страницах.

------------

Надеемся, Advego Plagiatus новой версии и дальше будет являться прекрасным помощником как для оценки готовых документов, так и для написания качественных уникальных материалов.

Для обсуждения различных аспектов работы программы на нашем форуме существует специальный раздел: https://advego.com/blog/read/plagiatus/

Внимание, в данной теме запрещено обсуждение ошибок программы. Для того, чтобы сообщить об ошибке программы, перейдите сюда: https://advego.com/blog/read/plagiatus/

Внимание, в данной теме абсолютно запрещено любое упоминание сторонних продуктов для анализа уникальности текстов.

В данной теме запрещается заявлять что-то наподобие этого: "у меня плагиатус показал уникальность 33% но я писал сам". Если у вас такая ситуация - пишите в ЛПА согласно этому документу: https://advego.com/blog/read/plagiatus/79953 с обязательным указанием текста и лога проверки. Если же у вас вопросы по процентам рерайта - прочитайте новость еще раз.

Спасибо за понимание, спасибо за внимание, с уважением, команда разработки Адвего.

Тема закрыта
Написал: Сергей (advego) , 03.07.2013 в 14:12
Комментариев: 961
Комментарии

Показано 41 комментарий
DELETED
За  1  /  Против  0
DELETED  написала  03.07.2013 в 14:41
Круто, реально круто)

                
Rubanenok
За  3  /  Против  1
Rubanenok  написала  03.07.2013 в 14:48
У меня есть заказчик, который требует уникальность 80%, теперь это плохо...

                
Сергей (advego)
За  2  /  Против  0
Сергей (advego)  написал  03.07.2013 в 14:55  в ответ на #2
Это и раньше было плохо. Как 20% копипаста может быть хорошо?

                
Rubanenok
За  9  /  Против  0
Rubanenok  написала  03.07.2013 в 15:04  в ответ на #6
Вот так: 350 знаков для описания парфюма, из них 70 "Carolina Herrera 212 On Ice Men 2006" и "Каролина Эрера 212 Он Айс Мэн 2006". Название товара менять нельзя. Получаем 20% копипаста. Что тут плохого?
p.s. ну это всё особенности каждого заказа.

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  03.07.2013 в 15:07  в ответ на #11
Всегда есть исключения.

                
Sharandin
За  0  /  Против  0
Sharandin  написал  14.10.2013 в 08:48  в ответ на #12
Здравствуйте. Сергей, простите что возвращаюсь к вопросу. Я правильно понял, что ключевые слова, которые повторяются в других документах и из-за которых падает уникальность, не должны влиять на решение ВМа об отказе на основании низкой уникальности текста?

                
Светлана (advego)
За  0  /  Против  0
Светлана (advego)  написала  15.10.2013 в 12:30  в ответ на #898
Об уникальности можно судить только лишь сравнив два текста - предполагаемый исходник и результат.

                
Sharandin
За  0  /  Против  0
Sharandin  написал  15.10.2013 в 15:43  в ответ на #899
Спасибо.

                
DELETED
За  9  /  Против  0
DELETED  написал  03.07.2013 в 15:19  в ответ на #11
Ваш заказчик потому и даёт в задании уникальность всего 80% потому что понимает, что трудно сделать лучше

                
Еще 6 веток / 32 комментария в темe

последний: 03.07.2013 в 11:26
DELETED
За  0  /  Против  0
DELETED  написала  03.07.2013 в 15:57
Поясните, пожалуйста, Плагиатус пишет "91%/100% - низкая уникальность текста". Это как?

                
Еще 42 ветки / 116 комментариев в темe

последний: 03.07.2013 в 12:31
DELETED
За  20  /  Против  10
DELETED  написал  04.07.2013 в 16:15
Все условия для заказчиков. А исполнители, как обычно, в проигрыше. Требования по уникальности ужесточаются, а плата за труд не повышается((

                
Сергей (advego)
За  8  /  Против  2
Сергей (advego)  написал  04.07.2013 в 16:48  в ответ на #162
Требования по уникальности повышаться не могут. Уникальность либо есть, либо ее нет. Если она есть, то текст уникальный. Если ее нет, то тогда уж появляются всякие критерии этой неуникальности.

Пишите уникальные тексты и никакие требования по НЕуникальности вас не коснутся.

Что касается платы за труд. У вас средняя стоимость за тысячу - 0.60 у.е. А у топ-авторов в 5 раз больше. Выводы, надеюсь, сможете сделать самостоятельно.

                
DELETED
За  9  /  Против  2
DELETED  написал  04.07.2013 в 17:54  в ответ на #171
Вы прекрасно понимаете, что дефолтные настройки "шингл/фраза 5/6" и "шингл/фраза 4/4" не одно и то же. Раньше если заказчик хотел, чтобы уникальность текста составляла 95% с настройками "шингл/фраза 4/4", то ему это надо было оговаривать в условиях задания, а дополнительные требования как бы подразумевают повышение оплаты. Сейчас же этого не нужно, поскольку такие настройки уже стоят по молчанию. Следовательно, никаких ужесточенных требований заказчик не предъявляет, а значит и платить можно по минимуму.

Что касается топ-авторов.. видимо это копирайтеры, а я рерайтер. На их гонорары я не претендую, но вот ожидать оплату в размере 0,9-1$ за 1000 символов за тексты с уникальностью 95% с настройками "шингл/фраза 4/4", мне кажется, более чем справедливо.

                
DELETED
За  0  /  Против  0
DELETED  написала  29.03.2016 в 16:37  в ответ на #171
кстати вы ошибаетесь. можно писать текст исключительно из головы. без источников. и получится может уникальность и 85 например. а если технический текст и термины, то еще хуже. Часто страдают формулировки предложений в угоду уникальности.
я вот уже ровно 3 часа не могу сео-рерайт с 1 источником конкретным довести до 95%. и сомневаюсь в том, что это возможно.

                
Еще 19 веток / 79 комментариев в темe

последний: 04.07.2013 в 13:02
DELETED
За  0  /  Против  0
DELETED  написала  05.07.2013 в 11:00
Объясните пожалуйста почему один и тот же текст АП выводит разные значения :
1) Уникальность текста 90% / 47%. Низкая уникальность текста. Возможно, рерайт.
2) Уникальность текста 95% / 100%. Хорошая уникальность текста.
В 1м случае выделяет синим и желтым, а во втором только только желтым. Проверяла 1 и тот же текст ничего не меняя.

                
Еще 25 веток / 72 комментария в темe

последний: 05.07.2013 в 07:55
Сергей (advego)
За  21  /  Против  11
Сергей (advego)  написал  08.07.2013 в 12:34
Оперативное обновление - версия 1.3.0.50
Скачать: https://advego.com/plagiatus
------

-- Корректировка критериев оценки уникальности:

- уникальность [95 .. 100]% - очень хорошо, ибо [0 .. 5]% совпадений;
- уникальность [90 .. 94]% - хорошо, ибо [6 .. 10]% совпадений;
- уникальность [80 .. 89]% - удовлетворительно, ибо [11 .. 20]% совпадений;
- уникальность [0 .. 79]% - не уникально, ибо [21 .. 100]% совпадений.

-- Комментарии:

- по каждой странице выводится процент СОВПАДЕНИЙ;
- в завершении проверки выводится общий процент СОВПАДЕНИЙ;
- затем, в итоговом отчете, выводится общий процент УНИКАЛЬНОСТИ;
- общий процент совпадений считается как полное пересечение совпадений на всех найденных страницах, так, как-будто все эти совпадения на одной странице;
- предположение о рерайте делается в том случае, если состав слов совпадает на 30% и выше;
- красным подсвечиваются совпадения УДОВЛЕТВОРИТЕЛЬНО и НЕ УНИКАЛЬНО, и предполагаемый рерайт.

-- Корректировка протоколы работы:

- добавлена информация о настройках проверки
- устранение ошибки работы панели прогресса

                
DELETED
За  25  /  Против  2
DELETED  написал  08.07.2013 в 20:53
Вообщем, прочитав все коментарии я понял одно: разработчики всегда правы.

                
DELETED
За  3  /  Против  4
DELETED  написал  08.07.2013 в 21:00
Да у меня только 25 выполненных работ и одна проданная статья. Но почему-то до обновленния програмы я умудрядся писать статьи с уникальностью 95 - 100 %, а после обновленния внезапно разучилься.

                
MartaNika
За  0  /  Против  0
MartaNika  написала  09.07.2013 в 02:44
Сегодня заметила интересную закономерность новой версии АП. При проверке текста 10 кзн получила 96% уникальности и 46% возможного рерайта. После того как разбила текст на две части по 5 кзн, получилось 100/63 и 96/100/. Таким образом получается, что чем меньше текст, тем меньшее количество совпадений часто встречающихся в сети выражений и технических терминов высвечивается в результате проверки по проценту возможного рерайта.

                
Сергей (advego)
За  2  /  Против  0
Сергей (advego)  написал  09.07.2013 в 02:47  в ответ на #401
Наоборот, чем меньше текст, тем больше совпадений в процентном соотношении.

                
MartaNika
За  0  /  Против  0
MartaNika  написала  09.07.2013 в 02:56  в ответ на #402
Могу предоставить скрины проверки. Первый - на 10 000 знаков, второй и третий этот же текст разделенный на две части.
#403.1
1340x619, png
121 Kb
#403.2
1341x598, png
95.2 Kb
#403.3
1323x579, png
123 Kb

                
Сергей (advego)
За  3  /  Против  0
Сергей (advego)  написал  09.07.2013 в 03:26  в ответ на #403
Наличие рерайта - может быть по разному. В вашем случае, по второму фрагменту нашелся источник рерайта, поэтому в первом фрагменте рерайта не найдено. Все вполне логично.

                
Еще 3 комментария

последний: 09.07.2013 в 00:02 в ответ на #404
DELETED
За  0  /  Против  0
DELETED  написал  09.07.2013 в 05:33  в ответ на #404
Сергей, наверно поздно по времени. но хочу спросить следующее. При проверке текстов часто выходит например 100/48 или 100/65. Плагиатус пишет, что уникальность отличная, но возможен рерайт. Прохожу по ссылкам, сайты мне не знакомые. Это означает, что программа просто нашла совпадения словосочетаний, при этом плагиата нет (настройки 4/4), правильно?

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  09.07.2013 в 14:29  в ответ на #408
Смотрите не сайты, а тексты. Этот документ найденный может быть рерайтом того же документа, с которого вы делаете рерайт. Или копией того документа.

100/48 - вероятность 95%, что найденный документ (если он один) является источником (копией источника) вашего рерайта, знаете вы об этом или нет.

                
DELETED
За  3  /  Против  0
DELETED  написала  10.07.2013 в 00:00  в ответ на #409
Мой хлеб - короткие юридические посты на 700-900 знаков. Только копирайт, только из собственной головы. Уник 76-79, выделяются стандартные "юридические" обороты. Выбросить слова из песни невозможно, как невозможно придумать синоним фразе "свидетельство о рождении". Как-то так...

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  10.07.2013 в 02:15  в ответ на #410
Ну тогда все ок.

                
DELETED
За  8  /  Против  0
DELETED  написала  10.07.2013 в 09:42  в ответ на #411
При таком раскладе мне добиться даже 80 уника почти нереально... не вижу ничего хорошего. А нужно 95. И все было прекрасно в старой версии. Лично у меня.

                
kazia
За  4  /  Против  0
kazia  написал  10.07.2013 в 12:46  в ответ на #412
Такая же ерунда и с экономикой. Слава богу, я еще в состоянии писать никуда не глядя, но гаденыш-плагиатус черкает все термины. Учитывая, что без них никуда, то уникальность падает до 80%. И как с этим жить?

                
Сергей (advego)
За  1  /  Против  2
Сергей (advego)  написал  10.07.2013 в 16:33  в ответ на #412
И что нам нужно сделать? Что не так? Мы считаем чистую математику. В вашем случае математика показывает, что ваш текст из такой сферы, в которой много устойчивых выражений. Заказчики же тоже понимают это?! Если не понимают - не работайте с ними.

                
kazia
За  7  /  Против  0
kazia  написал  10.07.2013 в 17:06  в ответ на #420
Не зря я так не любил математику в детстве. Она меня и сейчас нашла.

                
DELETED
За  4  /  Против  1
DELETED  написала  11.07.2013 в 16:48  в ответ на #420
тогда нескем и работать будет((

                
DELETED
За  2  /  Против  0
DELETED  написала  11.07.2013 в 17:24  в ответ на #440
Чуть ниже администрация уже ответила примерно в таком же ракурсе: " не работайте..."

                
Сергей (advego)
За  72  /  Против  9
Лучший комментарий  Сергей (advego)  написал  11.07.2013 в 17:46  в ответ на #442
Если заказчик будет проверять ваш текст с фразой 2 и шинглом 2 - и будет получать уникальность текста в 30% и будет требовать 100% - вы что будете делать? Приходить сюда и жаловаться на Плагиатус?

Если заказчик идиот - не надо с ним работать.

                
DELETED
За  4  /  Против  1
DELETED  написала  11.07.2013 в 18:10  в ответ на #443
Я, наверное, нарвусь на бан сегодня...
Пишу текст об алгоритме сокращения сотрудников на предприятии. На 3000 (450 слов) знаков, тычком пальца, насчитала приблизительно 40 словосочетаний, аналогов которым нельзя выдумать, ну никак. У меня такие тексты - через один. В них идет речь об установленных законом процедурах, где повторяются названия документов, государственных органов, законодательных актов документов, которые имеют стабильные названия, и не приемлют синонимайза.
С текстами на 700-1000 знаков беда полная... Я еще не видела в своих работах цифр 65-68. Никогда. А последние два дня вижу. Со старой версией не было таких проблем. Граничная цифра никогда не падала ниже 86, даже если приходилось местами цитировать законодательство.
Может это я одна такая, но что-то не так с новой версией...

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  11.07.2013 в 18:42  в ответ на #445

                
xoma_alex
За  0  /  Против  0
xoma_alex  написал  10.07.2013 в 12:31
Ради интереса проверил один и тот же текст 2 раза, выдало уникальность 91% и 88% соответственно. При этом при 91% указало, что низкая уникальность. Как-то неправильно.

                
Отправка жалобы...
Спасибо, ваша жалоба принята
Вы уже жаловались
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено.
Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186
Жаловаться можно только на чужой комментарий
Избранное
Добавить в избранное
Имя
URL
https://advego.com/blog/read/news/1158947/?o=0&l=1&n=113