Биржа копирайтинга Антиплагиат SEO-анализ текста Адвего Лингвист Проверка орфографии

Обсуждение Advego Plagiatus — Форум Адвего

боковая панель
Адвего / Обсуждение Advego Plagiatus
DELETED
Размер шингла, размер фраз

В новой версии добавлена возможность указывать размеры шингла и фраз для проверки. по умолчанию установлено 5 слов в шингле, и 6 слов в фразе.
А какое их количество было по умолчанию установлено в предыдущей версии?
И вообще, как оптимально пользоваться этими настройками, какие цифры указывать?

Написала: DELETED , 23.07.2010 в 13:49
Комментариев: 18
Комментарии
docadept
За  0  /  Против  0
docadept  написал  23.07.2010 в 14:45
Мне кажется, проверка в старом Плагиатусе велась по 4-словным шинглам. А вот в чем отличие шингла от фразы в данном случае - без понятия.

                
DELETED
За  0  /  Против  0
DELETED  написал  23.07.2010 в 16:43
С большой долей вероятности это количество идущих друг за другом слов, которые выдираются из проверяемого документа для составления запроса той или иной поисковой системе.

                
DELETED
За  0  /  Против  0
DELETED  написала  23.07.2010 в 18:16
Все таки установила предыдущую версию и сравнила их.
В 1.21 проверка ведется по шиглам из 5 слов, как это по умолчанию и установлено в новой версии.

                
DELETED
За  0  /  Против  0
DELETED  написал  04.08.2010 в 14:19
предыдущая версия находила 4-х словные совпадения.
Причём один раз нашла: "...и т. д. Все..." (в плагиатусе это выглядело: "и т д все")

                
DELETED
За  0  /  Против  0
DELETED  написала  04.08.2010 в 14:30  в ответ на #4
нет, предыдущую версию иногда "проглючивает" и она начинает искать 4словные шинглы. :) А так, в нормальном режиме работы, она ищет совпадения по шинглам из 5 слов. Я специально сравнивала обе версии.

                
docadept
За  0  /  Против  0
docadept  написал  05.08.2010 в 19:30  в ответ на #5
А где Вы в старой версии могли видеть размер шингла? Он же не настраивался вообще.

                
DELETED
За  0  /  Против  0
DELETED  написала  06.08.2010 в 01:35  в ответ на #8
Так я нигде и не видела. Видимо, он был "автоматом" прописан в самой программе. Потому и интересовалась его размером..

                
docadept
За  0  /  Против  0
docadept  написал  06.08.2010 в 11:18  в ответ на #9
В предыдущем посте Вы назвали конкретный размер шингла в 21 Плагиатусе. Как Вы ее определили?

                
DELETED
За  0  /  Против  0
DELETED  написала  06.08.2010 в 12:18  в ответ на #10
путем сравнения :) 21 и 49й дает одинаковую уникальность, если в 49м настроен шингл из 5 слов. Если в 49м ставлю 4 слова в шингле - они начинает показывать более низкую уникальность.
Да и обратила внимание, что он очень редко выделяет желтым фразы из 4х слов - обычно из 5-6 и больше.

                
docadept
За  0  /  Против  0
docadept  написал  06.08.2010 в 12:41  в ответ на #11
Спасибо за ответ, так и думал, просто хотел подтвердить свое предположение. Очень разумный подход, браво!)

                
DELETED
За  0  /  Против  0
DELETED  написала  06.08.2010 в 14:34  в ответ на #12
:)

                
DELETED
За  1  /  Против  0
DELETED  написал  04.08.2010 в 14:47
Шингл меньшего размера ищет совпадения меньшей длины. Соответсвенно, для скурпулезной проверки можно выставить размер шингла меньшего размера.
Так-же это утверждение верно и для текстов маленького размера.
Размер поисковой фразы означает размер фразы в словах по которым производится поик. Чем меньше размер фразы, тем больше поисковая выборка. Тем большее число документов будет проверено. Но как следствие большее число "мусора" придется проанализирвоать, больше траффика потратить, сильнее загрузить поисковые сервисы, увеличить вероятность блокировок.
Что такое "большие" документы и "маленькие" - понятие весьма субъективное. Мы счтаем средним документом - документ 1000-2500 символов.
Если проверки нечастые (например, вы проверяете 1-3 документ в день) , требования к трафику некритичны, скорость интернета большая - то можно ставить размер фразы и 5 и 3.
Если же вы проверяете часто и много документов, то можно ставить размер фразы 6 и 7.
Так-же советую для проверки небольших текстов уменьшать ограничение на размер до 200-300 кб. Реальные страницы в сети в среднем 100-150 кб.
Большие размеры 512-1мб-2мб только для литературных текстов (рассказов, изложений и т.д.)
Итого, лично Я бы советовал для средних текстов использовать размер фразы 5-7, размер шингла 5-8
для больших текстов фразу не менее 6-7 размер шингла 10
для маленьких текстов размер фразы 4-6 размер шингла 3-4
вцелом, нужно договариватсья с заказчиком какие параметры использовать при проверке.

                
DELETED
За  0  /  Против  0
DELETED  написала  04.08.2010 в 14:55  в ответ на #6
Спасибо за разъяснения!

                
DELETED
За  0  /  Против  0
DELETED  написала  11.08.2010 в 20:36
У меня стоят настройки рекомендуемые, т.е. те, что стояли при скачивании программы : размер шингла 5, размер фразы 5, таймаут 20. При проверке уникальности выдает 100%, а у ВМ - 95. Может надо ужесточить настойки? И если да, то насколько? Если руководствоваться советами коммент. №6, то будет совпадать уникальность с ВМ?

                
DELETED
За  0  /  Против  0
DELETED  написал  12.08.2010 в 14:19  в ответ на #14
попробуйте. уменьшить размер шингла до 3-4, если очень нужно. таймаут можно уменьшить до 10, если интернет быстрый.

                
DELETED
За  0  /  Против  0
DELETED  написала  24.06.2011 в 14:40
народ,прога толькона русском? у меня всё меню знаками вопросов... комп-то на турецком. а пользуюсь не только я, перставить всё на русский не вариант.

                
DELETED
За  0  /  Против  0
DELETED  написал  24.06.2011 в 15:04  в ответ на #16
надо установить пакет русификации и в настройках выставить регион русский. версия ОС какая?

                
DELETED
За  0  /  Против  0
DELETED  написал  01.11.2012 в 00:02
Но при шингле в 4 маленькие тексты тяжелее уникализировать, а большие очень легко. Все зависит от размера и количества ключей в тексте. На моей практики 4-х хватало с головой. В 5 тоже приемлемо, 6 уже не очень.

                
Отправка жалобы...
Спасибо, ваша жалоба принята
Вы уже жаловались
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено.
Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186
Жаловаться можно только на чужой комментарий
Избранное
Добавить в избранное
Имя
URL
https://advego.com/blog/read/plagiatus/152272/