Спасибо за проделанную работу. А количество проверенных урлов почему перестало отражаться? Пишет очень бледненько: "Найдено: 4 страницы. Проверено без ошибок:4". Это о чем? Проверено только 4 сайта?
Никакого резюме о 100-процентной уникальности Плагиатус не дает. Скажу больше - ни одна программа вообще не в состоянии ничего достоверного сказать об уникальности документа. Вот о НЕуникальности сказать можно.
Я не пойму вашей проблемы. Ну 4 документа. Что не так? Сколько должно быть? У вас есть данные о правильном количествве проверенных документов?
<Никакого резюме о 100-процентной уникальности Плагиатус не дает.> Разве не является резюме фраза, появляющаяся после проверки "Уникальность текста 100%" ? ))) Конечно, все прекрасно понимают, что это условность. Но тем не менее, вердикт вынесен, и с ним невозможно не считаться. Поскольку это один из основных критериев, по которому оценивается труд Автора.
От количества обработанных исходных данных зависит достоверность статистического анализа. Чем больше данных, тем достовернее вывод. Это аксиома. В нашем случае, 4 страницы - это практически 0.
Ответьте, пожалуйста, на вопросы. Есть ли у вас данные о правильном количестве страниц? Какая цифра вас удовлетворит? На каком основании? Знаете ли вы, что это за страницы, откуда они берутся и что означают?
Без ответов на эти вопросы обсуждать нечего. Вы мне рассказываете про соленое, называя его красным.
Данных о «правильном» количестве страниц у меня, конечно, нет. Вряд ли такая цифра существует. Но имею опыт практического использования различных программ, проверяющих тексты на уникальность, в т.ч. и АП предыдущих версий. И здравый смысл, который подсказывает, что чем больше тематических страниц проверено, тем достовернее вывод. Исходя из этого, меня устраивает «резюме», которое базируется на проверке хотя бы 100-120 страниц. Если больше, то и доверие к результату возрастает. Читала, что у некоторых АП проверяет до 300 страниц. Мне с таким сталкиваться не приходилось. Может, скорости Интернета не хватает. Отсюда мною и сделан вывод, что 4 страницы – это практически 0.
У вас в рассуждениях огромный пробел, который все ваши рассуждения и аксиомы сводит на нет - вы забываете о том, что происходит до получения Плагиатусом этих 4-х страниц и откуда эти самые 4 (или 400) страницы берутся.
В таком случае, восполните хотя бы парой фраз (конечно, если это Вас не затруднит) жуткий пробел в моем образовании. )) Или хотя бы подтвердите, что проверка 4 урлов и проверка значительно большего числа страниц - равнозначно весомы. И что заключение об уникальности текста, построенного на проверке 4-х стр., также достоверно, как после проверки сотни и больше.
Текст разбирается специальным хитрым алгоритмом Плагиатуса на "фразы" (те самые, которые есть в настройках), фразы отправляются в поисковики, поисковики выдают (или не выдают) результат в виде найденных страниц. Это и есть те самые страницы, о которых идет речь. Если текст очень уникальный или какой-нибудь специфический, то поисковики могут не выдать никаких результатов или выдать мало результатов. Найденные поисковиками страницы выкачиваются и производится сравнение этих страниц с исходным текстом. Сравнение происходит по "шинглам" (тем самым, которые есть в настройках).
В общем это количество страниц ни о чем не говорит. Вообще. Просто информация для размышления.
п.с.: чем больше параметр "фраза" в настройках, тем меньше страниц находит поисковик.
п.п.с.: на комментарий "Проверено всего четыре урл? Что же это за проверка и основание для резюме о 100-процентной уникальности? " отвечать совершенно не хочется.
Поскольку я перфекционист, то 96% мне мало, и я начинаю добиваться хотя бы 98-99%. Поработав над фразами, выделенными желтым цветом, снова запускаю проверку. АП мгновенно выдает результат: проверено 9 страниц, уникальность 100%. Удивляет скорость ответа. В силу своей дремучести расцениваю это таким образом: АП не потрудился должным образом.
Сергей, здравствуйте. Я правильно понимаю, что если проверено 4-12 страниц, но при этом нет ошибок, то такую глубокую проверку можно считать корректной? (не самая популярная тема в сети?)
Программа установилась и работает без проблем, но, как я уже успел заметить, тексты, проверяющиеся на новой версии стали менее уникальными. То есть требуемой уникальности при проверке через новый плагиатус стало добиться СЛОЖНЕЕ. Исходя из этого, сложнее стал труд автора. Судя из того, что я уже попробовал, уникальность выше 95% даже с настройками шингл 4 строка 5 на статье в 2000 символов теперь будет получить сложновато, а на статье в 1000 символов ну просто ооочень сложно. А требуют то и 100%. И как быть?
1. Новый Плагиатус стал работать верно(!). Предыдущие работали менее(!) верно. Если у вас тексты неуникальные - пеняйте на себя, а не на программу.
2. "даже с настройками шингл 4 строка 5",- что значит "даже"? Это вполне нормальные настройки.
3. Если заказчик требует у вас 100% уникальности (да еще и на коротких текстах) - не работайте с таким заказчиком. Уникальность 100% - это паранойя, говорящая о том, что заказчик вообще не понимает что такое уникальность, как она высчитывается и зачем она нужна. Максимальная уникальность, которую можно требовать - процентов 95.
4. Как быть? Работайте качественно, пишите самостоятельно уникальные тексты. Плагиатус тут не причем.
Сергей, простите за глупый вопрос, но какие все-таки настройки нужно ставить в Плагиатусе, если заказчик ничего не говорит? А так, один требует 4/5, а второй пишет - "как на Адвего, 5/6". Конечно, выгоднее ставить последние, чтобы не извращаться над статьями и не терять их читабельность (пишу для онлайн-журналов).
А какие все-таки нужно? И имеет ли право заказчик предъявить в будущем мне претензии, если, например, его Плагиатус с 4/5 посчитает, что в моем тексте, проверяемом на 5/6, уникальность недостаточна, например, - 92%?
Условия проверки нужно оговаривать с заказчиком. С заказчиками, про которых я написал в пункте 3, работать не нжуно вообще. С заказчиками, которые требуют(!) проверять уникальность 3/3 - работать не нужно.
Я (лично!) думаю, что нормальные параметры это: фраза - 5, шингл - 4.
Можно проверять на 4/4, если при этих параметрах уникальность больше 95%, значит с текстом вс в порядке.
Тем не менее, требование "уникальность 100%", хоть и паранойя, а встречается в огромном количестве заказов. Пусть заказчики не понимают, и авторы тоже так считают, но авторам от этого не легче. С настройками 4/5 я обычно проверяю свои тексты, если другого не требуется, статьи для магазина проверяю с настройками 4/4. Ранее всегда получал уникальность 100%. Сейчас она уже немножко съезжает вниз.
Далее, если Вы считаете, что максимальная уникальность, которую можно требовать 95% - почему бы не закрепить это правилами? Многие заказчики другого мнения! А с новым плагиатусом этот вопрос встает еще более остро.
Уник 4х4: 73, 86, 86, 86, [20:43:32] Ошибка (Ошибка запроса [499]): [ссылки видны только авторизованным пользователям] HEUR:Trojan.Script.Generic Первый раз норма, а дальше троян, но стабильный уник.
У меня вопросы возникли: 1. Капчу теперь не надо вводить? Или я где-то что-то в сообщении проглядела?(( 2. Что такое ошибка приема и недостаточность ресурсов (см.скрин)? 3. И конечно, в связи с этим уник=100% при настройках 4/4.
2. Разного рода ошибки сети и/или сайтов. Например, в случае высокой загрузки канала могу появляться ошибки "не удалось соединиться с сервером",
или "превышен интервал ожидания". Ошибку "недостаточно ресурсов" может выдавать перегруженный сайт. либо, если вы работаете через прокси - ваш прокси.
Ошибка приема - это когда сайт ответил, передача данных началась, но в процессе передачи (приема) возникли какие неустранимые ошибки. Скорее всео связано с каналом.
В целом на одну проверку, если ваша сеть не перегружена, и канал устойчив нормальным считается одна две такого рода ошибки. если это появляется систематически -
Увеличте таймаут. Если не помогает - пишите подробный баг-репорт.
Интернет нормальный, 100 Мбит/с, правда я настройки Плагиатуса не меняю, за исключением фраза-шингл. А то, что там таймаут 61с и ограничение на размер 3000 кб - так было при установке. Я думала, это стандарт. Просто мой заказчик при выполнении заказа просил таймаут на 1,5 минуты и не меньше, а лучше - больше.
Ваш заказчик, вероятнее всего, не знает, что такое таймаут и зачем он нужен. Только зачем требовать "то, не знаю что"? Нипанятна. При нормальном тырнете таймаут 1.5 минуты - шыза полная. ЗЫ: скорее всего, скорость у вас не 100 мбит/с. Сетевуха при подключении по локалке "сотку" всегда показывает, будь у вас 0.25, 0.5, 5, 10 etc мегабит.
нет, таймаут выставлялся в старом Плагиатусе (не знаю какой из древних версий, где еще не было настроек фраза - шингл), и там было по-моему 100 с, если не ошибаюсь. В новой версии - да, там больше 90 не выставляет, вижу сама. Насчет скорости - локальная на 100 мбит/с, а так тариф был на 1024 кажца. Не знаю, может у ВМа интернет глюковатый, вот и просит выставлять настройки "под себя". Ну, как говорится, кто платит, тот и музыку заказывает) Я тогда хочу уточнить по настройкам: если заказчики сами не знают, что им нужно по настройкам, как тогда определять "стандарт", при котором всех все устроит? Все равно ведь приходится прогонять текст по 2-3 раза (1 глубокая проверка, 1-2 обычных). У меня пару раз так было, что при глубокой проверке уник был выше, чем при обычных.
Для заказчика важен только один параметр "размер шингла". остальные параметры представляют интерес только для вам. чем меньше размер фразы - тем больше документов будет найдено. чем больше таймаут, тем большее число очень медленных сайтов будет обработано. хотя при больших таймаутах программа будет залипать на сайтах, которые не ответят никогда.
Таймаут задается в секундах. И не может быть более 90 секунд (1,5 минуты),с корее всео у вас таймаут 2 секунды. Поставте таймаут секунд 25-30 для начала.
Вчера установил новую версию - сегодня утром пришлось проводить процесс восстановления системы. ОС Win7 обновления от 15.03.2012. Может ли это как-то быть связано с совместимостью программы? После восстановления Плагиатус удалился, сейчас все работает как надо. Может причина в том, что я самостоятельно указал директорию для установки?
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186