Я то бишь о чём, братишки: накропал тут рерайт, пустяковый, на один килознакъ. С исходника. Заняло у меня это десять минут. Но работа над заказом длилась три с лишним часа. Что же я делал всё это время?
Боролся за уникальность.
Battle for the uniqueness проходила так: написал, прогнал через плагиатус, получил гордые 83%. Учитывая, что это год моего рождения, счёл это добрым знаком и продолжил мудохаться. Приемлемых 96% удалось добиться примерно после десятого прогона через АП. За это время я даже успел расколотить мышку в бешенстве - то есть урон в три раза превысил доход от выполнения заказа. Вот тебе и сальдо!
Вебмастер вроде бы остался доволен. Я - категорически нет. Потому что в борьбе за уник некоторые нормальные человеческие предложения пришлось менять на конструкции уникальные, но явно монструозные.
В связи с этим вопрос. Я заметил, что при написании коротких, на 800-1200 знаков, уникальности достичь раз в сто труднее, чем когда катаешь простыню на 10 килознаков. Большие тексты у меня всегда с первого раза выдают 100% на весьма жёстких настройках. Это на самом деле так - или это мои личные аберрации восприятия? Товарищи рерайтеры и рерайтерши (рерайтерки?) - а у вас как?
Лучший комментарийKengaRu написал 21.05.2012 в 03:25
0
На больших текстах выставленные сколь угодно жесткие настройки шингла/фразы перекрываются нижним пределом совпадений в 1%: к примеру, от 5000 знаков ...На больших текстах выставленные сколь угодно жесткие настройки шингла/фразы перекрываются нижним пределом совпадений в 1%: к примеру, от 5000 знаков это 50 знаков, что при средней длине слова в русском языке 7-8 букв дает 6-7 слов. Плагиатус попросту игнорирует обнаруженные неуникальные (по выставленным настройкам шингла/фразы) отрезки, если они короче 1% от проверяемого текста, поэтому 100% уникальный длинный текст при проверке кусками, нарезанными по 500-2000 символов (1% = 5-20 символов, т.е. меньше 3 слов), может показать туеву хучу совпадений, и наоборот, собрав несколько мелких неуникальных текстов в один большой массив, у него можно получить высокую уникальность.
Лучший комментарий
DELETED
написал 19.05.2012 в 20:48
182
Так я не вижу тут никакого перфекционизма. Перфекционизм - он в красоте текста, его читабельности, логичности, грамотной структуре, убедительности ...Так я не вижу тут никакого перфекционизма. Перфекционизм - он в красоте текста, его читабельности, логичности, грамотной структуре, убедительности, информативности.
А уникальность - это чисто технический параметр, и, чем больше заморачиваться на его увеличении - тем хуже будут получаться тексты.
Лучший комментарийOleMash написала 16.05.2012 в 18:47
0
О да!! Как знакомо!)) Мышка, правда, жива, но 5-10 прогонов через АП - это как раз про меня) Большие тексты всегда уникальность высокую выдают, а вот ...О да!! Как знакомо!)) Мышка, правда, жива, но 5-10 прогонов через АП - это как раз про меня) Большие тексты всегда уникальность высокую выдают, а вот если их разбить на тысячные, картина получается менее оптимистичная. Причем, шаблоные фразы уже научилась чувствовать еще в стадии написания текста и стараюсь не использовать их или минимизировать использование, а первоначальный уник все равно 90-92% в среднем. Обидно бывает, когда завернешь чего-нибудь такое, что прям кажется никто не додумался еще до такого. Ага, счас же! Уже кто-то умный до меня такое завернул...)) Или исправляю уникальность в одном предложении (следующее АП благосклонно разрешил оставить как есть), проверяю, с мыслью, что наконец-то можно будет уползти спать. Как же, размечталась! Вредный Плагиатус говорит, что теперь уже хвостик этого предложения и начало следующего ему не нравятся и между делом находит еще пару неуникальных моментов! Помянув его маму, продолжаешь борьбу и думаешь: "Интересно, а как мы будем уникалить лет через 5?"
Лучший комментарийbure37 написал 16.05.2012 в 18:12
2
Ага! То есть заказчик может большие тексты проверять кусками по 1 кз? Любопытно. В том и проблема общеупотребительных предложений, что большинство ...Ага! То есть заказчик может большие тексты проверять кусками по 1 кз? Любопытно. В том и проблема общеупотребительных предложений, что большинство вариантов, которыми их можно заменить, - тоже общеупотребительные. :)
Вы меня подкупаете, уважаемый)) По-моему, троллинг заключён в том, что в самом начале темы вы уже сами себе ответили фактически.. Ну борьба за уникальность - это ведь хлеб копирайтерский.. Хотя я бы это назвал пародией на передачу "Битва экстрасенсов", там чуваки тоже всё шаманят и не могут успокоиться.. А повышение уникальности, ну скажем с 90 до 95, пойдёт для новой передачи под названием "Битва садомазохистов"))
А вот нет) Меня интересовал не столько феномен борьбы за уникальность, сколько частный случай того, что в больших текстах уника добиться куда легче. Хотя, казалось бы, используешь одни и те же заштампованные на тыщу раз обороты - ан нет. Меня интересовал сам механизм подобного явления.
А повышение уника - да ведь для самого автора оно и вовсе не важно, имхо. Я бы с огромным удовольствием писал тексты с уником в 50% и не заморачивался - так ведь заблокируют же. :)
Где-то читал, что в зависимости от размера текста, выставляются разные настройки. Очень часто приходится писать по 500 знаков, и там проверяю другими настройками, по сравнению с текстом в 3 тысячи.
Не все так просто. Пропорция тут может и не работать. Вот если ваш текст на 1000 знаков показывал 85%, и второй такой же покажет 85, то сколько в сумме должен будет показать текст на 2000?
По идее - все те же 85%:)). Все строго пропорционально. Но нет ведь этого. Более того. Увеличив текст всего в два раза, можно добиться очень значительного повышения уникальности - буквально в несколько раз (если сравнивать процент совпадений).
Так что это все-таки больше похоже на какой-то глюк, недоработку алгоритма.
П.С. По логике, РЕЗКОЕ изменение измеряемой (показываемой) уникальности должно наступить только с текстов величиной 500 слов (т.е. сравниваемый минимум вместо 4 слов станет 5). Хотя - может быть, этот алгоритм начинает работать уже на 401-м слове:)).
Ну это где-то свыше 3000 знаков получается, если так. Но не 2 и не 2.5 кз.
П.П.С. Вот я только что специально проверил. Взял кусок текста чуть меньше 2500 знаков (ровно 299 слов:)), проверил - 100%. Потом разбил на 2 части и ещё раз проверил - порядка 92-93% каждая. Так что объяснение с пропорцией напрямую не работает. Тут что-то другое.
Посмотрите коммент №146. Речь идет о том, что ВОЗМОЖНО, с увеличением длины текста уменьшается "удельный вес" совпадений. Вот я и говорю, что прямой пропорциональной зависимости тут не наблюдается.
Как по мне, лучше плясок с бубном не устраивать. Нынешняя версия Плагиатуса работает на удивление быстро, надежно и стабильно - так что пусть усё остается как и було:)).
Размер имеет значение) боинги то хороши для фигурного катания, но короткие тексты интереснее в них то и приходится попотеть) это как в шахматы: поставить мат в 6-7 ходов то тяжелее, чем мочалить до последнего.. Да и ещё - смотря кто и на каких настройках проверяет уникальность)) знаю любителей, которые ставят размер шингла = 3 слова, вот где веселуха то самая:) На этом ухожу и ещё одну весёлую или может не очень картинку оставлю)))
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186