Я то бишь о чём, братишки: накропал тут рерайт, пустяковый, на один килознакъ. С исходника. Заняло у меня это десять минут. Но работа над заказом длилась три с лишним часа. Что же я делал всё это время?
Боролся за уникальность.
Battle for the uniqueness проходила так: написал, прогнал через плагиатус, получил гордые 83%. Учитывая, что это год моего рождения, счёл это добрым знаком и продолжил мудохаться. Приемлемых 96% удалось добиться примерно после десятого прогона через АП. За это время я даже успел расколотить мышку в бешенстве - то есть урон в три раза превысил доход от выполнения заказа. Вот тебе и сальдо!
Вебмастер вроде бы остался доволен. Я - категорически нет. Потому что в борьбе за уник некоторые нормальные человеческие предложения пришлось менять на конструкции уникальные, но явно монструозные.
В связи с этим вопрос. Я заметил, что при написании коротких, на 800-1200 знаков, уникальности достичь раз в сто труднее, чем когда катаешь простыню на 10 килознаков. Большие тексты у меня всегда с первого раза выдают 100% на весьма жёстких настройках. Это на самом деле так - или это мои личные аберрации восприятия? Товарищи рерайтеры и рерайтерши (рерайтерки?) - а у вас как?
Лучший комментарийKengaRu написал 21.05.2012 в 03:25
0
На больших текстах выставленные сколь угодно жесткие настройки шингла/фразы перекрываются нижним пределом совпадений в 1%: к примеру, от 5000 знаков ...На больших текстах выставленные сколь угодно жесткие настройки шингла/фразы перекрываются нижним пределом совпадений в 1%: к примеру, от 5000 знаков это 50 знаков, что при средней длине слова в русском языке 7-8 букв дает 6-7 слов. Плагиатус попросту игнорирует обнаруженные неуникальные (по выставленным настройкам шингла/фразы) отрезки, если они короче 1% от проверяемого текста, поэтому 100% уникальный длинный текст при проверке кусками, нарезанными по 500-2000 символов (1% = 5-20 символов, т.е. меньше 3 слов), может показать туеву хучу совпадений, и наоборот, собрав несколько мелких неуникальных текстов в один большой массив, у него можно получить высокую уникальность.
Лучший комментарий
DELETED
написал 19.05.2012 в 20:48
182
Так я не вижу тут никакого перфекционизма. Перфекционизм - он в красоте текста, его читабельности, логичности, грамотной структуре, убедительности ...Так я не вижу тут никакого перфекционизма. Перфекционизм - он в красоте текста, его читабельности, логичности, грамотной структуре, убедительности, информативности.
А уникальность - это чисто технический параметр, и, чем больше заморачиваться на его увеличении - тем хуже будут получаться тексты.
Лучший комментарийOleMash написала 16.05.2012 в 18:47
0
О да!! Как знакомо!)) Мышка, правда, жива, но 5-10 прогонов через АП - это как раз про меня) Большие тексты всегда уникальность высокую выдают, а вот ...О да!! Как знакомо!)) Мышка, правда, жива, но 5-10 прогонов через АП - это как раз про меня) Большие тексты всегда уникальность высокую выдают, а вот если их разбить на тысячные, картина получается менее оптимистичная. Причем, шаблоные фразы уже научилась чувствовать еще в стадии написания текста и стараюсь не использовать их или минимизировать использование, а первоначальный уник все равно 90-92% в среднем. Обидно бывает, когда завернешь чего-нибудь такое, что прям кажется никто не додумался еще до такого. Ага, счас же! Уже кто-то умный до меня такое завернул...)) Или исправляю уникальность в одном предложении (следующее АП благосклонно разрешил оставить как есть), проверяю, с мыслью, что наконец-то можно будет уползти спать. Как же, размечталась! Вредный Плагиатус говорит, что теперь уже хвостик этого предложения и начало следующего ему не нравятся и между делом находит еще пару неуникальных моментов! Помянув его маму, продолжаешь борьбу и думаешь: "Интересно, а как мы будем уникалить лет через 5?"
Лучший комментарийbure37 написал 16.05.2012 в 18:12
2
Ага! То есть заказчик может большие тексты проверять кусками по 1 кз? Любопытно. В том и проблема общеупотребительных предложений, что большинство ...Ага! То есть заказчик может большие тексты проверять кусками по 1 кз? Любопытно. В том и проблема общеупотребительных предложений, что большинство вариантов, которыми их можно заменить, - тоже общеупотребительные. :)
Особенно чудесен в этом смысле рерайт описания схем к вязанию. Любое сочетание букоф на эту тематику уже упоминалось миллион миллионов раз. Каждая попытка улучшить текст заканчивалась все меньшим и меньшим показателем уникальности. У меня вышло в конце-концов где-то около 96, но ту тысячу символов я тоже надолго запомню). Мышку жалко.
Мышка и так была полудохлая. :) Ещё гадко рерайтить новости, особенно сугубо тематические - потому что они уже на 9000 новостных сайтов в разных вариациях отображены...
Если будете проверять простыню по 1 кило (что и сделает заказчик), то может получиться тоже, что и с эти текстом. Не пытайтесь править предложения, особенно общеупотребительные, быстрее переписать его заново и по другому.
Такая же беда: чем меньше текст, тем меньше шансов на то, что удастся договориться с АП по-хорошему. Нормальный текст тысячи на 2,5 с первого захода удается, поэтому не люблю маленькие статьи. Испсихуюсь вся, доходит даже до нервных расстройств, заканчивающихся распитием успокоительных средств (шутка конечно же).
Лучший комментарийOleMash
написала
16.05.2012 в 18:47
00
О да!! Как знакомо!)) Мышка, правда, жива, но 5-10 прогонов через АП - это как раз про меня) Большие тексты всегда уникальность высокую выдают, а вот если их разбить на тысячные, картина получается менее оптимистичная. Причем, шаблоные фразы уже научилась чувствовать еще в стадии написания текста и стараюсь не использовать их или минимизировать использование, а первоначальный уник все равно 90-92% в среднем. Обидно бывает, когда завернешь чего-нибудь такое, что прям кажется никто не додумался еще до такого. Ага, счас же! Уже кто-то умный до меня такое завернул...)) Или исправляю уникальность в одном предложении (следующее АП благосклонно разрешил оставить как есть), проверяю, с мыслью, что наконец-то можно будет уползти спать. Как же, размечталась! Вредный Плагиатус говорит, что теперь уже хвостик этого предложения и начало следующего ему не нравятся и между делом находит еще пару неуникальных моментов! Помянув его маму, продолжаешь борьбу и думаешь: "Интересно, а как мы будем уникалить лет через 5?"
Вы бы попробовали на инглише или на немецком рерайтить. Там ваще мутотень. Предлог+артикль+существительно е (уже три слова, которые не выбросишь), а дальше? А относительно больших простыней – это правда. Чем длиннее текст, тем легче добиться уникальности.
"Невыносимая тяжесть уникальности" - это неизбежные издержки производства, которые часто предугадать невозможно, особенно это касается новостей. По-моему, уникальность зачастую и не зависит от объема: последний раз делала рерайт на тему "1С Предприятие" (около 20 тыс. зн.) - прокляла все на свете. Термины настолько специфичны и при этом избиты, что заменить их ничем невозможно, хотя я в теме (работала в этой программе в реале), хотелось бросить все к чертовой матери:(( Со временем вы научитесь предугадывать такие сюрпризы, я в данном случае, с 1С, "купилась" на то, что я в совершенстве знакома с этой темой.
Я на заре туманной юности старательно добивался в любом тексте 100% уникальности, маниакально бубня себе под нос: "Тварь я дрожащая или право имею!?" Для меня это было азартной игрой. Когда текстов стало очень много, я прекратил эту художественную гимнастику.
Это даже не художественная, а куда менее эстетичная спортивная гимнастика с потом, руганью и плюханьем на маты со всего размаху; однако ведь она жёстко привязана к техзаданию - не ради же собственного самоуслаждения я тут рукоблудствую? "Уник от 95/96/98" в ТЗ - цифры красноречивые, мимо которых пройти нельзя.
Конечно, чем меньше текста, тем меньше шансов сделать 100% уникальный рерайт. Да, и заказчики иногда просто поражают, требуя 30 уникальных рерайтов на текст в 300-400 знаков.
Наоборот не бывает, не сочиняйте:))). Это только если сравнивать _совершенно разные_ тексты. Например, большой - описание особенностей применения упомянутой тут программы 1С и маленький - как я провел лето:)).
Да я не сочиняю. Моя практика показывает текст на 1000-1500 в 98% случаев будет от 98 уник. А вот с текстами 2500-3000....Из 100% с 70 % точно придется дергаться за уникальность. Кстати недавно была удивлена проверив плагиутсом получила 98 %, поставила настройки проверки строже получила 100% уника.... Проверяю много раз, нечего не путаю.
А вы проверьте таким образом. Возьмите два текста по 1500. Пусть у каждого - 98%. Сложите их вместе и проверьте, как один текст на 3000. И посмотрите, сколько получится.
Потом возьмите текст на 3000 (другой). Пусть у него будет, скажем, 90-95% (ну или хоть 70-80%, если у вас есть такие).
Разбейте его на три по 1000 и проверьте каждый.
А потом расскажете нам о результатах:)).
Я уверен, что ваше мнение изменится. Просто, видимо, у вас так случайно совпадало с тематикой/направленностью текстов.
Да, так и есть. Особенно если тема популярная( Написать можно быстро, но сделать требуемую уникальность зачастую сложно.
Кстати, я вот постингом не занимаюсь практически, но как-то мне понравился один форум и стала частенько там писать. Однажды пришла мне оплата с комментом "уникальность 90%, поднять до 96% - нужен КОПИРАЙТ!". А ведь писала я совершенно своими словами, но упомянула цитату... На этом мой постинг и закончился. ВМ понять можно (ничего не имею против, мог бы и не оплатить). Но представила, как сижу и проверяю свои сообщения плагиатусом, в надежде получить 96%, а затем на форуме появляются "гладко причесанные" нечеловеческие фразы... нет уж;)
Кстати, да. Мне кажется, что уж к форумному общению уникальность вообще не должна применяться. Если идёт цитирование, это должно быть добросовестно выделено. Но какой плагиат, если сообщение в 200 знаков. И мысль будет выражена: ...ибо...ибо...тык-мык. Живое общение на то и живое, что в вылизывании не нуждается. Это ж не статья. Форумы тоже индексируются?
Это еще что! Я видел одного (какое бы мне слово подобрать), так он вообще проверял уникальность по предложению через Яндекс и еще считал, что проявляет к авторам лояльность, т.к. не требует от них подобно Плагиатусу нарезать по три слова.
Я ему ответил, что парочка таких лояльностей и трудности вообще не нужны в жизни! Написал бы как звать это человеконенавистническое создание, да не уверен, что это по правилам можно делать!
Прошу извинить, т.к. не совсем в тему топика моя реплика, но, все-таки, она к вопросу о проблемах с уникальностью так или иначе относится (или к проблемам с головушкой у требующего)
Вообще-то ситуация немного странная. С одной стороны - я вполне доволен новой версией Плагиатуса - работает очень быстро, проверяет много сайтов (раньше у меня нормой было, когда проверяло всего 10-15 урлов, а сейчас - и 200 бывает, и больше). Уникальность, опять же, показывает показывает высокую:)).
Но как-то я то ли по глупости, то ли ввиду спешки отправил на проверку не весь текст, а только его первую часть. Решил таким образом ускорить процесс - пока буду дописывать, добрая половина проверится. И вот там кусок был действительно небольшой - килознака полтора, что ли.
И я был очень удивлен, когда Плагиатус выдал мне довольно низкую уникальность - чуть больше 90%, где-то 92-93. Я "на ходу" заменил несколько словоформ, и отправил на проверку по новой (продолжая дописывать текст). Плагиатус опять наложил мне желтых кучек, но при этом уже совершенно других.
Я насторожился:))).
Опять изменил пару словоформ, добавил ещё один (только что написанный) абзац и отправил. Результат получился получше - где-то в районе 97%. Я уже не стал спешить и сначала дописал весь текст. Потом что-то совсем незначительно изменил в первой части и отправил на, как оказалось, последнюю проверку. Выдало, как и обычно, 100%.
Вывод. Я теперь стараюсь небольшие работы по частям не проверять, только полностью. Конечно, если текст великоватый - килознаков на 6-7 и выше, то его желательно все-таки разбить на несколько кусков. А 2-3 кз - как правило, проверяю только целиком.
Даже и не знаю, это какая-то недоработка алгоритма, или так и задумано. Простое объяснение о пропорциональности тут, имхо, не работает.
Лучший комментарийKengaRu
написал
21.05.2012 в 03:25
00
На больших текстах выставленные сколь угодно жесткие настройки шингла/фразы перекрываются нижним пределом совпадений в 1%: к примеру, от 5000 знаков это 50 знаков, что при средней длине слова в русском языке 7-8 букв дает 6-7 слов. Плагиатус попросту игнорирует обнаруженные неуникальные (по выставленным настройкам шингла/фразы) отрезки, если они короче 1% от проверяемого текста, поэтому 100% уникальный длинный текст при проверке кусками, нарезанными по 500-2000 символов (1% = 5-20 символов, т.е. меньше 3 слов), может показать туеву хучу совпадений, и наоборот, собрав несколько мелких неуникальных текстов в один большой массив, у него можно получить высокую уникальность.
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186