Биржа копирайтеров Антиплагиат онлайн Уникальность текста Проверка орфографии онлайн SEO анализ онлайн Транслит онлайн Заработать на капче

Форум авторов — Форум Адвего

боковая панель
Адвего / Форум авторов
bure37
Невыносимая тяжесть уникальности

Я то бишь о чём, братишки: накропал тут рерайт, пустяковый, на один килознакъ. С исходника. Заняло у меня это десять минут. Но работа над заказом длилась три с лишним часа. Что же я делал всё это время?
Боролся за уникальность.
Battle for the uniqueness проходила так: написал, прогнал через плагиатус, получил гордые 83%. Учитывая, что это год моего рождения, счёл это добрым знаком и продолжил мудохаться. Приемлемых 96% удалось добиться примерно после десятого прогона через АП. За это время я даже успел расколотить мышку в бешенстве - то есть урон в три раза превысил доход от выполнения заказа. Вот тебе и сальдо!
Вебмастер вроде бы остался доволен. Я - категорически нет. Потому что в борьбе за уник некоторые нормальные человеческие предложения пришлось менять на конструкции уникальные, но явно монструозные.
В связи с этим вопрос. Я заметил, что при написании коротких, на 800-1200 знаков, уникальности достичь раз в сто труднее, чем когда катаешь простыню на 10 килознаков. Большие тексты у меня всегда с первого раза выдают 100% на весьма жёстких настройках. Это на самом деле так - или это мои личные аберрации восприятия? Товарищи рерайтеры и рерайтерши (рерайтерки?) - а у вас как?

Написал: bure37 , 16.05.2012 в 17:10
В форуме: Форум авторов
Комментариев: 254
Последние темы:
Комментарии
KengaRu
За  8  /  Против  0
Лучший комментарий  KengaRu  написал  21.05.2012 в 03:25

На больших текстах выставленные сколь угодно жесткие настройки шингла/фразы перекрываются нижним пределом совпадений в 1%: к примеру, от 5000 знаков ... На больших текстах выставленные сколь угодно жесткие настройки шингла/фразы перекрываются нижним пределом совпадений в 1%: к примеру, от 5000 знаков это 50 знаков, что при средней длине слова в русском языке 7-8 букв дает 6-7 слов. Плагиатус попросту игнорирует обнаруженные неуникальные (по выставленным настройкам шингла/фразы) отрезки, если они короче 1% от проверяемого текста, поэтому 100% уникальный длинный текст при проверке кусками, нарезанными по 500-2000 символов (1% = 5-20 символов, т.е. меньше 3 слов), может показать туеву хучу совпадений, и наоборот, собрав несколько мелких неуникальных текстов в один большой массив, у него можно получить высокую уникальность.

fakconet
За  8  /  Против  0
Лучший комментарий  fakconet  написал  19.05.2012 в 20:48

Так я не вижу тут никакого перфекционизма. Перфекционизм - он в красоте текста, его читабельности, логичности, грамотной структуре, убедительности ... Так я не вижу тут никакого перфекционизма. Перфекционизм - он в красоте текста, его читабельности, логичности, грамотной структуре, убедительности, информативности.

А уникальность - это чисто технический параметр, и, чем больше заморачиваться на его увеличении - тем хуже будут получаться тексты.

wooden_dragon
За  7  /  Против  0
Лучший комментарий  wooden_dragon  написал  16.05.2012 в 19:13

Пробовал. А кроме меня это же самое уже сделали 10 000 других авторов. Результат - пишешь 10 минут, а подгоняешь до 96% часа два.

OleMash
За  6  /  Против  0
Лучший комментарий  OleMash  написала  16.05.2012 в 18:47

О да!! Как знакомо!)) Мышка, правда, жива, но 5-10 прогонов через АП - это как раз про меня) Большие тексты всегда уникальность высокую выдают, а вот ... О да!! Как знакомо!)) Мышка, правда, жива, но 5-10 прогонов через АП - это как раз про меня)
Большие тексты всегда уникальность высокую выдают, а вот если их разбить на тысячные, картина получается менее оптимистичная. Причем, шаблоные фразы уже научилась чувствовать еще в стадии написания текста и стараюсь не использовать их или минимизировать использование, а первоначальный уник все равно 90-92% в среднем.
Обидно бывает, когда завернешь чего-нибудь такое, что прям кажется никто не додумался еще до такого. Ага, счас же! Уже кто-то умный до меня такое завернул...)) Или исправляю уникальность в одном предложении (следующее АП благосклонно разрешил оставить как есть), проверяю, с мыслью, что наконец-то можно будет уползти спать. Как же, размечталась! Вредный Плагиатус говорит, что теперь уже хвостик этого предложения и начало следующего ему не нравятся и между делом находит еще пару неуникальных моментов! Помянув его маму, продолжаешь борьбу и думаешь: "Интересно, а как мы будем уникалить лет через 5?"

bure37
За  5  /  Против  0
Лучший комментарий  bure37  написал  16.05.2012 в 18:12

Ага! То есть заказчик может большие тексты проверять кусками по 1 кз? Любопытно. В том и проблема общеупотребительных предложений, что большинство ... Ага! То есть заказчик может большие тексты проверять кусками по 1 кз? Любопытно.
В том и проблема общеупотребительных предложений, что большинство вариантов, которыми их можно заменить, - тоже общеупотребительные. :)

Manana456
За  0  /  Против  0
Manana456  написала  16.05.2012 в 17:42
Особенно чудесен в этом смысле рерайт описания схем к вязанию. Любое сочетание букоф на эту тематику уже упоминалось миллион миллионов раз. Каждая попытка улучшить текст заканчивалась все меньшим и меньшим показателем уникальности. У меня вышло в конце-концов где-то около 96, но ту тысячу символов я тоже надолго запомню). Мышку жалко.

                
bure37
За  3  /  Против  0
bure37  написал  16.05.2012 в 18:06  в ответ на #1
Мышка и так была полудохлая. :)
Ещё гадко рерайтить новости, особенно сугубо тематические - потому что они уже на 9000 новостных сайтов в разных вариациях отображены...

                
irbritan
За  0  /  Против  1
irbritan  написала  16.05.2012 в 17:51
Если будете проверять простыню по 1 кило (что и сделает заказчик), то может получиться тоже, что и с эти текстом. Не пытайтесь править предложения, особенно общеупотребительные, быстрее переписать его заново и по другому.

                
evaefremova81
За  0  /  Против  0
evaefremova81  написала  16.05.2012 в 17:53
Такая же беда: чем меньше текст, тем меньше шансов на то, что удастся договориться с АП по-хорошему. Нормальный текст тысячи на 2,5 с первого захода удается, поэтому не люблю маленькие статьи. Испсихуюсь вся, доходит даже до нервных расстройств, заканчивающихся распитием успокоительных средств (шутка конечно же).

                
OleMash
За  6  /  Против  0
Лучший комментарий  OleMash  написала  16.05.2012 в 18:47
О да!! Как знакомо!)) Мышка, правда, жива, но 5-10 прогонов через АП - это как раз про меня)
Большие тексты всегда уникальность высокую выдают, а вот если их разбить на тысячные, картина получается менее оптимистичная. Причем, шаблоные фразы уже научилась чувствовать еще в стадии написания текста и стараюсь не использовать их или минимизировать использование, а первоначальный уник все равно 90-92% в среднем.
Обидно бывает, когда завернешь чего-нибудь такое, что прям кажется никто не додумался еще до такого. Ага, счас же! Уже кто-то умный до меня такое завернул...)) Или исправляю уникальность в одном предложении (следующее АП благосклонно разрешил оставить как есть), проверяю, с мыслью, что наконец-то можно будет уползти спать. Как же, размечталась! Вредный Плагиатус говорит, что теперь уже хвостик этого предложения и начало следующего ему не нравятся и между делом находит еще пару неуникальных моментов! Помянув его маму, продолжаешь борьбу и думаешь: "Интересно, а как мы будем уникалить лет через 5?"

                
DELETED
За  0  /  Против  0
DELETED  написал  16.05.2012 в 18:50
А какие самые жесткие настройки АП???Шингл-3,Кол-во слов-3???

                
DELETED
За  0  /  Против  0
DELETED  написал  16.05.2012 в 20:32
Вы бы попробовали на инглише или на немецком рерайтить. Там ваще мутотень. Предлог+артикль+существительно е (уже три слова, которые не выбросишь), а дальше? А относительно больших простыней – это правда. Чем длиннее текст, тем легче добиться уникальности.

                
ElenaB1
За  0  /  Против  0
ElenaB1  написала  16.05.2012 в 23:04
"Невыносимая тяжесть уникальности" - это неизбежные издержки производства, которые часто предугадать невозможно, особенно это касается новостей. По-моему, уникальность зачастую и не зависит от объема: последний раз делала рерайт на тему "1С Предприятие" (около 20 тыс. зн.) - прокляла все на свете. Термины настолько специфичны и при этом избиты, что заменить их ничем невозможно, хотя я в теме (работала в этой программе в реале), хотелось бросить все к чертовой матери:(( Со временем вы научитесь предугадывать такие сюрпризы, я в данном случае, с 1С, "купилась" на то, что я в совершенстве знакома с этой темой.

                
DELETED
За  1  /  Против  0
DELETED  написал  16.05.2012 в 23:16
Я прям в шоке.
Не проверяйте на уникальность и все дела...

                
bure37
За  0  /  Против  0
bure37  написал  16.05.2012 в 23:20  в ответ на #132
"ТЗ:

Требования к уникальности - от 95%"

Цытата. :)

                
DELETED
За  0  /  Против  0
DELETED  написал  16.05.2012 в 23:22  в ответ на #135
Amen.

                
Rokintis
За  1  /  Против  0
Rokintis  написал  16.05.2012 в 23:33  в ответ на #135
Я на заре туманной юности старательно добивался в любом тексте 100% уникальности, маниакально бубня себе под нос: "Тварь я дрожащая или право имею!?" Для меня это было азартной игрой.
Когда текстов стало очень много, я прекратил эту художественную гимнастику.

                
bure37
За  0  /  Против  0
bure37  написал  16.05.2012 в 23:57  в ответ на #140
Это даже не художественная, а куда менее эстетичная спортивная гимнастика с потом, руганью и плюханьем на маты со всего размаху; однако ведь она жёстко привязана к техзаданию - не ради же собственного самоуслаждения я тут рукоблудствую? "Уник от 95/96/98" в ТЗ - цифры красноречивые, мимо которых пройти нельзя.

                
Shandi
За  0  /  Против  0
Shandi  написала  17.05.2012 в 07:54  в ответ на #140
Вот-вот.))) Я мне ещё интересно.

                
DELETED
За  0  /  Против  0
DELETED  написал  16.05.2012 в 23:23
Конечно, чем меньше текста, тем меньше шансов сделать 100% уникальный рерайт. Да, и заказчики иногда просто поражают, требуя 30 уникальных рерайтов на текст в 300-400 знаков.

                
diana2176
За  0  /  Против  0
diana2176  написала  16.05.2012 в 23:35
Только что занималась борьбой за уникальность. Рерайтила новость на 1300 знаков, уникальность нужна была от 95%. С 6-го раза получилось.

                
DELETED
За  0  /  Против  0
DELETED  написал  16.05.2012 в 23:44
Жестокая тема, а на ночь она кажется вообще каким-то троллингом просто.

                
natali06011985
За  0  /  Против  0
natali06011985  написала  17.05.2012 в 01:14
Надо же, а у меня наоборот... Хотя предпочитаю объемные работы.

                
fakconet
За  0  /  Против  0
fakconet  написал  19.05.2012 в 20:24  в ответ на #159
Наоборот не бывает, не сочиняйте:))). Это только если сравнивать _совершенно разные_ тексты. Например, большой - описание особенностей применения упомянутой тут программы 1С и маленький - как я провел лето:)).

                
natali06011985
За  0  /  Против  0
natali06011985  написала  20.05.2012 в 10:39  в ответ на #180
Да я не сочиняю. Моя практика показывает текст на 1000-1500 в 98% случаев будет от 98 уник. А вот с текстами 2500-3000....Из 100% с 70 % точно придется дергаться за уникальность. Кстати недавно была удивлена проверив плагиутсом получила 98 %, поставила настройки проверки строже получила 100% уника.... Проверяю много раз, нечего не путаю.

                
fakconet
За  0  /  Против  0
fakconet  написал  20.05.2012 в 19:38  в ответ на #243
А вы проверьте таким образом. Возьмите два текста по 1500. Пусть у каждого - 98%. Сложите их вместе и проверьте, как один текст на 3000. И посмотрите, сколько получится.

Потом возьмите текст на 3000 (другой). Пусть у него будет, скажем, 90-95% (ну или хоть 70-80%, если у вас есть такие).

Разбейте его на три по 1000 и проверьте каждый.

А потом расскажете нам о результатах:)).

Я уверен, что ваше мнение изменится. Просто, видимо, у вас так случайно совпадало с тематикой/направленностью текстов.

                
N_Special
За  0  /  Против  0
N_Special  написала  17.05.2012 в 23:43
Да, так и есть. Особенно если тема популярная( Написать можно быстро, но сделать требуемую уникальность зачастую сложно.

Кстати, я вот постингом не занимаюсь практически, но как-то мне понравился один форум и стала частенько там писать. Однажды пришла мне оплата с комментом "уникальность 90%, поднять до 96% - нужен КОПИРАЙТ!". А ведь писала я совершенно своими словами, но упомянула цитату... На этом мой постинг и закончился. ВМ понять можно (ничего не имею против, мог бы и не оплатить). Но представила, как сижу и проверяю свои сообщения плагиатусом, в надежде получить 96%, а затем на форуме появляются "гладко причесанные" нечеловеческие фразы... нет уж;)

                
Shandi
За  0  /  Против  0
Shandi  написала  19.05.2012 в 20:04  в ответ на #168
Кстати, да. Мне кажется, что уж к форумному общению уникальность вообще не должна применяться. Если идёт цитирование, это должно быть добросовестно выделено. Но какой плагиат, если сообщение в 200 знаков. И мысль будет выражена: ...ибо...ибо...тык-мык. Живое общение на то и живое, что в вылизывании не нуждается. Это ж не статья. Форумы тоже индексируются?

                
DELETED
За  0  /  Против  0
DELETED  написал  19.05.2012 в 15:46
Это еще что! Я видел одного (какое бы мне слово подобрать), так он вообще проверял уникальность по предложению через Яндекс и еще считал, что проявляет к авторам лояльность, т.к. не требует от них подобно Плагиатусу нарезать по три слова.

Я ему ответил, что парочка таких лояльностей и трудности вообще не нужны в жизни! Написал бы как звать это человеконенавистническое создание, да не уверен, что это по правилам можно делать!

Вот так вот! "А ты говоришь, павлины..."

                
DELETED
За  0  /  Против  0
DELETED  написал  19.05.2012 в 15:50
Прошу извинить, т.к. не совсем в тему топика моя реплика, но, все-таки, она к вопросу о проблемах с уникальностью так или иначе относится (или к проблемам с головушкой у требующего)

                
fakconet
За  1  /  Против  0
fakconet  написал  19.05.2012 в 19:25
Вообще-то ситуация немного странная. С одной стороны - я вполне доволен новой версией Плагиатуса - работает очень быстро, проверяет много сайтов (раньше у меня нормой было, когда проверяло всего 10-15 урлов, а сейчас - и 200 бывает, и больше). Уникальность, опять же, показывает показывает высокую:)).

Но как-то я то ли по глупости, то ли ввиду спешки отправил на проверку не весь текст, а только его первую часть. Решил таким образом ускорить процесс - пока буду дописывать, добрая половина проверится. И вот там кусок был действительно небольшой - килознака полтора, что ли.

И я был очень удивлен, когда Плагиатус выдал мне довольно низкую уникальность - чуть больше 90%, где-то 92-93. Я "на ходу" заменил несколько словоформ, и отправил на проверку по новой (продолжая дописывать текст). Плагиатус опять наложил мне желтых кучек, но при этом уже совершенно других.

Я насторожился:))).

Опять изменил пару словоформ, добавил ещё один (только что написанный) абзац и отправил. Результат получился получше - где-то в районе 97%. Я уже не стал спешить и сначала дописал весь текст. Потом что-то совсем незначительно изменил в первой части и отправил на, как оказалось, последнюю проверку. Выдало, как и обычно, 100%.

Вывод. Я теперь стараюсь небольшие работы по частям не проверять, только полностью. Конечно, если текст великоватый - килознаков на 6-7 и выше, то его желательно все-таки разбить на несколько кусков. А 2-3 кз - как правило, проверяю только целиком.

Даже и не знаю, это какая-то недоработка алгоритма, или так и задумано. Простое объяснение о пропорциональности тут, имхо, не работает.

                
KengaRu
За  8  /  Против  0
Лучший комментарий  KengaRu  написал  21.05.2012 в 03:25
На больших текстах выставленные сколь угодно жесткие настройки шингла/фразы перекрываются нижним пределом совпадений в 1%: к примеру, от 5000 знаков это 50 знаков, что при средней длине слова в русском языке 7-8 букв дает 6-7 слов. Плагиатус попросту игнорирует обнаруженные неуникальные (по выставленным настройкам шингла/фразы) отрезки, если они короче 1% от проверяемого текста, поэтому 100% уникальный длинный текст при проверке кусками, нарезанными по 500-2000 символов (1% = 5-20 символов, т.е. меньше 3 слов), может показать туеву хучу совпадений, и наоборот, собрав несколько мелких неуникальных текстов в один большой массив, у него можно получить высокую уникальность.

                
Отправка жалобы...
Спасибо, ваша жалоба принята
Вы уже жаловались
Ваша учётная запись заблокирована для участия в форуме.
Жаловаться можно только на чужой комментарий
Избранное
Добавить в избранное
Имя
URL
https://advego.com/blog/read/author/652703/all1/