Я то бишь о чём, братишки: накропал тут рерайт, пустяковый, на один килознакъ. С исходника. Заняло у меня это десять минут. Но работа над заказом длилась три с лишним часа. Что же я делал всё это время?
Боролся за уникальность.
Battle for the uniqueness проходила так: написал, прогнал через плагиатус, получил гордые 83%. Учитывая, что это год моего рождения, счёл это добрым знаком и продолжил мудохаться. Приемлемых 96% удалось добиться примерно после десятого прогона через АП. За это время я даже успел расколотить мышку в бешенстве - то есть урон в три раза превысил доход от выполнения заказа. Вот тебе и сальдо!
Вебмастер вроде бы остался доволен. Я - категорически нет. Потому что в борьбе за уник некоторые нормальные человеческие предложения пришлось менять на конструкции уникальные, но явно монструозные.
В связи с этим вопрос. Я заметил, что при написании коротких, на 800-1200 знаков, уникальности достичь раз в сто труднее, чем когда катаешь простыню на 10 килознаков. Большие тексты у меня всегда с первого раза выдают 100% на весьма жёстких настройках. Это на самом деле так - или это мои личные аберрации восприятия? Товарищи рерайтеры и рерайтерши (рерайтерки?) - а у вас как?
Лучший комментарийKengaRu написал 21.05.2012 в 03:25
0
На больших текстах выставленные сколь угодно жесткие настройки шингла/фразы перекрываются нижним пределом совпадений в 1%: к примеру, от 5000 знаков ...На больших текстах выставленные сколь угодно жесткие настройки шингла/фразы перекрываются нижним пределом совпадений в 1%: к примеру, от 5000 знаков это 50 знаков, что при средней длине слова в русском языке 7-8 букв дает 6-7 слов. Плагиатус попросту игнорирует обнаруженные неуникальные (по выставленным настройкам шингла/фразы) отрезки, если они короче 1% от проверяемого текста, поэтому 100% уникальный длинный текст при проверке кусками, нарезанными по 500-2000 символов (1% = 5-20 символов, т.е. меньше 3 слов), может показать туеву хучу совпадений, и наоборот, собрав несколько мелких неуникальных текстов в один большой массив, у него можно получить высокую уникальность.
Лучший комментарий
DELETED
написал 19.05.2012 в 20:48
182
Так я не вижу тут никакого перфекционизма. Перфекционизм - он в красоте текста, его читабельности, логичности, грамотной структуре, убедительности ...Так я не вижу тут никакого перфекционизма. Перфекционизм - он в красоте текста, его читабельности, логичности, грамотной структуре, убедительности, информативности.
А уникальность - это чисто технический параметр, и, чем больше заморачиваться на его увеличении - тем хуже будут получаться тексты.
Лучший комментарийOleMash написала 16.05.2012 в 18:47
0
О да!! Как знакомо!)) Мышка, правда, жива, но 5-10 прогонов через АП - это как раз про меня) Большие тексты всегда уникальность высокую выдают, а вот ...О да!! Как знакомо!)) Мышка, правда, жива, но 5-10 прогонов через АП - это как раз про меня) Большие тексты всегда уникальность высокую выдают, а вот если их разбить на тысячные, картина получается менее оптимистичная. Причем, шаблоные фразы уже научилась чувствовать еще в стадии написания текста и стараюсь не использовать их или минимизировать использование, а первоначальный уник все равно 90-92% в среднем. Обидно бывает, когда завернешь чего-нибудь такое, что прям кажется никто не додумался еще до такого. Ага, счас же! Уже кто-то умный до меня такое завернул...)) Или исправляю уникальность в одном предложении (следующее АП благосклонно разрешил оставить как есть), проверяю, с мыслью, что наконец-то можно будет уползти спать. Как же, размечталась! Вредный Плагиатус говорит, что теперь уже хвостик этого предложения и начало следующего ему не нравятся и между делом находит еще пару неуникальных моментов! Помянув его маму, продолжаешь борьбу и думаешь: "Интересно, а как мы будем уникалить лет через 5?"
Лучший комментарийbure37 написал 16.05.2012 в 18:12
2
Ага! То есть заказчик может большие тексты проверять кусками по 1 кз? Любопытно. В том и проблема общеупотребительных предложений, что большинство ...Ага! То есть заказчик может большие тексты проверять кусками по 1 кз? Любопытно. В том и проблема общеупотребительных предложений, что большинство вариантов, которыми их можно заменить, - тоже общеупотребительные. :)
Особенно чудесен в этом смысле рерайт описания схем к вязанию. Любое сочетание букоф на эту тематику уже упоминалось миллион миллионов раз. Каждая попытка улучшить текст заканчивалась все меньшим и меньшим показателем уникальности. У меня вышло в конце-концов где-то около 96, но ту тысячу символов я тоже надолго запомню). Мышку жалко.
Мышка и так была полудохлая. :) Ещё гадко рерайтить новости, особенно сугубо тематические - потому что они уже на 9000 новостных сайтов в разных вариациях отображены...
Если будете проверять простыню по 1 кило (что и сделает заказчик), то может получиться тоже, что и с эти текстом. Не пытайтесь править предложения, особенно общеупотребительные, быстрее переписать его заново и по другому.
Ага! То есть заказчик может большие тексты проверять кусками по 1 кз? Любопытно. В том и проблема общеупотребительных предложений, что большинство вариантов, которыми их можно заменить, - тоже общеупотребительные. :)
Такая же беда: чем меньше текст, тем меньше шансов на то, что удастся договориться с АП по-хорошему. Нормальный текст тысячи на 2,5 с первого захода удается, поэтому не люблю маленькие статьи. Испсихуюсь вся, доходит даже до нервных расстройств, заканчивающихся распитием успокоительных средств (шутка конечно же).
Я - Сергей) Приятно) ...в смысле познакомиться))) Знаете, это, наверное, самый естественный и логичный путь - на кого-то ровняться! Я вот, в своё время, на Иру ровнялся - она для меня самым авторитетным автором на Адвего была! http://advego.ru/blog/read/master_search/190978
О, еще один супер-пупер автор! Блин, вас так много, хороших авторов! Я теперь чувствую себя какой-то ущербной! Но.... Москва не сразу строилась! Буду стараться, буду стремится, авось чего-нибудь добьюсь
я зарегалась действительно давно, но как-то сразу не поняла адвеговскую кухню, сбежала от страха и непоняток. А пару месяцев назад, волею судьбы, забрела на форум, написала несколько статей, которые, к моему удивлению и удовольствию, быстро купили. Появился стимул и желание работать дальше. Вот теперь меня за уши не оттащишь!
Привет! Не помню... А, вроде бы она ссылочку давала в теме "как ключи вставить". Нет, это было уже после того, как я его нашла. Как-то сам отыскался... А может, что в инете по копирайтингу искала :))
разочек на доработку прислал, но он сам ключи неправильно посчитал. в принципе, нам не жалко - повысили еще их концентрацию и дописали пару предложений, призывающих к к действию. кстати, нужно спросить - как там дела, а то замолчал что-то
А мне нравится рерайтить всякие текстики по 500 знаков, или вообще - сокращать с 2тыс. до 300 знаков. Одно объявление - 10 мин, и только первые два через плагиатус проверяла. Помню свою первую 20-ку таких текстов на сайт недвижимости, через час - автоматом. А потом мне заказчик отказал, потому что нашлась девченка, которая в два раза быстрее работала, и уникальность 98% в отличие от моих 95%
Ну это какой-то специфический талант нужен. Как вот я - могу нормальный текст написать, могу даже хороший, а в редких случаях - отменный; но блин, написать слоган или заголовок красивый - тут я полный лох. Мозги по-другому устроены.
Десять статей - не считается.. каталог дверей, часов, кранов.. вот где сила.. уфф.. как вспомню, так вздрогну.. :)) А по тексту, так вполне.. было бы плохо - я бы сказала.. ) Ида, можно на ты :)
Лучший комментарийOleMash
написала
16.05.2012 в 18:47
00
О да!! Как знакомо!)) Мышка, правда, жива, но 5-10 прогонов через АП - это как раз про меня) Большие тексты всегда уникальность высокую выдают, а вот если их разбить на тысячные, картина получается менее оптимистичная. Причем, шаблоные фразы уже научилась чувствовать еще в стадии написания текста и стараюсь не использовать их или минимизировать использование, а первоначальный уник все равно 90-92% в среднем. Обидно бывает, когда завернешь чего-нибудь такое, что прям кажется никто не додумался еще до такого. Ага, счас же! Уже кто-то умный до меня такое завернул...)) Или исправляю уникальность в одном предложении (следующее АП благосклонно разрешил оставить как есть), проверяю, с мыслью, что наконец-то можно будет уползти спать. Как же, размечталась! Вредный Плагиатус говорит, что теперь уже хвостик этого предложения и начало следующего ему не нравятся и между делом находит еще пару неуникальных моментов! Помянув его маму, продолжаешь борьбу и думаешь: "Интересно, а как мы будем уникалить лет через 5?"
Я в обсуждениях отписывал заказчику уникальность при таком раскладе. Сообщал, что Плагиатус светит только ключи. Те, с кем я работал и работаю, знают об этой проблеме и принимают работу.
Обычно в таких случаях ВМы идут навстречу. Просто надо поставить в известность, что уник страдает от ключей. Впрочем, когда они будут проверять работу - сами увидят.
У большинства моих чудесных ВМов вообще стоят 4/5 или там 5/6 какие-нибудь. За что моя им сердечная благодарность - хотя я и на "внедорожнике" стараюсь добиваться 100%.
Вы бы попробовали на инглише или на немецком рерайтить. Там ваще мутотень. Предлог+артикль+существительно е (уже три слова, которые не выбросишь), а дальше? А относительно больших простыней – это правда. Чем длиннее текст, тем легче добиться уникальности.
Ох, я из-за этих артиклей так и не смог ни один язык "нечувствительно превзойти". К людям же, которые на ненашенском ещё и рерайтят или, не дай бог, копирайтят, у меня и вовсе отношение как к богам-олимпийцам. (Не ирония).
Видать с преподами не повезло. Я бы Вам за 20 минут суть проблемы объяснил. А относительно богов-олимпийцев, скажу, что здесь Вы перегнули. Просто некоторые выучат язык на уровне 10 класса (так, как это должно было бы быть, т.е. требует программа, и строят из себя небожителей). Да и сейчас редко такое попадается. Как сделали обучение доступным (читай платным), мелковатый студент пошёл.
То, что я скажу за 20 минут, мне придется хлопать на клаве 5 часов (печатаю медленно). А вообще у меня уже спрашивали, не хочу ли я написать статью о рерайте на иностранных языках. Цена была не очень (1,5 у.е. за 1000), но я согласился. Правда, как спросили, так потом и молчок.
У меня нет ни микрофона, ни видеокамеры. Нет нужды. Зачем лишние цацки покупать, если ими не пользуешься. Проблемой также может стать скорость Интернета, потому что она у меня постоянно меняется. У Вас там новая тема в поиске авторов, кину там ссылки на некоторые свои работы в области просвещения по инглишу, если действительно интересует. Просьба ответить, стоит ли их туда помещать.
Как по мне, Женя интересную тему предлагает: http://advego.ru/blog/read/aut...or/652703#comment158 Сам планировал вебинар провести (тема другая, английским не владею на уровне преподавания) никак руки не доходят. Я б например баксов 20 за полезный вебинар на эту тему с удовольствием отвалил. Думаю не один я.
Серёга, я уже писал выше, что мои технические возможности этого не позволяют. А если Женя - это docadept, то ему это не особо нужно. Больше похоже на обычный стёб.
Сань, проблемы решаемые. Быстрый и-нет можно арендовать на пару часов. Вебка =наушники с майком обойдутся тебе бачей в 30. Даже если ты будешь продавать свой вебинар по 10 уе - 5 слушателей окупят расходы. А если правильно продавать - их будет много больше.
Почему сразу стеб, здесь же не тема про анекдоты? Видеоконференции на сегодня - самый удобный способ общения и обучения, в частности. Я же не в курсе Ваших технических возможностей в этом плане. Если пока нет - то ладно, но ссылки бросайте, можно прямо здесь, я с удовольствием почитаю.
Однажды исходник копировала и чувствую, что что-то в нем не то. Вроде всё так, но почему-то в Ворде некоторые нормальные слова, не вызывающие сомнений, подчеркнуты.)))) Догадались? Ага. Вот кто-то за уникальность боролся путём замены русских "о" и "е" на английские аналоги. ))) Я бы сама не дотумкала так делать, но я так и не буду делать. Я своих ВМ-ов уважаю. И... мне нравится с Плагиатусом бодаться. Интересно.
Ну я вычислила, хотя ... случайно. Просто заинтересовалась почему вдруг подчеркивает. Думаю, что и ВМ, конечно, вычислят. Тем более, кто давно работает.
Сереж, сорри за оффтоп, я шепотом, на ушко: деревянный дракончик, с которым ты сейчас беседуешь, довольно серьезный и ответственный автор, хотя и недавно в копирайтинге. Я с ним работаю, он сложные технические тесты пишет на раз-два, грамотно, уникально и без воды. Но ему уверенности в себе не хватает. Поддержи его морально по возможности, ага? Ты опытный, и душа у тебя добрая, я знаю:) А то один (то бишь я) в поле не воин:)
Хороший мужик. Толковый, да и как человек мне импонирует. Наверное, потому что земляк:) Только ему наглости не хватает, как мне, например:) Ну или тебе:)))
Растягивай до 1500 - быстрее дело будет двигаться, я всегда так поступаю - гораздо быстрей лишний абзац написать на 500 зн, чем тот АП гонять потом и фразы коверкать)) Если заказчик, конечно, не против лишних знаков))
Че-то там медленно народ реагирует. Я уже попкорн заготовила, место под столом разгребла, чтоб было куда стекать, а движухи-то и нет особо... Жене надо было в пятницу желающих искать, к вечеру ближе)
Ну дык, я и говорю, что в пятницу было бы лучше. Я сегодня самый разгар недели, нифига не смешной день( Не то что бы в совсем в тему, но картиночка понравилась...)
Бай!)) Я пойду таки досматривать сериал про лопоухую Белоснежку в годах (такую вот подобрали "замечательную" актрису на роль юной Белоснежки) и прочих сказочных персонажов))
Хехе. Странно, у меня почему-то этого заказа нет в списке доступных. Я думал, по нему уже работу кто-то взял. Окей, щас как с другими расквитаюсь - возьму.
))) "Нездоровится" - это в смысле, что и у меня запал поутих)) Не знаю, вот, то ли кино сериал помучать, то ли спать пойти...
А насчет не представлены, так это мы исправим сейчас) На "ты" переходим, так же?) А величать меня Аленой. Это был первый вариант или второй?) Второй, небось, Оля какая-нибудь?))
Плачевна участь топик-стартера, которому комменты в его теме приходят на почту в виде ответов. Я сперва решил, что вы себя одёргиваете, чтоб МЕНЯ Олей не назвать. :)
)))) А, кстати, да, я ТС только один или два раза была и отделалась малой кровью. А теперь, сколько наблюдаю дебаты, флуд или грызню в топиках, столько и зарекаюсь, что я только под страхом смертной казни еще раз Тсом буду))
Оно класно, когда по-доброму все)) А порой, ничего не подозравающий ТС ложится спать, в веточке тишь, гладь и анекдоты, а утром упс! В ящике 100500 писем - оказалось, народ самозабвенно срался всю ночь, и половина коллектива уже в бане отдыхает)
Поверь уж старому сетевому троллю, который сразу летит туда, где почуял запах жареного, - ничего лучше для меня нет! Летают ядра, свистят пули, вопли, мат, народ самозабвенно плюсует и минусует, модераторы не успевают перезаряжать баномёты... Это ж песня!
:)))) Кааак написал поэтично! Прям кровь в жилах забурлила!))) Не накаркать бы, но захотелось чего-то такого, с драйвом, ядрами и плюсаторами-минусаторами))
Для этого надо открыть тему "На Адвеге нет ни одного нормального автора, а заказчики платят поганые копейки! Не биржа, а г..." Думаю, ждать очередного революционера долго не придётся - их бывает тут... :)
Классно* Хотя, фиг его знает, может и за срачем понаблюдать интересно бывает) Да и утрировала я малость... Классическая ругань редко возникает, но спорим, порой, самозабвенно) Кто-то очень про виниловых детей топик завел... Тоже человек вряд ли предполагал, что за этим последует))) Неделю форум колыхало))
Первый был какая-нибудь Оля, второй - какая-нибудь Маша. :) А я Василий. До ужаса жалею, что прогадил аккаунт с никнеймом, который у меня везде и всюду. Может, даже кто-то из ЖЖ-френдов здесь меня встретил бы...
О как!)) Я уже где-то писала, для ника "сложила" имена детей - Олег и Маша)) Что ты Василий, я уже запомнила, правда, путалась сначала, Василий ты или Сергей) Вообще, форум- хорошая гимнастика для памяти)) Столько имен уже в голове) С ними у меня еще более-менее нормально все, но вот с кем я уже на "ты", а с кем еще на "вы"... Тут у меня беда) Вон, Цельсия сегодня на "вы" обозвала) В 1/3 собеседников не уверена, как мне обращаться к ним)
Кстати, да. Между прочим (насчёт Сергея), я даже не знаю, кого на форуме больше - фрилансеров из Украины или Сергеев. :) Хорошо, что один Сергей немножко пол сменил, а то совсем можно было запутаться.
Мой педагог в муз. училище любил нам повторять: на сцену нужно выходить не просто уверенно, а самоуверенно, но так, чтобы самоуверенность не переходила в наглость. Золотые слова! Помогают не только в копирайтинге, а вообще в жизни:)
Где это я, Серёга, натупил? Местоимений я, мне, вам не вижу в упор. Я когда-то создавал тему перевода/рерайта на иностранных языках, но мне так никто и не ответил. Голой ушла темка в небытиё.
Капец! да не ты натупил - ты МЕНЯ натупил))) Вынес мне мозг своим комментарием. Я ж в курсе дела, какая это радость - англорерайт) Вот и отреагировал поэтому!) Привет, кстати)
"Невыносимая тяжесть уникальности" - это неизбежные издержки производства, которые часто предугадать невозможно, особенно это касается новостей. По-моему, уникальность зачастую и не зависит от объема: последний раз делала рерайт на тему "1С Предприятие" (около 20 тыс. зн.) - прокляла все на свете. Термины настолько специфичны и при этом избиты, что заменить их ничем невозможно, хотя я в теме (работала в этой программе в реале), хотелось бросить все к чертовой матери:(( Со временем вы научитесь предугадывать такие сюрпризы, я в данном случае, с 1С, "купилась" на то, что я в совершенстве знакома с этой темой.
Я на заре туманной юности старательно добивался в любом тексте 100% уникальности, маниакально бубня себе под нос: "Тварь я дрожащая или право имею!?" Для меня это было азартной игрой. Когда текстов стало очень много, я прекратил эту художественную гимнастику.
Это даже не художественная, а куда менее эстетичная спортивная гимнастика с потом, руганью и плюханьем на маты со всего размаху; однако ведь она жёстко привязана к техзаданию - не ради же собственного самоуслаждения я тут рукоблудствую? "Уник от 95/96/98" в ТЗ - цифры красноречивые, мимо которых пройти нельзя.
Конечно, чем меньше текста, тем меньше шансов сделать 100% уникальный рерайт. Да, и заказчики иногда просто поражают, требуя 30 уникальных рерайтов на текст в 300-400 знаков.
Вы меня подкупаете, уважаемый)) По-моему, троллинг заключён в том, что в самом начале темы вы уже сами себе ответили фактически.. Ну борьба за уникальность - это ведь хлеб копирайтерский.. Хотя я бы это назвал пародией на передачу "Битва экстрасенсов", там чуваки тоже всё шаманят и не могут успокоиться.. А повышение уникальности, ну скажем с 90 до 95, пойдёт для новой передачи под названием "Битва садомазохистов"))
А вот нет) Меня интересовал не столько феномен борьбы за уникальность, сколько частный случай того, что в больших текстах уника добиться куда легче. Хотя, казалось бы, используешь одни и те же заштампованные на тыщу раз обороты - ан нет. Меня интересовал сам механизм подобного явления.
А повышение уника - да ведь для самого автора оно и вовсе не важно, имхо. Я бы с огромным удовольствием писал тексты с уником в 50% и не заморачивался - так ведь заблокируют же. :)
Где-то читал, что в зависимости от размера текста, выставляются разные настройки. Очень часто приходится писать по 500 знаков, и там проверяю другими настройками, по сравнению с текстом в 3 тысячи.
Не все так просто. Пропорция тут может и не работать. Вот если ваш текст на 1000 знаков показывал 85%, и второй такой же покажет 85, то сколько в сумме должен будет показать текст на 2000?
По идее - все те же 85%:)). Все строго пропорционально. Но нет ведь этого. Более того. Увеличив текст всего в два раза, можно добиться очень значительного повышения уникальности - буквально в несколько раз (если сравнивать процент совпадений).
Так что это все-таки больше похоже на какой-то глюк, недоработку алгоритма.
П.С. По логике, РЕЗКОЕ изменение измеряемой (показываемой) уникальности должно наступить только с текстов величиной 500 слов (т.е. сравниваемый минимум вместо 4 слов станет 5). Хотя - может быть, этот алгоритм начинает работать уже на 401-м слове:)).
Ну это где-то свыше 3000 знаков получается, если так. Но не 2 и не 2.5 кз.
П.П.С. Вот я только что специально проверил. Взял кусок текста чуть меньше 2500 знаков (ровно 299 слов:)), проверил - 100%. Потом разбил на 2 части и ещё раз проверил - порядка 92-93% каждая. Так что объяснение с пропорцией напрямую не работает. Тут что-то другое.
Посмотрите коммент №146. Речь идет о том, что ВОЗМОЖНО, с увеличением длины текста уменьшается "удельный вес" совпадений. Вот я и говорю, что прямой пропорциональной зависимости тут не наблюдается.
Как по мне, лучше плясок с бубном не устраивать. Нынешняя версия Плагиатуса работает на удивление быстро, надежно и стабильно - так что пусть усё остается как и було:)).
Размер имеет значение) боинги то хороши для фигурного катания, но короткие тексты интереснее в них то и приходится попотеть) это как в шахматы: поставить мат в 6-7 ходов то тяжелее, чем мочалить до последнего.. Да и ещё - смотря кто и на каких настройках проверяет уникальность)) знаю любителей, которые ставят размер шингла = 3 слова, вот где веселуха то самая:) На этом ухожу и ещё одну весёлую или может не очень картинку оставлю)))
Наоборот не бывает, не сочиняйте:))). Это только если сравнивать _совершенно разные_ тексты. Например, большой - описание особенностей применения упомянутой тут программы 1С и маленький - как я провел лето:)).
Да я не сочиняю. Моя практика показывает текст на 1000-1500 в 98% случаев будет от 98 уник. А вот с текстами 2500-3000....Из 100% с 70 % точно придется дергаться за уникальность. Кстати недавно была удивлена проверив плагиутсом получила 98 %, поставила настройки проверки строже получила 100% уника.... Проверяю много раз, нечего не путаю.
А вы проверьте таким образом. Возьмите два текста по 1500. Пусть у каждого - 98%. Сложите их вместе и проверьте, как один текст на 3000. И посмотрите, сколько получится.
Потом возьмите текст на 3000 (другой). Пусть у него будет, скажем, 90-95% (ну или хоть 70-80%, если у вас есть такие).
Разбейте его на три по 1000 и проверьте каждый.
А потом расскажете нам о результатах:)).
Я уверен, что ваше мнение изменится. Просто, видимо, у вас так случайно совпадало с тематикой/направленностью текстов.
Да, так и есть. Особенно если тема популярная( Написать можно быстро, но сделать требуемую уникальность зачастую сложно.
Кстати, я вот постингом не занимаюсь практически, но как-то мне понравился один форум и стала частенько там писать. Однажды пришла мне оплата с комментом "уникальность 90%, поднять до 96% - нужен КОПИРАЙТ!". А ведь писала я совершенно своими словами, но упомянула цитату... На этом мой постинг и закончился. ВМ понять можно (ничего не имею против, мог бы и не оплатить). Но представила, как сижу и проверяю свои сообщения плагиатусом, в надежде получить 96%, а затем на форуме появляются "гладко причесанные" нечеловеческие фразы... нет уж;)
Кстати, да. Мне кажется, что уж к форумному общению уникальность вообще не должна применяться. Если идёт цитирование, это должно быть добросовестно выделено. Но какой плагиат, если сообщение в 200 знаков. И мысль будет выражена: ...ибо...ибо...тык-мык. Живое общение на то и живое, что в вылизывании не нуждается. Это ж не статья. Форумы тоже индексируются?
Это еще что! Я видел одного (какое бы мне слово подобрать), так он вообще проверял уникальность по предложению через Яндекс и еще считал, что проявляет к авторам лояльность, т.к. не требует от них подобно Плагиатусу нарезать по три слова.
Я ему ответил, что парочка таких лояльностей и трудности вообще не нужны в жизни! Написал бы как звать это человеконенавистническое создание, да не уверен, что это по правилам можно делать!
Прошу извинить, т.к. не совсем в тему топика моя реплика, но, все-таки, она к вопросу о проблемах с уникальностью так или иначе относится (или к проблемам с головушкой у требующего)
Вообще-то ситуация немного странная. С одной стороны - я вполне доволен новой версией Плагиатуса - работает очень быстро, проверяет много сайтов (раньше у меня нормой было, когда проверяло всего 10-15 урлов, а сейчас - и 200 бывает, и больше). Уникальность, опять же, показывает показывает высокую:)).
Но как-то я то ли по глупости, то ли ввиду спешки отправил на проверку не весь текст, а только его первую часть. Решил таким образом ускорить процесс - пока буду дописывать, добрая половина проверится. И вот там кусок был действительно небольшой - килознака полтора, что ли.
И я был очень удивлен, когда Плагиатус выдал мне довольно низкую уникальность - чуть больше 90%, где-то 92-93. Я "на ходу" заменил несколько словоформ, и отправил на проверку по новой (продолжая дописывать текст). Плагиатус опять наложил мне желтых кучек, но при этом уже совершенно других.
Я насторожился:))).
Опять изменил пару словоформ, добавил ещё один (только что написанный) абзац и отправил. Результат получился получше - где-то в районе 97%. Я уже не стал спешить и сначала дописал весь текст. Потом что-то совсем незначительно изменил в первой части и отправил на, как оказалось, последнюю проверку. Выдало, как и обычно, 100%.
Вывод. Я теперь стараюсь небольшие работы по частям не проверять, только полностью. Конечно, если текст великоватый - килознаков на 6-7 и выше, то его желательно все-таки разбить на несколько кусков. А 2-3 кз - как правило, проверяю только целиком.
Даже и не знаю, это какая-то недоработка алгоритма, или так и задумано. Простое объяснение о пропорциональности тут, имхо, не работает.
А я наоборот только мелкими порциями любой текст и проверяю. По 600 знаков. Так мне как-то поспокойнее. А то однажды при 100% уникальности у меня, заказчик мне посетовала, что у неё проверка выдала 91%. Неприятненько было.
Ну, если вам так нравится:)). Имхо, это как в анекдоте про башню танка и добрую фею. Я вообще Плагиатусом долгое время не пользовался, доверяя исключительно собственному чувству слова. Но то ли оно за два с половиной года изрядно притупилось, то ли число текстов в сети растет в геометрической прогрессии, а миллионы обезьянок каждый день стучат по клавишам, пытаясь набрать "Войну и мир":)).
Так что, если мне проверка ВСЕГО текста показала 100% - то и претензий никаких быть не может. Проверять же по кусочкам - а зачем оно вообще надо? Чисто лишнюю работу себе на голову придумывать?
Лучший комментарий
DELETED
написал
19.05.2012 в 20:48
в ответ на #182
4182
Так я не вижу тут никакого перфекционизма. Перфекционизм - он в красоте текста, его читабельности, логичности, грамотной структуре, убедительности, информативности.
А уникальность - это чисто технический параметр, и, чем больше заморачиваться на его увеличении - тем хуже будут получаться тексты.
Тем не менее, уникальность является одним из параметров заказа. Хотим мы того или нет. Мне тоже это поперёк горла, особенно если пишу ... ну, хотя бы про налоги. Там вообще одни штампы кругом. И названия на козе не объедешь.
Правильно. Уникальность - один из параметров работы, заказа, текста. ВСЕГО текста, всей работы. Так какой смысл разбивать небольшой текст на 2.5 кз на 4 четыре совсем крохотных по 600 зн?
Если программа показывает, что уникальность всего текста - 100%, какой смысл придумывать себе дополнительный гембель на голову?
Ну не хотите Вы меня услышать категорически. Ещё раз объясняю, что то, что программа показывает зависит от погрешности в выборке. Вам она покажет 100%, а ей через 20 минут 91%. Одна и та же программа. Один и тот же текст. Я те заказы, где требуют 100% не беру вообще, потому что быть такой уникальности не может. Это как в анекдоте про то, что получается, если музыку Бетховена задом наперёд играть.)))
Ну, не знаю. Моим тексты мне всегда (шучу:)) показывают 100%. С чего бы вдруг им сойти с ума и стать показывать 91%?:)) Ну, пусть что-то где-то глюкнет и будет 98% или даже 97% - вполне нормально.
Тут ещё надо, имхо, уточнять у профессиональных сеошников, в действительности ли уникальность текста настолько важна, как это принято считать? Складывается ощущение, что ныне уник - это сингулярный фактор, который намертво перевешивает все вышеописанные мелочи вроде "читабельности и логичности". Пущай текст в будет стиле "Купите смартфон. Он очень хороший. У него тачскрин. Его трогают пальцем" - но уник 100%, и ВМ удовлетворённо кивает. А надо ли?
Или, страшно сказать, высокая уникальность - достоинство говносайтов, а сайту для людей 100% уник и не очень нужон?
Добрый. :) Нежное касание тачскрина кончиком ногтя... :) На самом деле: на какие только монструозные сочетания ни приходилось идти ради сохранения искомого уника...
Существует мнение, что многое зависит от тематики (к рецептам, новостям... требования ботов довольно скромные), от траста, от выдержки домена, регулярности обновления ресурса,... температуры воды в Паттайе, цен на пирожки у бабы Нюры и курса тугрика :)
Прошу прощения за оффтоп, но я к Вам, как к старожилу: где-то тут есть описание процесса изготовление скрина полной страницы сайта? Оч. нужно. Спасибо.
Я вот тут нашла какую-то ссылку, но при загрузке стали пугать тем всякими бяками от непроверенных источников. Что-то побоялась.У меня ФайрФокс. Ну да, мазила.
Зачем в Урюпинск через Сан-Франциско добираться? :) Уж по мазиловской ссылке (с защищенным соединением) ничего плохого точно не произойдет (с большой долей вероятности): [ссылки видны только авторизованным пользователям]
Ничё не скачалось. Я его и так и эдак. Зарегистрировалась и перезагрузилась раз 100.))) Я так поняла, что в инструментах должен был новый значок отобразиться, ан нету. Зато обойки себе новые мазилистые повесила. Пойду застрелюсь.
А здесь? - [ссылки видны только авторизованным пользователям] SnagIt вроде тож нормально скрины полные делает (если склероз мне не изменяет). Программка ни к какому браузеру не привязывается. Попробуйте поискать (она везде практически есть)
Добрый день!))) С мазилой я разобралась. Они для 10-й версии не устанавливаются. Тамбшоты, я так поняла, - это заказ на платные скрины. А SnagIt сейчас добью. Похоже, что у меня диски забиты. В понедельник сына попрошу, а то снесу что-нить нужное сгоряча. Спасибо!
Если это действительно интересные сайты для людей и тексты достаточно объемные, то при проверке таких статей у меня ещё ни разу не было случая, чтобы показало меньше 100%:)).
Проблемы как раз могут возникнуть со всякой нудотиной и небольшими говнотекстами:)).
Вы же сами сказали, что в следующий раз показывает совпадения совсем в других позициях. Очевидно, что за отведённый на проверку срок( и что-то там в зависимости от скорости Интернета...) не может быть осуществлена по-настоящему глубокая проверка. Речь идёт о более-менее подробной выборке. Насколько объём выборки может соответствовать величине общего объёма? Я проверила и у меня вышло 100%, а она проверила - 91%. Хотя я делала всё добросовестно. А она тем более, поскольку заинтересована она больше, чем я. Материально в том числе.
Правильно. И так будете три часа править 1000 знаков? А - зачем это нужно, если весь небольшой текст на 2.5 кз показывает 100% при нескольких глубоких проверках подряд?
Лучший комментарийKengaRu
написал
21.05.2012 в 03:25
00
На больших текстах выставленные сколь угодно жесткие настройки шингла/фразы перекрываются нижним пределом совпадений в 1%: к примеру, от 5000 знаков это 50 знаков, что при средней длине слова в русском языке 7-8 букв дает 6-7 слов. Плагиатус попросту игнорирует обнаруженные неуникальные (по выставленным настройкам шингла/фразы) отрезки, если они короче 1% от проверяемого текста, поэтому 100% уникальный длинный текст при проверке кусками, нарезанными по 500-2000 символов (1% = 5-20 символов, т.е. меньше 3 слов), может показать туеву хучу совпадений, и наоборот, собрав несколько мелких неуникальных текстов в один большой массив, у него можно получить высокую уникальность.
Чегойта мне по этому поводу вспоминается онегдод о самолете, паровозе и тщательной обработке напильником :) Смысла кагбэ в таком игноре особо нету. И изменить алгоритм, чтоб складывались совпадения <1% с округлением результата до целых - дело пары минут. См. 178. Вроде не так все просто
"тут не так все просто" = 21 знак, 5 слов, гугление точной фразы дает миллион результатов Шингл 5, фраза 5, текст 1500 знаков — эта фраза высвечивается как неуникальная (пусть и не при каждой проверке). Берем текст побольше (да хоть тупо сдублировать эти 1500 знаков, итого будет 3000) — эта фраза _никогда_ не высветится как отдельная неуникальная, если не образует последовательность вместе с предшествующим или последующим словом. Обнаруживаются совпадения в 1% и более от количества знаков проверяемого текста. Тот же текст 1500 знаков, но выставляем в настройках нижний процент совпадений = 2%. Искомая фраза не обнаруживается, уникальность 100%. Отрезаем треть, оставляя 1000 знаков — паскудная фраза везде повылазила, потому что для текста 1500 знаков ее длина не превышает порог 2%, а для 1000 уже оппаньки.
1500 и 1000 — для того, чтобы были красивые круглые числа. На самом деле может высчитываться процент знаков без учета пробелов и знаков препинания, можно попробовать для текстов 1200 и 800 (фраза-то взята из коротких слов, 4 пробела). Факт, что есть порог срабатывания проверки, этот порог повышается при увеличении длины проверяемого текста, и при длине 5000 и больше изменение настроек шингла/фразы от 3 до 6 слов не оказывает влияния на расчетную уникальность (если текст не изобилует идущими друг за другом длинными словами "высокопреосвященство сверхвысокочастотный глубокоуважаемый вагоноуважатый" и проч.), т.к. нижний процент совпадений 1% = 50 знаков, а для коротких текстов измеренная уникальность сильно меняется в зависимости от настроек шингла/фразы (из-за коротких слов: предлогов, союзов, частиц, местоимений), если не повысить порог срабатывания.
"Война и мир" уникальна как целое, но при проверке по главам будут обнаружены заимствования и цитаты. Энциклопедия уникальна как целое, хоть и составлена из неуникальных статей. Любой текст неуникален, т.к. составлен из неуникальных слов и устойчивых словосочетаний, но чем он длиннее, тем более длинные последовательности можно игнорировать. Чем короче слово, тем меньше вероятность повторения в нем одной и той же буквы. и т.п.
"Войну и мир" и Википедию вряд ли кто будет в плагиатус загонять :) Узнать бы еще точный алгоритм проверки и оценки уникальности текстов Яндексом, вообще было бы круто.
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186