Уникальность коротких текстов по-новому Плагиатусу или что общего между кофеварками и бойцовскими породами собак?
Помниться, некоторое время назад активно обсуждалась, заведенная Натальей тема, о том, что работать с короткими тестами стало невозможно по причине их низкой уникальности. Наташа тогда писала, что достаточно добить сколько-то сот символов, чтобы уникальность выросла на десятки процентов и достигла 100, т.е. нужно просто увеличить текст, ничего в нем не меняя. Я не придала значения проблеме, поскольку давно не тратила время на доработку текста из-за низкой уникальности, и вот в последние пару недель столкнулась с теми самыми на тысячу плюс-минус.
Сегодня я битый час издевалась над текстом, дабы повысить его уникальность. Сдать статью, которую я за это время превратила в глубокого инвалида, признаюсь, не хватило духу, поэтому и здесь ее выкладывать не буду. Но меня обуяло любопытство, что же это за тексты, с которыми у моего 1 общий процент. Обуяло потому, что было их чрезвычайно много.
Согласно ТЗ, мне нужно было описать категорию "кофеварки", причем описать так, чтобы вышел продающий текст. У продающих текстов есть особенность - это реклама. А реклама должна быть написана простым и понятным языком, никакого авторского и замысловатого стиля здесь быть не должно. Простой и понятный привел меня изначально к 75%.
Итак, я пошла по шла по ссылкам. Каково же было мое удивление, когда первой мне открылась вот эта страница: [ссылки видны только авторизованным пользователям] - здесь рассказывается о бойцовских породах собак.
Горестно мне стало и я написал плохонький рерайт одной всем нам знакомой истории(уникальность не проверял, ибо чревато разочарованиями) )) "Всем нам ...Горестно мне стало и я написал плохонький рерайт одной всем нам знакомой истории(уникальность не проверял, ибо чревато разочарованиями) ))
"Всем нам трудно пишется, текст не подогнать, Что же нас заставило сильно так страдать? Мы страдаем, бедные и клянём беду Новый Плагиатус изломал судьбу! Нам бы уникальность взять, да отменить, Трудно мне представить, что могло бы быть."
Лучший комментарий
DELETED
написала 19.10.2013 в 11:30
0
Мне казалось, только у меня так. Задания выполняю недавно, на небольшие тексты уходило по несколько часов. Совершенно бездарная трата времени и ...Мне казалось, только у меня так. Задания выполняю недавно, на небольшие тексты уходило по несколько часов. Совершенно бездарная трата времени и уродливые обороты получаются. С большими все нормально, время уходит только на написание и корректировку. Но в "меньше или равно тысяче", эту уникальность приходится просто рожать. Ужасно(
Лучший комментарий
DELETED
написал 19.10.2013 в 07:26
0
Действительно, написание коротких текстов стало проблемой. Не смог добиться нужной уникальности в коротких текстах о дверях. Особенно сложно, когда ...Действительно, написание коротких текстов стало проблемой. Не смог добиться нужной уникальности в коротких текстах о дверях. Особенно сложно, когда речь идет об общепринятых терминах технического содержания. Но если двери устанавливаются или монтируются, то как еще сказать об этом? Ну можно так наверное ...мы впендюрим в Ваш проем дверное полотно любых размеров. Но кому это нужно?
Лучший комментарий
DELETED
написала 19.10.2013 в 06:48
0
Чтобы работать с такими текстами, нужно научиться писать кардинально по-другому. Например: Кофеварка *модель* трансформирует ваш утренний кофе в ...Чтобы работать с такими текстами, нужно научиться писать кардинально по-другому. Например: Кофеварка *модель* трансформирует ваш утренний кофе в эликсир удовольствия. И тому подобный бред)))
Согласна на все 100%. Уникализация текстов на тысячу и ниже - настоящий мазохизм. Я даже не решилась взять ни одного заказа на описание бытовой техники. Буквально перед этим выполнила описание компьютерной игрушки со строгим указанием "текст не более 1100". Убила, иначе и не скажешь, больше часа на уник. Кое-как дотащила до 98%. Еще раз зареклась брать заказы менее 2 000. Иначе - просто потеря времени. Имхо, конечно.
Да, причем заказчики выставляют более низкие требования к уникальности коротких текстов, но текст на 1000-1500 трудно назвать коротким. И потом, исходят они из плотности ключей и здравого смысла, а поиск шингла по нетематическим сайтам... может быть я чего-то не понимаю!? Может мне почитать чего-нибудь...
Т.е. я правильно поняла "поиск шингла по нетематическим сайтам" - это теперь норма? Я впервые такое вижу, просто слышу тут и там разговоры "меньше 2 кб заказы не брать". Было даже убедительное объяснение Ростислава, что такой результат возникает за счет коротких фраз, которые в % в коротком тексте дотягивают до 1, а в длинном отбрасываются, поскольку составляют меньше 1.
Скорее всего так и есть. Думаю, Ростислав прав. Действительно, когда текст увеличивается - проблем гораздо меньше. Как-то проводила эксперимент. Писала текст и проверяла его поэтапно. Длина около 900 - уник 73%, за 2 000 и более - 99%. Ничего в нем не меняла, в чем причина - не объясню. Однако выводы для себя сделала.
Да, но почему выпадают никак не связанные сайты. Где кофеварки, и где бойцовские породы собак!?)))))))))))))))))))) И ведь не один же такой выпал, а все-все-все. Я такое в первый раз вижу.))
Значит вам просто повезло!:) Это обычная практика. Думаю, просто совпали самые распространенные фразы, которые можно отнести и к собакам, и к кофеваркам, и гипсокартону.
Да таких фраз и в двухтысячном будет много, причем длинных, но нетематические страницы не выпадают. Нет, тут сложнее. Программа как-то должна определять текст как тематический, и вот тут с алгоритмом что-то не так. Это как второй показатель: на универсальных (присущих любому тексту) словах может выпасть "возможно рерайт", но статьи будут все равно на ту же тематику, пусть и на другую тему. А одинаковыми фразами полнится весь интернет.
Согласна, однако АП больше всего "лютует" именно на коротких текстах и "хватает" без разбора универсальные и специальные фразы. Насчет алгоритма определения тематики текста ничего не знаю - не программист :). Хотя предполагаю, что он все-таки должен быть.
Извините, что вмешиваюсь. А я не согласна. Не должна она этого делать, потому что уникальность в большей степени интересует поисковых роботов. Пауки не будут разделять сайты на тематические/не тематические, они сканируют весь интернет. Скажите, пожалуйста, а какой объем текста у вас был? И неужели требовали уник.95%.
Я тоже за короткие тексты браться не хочу - когда начинала работу на Адвего (месяц назад) писала сначала короткие тексты, на пробу - заказы приятные (копирайт, на одном дыхании), а при проверке Плагиатусом - уникальность не выше 60 - 70%. Подгонять под 95 (которые требует заказчик от небольших текстов) - сумасшествие... Кроме головной боли ничего себе не заработаешь.
А самое главное - вы правы, пишешь статью про детей, к примеру, а выпадает какой-нибудь сайт на оккультные или строительные темы. Ну и где связь спрашивается?...:)))
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186