Предлагаю добавить в Плагиатус возможность самому указать исходный текст
Собственно, сабж.
Дело в том, что я занимаюсь рерайтом новостей. А только что опубликованные порталами новости индексируются поисковыми системами, скажем так, не мгновенно.
Я-то делаю рерайты, держа стабильный уровень переработки исходного текста, но все равно не застрахован от неприятностей.
Неприятности в этом случае возможны такого плана. Скажем, я прочел на каком-нибудь портале непроиндексированную новость и быстро сделал ее рерайт. Плагиатус, что мой, что автоматический при публикации в магазине статей, показал уникальность 100% (поскольку поисковики не видят оригинала текста). Потом статья ждет модерации, и на момент просмотра модератором поисковики, допустим, исходник уже проиндексировали, и уникальность моего рерайта станет резко ниже. Хорошо, если она будет выше 80%, а если 78%? Последует в лучшем случае отказ в публикации статьи.
Что же делать, чтобы этого избежать? Предлагаю добавить в Плагиатус возможность указывать исходный текст. Чтобы Плагиатус искал не только во внешних источниках через поисковики, но и в качестве одного из источников взял мой, принудительно ему указанный. В виде ссылки или в виде куска текста - это непринципиально.
Точно так же и ВМ-ам, я считаю, было бы полезно в некоторых случаях проверять не некую абстрактную уникальность, а глубину переработки именно исходного, предоставленного ими для рерайта текста.
Shingle Expert в помощь. Запускаете параллельно плагиатусу. Пока АП проверит уник по сети, SE покажет уникальность текстов относительно друг друга. Хотя, можно и с помощью Плагиатуса такой фокус провернуть, только заморочек будет минут на пять больше :)
Я пробовал :) Я, правда, не программист (если точнее, программистом я был лет 15 назад). Но на базе существующих программ-синонимайзеров и лично составленного уникального словаря синонимов мне удалось добиться только 15-30% уникальности синонимизированного текста при сравнительно небольшом числе идиотских ляпов. Чтобы написать хороший генератор рерайта, нужно как минимум разработать алгоритм распознания и изменения структуры предложения, а также алгоритм изменения падежей существительных-прилагательных и спряжения глаголов. С перечнем исключений и проверкой на предмет идиотизма полученного текста эта задача, ИМХО, переходит в ту же область, что и создание искусственного интеллекта. То есть мне лично непонятно, как ее выполнить.
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186