Уважаемые пользователи, представляем вашему вниманию новый сервис: семантический анализ текста.
Анализатор показывает следующие показатели текста:
- количество символов
- количество символов без пробелов
- количество слов
- количество уникальных слов
- количество значимых слов
- количество стоп-слов
- вода
- количество грамматических ошибок
- классическая тошнота документа
- академическая тошнота документа
Анализатор текста показывает семантическое ядро текста с количеством и частотой запросов, список слов и стоп-слов, а также грамматические ошибки.
Короче, кто писать умеет (не ухмыляйтесь такой скромности, я же не обязательно про себя), тому эти костыли не нужны. Одно пугает. Ведь уже сейчас нередки споры между автором и ВМ об уникальности. НОРМАЛЬНЫЙ ВМ потом извиняется: "Глюк. Перепроверил вручную. Все нормально." А если будет ПО, оценивающее тексты ПОЛНОСТЬЮ - и удобочитаемость, и понятность для определенной аудитории, и остроумие, и тошноту и т.д., и т.п., заказчик (хотя бы из экономии времени) при проверке их вообще читать перестанет! Вот тогда на коне как раз окажутся всякорайтеры, пишущие с помощью программ, специально подогнанных под программы проверяющие... Это уже не то что НЕ ЛИТЕРАТУРА будет, но даже и не копирайт... Вообще названия пока нет. Была раньше шутка, что если 1000 мартышек усадитиь за печатные машинки на 1000 лет, они напишут "Войну и мир". А поскольку ПК уже способен ту же работу выполнить за секунды, мы явно движемся к этой светлой цели... Только не хотелось бы, чтоб внуки вынуждены были ТАКУЮ "Войну и мир" читать...
А что - не помню уже, в каком фантастическом рассказе читала: засыпал,что под руку попало, потряс - получи, фашист, гранату! насыпал ключевиков, протряс в программе - воду выжал, стоп-слова сократил, и - пошла читать губерния! а потом жалобы на мастеров идут, написанные на таком "грамотном" русском, что удивительно, как монитор не краснеет. Лучше курсы русского языка открыли бы, может и программы не были бы так востребованы. А всякорайтеры и так уже на коне. Иногда заказчики просят рерайтить такое,что сами не понимают смысла самими же заказанного когда-то и оплаченного текста. И не надо мне про поисковик,что ему, мол, все равно. Было бы все равно - не просили бы мастера читабельности. А ведь эти исходники - после вашего же плагиатуса и проверочных программ. Лучше бы на наличие смысла проверяли . И мастера бы довольны были, и всякорайтерам бы пришлось или учиться и качественно работать,или уходить и дать спокойно работать другим. Ешкин кот, вчера целый час вдвоем пытались понять, что именно написано в тексте. Конечно, уникальность будет! Китайский текст - русскими буквами и только иногда знакомое, до счастья, слово Nokia.
:) Nokia - смешно:) Но вмешалась не поэтому только. О литературных талантах наслышана, отношусь с почтением. Наш рерайт отношения к литературе художественной не имеет вообще. И, наверное, не должен. Адвего не ставил цель развития русского языка или классической русской речи.Совсем другие цели и у ВМ. Мы пишем с ключевиками некоторым образом "зомбирующие" тексты,а это совсем другая наука. И все эти анализаторы не для того, чтобы нас научить говорить или писать правильно, а чтобы показать, что нужно заказчикам, которые платят. Если развивать и совершенствовать великий и могучий - это в другой очереди. Здесь другие задачи. Не знаю, насколько внятно мне удалось передать свою мысль, но я в последнее время замечаю всё возрастающую агрессию авторов по отношению к ВМ и админам сайта. ВМы, с которыми работаю, мне нравятся.(было два неприятных - из бс ушла сама).Администрация сайта, насколько это видно, всячески пытается нам жизнь упростить. Скажу честно - пока вчера три существительных без изменений в И.п. в текст вложила,думала поседею,но...Если хочется языка и литературы, беру томик Пастернака или Бунина.
Согласна и несогласна с Вами. Конечно, и рерайт и копирайт имеют к литературе весьма и весьма далекое отношение. Не первый раз упоминаю про акробатические этюды, выделываемые райтерами на "сео"-проволоке. Развивать язык - дело вообще невыполнимое, ибо он развивается, не обращая внимание на экспансию жаргона или англицизмов. Он все переживет, подомнет,переделает по-своему. так что всякорайтеры ему не страшны). Но тем не менее, даже самый глупый текст должен быть написан грамотно,хотя бы из уважения к самому себе. Я,как и Вы,терпеть ненавижу писать статьи с ключами, но мне легче,так как я - "вольный стрелок", пишу под заказ и могу отказаться от тех работ,которые мне не нравятся. Я поддерживаю Вас в том, что агрессия к мастерам и админам во многом необоснована, но пенять на зеркало ведь гораздо легче). Приятно встретить поклонника Бунина. Я очень люблю Лескова и,как и Вы, с удовольствием отдыхаю за чтением хорошей литературы. Жаль,только что времени на это мало)
Проверка на наличие смысла? :) Возможно, но ресурсоемко... если не ошибаюсь полноценный семантический анализ текста требует примерно в 1000 раз больше ресурсов чем статистический. Хотя это смертельно в масштабах Яндекса, но не так смертельно в масштабах того же адвего...
Уважаемые Мастера! Не надо проверять остроумие,хотя,конечно, можно развить эту тему до абсурда и представить,как отклоняют текст по бетону,за то,что в нем мал процент остроумия.) Но на наличие смысла проверить - при мысли о таких возможностях, душа начинает петь колоратурным сопраном)). вчера расшифровывала исходник до поного обалдения,в результате ничего не поняла и написала отсебятину. А может в этой невнятице что-то умное было зашифровано, и Сеть потеряла возможность причаститься к гениальным мыслям бедного перерерайченого мною автора? А так бы его еще в исходнике придушили. И мне хорошо - и он бы не мучился)
теоретически можно.... :) строим семантическое дерево... смотрим насколько нам удалось его собрать единым, без отдельных кустов.. раздаем веса узлам графа, исходя из частотности слова/словосочетания.... делаем из графа синтез... хоть какой синтез, пусть и слабочитаемый... синтезированное резюме и его размер дают нам более объективный критерий "воды". Смотрим длину путей между самыми весомыми узлами. Чем они короче, тем текст "связнее". Смотрим насколько веса узлов соизмеримы с законом Зипфа... Слишком "связный" текст спамовит и тавтологичен...слишком несвязный, бессмысленный. Дорвейный текст как правило представляет из себя набор вырванных из контекста слов и фраз, связанных по разумным правилам. Значит будем иметь слишком много "ключевых узлов", вокруг которых будут висеть много узлов "второго уровня" которые очень слабо связанны между собою... Может еще какие эвристики можно придумать... Да только долго это все писать... нужна команда из кодеров. Так что вряд ли это будет реализовано в ближайшее время. По крайней мере я не стану финансировать такую разработку до конца кризиса :)
Ну вот, как всегда - на самом интересном месте.. я теперь умру от любопытства. Поэтому, если можно (мне и так неудобно отнимать у Вас время), что такое закон Зипфа? Остальное я худо-бедно но поняла. Вы доходчиво объясняете).
Небольшое статистическое наблюдение, из которого было сделано множество интересных методик... кратко, но доходчиво об этом можно почитать здесь: [ссылки видны только авторизованным пользователям] Статья не совсем об этом, но во многом про Зипфа... сразу так сказать и теория и практика.
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186