Семантический анализ текста онлайн - каковы параметры хорошей сатьи?
Вот к примеру анализ куска одной статьи. Что можно сказать о её качестве?
Количество символов 1806
Количество символов без пробелов 1561
Количество слов 243
Количество уникальных слов 176
Количество значимых слов 75
Количество стоп-слов 86
Вода 30.9 %
Количество грамматических ошибок 4
Классическая тошнота документа 1.73
Академическая тошнота документа 6.2 %
Дам подсказку: если я Вам скажу, что у моей машины 200 лошадиных сил и красный кузов, Вы сможете сказать, хорошая она или нет, если не увидите ее саму?
Меня тоже интересует этот вопрос, может кто-нибудь растолкует поподробнее, что такое "тошнота документа" и "Вода " и в каких пределах должны быть эти показатели?
Как я понимаю, тошнота высчитывается по повторяемости однокоренных слов. Понятно, чем их меньше, тем и показатель тошнотности будет меньше, и соответственно текст будет красивее. Могу ошибаться но "классическая т" - до 3, а "академическая т" - до 7 - считаются нормой. Вода - это то, что при анализатор посчитал несущественным, излишним в тексте, не относящемуся к словарному ядру текста. Совсем без воды обойтись, но в пределах 30 % - это нормально. Хотя всё зависит от самого текста, его стиля и предназначения.
В принципе Вам эти дебри не нужны :) не заморачивайтесь - просто пишите красивые и грамотные статьи, и _главное_ уникальные. Это важнее для ВМ. Если же всё-таки интересно - спросите у Гугла или Яндекса.
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186