Биржа копирайтинга Антиплагиат SEO-анализ текста Скачать Advego Plagiatus Проверка орфографии Транслит онлайн Антикапча
Адвего
Форум
Все форумы
Адвего
Общие вопросы по работе системы

Общие вопросы по работе системы — Форум Адвего

боковая панель
Адвего / Общие вопросы по работе системы
AnnaJas_M
Как определяется вода

Можно узнать, как точно высчитывается процент воды в тексте? Без конкретной инфо, что нужно менять, можно бегать по кругу. Я читала, что это соотношение стоп-слов к общему кол-ву, но только так это не работает.
Один текст на 700 слов с 333 стоп-словами выдает менее 65%, а текст на 1000 слов с 300 словами более 67%. Тексты на английском. Хотелось бы точно знать, что нужно изменить, а не догадываться. Спасибо!

Написала: AnnaJas_M , 21.10.2019 в 10:20
Комментариев: 14
Комментарии
Маргарита (advego)
За  1  /  Против  0
Маргарита (advego)  написала  21.10.2019 в 10:39
Добрый день. Процент воды в Адвего определяется как отношение незначимых слов к общему количеству слов. То есть чем больше в статье значимых слов, тем меньше в итоге «воды».

Чтобы уменьшить процент водности, необходимо почистить текст от широко распространенных фраз и терминов, вставных слов: «в современном мире», «так сказать», «всем известно» и т. п. Попробуйте сократить количество слов "также", "тоже", "что", "который", "для", союзов и слов-связок. Это актуально как для русского, так и для английского текста. Также повышает качество текста употребление специализированных терминов и профессиональной лексики.

                
AnnaJas_M
За  0  /  Против  2
AnnaJas_M  написала  21.10.2019 в 10:56
Спасибо за ответ! Это прекрасно, но, может, можно как-то увидеть эти слова? То, что вы написали, это стоп слова, но как, видно, из примера, процент подсчитывает по разному. Это ведь не живой редактор там сидит, а прога, которая имеет какую-то формулу. Можно, как, например, с уникальностью, понять, что не нравится программе? Уникальность подсвечивает, статистика о значимых и не значимых словах предоставляется, только вот соотношение данных непонятно, как просчитывается.
Вот пример: [ссылки видны только авторизованным пользователям] и [ссылки видны только авторизованным пользователям].
Объясните, пожалуйста, как на основе этих стат. данных получился такой процент. В любом случае, если это программа опирается на конкретные данные, то должен быть конкретный метод определения, как уменьшить воду. Спасибо!

                
KseniyaRusakova
За  1  /  Против  1
KseniyaRusakova  написала  21.10.2019 в 11:16
Чем меньше слов, лишившись которых, текст не теряет смысл, тем меньше воды.
Перечитывайте текст. Если вы понимаете, что без этого слова смысл останется такой же, как и был, то убирайте его. - Вода 89.5 %
Перечитывайте текст. Убирайте слова не влияющие на смысл. - Вода 62.5 %
Смысл один, водность разная. Вам никто не скажет формулу расчета.

                
AnnaJas_M
За  0  /  Против  0
AnnaJas_M  написала  21.10.2019 в 13:17  в ответ на #3
почему не скажет? это секрет или никто не знает?

                
Маргарита (advego)
За  0  /  Против  0
Маргарита (advego)  написала  21.10.2019 в 11:19
Без примера конкретного текста сложно что-либо рекомендовать. Пришлите пример текста в ЛПА https://advego.com/blog/post/feedback/v1/ - посмотрим.

                
AnnaJas_M
За  0  /  Против  0
AnnaJas_M  написала  21.10.2019 в 13:24  в ответ на #4
простите, текст прислать не могу, так как он еще в работе, но речь ведь не о том, чтобы живой редактор смотрел. advego вычисляет процент по формуле, он не сидит и не думает, что вот тут можно бы и сократить, бла-бла-бла. В принципе вода - это соотношение стоп слов к общему кол-ву слов, или я чего-то не поняла? Должна быть конкретная формула. Вот, кстати, еще вопрос по вот этому [ссылки видны только авторизованным пользователям] * 358+325+305=988 слов, а по адвего 1009. Что это еще за слова, которые ни в одну категорию не попадают? Спасибо!

                
Arthur_Petrov
За  2  /  Против  0
Arthur_Petrov  написал  21.10.2019 в 14:07  в ответ на #6
358 - это количество УНИКАЛЬНЫХ слов (как стоп-слов, так и значимых). Т.е. если у вас какое-то слово повторяется дважды, то оно считается единожды. Вы просто не те циферки складываете. Да и количество стоп-слов тоже не фактическое (тут не уверен, просто проверил пару простых предложений, там не все стоп-слова посчитались, хотя это логично - этим объясняется, почему сумма стоп-слов и значимых не равна общему количеству, но количество значимых, судя по всему, фактическое).

Формула: 100 - (значимые слова : общее количество слов * 100) = процент "воды".

Нет смысла четко знать алгоритм. Важно просто понять: хотите снизить процент воды - избавляйтесь от стоп-слов и используйте больше значимых слов. [ссылки видны только авторизованным пользователям] - тут, например, можно узнать, что это такое стоп-слова.

                
AnnaJas_M
За  0  /  Против  0
AnnaJas_M  написала  21.10.2019 в 14:17  в ответ на #7
Спасибо за такое информативное пояснение! Да, с цифорками меня не туда занесло. За формулу спасибо огромное! Идеально не совпадает, но явно помогает. Значимые слова, это все те, что не относятся к стоп, по логике адвего? Спасибо!

                
Евгений (advego)
За  0  /  Против  0
Евгений (advego)  написал  21.07.2020 в 17:37  в ответ на #9
"Значимые слова, это все те, что не относятся к стоп, по логике адвего?" - нет, значимые - это все слова минус стоп-слова и малозначимые.

Кроме стоп-слов по типу "а", "не" существуют слова, которые и не служебные, но имеют очень общий смысл или высокую частотность в языке, вот они и повышают воду в тексте вместе со стоп-словами.

Вам уже правильно написали, что для уменьшения воды стоит использовать более конкретные и узкие термины, если это применимо, точнее, так получится, если вы будете писать на тему, в которой являетесь экспертом, это получится автоматически.

Вывод - если вы взялись за тему, в которой "плаваете", то практически всегда будете сталкиваться с повышенным показателем воды, так как будете использовать более распостраненные слова.

                
Василий (advego)
За  0  /  Против  0
Василий (advego)  написал  21.10.2019 в 14:22  в ответ на #6
Добрый день. Точно так же как и с уникальностью, не нужно пытаться подогнать процент воды в тексте под конкретные показатели, в большинстве случаев это только снижает качество и читабельность текста. Как верно написали выше, точное знание алгоритмов и формул не повысит автоматически качество текста, если он излишне водный.

Даже если методом исключения выбросить пару слов и привести водность текста, допустим, к искомым 60%, если в остальном текст малосодержательный, содержит зашкаливающее количество штампованных оборотов, незначимых и стоп-слов, закачик имеет право счесть такой текст некачественным и отказать в оплате. При этом чисто технически сео-параметры текста могут быть в норме.

Выше даны рекомендации, как снизить водность текста до приемлемых величин. В остальном без примера текста сложно дать какую-либо конкретику.

                
AnnaJas_M
За  0  /  Против  0
AnnaJas_M  написала  21.10.2019 в 14:33  в ответ на #10
спасибо за ответ. только вот, когда имеешь дело с английским, то процент увеличивается из-за необходимых слов для граммы, включая артикли, частицы to и даже глагола to be в разных формах. В том-то и дело, что таких вот водных конструкций в тексте нет. Напрягло то, что в тексте с большим кол-вом стоп-слов водность ниже, чем в тексте большего объема, где их меньше. Формулу нужно давать однозначно с четкой расшифровкой, на что смотреть, потому что не одни копирайтер обливался крокодильими слезами, борясь с ветряными мельницами. Спасибо!

                
VelKond
За  0  /  Против  0
VelKond  написал  21.07.2020 в 16:35  в ответ на #10
Если бы ещё это понимали заказчики)

                
TextMaster13
За  0  /  Против  0
TextMaster13  написал  21.10.2019 в 14:15
"Хотелось бы точно знать, что нужно изменить, а не догадываться" - а вот именно догадываться.

                
lamzenkovaleksandr
За  3  /  Против  1
lamzenkovaleksandr  написал  21.07.2020 в 17:08
Капец. Тут по формулам люди считают. Я просто пишу...

                
Отправка жалобы...
Спасибо, ваша жалоба принята
Вы уже жаловались
Ваша учётная запись заблокирована для участия в форуме.
Жаловаться можно только на чужой комментарий
Избранное
Добавить в избранное
Имя
URL
https://advego.com/blog/read/common/5700420/