Уважаемые пользователи, представляем вашему вниманию новый сервис: семантический анализ текста.
Анализатор показывает следующие показатели текста:
- количество символов
- количество символов без пробелов
- количество слов
- количество уникальных слов
- количество значимых слов
- количество стоп-слов
- вода
- количество грамматических ошибок
- классическая тошнота документа
- академическая тошнота документа
Анализатор текста показывает семантическое ядро текста с количеством и частотой запросов, список слов и стоп-слов, а также грамматические ошибки.
Классическая тошнота - квадратный корень из количества повторений самого тошнотного слова. Если количество меньше 7-ми, то корень из 7-ми. Академическая тошнота - тошнота документа с учетом тошнотности всех тошнотных фраз.
Академическая тошнота - неким образом показывает натуральность документа. Если в документе много различных повторяющихся слов, то академическая тошнота большая.
Здравствуйте! Администрация сервиса как всегда по уровню заботы по отношению к пользователям сервиса на высоте, спасибо!
Уважаемый, Сергей (advego), у меня небольшая просьба, по возможности Вы или Ваши коллеги сообшите в этой теме следующие данные:
1) К каким средним цифрам желательно стремиться по показателю - "вода" : до 10%, до 30% или до 50%, а может и более или , наоборот, менее? 2) То же самое по показателям "классическая тошнота" и "академичечская тошнота" ?
Пример (с моей точки зрения текст в этом примере вполне на должном уровне и "плагиатус" даёт 100% уникальности)
Я проверил "технический" текст в 5000 знаков без пробелов с помощью вашего нового сервиса, получилось:
- вода 41,7% (я понимаю, что меньше сделать не возможно, так как по условиям заказа обязан писать строго на определённую тему и включать необходимое количество "ключевиков", а поймёт ли это заказчик?)
Они же (WM-мы) у нас здесь разные: есть вполне нормальные которые поймут, что при подобной "водности" текст читается очень даже не надоедливо и легко, при меньшей сухо, а 0% водности - это простое перечисление через запятую каких то неповторяющихся данных. А другой заказчик (скажем так - "капризный WM") вспылит: "... да этот "Автор", мне "воду льёт..." и т.д.;
- классическая тошнота 6, 08%;
- академическая тошнота 9,1%.
К орфографическим ошибкам сервис отнёс абревиатуру "МДФ" и слово "шпонированный" (подсказывает замену на "лакированный", что есть не совсем правильно). Все остальные показатели вполне понятны и находятся в норме.
Если кратко, то желательно "показать" к каким средним цифровым показателям должен стремиться "Автор" по доработке своих статей с использованием вашего нового и очень полезного дополнения к "Advego".
Ещё раз спасибо и всего доброго. Коллегам творческих удач.
спасибо большое, дорогим Админам!!! Очень удобный сервис! подсчет слов-отличненько работает. единственный минус-все падежи одного слова считает отдельно. неплохо было бы и вместе подсчитать(иногда ключевики разрешается склонять). присоединюсь к вопросу в посте 11.
Всё это ужасно интересно. Только вот мне кажется, что оптимизаторы разрабатывают различные методы, просчитывают необходимые показатели, мы пишем специально оптимизированные тексты, а поисковики всё равно следуют какой-то своей, непонятной нам логике. Ну, смотрите... Все оптимизаторы заказывают тексты с разными параметрами: кто-то требует плотность ключевиков 5-7%, кто-то вообще плотность не считает, а требует ввести каждый ключевик определённое количество раз независимо от количества символов в тексте, причём, у кого-то это 2-3 раза, а у кого-то аж 10. И я полагаю, что все они добиваются результата с такими противоречивыми требованиями. Ну вот пример из жизни. Есть у меня заказчик, который ведёт несколько проектов, для которых я пишу тексты. Так вот все сайты у него успешно продвигаются, а один застрял на тридцать какой-то позиции и ни с места. В конце концов, он просит меня написать текст, в который надо напихать ключевик под завязку. Благо, ключевик там приятный, поэтому я без особого ущерба для читабельности сделала там... больше 15% плотность. Даже сама испугалась :))) Я честно говоря, думала, что такое поисковик уж точно посчитает поисковым спамом, ан нет. По этому запросу сайт быстренько попал в десятку. Я, конечно, не отношу себя к оптимизаторам, но мне было интересно посмотреть, как же это всё работает, и я создала блог. Тексты, размещаемые там, я пишу вообще совершенно с разными показателями, вообще-то без всякой системы. Но через месяц блог поселился на второй позиции в региональной выдаче Гугла и так там и живёт уже месяц почти, время от времени перемещаясь то на первую позицию, то на третью. В Яндексе блог тоже по ключевому запросу в сотне. Да и запрос никак не низкочастотный. Вот не вижу я вообще никаких закономерностей в работе поисковиков. А, причём, Гугл начал индексировать страницы уже через несколько дней, Яндекс раскачивался недели две. Рамблер меня вообще игнорирует до сих пор. Я ничего не понимаю, хотя написала уже кучу статей с умным видом на тему оптимизации :))))))) О Боже! Это ж ещё одна статья получилась нечаянно :))))))))))!
5-7% - это нормальная плотность ключевых слов, для статьи на своём сайте. 2-3 ключевика на статью, это когда статья пишется для статейного продвижения, и устанавливается на другом сайте с интерактивными ключевыми ссылками на свой сайт. С Яндексом, просто повезло. Бывает, что не индексирует до 4 месяцев. А Рамблер и будет игнорировать, потому, что у блога домен в *.com зоне. Он считает эту зону буржуйской, и без письма в администрацию с просьбой принять сайт к индексации, выдавать его не будет :)
Инструмент прекрасный, сразу видно. Всё очень подробно. Однако может поэтому чего-то недопонимаю... Как узнать плотность ключевиков, требуемую заказчиком? Вот например - "интернет магазин косметики" - количество - 15 - частота % - 3.45 / 10.34 Это и есть плотность ключевиков в процентном отношении? Или нет? А что означает косая черта?
Здорово! Спасибо большое! Но, интересно, что значит фраза/слово: "иза", "длить", "материть", "антитело", - таких слов у меня в статье точно нет, но во вкладке семантическое ядро они присутствуют.
ошибки морфологии :) к примеру опечатка слова "материал" == "материл", которая распознается как "материть", т.е. типа "он ее материл". В оригинальном сервисе с которого этот был слизан тоже есть эта ошибка :)
Под оригинальным сервисом я подразумеваю тот сервис с которого была взята идея, и структура. Глупо утверждать что мол идея разрешения омонимии "пальцем в небо" была вынута обратным инжинерингом и т.п., но также само глупо говорить, что сервис не писался глядя на оригинал, с учетом ошибок и наоброт удачных идей оригинала. Каждый кто видел оригинал видит в усовершенствованном клоне именно то чем он является. :)
)))))))))))))))))))) Спасибо, посмешили)))) Ну а если по сути, то факты остаются фактами, и от того знаете ли вы с кого вы копировали свой сервис или нет ничего не меняется :) Если вам приятнее считать, что за основу брались сотни англо/франко/и прочее-язычных сайтов с различной функциональностью смутно похожей на вашу, а не русскоязычный сервис который где-то на 80% схож с Вашим вариантом, то я в принципе не против. Мало того, могу сказать, что не все "болячки" перешли вам "по наследству", и в среднем Ваш вариант ЛУЧШЕ оригинала. Лично я не вижу ничего плохого в том, что Вы взяли чужие идеи, немного доработали их и воспроизвели у себя. :)
Я знаю ваш сервис, я его видел, я его тестировал. Но мы никак не ориентировались на него, когда делали свой. Единственно сходство, которое я вижу - это слово "тошнота", но ваш сервис к этому слову не имеет отношения.
Я ни вижу ни в вашем ни в нашем сервисе никаких новых идей, все это реализовано в том или ином виде сотни раз. И в онлайне и в оффлайне. (В оффлайне - тысячи раз)
Если вы хотите считать, что за основу взят ваш сервис - можете считать так )
тошнота? :) А почему не водность тогда уже? :) Ладно, завязываем с этим спором. Думаю пользователям он точно не нужен, а мы с Вами все равно останемся при своем мнении. В любом случае сервис хорош, и желаю Вам его развивать и поддерживать.
Не знаю что значит очень умное слово "Лемматизатор", которое наверное сказано с целью ввести в заблуждение столь же неосведомленных в терминологии, как и я... Но очевидно, что Mendel имел в виду тот сервис, откуда вы *программисты и администрация Адвего* взяли идеи проверки семантического анализа текста.
Mendel, что-то ничего не поняла, опечатки в системе или где? :). Статья была про герпес и беременность)))) за "ошибки" были приняты слова "Зовиракс", "рецидивирующим", откуда взялись "длить", "материть", "антитело", "иза" - я так и не поняла, можно предположить: "длить" от "продлить", "материть" - может быть, это "от матери к ребенку"?? не знаю
Сервис очень полезный, большое спасибо! Единственная просьба, если возможно - разместить русский язык в таблице языков первым, а не в алфавитном порядке (или добавить его второй раз в начало) и второе - сделать так, чтобы при переходе от проверки орфографии к семантическому анализу текста уже размещенный текст не исчезал из формы. Это заметно облегчило бы проверку, особенно когда неоднократно редактируешь текст для правильного количества ключей или иного показателя. А так - все очень замечательно, еще раз спасибо!
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186