Уважаемые пользователи, представляем вашему вниманию новый сервис: семантический анализ текста.
Анализатор показывает следующие показатели текста:
- количество символов
- количество символов без пробелов
- количество слов
- количество уникальных слов
- количество значимых слов
- количество стоп-слов
- вода
- количество грамматических ошибок
- классическая тошнота документа
- академическая тошнота документа
Анализатор текста показывает семантическое ядро текста с количеством и частотой запросов, список слов и стоп-слов, а также грамматические ошибки.
Обалдеваю! Стоп- слово "и", грамматическая ошибка в слове "чат" и "жлобство". Можно, конечно , вместо "еще" написать "истчо", но как еще можно написать слово "чат"?? Воды в тексте, написанном практически ни о чем,(писала как-то зарисовочку для дамского форума) 24%, хотя, как на мой взгляд, там вообще 80% воды. Нет там информации,это был комплимент форуму. про тошноту - молчу, ее там 2% .Только что это? там 2700 знаов, следовательно 2% - 54 знака, примерно 7 слов. От каких эту хрень тошнит? Ну,"жлобство", я понимаю, а остальные 4 тошнотворных слова? с Плагиатусом еще смешнее. Никогда не пользовалась. Стало любопытно. Сунула туда давно ОПУБЛИКОВАННЫЙ текст. 69% уникальности. Сейчас еще один эксперимент сделаю. Проверю рерайт сказки про репку. что еще умного системка скажет??
Слова "чат" нет в словарях системы, поэтому и неправильно считает :) Для проверки текстов это неважно, ибо оно лишь обращает наше внимание на то или иное слово, а вот при приеме текстов как заказчик.... напрягает когда 80% нормальных работ автомат забраковывает как тексты с ошибками которых нет... ну да об этом я писал администрации... :) Если считаете "жлобство" с "чатом" правильными словами - проверьте их в ворде....
Что же касается уникальности, то думаю проблема в том, что яндекс некоторые запросы игнорирует... типа статья находится в яше по другим запросам, а вот по некоторым присутствующим в тексте запросам не находит... бывает еще, что статья опубликована но не в индексе... ну и по моему опыту 80% статей дешевых котроые писались на заказ для сателитов и были в индексе спустя год уже не находятся... так что если опубликовано не на вашем сайте, то всякое может быть... :)
хоть кто-то объяснил нормально) Мне, по большому счету, все равно. у меня один раз была проблема с уникальностью, да и то, три разных программы исполнили каждая свою песнь. с грамматическими ошибками я борюсь путем вычитывания текста не сразу, а после того,как он хотя бы полчаса "отлежится", то же касается и стилистики. Слова "чат" и "жлобство" из песни, увы! не выкинешь, так как язык их уже воспринял, так что мое мнение ничего уже не изменит. в тот момент,когда я стану доверять "ворду" проверку правописания,а тем более считать его истиной в последней инстанции, я повешусь на мышьем шнуре. Но Ваши объяснения,конечно, очень полезны, я,кстати выясняла,что такое пресловутая "тошнота" на Вашем сайте))
Ну ВОРД не истина в последней инстанции, а лишь метод обратить внимание :) Что касается тошноты, то вы более любознательны чем я.... я все никак не заставлю себя прочитать что такое "академическая" тошонта... ну и перенять у Адвего ее себе :) а то вроде как на первый взгляд она более симпотична :)
Ну просто смотрим, что в документе слишком много различных повторяющихся (тошнотных) фраз (ну, к примеру, если 2 раза появилась фраза, то уже тошнит от нее). Вот и тошнит от всего этого дела :) Ну а там как угодно можно считать. Можно по экспоненте - чем больше фраз, тем сильнее тошнит по экспоненте, можно линейно, можно так, можно сяк... Тут простора много.
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186