Уважаемые пользователи, представляем вашему вниманию новый сервис: семантический анализ текста.
Анализатор показывает следующие показатели текста:
- количество символов
- количество символов без пробелов
- количество слов
- количество уникальных слов
- количество значимых слов
- количество стоп-слов
- вода
- количество грамматических ошибок
- классическая тошнота документа
- академическая тошнота документа
Анализатор текста показывает семантическое ядро текста с количеством и частотой запросов, список слов и стоп-слов, а также грамматические ошибки.
А можно сделать так что бы по дефолту сразу предлагался русский язык? А то он в самой середине, и мотать долго. Предлагаю расположить сверху - Русский, Украинский, как самые часто используемые
))))) читайте обсуждение. Он и так по умолчанию. 2Сергей, сделайте чтобы вместо "Выберите язык" писалось "Русский" как того и требуют принципы эргономики. ;)
Бедный, бедный Пушкин. Его стихотворение "Бесы" получило следующую оценку программы:
Вода 43.1 % Количество грамматических ошибок 3 Классическая тошнота документа 2.65 Академическая тошнота документа 10.2 %
А вот Толстой со своей "Войной и миром" (разговор Пьера и Андрея в Лысых горах о смысле жизни): Вода 21.1 % Количество грамматических ошибок 7 Классическая тошнота документа 5.00 Академическая тошнота документа 9.8 %
Таким образом, Пушкин тошнее академически, а Толстой - классически.:)) И все, все пишут с грамматическими ошибками (с точки зрения программы)! :)))))))))))
у меня есть еще вопрос, а не планируется ли стоп-слова (сорняки), как, например, вот, который, наверное и т.д. каким-нибудь цветом выделять или подчеркивать? Это я спрашиваю из любви к искусству :)
Пардоньте, это Вы все союзы и предлоги сорняками называете?! А сорняки, как я понимаю, нужно беспощадно искоренять? Иначе зачем же их "цветом выделять или подчеркивать". По этой логике от фразы "Вот Карлсон, который наверное живёт на крыше." останется лишь "Карлсон наверное крыше.", а это абсурд, поскольку вдруг кто-то другой окажется "крыше" Карлсона. :)
С приведённым аргументом не спорю, тем более, мне эта штуковина очень понравилась самому. Считаю её полезной (правда, более для заказчиков) и занимательной (для авторов). Просто, я не могу понять, как можно уменьшить или удалить "(сорняки), как, например, вот, который, наверное и т.д." (цитата), если это предлоги и союзы. Ну иначе, зачем человеку хочется, чтобы их выделяли?
Я после того как у себя стал выделять водность и стопслова, стал автоматом сокращать количество "сорняков" когда пишу более-менее важные письма или тексты... За редкими исключениями в компреде фраза "Предлагаем услуги по хххх" или даже "предлагаем услуги ххх" будет лучше чем "Мы предлагаем вам самое лучшее качество услуг направленных на выполнение ххх". Человек может и не дочитать до конца :)
Обалдеваю! Стоп- слово "и", грамматическая ошибка в слове "чат" и "жлобство". Можно, конечно , вместо "еще" написать "истчо", но как еще можно написать слово "чат"?? Воды в тексте, написанном практически ни о чем,(писала как-то зарисовочку для дамского форума) 24%, хотя, как на мой взгляд, там вообще 80% воды. Нет там информации,это был комплимент форуму. про тошноту - молчу, ее там 2% .Только что это? там 2700 знаов, следовательно 2% - 54 знака, примерно 7 слов. От каких эту хрень тошнит? Ну,"жлобство", я понимаю, а остальные 4 тошнотворных слова? с Плагиатусом еще смешнее. Никогда не пользовалась. Стало любопытно. Сунула туда давно ОПУБЛИКОВАННЫЙ текст. 69% уникальности. Сейчас еще один эксперимент сделаю. Проверю рерайт сказки про репку. что еще умного системка скажет??
Слова "чат" нет в словарях системы, поэтому и неправильно считает :) Для проверки текстов это неважно, ибо оно лишь обращает наше внимание на то или иное слово, а вот при приеме текстов как заказчик.... напрягает когда 80% нормальных работ автомат забраковывает как тексты с ошибками которых нет... ну да об этом я писал администрации... :) Если считаете "жлобство" с "чатом" правильными словами - проверьте их в ворде....
Что же касается уникальности, то думаю проблема в том, что яндекс некоторые запросы игнорирует... типа статья находится в яше по другим запросам, а вот по некоторым присутствующим в тексте запросам не находит... бывает еще, что статья опубликована но не в индексе... ну и по моему опыту 80% статей дешевых котроые писались на заказ для сателитов и были в индексе спустя год уже не находятся... так что если опубликовано не на вашем сайте, то всякое может быть... :)
хоть кто-то объяснил нормально) Мне, по большому счету, все равно. у меня один раз была проблема с уникальностью, да и то, три разных программы исполнили каждая свою песнь. с грамматическими ошибками я борюсь путем вычитывания текста не сразу, а после того,как он хотя бы полчаса "отлежится", то же касается и стилистики. Слова "чат" и "жлобство" из песни, увы! не выкинешь, так как язык их уже воспринял, так что мое мнение ничего уже не изменит. в тот момент,когда я стану доверять "ворду" проверку правописания,а тем более считать его истиной в последней инстанции, я повешусь на мышьем шнуре. Но Ваши объяснения,конечно, очень полезны, я,кстати выясняла,что такое пресловутая "тошнота" на Вашем сайте))
Ну ВОРД не истина в последней инстанции, а лишь метод обратить внимание :) Что касается тошноты, то вы более любознательны чем я.... я все никак не заставлю себя прочитать что такое "академическая" тошонта... ну и перенять у Адвего ее себе :) а то вроде как на первый взгляд она более симпотична :)
Ну просто смотрим, что в документе слишком много различных повторяющихся (тошнотных) фраз (ну, к примеру, если 2 раза появилась фраза, то уже тошнит от нее). Вот и тошнит от всего этого дела :) Ну а там как угодно можно считать. Можно по экспоненте - чем больше фраз, тем сильнее тошнит по экспоненте, можно линейно, можно так, можно сяк... Тут простора много.
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186