Уважаемые пользователи, представляем вашему вниманию новый сервис: семантический анализ текста.
Анализатор показывает следующие показатели текста:
- количество символов
- количество символов без пробелов
- количество слов
- количество уникальных слов
- количество значимых слов
- количество стоп-слов
- вода
- количество грамматических ошибок
- классическая тошнота документа
- академическая тошнота документа
Анализатор текста показывает семантическое ядро текста с количеством и частотой запросов, список слов и стоп-слов, а также грамматические ошибки.
Инструмент прекрасный, сразу видно. Всё очень подробно. Однако может поэтому чего-то недопонимаю... Как узнать плотность ключевиков, требуемую заказчиком? Вот например - "интернет магазин косметики" - количество - 15 - частота % - 3.45 / 10.34 Это и есть плотность ключевиков в процентном отношении? Или нет? А что означает косая черта?
Здорово! Спасибо большое! Но, интересно, что значит фраза/слово: "иза", "длить", "материть", "антитело", - таких слов у меня в статье точно нет, но во вкладке семантическое ядро они присутствуют.
ошибки морфологии :) к примеру опечатка слова "материал" == "материл", которая распознается как "материть", т.е. типа "он ее материл". В оригинальном сервисе с которого этот был слизан тоже есть эта ошибка :)
Под оригинальным сервисом я подразумеваю тот сервис с которого была взята идея, и структура. Глупо утверждать что мол идея разрешения омонимии "пальцем в небо" была вынута обратным инжинерингом и т.п., но также само глупо говорить, что сервис не писался глядя на оригинал, с учетом ошибок и наоброт удачных идей оригинала. Каждый кто видел оригинал видит в усовершенствованном клоне именно то чем он является. :)
)))))))))))))))))))) Спасибо, посмешили)))) Ну а если по сути, то факты остаются фактами, и от того знаете ли вы с кого вы копировали свой сервис или нет ничего не меняется :) Если вам приятнее считать, что за основу брались сотни англо/франко/и прочее-язычных сайтов с различной функциональностью смутно похожей на вашу, а не русскоязычный сервис который где-то на 80% схож с Вашим вариантом, то я в принципе не против. Мало того, могу сказать, что не все "болячки" перешли вам "по наследству", и в среднем Ваш вариант ЛУЧШЕ оригинала. Лично я не вижу ничего плохого в том, что Вы взяли чужие идеи, немного доработали их и воспроизвели у себя. :)
Я знаю ваш сервис, я его видел, я его тестировал. Но мы никак не ориентировались на него, когда делали свой. Единственно сходство, которое я вижу - это слово "тошнота", но ваш сервис к этому слову не имеет отношения.
Я ни вижу ни в вашем ни в нашем сервисе никаких новых идей, все это реализовано в том или ином виде сотни раз. И в онлайне и в оффлайне. (В оффлайне - тысячи раз)
Если вы хотите считать, что за основу взят ваш сервис - можете считать так )
тошнота? :) А почему не водность тогда уже? :) Ладно, завязываем с этим спором. Думаю пользователям он точно не нужен, а мы с Вами все равно останемся при своем мнении. В любом случае сервис хорош, и желаю Вам его развивать и поддерживать.
Не знаю что значит очень умное слово "Лемматизатор", которое наверное сказано с целью ввести в заблуждение столь же неосведомленных в терминологии, как и я... Но очевидно, что Mendel имел в виду тот сервис, откуда вы *программисты и администрация Адвего* взяли идеи проверки семантического анализа текста.
Mendel, что-то ничего не поняла, опечатки в системе или где? :). Статья была про герпес и беременность)))) за "ошибки" были приняты слова "Зовиракс", "рецидивирующим", откуда взялись "длить", "материть", "антитело", "иза" - я так и не поняла, можно предположить: "длить" от "продлить", "материть" - может быть, это "от матери к ребенку"?? не знаю
Сервис очень полезный, большое спасибо! Единственная просьба, если возможно - разместить русский язык в таблице языков первым, а не в алфавитном порядке (или добавить его второй раз в начало) и второе - сделать так, чтобы при переходе от проверки орфографии к семантическому анализу текста уже размещенный текст не исчезал из формы. Это заметно облегчило бы проверку, особенно когда неоднократно редактируешь текст для правильного количества ключей или иного показателя. А так - все очень замечательно, еще раз спасибо!
А можно сделать так что бы по дефолту сразу предлагался русский язык? А то он в самой середине, и мотать долго. Предлагаю расположить сверху - Русский, Украинский, как самые часто используемые
Бедный, бедный Пушкин. Его стихотворение "Бесы" получило следующую оценку программы:
Вода 43.1 % Количество грамматических ошибок 3 Классическая тошнота документа 2.65 Академическая тошнота документа 10.2 %
А вот Толстой со своей "Войной и миром" (разговор Пьера и Андрея в Лысых горах о смысле жизни): Вода 21.1 % Количество грамматических ошибок 7 Классическая тошнота документа 5.00 Академическая тошнота документа 9.8 %
Таким образом, Пушкин тошнее академически, а Толстой - классически.:)) И все, все пишут с грамматическими ошибками (с точки зрения программы)! :)))))))))))
у меня есть еще вопрос, а не планируется ли стоп-слова (сорняки), как, например, вот, который, наверное и т.д. каким-нибудь цветом выделять или подчеркивать? Это я спрашиваю из любви к искусству :)
Пардоньте, это Вы все союзы и предлоги сорняками называете?! А сорняки, как я понимаю, нужно беспощадно искоренять? Иначе зачем же их "цветом выделять или подчеркивать". По этой логике от фразы "Вот Карлсон, который наверное живёт на крыше." останется лишь "Карлсон наверное крыше.", а это абсурд, поскольку вдруг кто-то другой окажется "крыше" Карлсона. :)
Обалдеваю! Стоп- слово "и", грамматическая ошибка в слове "чат" и "жлобство". Можно, конечно , вместо "еще" написать "истчо", но как еще можно написать слово "чат"?? Воды в тексте, написанном практически ни о чем,(писала как-то зарисовочку для дамского форума) 24%, хотя, как на мой взгляд, там вообще 80% воды. Нет там информации,это был комплимент форуму. про тошноту - молчу, ее там 2% .Только что это? там 2700 знаов, следовательно 2% - 54 знака, примерно 7 слов. От каких эту хрень тошнит? Ну,"жлобство", я понимаю, а остальные 4 тошнотворных слова? с Плагиатусом еще смешнее. Никогда не пользовалась. Стало любопытно. Сунула туда давно ОПУБЛИКОВАННЫЙ текст. 69% уникальности. Сейчас еще один эксперимент сделаю. Проверю рерайт сказки про репку. что еще умного системка скажет??
Слова "чат" нет в словарях системы, поэтому и неправильно считает :) Для проверки текстов это неважно, ибо оно лишь обращает наше внимание на то или иное слово, а вот при приеме текстов как заказчик.... напрягает когда 80% нормальных работ автомат забраковывает как тексты с ошибками которых нет... ну да об этом я писал администрации... :) Если считаете "жлобство" с "чатом" правильными словами - проверьте их в ворде....
Что же касается уникальности, то думаю проблема в том, что яндекс некоторые запросы игнорирует... типа статья находится в яше по другим запросам, а вот по некоторым присутствующим в тексте запросам не находит... бывает еще, что статья опубликована но не в индексе... ну и по моему опыту 80% статей дешевых котроые писались на заказ для сателитов и были в индексе спустя год уже не находятся... так что если опубликовано не на вашем сайте, то всякое может быть... :)
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186