Уважаемые пользователи, представляем вашему вниманию новый сервис: семантический анализ текста.
Анализатор показывает следующие показатели текста:
- количество символов
- количество символов без пробелов
- количество слов
- количество уникальных слов
- количество значимых слов
- количество стоп-слов
- вода
- количество грамматических ошибок
- классическая тошнота документа
- академическая тошнота документа
Анализатор текста показывает семантическое ядро текста с количеством и частотой запросов, список слов и стоп-слов, а также грамматические ошибки.
Здравствуйте! Администрация сервиса как всегда по уровню заботы по отношению к пользователям сервиса на высоте, спасибо!
Уважаемый, Сергей (advego), у меня небольшая просьба, по возможности Вы или Ваши коллеги сообшите в этой теме следующие данные:
1) К каким средним цифрам желательно стремиться по показателю - "вода" : до 10%, до 30% или до 50%, а может и более или , наоборот, менее? 2) То же самое по показателям "классическая тошнота" и "академичечская тошнота" ?
Пример (с моей точки зрения текст в этом примере вполне на должном уровне и "плагиатус" даёт 100% уникальности)
Я проверил "технический" текст в 5000 знаков без пробелов с помощью вашего нового сервиса, получилось:
- вода 41,7% (я понимаю, что меньше сделать не возможно, так как по условиям заказа обязан писать строго на определённую тему и включать необходимое количество "ключевиков", а поймёт ли это заказчик?)
Они же (WM-мы) у нас здесь разные: есть вполне нормальные которые поймут, что при подобной "водности" текст читается очень даже не надоедливо и легко, при меньшей сухо, а 0% водности - это простое перечисление через запятую каких то неповторяющихся данных. А другой заказчик (скажем так - "капризный WM") вспылит: "... да этот "Автор", мне "воду льёт..." и т.д.;
- классическая тошнота 6, 08%;
- академическая тошнота 9,1%.
К орфографическим ошибкам сервис отнёс абревиатуру "МДФ" и слово "шпонированный" (подсказывает замену на "лакированный", что есть не совсем правильно). Все остальные показатели вполне понятны и находятся в норме.
Если кратко, то желательно "показать" к каким средним цифровым показателям должен стремиться "Автор" по доработке своих статей с использованием вашего нового и очень полезного дополнения к "Advego".
Ещё раз спасибо и всего доброго. Коллегам творческих удач.
Спасибо Вам, Сергей! Очень востребованный инструмент будет.Но a5, поддерживаю во всех пунктах! По незнанию, от двух видов тошноты и энного количества воды не по себе как-то...
спасибо большое, дорогим Админам!!! Очень удобный сервис! подсчет слов-отличненько работает. единственный минус-все падежи одного слова считает отдельно. неплохо было бы и вместе подсчитать(иногда ключевики разрешается склонять). присоединюсь к вопросу в посте 11.
О, Боже и тут спам! :)) Благодарю за полезный сервис. Программка нашла пару опечаток, в отличие от Word-а, который посчитал это нормальными словами. Хотелось бы знать о приемлемых параметрах текста: проценте воды, тошнотворностей и прочих показателей. Спасибо.
[ссылки видны только авторизованным пользователям] - самый лучший, на мой взгляд, топик о "тошноте". Там есть неявные ответы уважаемых людей, на основе которых можно составить достаточно четкую картинку о "тошноте".
Всё это ужасно интересно. Только вот мне кажется, что оптимизаторы разрабатывают различные методы, просчитывают необходимые показатели, мы пишем специально оптимизированные тексты, а поисковики всё равно следуют какой-то своей, непонятной нам логике. Ну, смотрите... Все оптимизаторы заказывают тексты с разными параметрами: кто-то требует плотность ключевиков 5-7%, кто-то вообще плотность не считает, а требует ввести каждый ключевик определённое количество раз независимо от количества символов в тексте, причём, у кого-то это 2-3 раза, а у кого-то аж 10. И я полагаю, что все они добиваются результата с такими противоречивыми требованиями. Ну вот пример из жизни. Есть у меня заказчик, который ведёт несколько проектов, для которых я пишу тексты. Так вот все сайты у него успешно продвигаются, а один застрял на тридцать какой-то позиции и ни с места. В конце концов, он просит меня написать текст, в который надо напихать ключевик под завязку. Благо, ключевик там приятный, поэтому я без особого ущерба для читабельности сделала там... больше 15% плотность. Даже сама испугалась :))) Я честно говоря, думала, что такое поисковик уж точно посчитает поисковым спамом, ан нет. По этому запросу сайт быстренько попал в десятку. Я, конечно, не отношу себя к оптимизаторам, но мне было интересно посмотреть, как же это всё работает, и я создала блог. Тексты, размещаемые там, я пишу вообще совершенно с разными показателями, вообще-то без всякой системы. Но через месяц блог поселился на второй позиции в региональной выдаче Гугла и так там и живёт уже месяц почти, время от времени перемещаясь то на первую позицию, то на третью. В Яндексе блог тоже по ключевому запросу в сотне. Да и запрос никак не низкочастотный. Вот не вижу я вообще никаких закономерностей в работе поисковиков. А, причём, Гугл начал индексировать страницы уже через несколько дней, Яндекс раскачивался недели две. Рамблер меня вообще игнорирует до сих пор. Я ничего не понимаю, хотя написала уже кучу статей с умным видом на тему оптимизации :))))))) О Боже! Это ж ещё одна статья получилась нечаянно :))))))))))!
5-7% - это нормальная плотность ключевых слов, для статьи на своём сайте. 2-3 ключевика на статью, это когда статья пишется для статейного продвижения, и устанавливается на другом сайте с интерактивными ключевыми ссылками на свой сайт. С Яндексом, просто повезло. Бывает, что не индексирует до 4 месяцев. А Рамблер и будет игнорировать, потому, что у блога домен в *.com зоне. Он считает эту зону буржуйской, и без письма в администрацию с просьбой принять сайт к индексации, выдавать его не будет :)
Я уже скоро совсем разленюсь. Орфографию проверяют, тошноту считают... Еще бы пунктуацию конролировали - и все, можно по клаве бить, не сильно заботясь о правилах, есть программа - она поправит. :) Спасибо, действительно очень интересные и полезные нововведения пошли на Адвего. Взрослеем, однако! :)
Инструмент прекрасный, сразу видно. Всё очень подробно. Однако может поэтому чего-то недопонимаю... Как узнать плотность ключевиков, требуемую заказчиком? Вот например - "интернет магазин косметики" - количество - 15 - частота % - 3.45 / 10.34 Это и есть плотность ключевиков в процентном отношении? Или нет? А что означает косая черта?
Я думаю, что частота % - 3,4 , но поскольку слов в ключевике 3, то процент - 10,34. Скорее всего, заказчика интересует второй вариант. Но нужно уточнять
Здорово! Спасибо большое! Но, интересно, что значит фраза/слово: "иза", "длить", "материть", "антитело", - таких слов у меня в статье точно нет, но во вкладке семантическое ядро они присутствуют.
Сервис очень полезный, большое спасибо! Единственная просьба, если возможно - разместить русский язык в таблице языков первым, а не в алфавитном порядке (или добавить его второй раз в начало) и второе - сделать так, чтобы при переходе от проверки орфографии к семантическому анализу текста уже размещенный текст не исчезал из формы. Это заметно облегчило бы проверку, особенно когда неоднократно редактируешь текст для правильного количества ключей или иного показателя. А так - все очень замечательно, еще раз спасибо!
упс.... не прочитал меленьким-сереньким надпись. :) таки русский а не автовыбор. Но вообще по эргономики надо в селекте прописать дефолт русский а не так как сделано.
А можно сделать так что бы по дефолту сразу предлагался русский язык? А то он в самой середине, и мотать долго. Предлагаю расположить сверху - Русский, Украинский, как самые часто используемые
))))) читайте обсуждение. Он и так по умолчанию. 2Сергей, сделайте чтобы вместо "Выберите язык" писалось "Русский" как того и требуют принципы эргономики. ;)
Бедный, бедный Пушкин. Его стихотворение "Бесы" получило следующую оценку программы:
Вода 43.1 % Количество грамматических ошибок 3 Классическая тошнота документа 2.65 Академическая тошнота документа 10.2 %
А вот Толстой со своей "Войной и миром" (разговор Пьера и Андрея в Лысых горах о смысле жизни): Вода 21.1 % Количество грамматических ошибок 7 Классическая тошнота документа 5.00 Академическая тошнота документа 9.8 %
Таким образом, Пушкин тошнее академически, а Толстой - классически.:)) И все, все пишут с грамматическими ошибками (с точки зрения программы)! :)))))))))))
у меня есть еще вопрос, а не планируется ли стоп-слова (сорняки), как, например, вот, который, наверное и т.д. каким-нибудь цветом выделять или подчеркивать? Это я спрашиваю из любви к искусству :)
Обалдеваю! Стоп- слово "и", грамматическая ошибка в слове "чат" и "жлобство". Можно, конечно , вместо "еще" написать "истчо", но как еще можно написать слово "чат"?? Воды в тексте, написанном практически ни о чем,(писала как-то зарисовочку для дамского форума) 24%, хотя, как на мой взгляд, там вообще 80% воды. Нет там информации,это был комплимент форуму. про тошноту - молчу, ее там 2% .Только что это? там 2700 знаов, следовательно 2% - 54 знака, примерно 7 слов. От каких эту хрень тошнит? Ну,"жлобство", я понимаю, а остальные 4 тошнотворных слова? с Плагиатусом еще смешнее. Никогда не пользовалась. Стало любопытно. Сунула туда давно ОПУБЛИКОВАННЫЙ текст. 69% уникальности. Сейчас еще один эксперимент сделаю. Проверю рерайт сказки про репку. что еще умного системка скажет??
одни нестарые, но интересные времена, в одной затерянной вологодской деревеньке, в избушке-развалюшке жил-был дедко.Да не один, а с бабкой, Дашуткой-внучкой, собачкой Жучкой, кошкой Муськой и целой оравой мышей в подполье. Жили они дружно, но голодно. У мышей в подполе в животах марш играл, Муська на них, костлявых давно лапой махнула, Жучка пропитывалась, чем придется, да и внучка с бабкой и дедком на голодном пайке сидели. Дедко, конечно, в собес ходил, насчет прибавки к пенсии хлопотал, но там ему про какой-то страшный "крызис" разъобъяснили. Вот с тем он, несолоно хлебавши, и вернулся. А тут еще знахарка из соседней деревни масла-то в огонь подлила. - Тут, говорит,- такая диспозиция: аль опять супостат на нас войной пойдет, аль снова все смирно, как при батюшке Царе Горохе, будет. В общем, надвое сказала. Призадумался дедко. Но, однако, надумал. Вскопал он грядку, да посадил репу, а бабку с внучкой припахал полоть-поливать. Скоро сказка сказывается, а репа еще спорее растет. Вот и выросла она большая-пребольшая. Надо урожай собирать. Пошел дедко на грядку, ухватил репку. Тянет-потянет, а вытянуть не может. Ну, тащил он эту репку, тащил, гряду истоптал, полпачки "Примы" искурил, а толку - ноль. Бабка-то сначала советы полезные давала, потом кругами запохаживала, да тоже взялась вместе с дедкой за эту репку. Тянут-потянут, ан нет, фиг вам, а не корнеплод! Стали они внучку Дашутку звать на помощь. Теперь уж втроем тянут репку. Результат тот же: око видит, а зуб неймет. Дедко матерится, бабка блажит, внучка визжит - ну, прям, кошмар и истинное светопреставление. Жучке это дело сразу понравилось, отродясь в такие веселые игры никто не играл. Ну и решила поучаствовать. Ухватила Дашутку-внучку за подол давай тянуть. Тянут-потянут... (смотри выше) Тут и Муська, что на солнышке грелась, решила присоединиться, тем более что у главной ее врагини зубы-то заняты. Да и под такое благое дело можно будет хоть в хвост Жучкин побольнее вцепиться. Вот они всем коллективом и тянут репку. А репке хоть бы хны, как сидела в гряде, так и сидит сиднем. А тут мышь брела по своим мышачим делам. Как увидела эту катавасию, чуть со смеху животики не надорвала, ладно, бдительность не потеряла. Как увидела Муська мышку, так в ней тигр голодный и проснулся. Изо всех своих сил рванулась она к добыче. А в зубах- то Жучкин хвост! Дернулась отчаянно Жучка, оступилась и шлепнулась на нее внучка и потащила за собой бабку. В общем: внучка - на Жучку, бабка - на внучку, дедко на бабку, а репка - на дедку. И репка-то и впрямь большая-пребольшая.
оличество стоп-слов 156 Вода 39.5 % Количество грамматических ошибок 17 Классическая тошнота документа 2.65 Академическая тошнота документа 7.1 %
озможно, ошибки в словах: Дедко, Жучкин, Жучкой, Муська, Муськой, блажит, дедко, дедкой, дедком, дедку, крызис, мышачим, полпачки, припахал, разъобъяснили, спорее, хлебавши У меня началась классическая тошнота. для чего сесь сыр-бор? И как, простите, писать слова,которорые имеются в словаре Даля "блажит", "споро", "хлебать"? Почему в этой бессмыслице всего 40% воды? чем не угодили "Муська" с "Жучкой"? как обойтись без служебных слов? Так что - не жили хорошо,неча и начинать. И пусть семантический анализ меня поправит)
И я там был, самогонку пил и пареной репой закусывал.
И всё же, пожалуйста, дайте по каждому пункту, где указаны проценты, какая должна быть общепринятая норма. Мне надо знать к каким показателям стремиться. Заранее благодарю за ответ.
Возьмите запрос "пластиковые окна", введите его в яндексе, откройте сайт из топ-10, возьмите текст с сайта и сделайте анализ этого текста. Вы получите "общепринятую норму" по запросу "пластиковые окна". Для яндекса. Для вашего региона.
Не находите, что это симптоматично? Может, Вам и "семантика языка интересна сама по себе", но всякорайтерам, как видите, после проги, выдающей некие параметры текста, сразу нужно и точные значения этих параметров - стремиться к "совершенству"! Проще это, чем прочитать томик Пушкина и Унитазова Сортир-Сортирыча. И сравнить. И поразмыслить... К чему такие напряги? Ведь чукча - не читатель, чукча - писатель...
да нет идеала, ну почему вы спорите? :) идеал меняется в зависимости от задачи. Как заказчик скажет, мол ему надо тошноту в пределах 5-7, так вы и считайте его идеалом :) НЧ, ВЧ, СЧ, статья под ссылки, под траф... размер "облака" кеев, колво "облак" в статье... да мало ли еще каких критериев может быть которые влияют на "идеал" :)
А я вот и Плагиатус еще не пробовал. И сие нововведение не собираюсь.:) И без них можно писать уникально, читабельно, грамотно, интересно. Без воды, тошноты и т.п. А за тексты, где требуется 10% ключевика "сайдинг доставка Москва купить" в точном вхождении, просто не берусь... Короче, 100% согласен с Черным Величеством. Только в одном ОНО не право (а прав ответивший Сергей): не надо путать художника с маляром. СЕО-писанина имеет с Литературой не больше общего, чем паровозный гудок с музыкой:))) Так что, пусть их... Не переймайся! Уже есть поколение, не умеющее считать без калькулятора. Будут и писатели, не умеющие писать без программ... Вернее, это не писатели, а всяко-райтеры. Опять же не надо путать!
Короче, кто писать умеет (не ухмыляйтесь такой скромности, я же не обязательно про себя), тому эти костыли не нужны. Одно пугает. Ведь уже сейчас нередки споры между автором и ВМ об уникальности. НОРМАЛЬНЫЙ ВМ потом извиняется: "Глюк. Перепроверил вручную. Все нормально." А если будет ПО, оценивающее тексты ПОЛНОСТЬЮ - и удобочитаемость, и понятность для определенной аудитории, и остроумие, и тошноту и т.д., и т.п., заказчик (хотя бы из экономии времени) при проверке их вообще читать перестанет! Вот тогда на коне как раз окажутся всякорайтеры, пишущие с помощью программ, специально подогнанных под программы проверяющие... Это уже не то что НЕ ЛИТЕРАТУРА будет, но даже и не копирайт... Вообще названия пока нет. Была раньше шутка, что если 1000 мартышек усадитиь за печатные машинки на 1000 лет, они напишут "Войну и мир". А поскольку ПК уже способен ту же работу выполнить за секунды, мы явно движемся к этой светлой цели... Только не хотелось бы, чтоб внуки вынуждены были ТАКУЮ "Войну и мир" читать...
Особено, если заодно проводить и семантический анализ плагиату.) Вот про это я и бубню, с упорством достойным австралийского сумчатого дятла). Кстати, я нашла применение программе. Хорошо проверять некоторые "гениальные" источники, после предъявления результатов проверки исходника,удалось доказать, что это шедевр надо не рерайтить,а создавать принципиально новый текст, а именно - писать копирайт, а это уже совсем другие деньги.))
Браво Вашему упорству! А что до исходников, то порой это такие "перлы" - уму непостижимо, как их разместить могли , разве что не читая. А плагиатус показывает приличный процент. Я для себя решила, что это происходит из-за множества ошибок в тексте(несогласованные члены предложения, в частности) Чем не 100% уникальность - так и вправду никто не писал, с ошибками-то.:)
Я, вообще, предложила бы завести раздел: "Нарочно не придумаешь". Прислала мне мой постоянный мастер исходник на редактирование, причем, хохотала по аське до упаду. Я, как прочла, тоже хохотать начала. Рерайтер, хитрец, через каждые три слова вставлял первое попавшееся слово из этого же исходника. Как додумался? бог весть, но уникальность - то 100%.)) И удобно - зашел, почитал, задумался - а оно мне надо, с этим человеком работать?...
Вопрос конфиденциальности. Кому кроме меня могут быть доступны тексты, которые мы здесь проверяем? Странно, что никто в ветке еще этим не поинтересовался, неужели никого этот вопрос не заботит? Вот детские сказки про репку дедку и внучку очень видимо актуально.., как ни странно. Разъясните пожалуйста вопрос, а-то рука не поднимается работать здесь со своими документами.
Как говорится, обратитесь к системному администратору:) Если Вы входите в паутинку через прокси с недобросовестным админом, то даже пароли, набираемые Вами на клаве для чисто внутренних файлов, могут быть доступны ВСЕМ. Просто смешно переживать про удаленные ресурсы! Двум смертям не бывать... Никто не съест Ваши документы. Лично я уже знаю (хоть специально не интересовался) десятки людей, на Адвего не работающих, но СПЕЦИАЛЬНО сюда ходячих за "Плагиатусом"! Так что пусть у Вас все поднимается!
Чего за ним ходить? Скачал и поставил. Я не о плагиатусе, с ним все понятно, а про сервис: семантический анализ текста. Здесь проверяется текст, которого как правило в Инете еще нет. А админы тут не причем, если бы мои тексты, над которыми я работаю, и тем более пароли были бы доступны, как Вы говорите ВСЕМ, то я бы имел очень очень много проблем, в том числе с заказчиками. В инет я хожу из asp linux через шлюз с аппаратным фаерволом, чего и всем советую..
Ну, тады - ой! Тогда вам к доктору, а мы тут красим, белим... Древненанайская мудрость гласит: "Если у вас параноя, это еще не значит, что в действительности за вами не следят враги!" Так что, на фаервола надейся, а презерватив не снимай!:)
Это мнение быстро меняется, когда обнаруживаете кучу текстов, над которыми Вы работали на левых сайтах без реальной контактной информации с китайским ip. Еще неплохо отрезвляет, когда с компа уходят пароли к ftp сайтов и вся Ваша сетка из 50 штук летит за час в Ж...
Далеко мы зашли: и все и про все. Может с другой стороны на семантический анализ текста посмотреть. По "Современному толковому словарю русского языка" СЕМАНТИКА - значение, смысл...Так, давайте и подходить к тексту: соответствует-ли он теме, названию статьи и доводит-ли коротко и ясно значение и смысл написанного до читателя. А то нас самих затошнит от запрограммированных в анализаторе показателей.
а что означают все эти показатели при проверке - Количество уникальных слов,Количество значимых слов,Количество стоп-слов, Вода,Классическая тошнота документа, Академическая тошнота документа? а каковы их допустимый и идеальный уровни?
Давненько здесь не отвечают... Но все же рискну задать вопрос: "Какой допустимый процент классической и академической тошноты?" Жду ответ. Заранее, спасибо.
Нашла в гугле: "Что такое тошнота текста, ясно из одного названия. Если текст читать неприятно или неловкая тавтология постоянно режет глаз, значит, показатель тошноты будет повышенным. Различают понятие классической тошноты (из суммы навязчиво повторяющихся слов извлекается квадратный корень) и академической (сумма всех однокоренных слов в процентном отношении). Показатели тошноты должны быть в пределах 6 и 10% соответственно." Там еще много чего полезного написано, но я не знаю можно ли тут давать ссылки...Напишите текст выше в гугл и найдёте всю статью.
Уважаемые коллеги! Подскажите, пожалуйста, как понизить классическую тошноту. Статья кулинарной тематики. В тексте 5 рецептов приготовления теста с перечислением компонентов и коротким описанием замеса. Частота слов - максимум 2, 28%. Убираю предлоги и однокоренные слова, понижается вода и академическая тошнота (6,6%). Классическая практически без изменений (5,39%), а заказчик просит не более 3%. Самые повторяемые слова: тесто, кефир, мука, в, на. Заранее спасибо за помощь!
Добрый день. Классическая тошнота - это коэффициент, показывающий заспамленность текста самым повторяющимся словом. Чтобы снизить этот процент, необходимо либо заменить это слово (слова) синонимами, либо, если такой возможности нет, изменить структуру предложений, в котором оно встречается, уменьшив количество повторений этого слова.
Тема начата в 2010 году, последний пост 2017, а вопрос так и не прояснен. Все лежит на виду, не стоит секретить известные всему свету алгоритмы. Академическая частота считается на раз, по вкладке СЛОВА сео-адвего, вкладка СТОП_СЛОВА не учитываются. Классическая частота термин вредный, поскольку не учитывает объем текста, про то и на адвего не единожды говорилось, зачем тогда его считать, если это прямая функция первого слова вкладки СЛОВА. Только вводит зхаков в заблуждение, некотоыре фанатеют и требуют на текст 10 кзн класс. тошн. 4. Попробуй сделай, когда в ключах больше вхождений. Это пример, просьба не требовать с меня указания на лицу, но ситуация распространенная. Если меняются алгоритмы поисковиков, отчего тут все без изменений? И нету в мире никаких тошнот, есть keyword density, а это совсем иное. Неужто наши сеошники впереди всего мира?
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186