Биржа копирайтинга Антиплагиат SEO-анализ текста Адвего Лингвист Проверка орфографии

Новости Адвего — Форум Адвего

боковая панель
Адвего / Новости Адвего
Сергей (advego)
Новый сервис: семантический анализ текста

Уважаемые пользователи, представляем вашему вниманию новый сервис: семантический анализ текста.

Анализатор показывает следующие показатели текста:

- количество символов
- количество символов без пробелов
- количество слов
- количество уникальных слов
- количество значимых слов
- количество стоп-слов
- вода
- количество грамматических ошибок
- классическая тошнота документа
- академическая тошнота документа

Анализатор текста показывает семантическое ядро текста с количеством и частотой запросов, список слов и стоп-слов, а также грамматические ошибки.

Анализ текста вы можете провести тут: http://advego.ru/text/seo/

Надеемся, что данный инструмент будет полезен в вашей работе.

С удовольствием выслушаем ваши пожелания и предложения.

Написал: Сергей (advego) , 24.07.2009 в 21:57
Комментариев: 158
Комментарии
DELETED
За  1  /  Против  0
DELETED  написала  24.07.2009 в 22:02
А что такое Классическая тошнота документа и Академическая тошнота документа ?

                
Сергей (advego)
За  1  /  Против  0
Сергей (advego)  написал  24.07.2009 в 22:18  в ответ на #1
Классическая тошнота - квадратный корень из количества повторений самого тошнотного слова. Если количество меньше 7-ми, то корень из 7-ми.
Академическая тошнота - тошнота документа с учетом тошнотности всех тошнотных фраз.

                
DELETED
За  0  /  Против  0
DELETED  написала  24.07.2009 в 22:24  в ответ на #3
Нельзя ли немного попроще......математику с детства терпеть не могу :)))

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  24.07.2009 в 22:36  в ответ на #4
Классическая тошнота - специфический термин необходимый некоторым оптимизаторам, смысл термина ищите по слову "тошнота" тут: [ссылки видны только авторизованным пользователям]

Академическая тошнота - неким образом показывает натуральность документа. Если в документе много различных повторяющихся слов, то академическая тошнота большая.

                
DELETED
За  0  /  Против  0
DELETED  написала  25.07.2009 в 00:12  в ответ на #5
Спасибо, а то я тоже весь вечер гадаю, чем классическая тошнота отличается от академической ))

                
DELETED
За  2  /  Против  0
DELETED  написала  25.07.2009 в 07:13  в ответ на #5
Ничего на этом сайте не нашла. Может быть, плохо искала...
Поэтому хочу задать вопрос: Каким должен быть процент этих тошнот, чтобы не вырвать?

                
DELETED
За  0  /  Против  0
DELETED  написала  25.07.2009 в 07:53  в ответ на #10
По некоторым данным после 7% может и того, вывернуть наизнанку. Показатель классической тошноты сильно меняется от количества одного и того же ключевика. Чем чаще он употребляется, тем больше тошнота. И наши речевые привычки на неё влияют: "возможно", "наверное" и т.д. употребленные несколько раз, повышают тошноту.

                
DELETED
За  0  /  Против  0
DELETED  написал  25.07.2009 в 09:51  в ответ на #10
«Тошнота» это «SEO-шный» термин оценки степени "заспамленности" текста самым частым словом. Как правило - это наиболее часто повторяющееся ключевое слово. Поисковая система на нём – «зацикливается» и по остальным ключевым словам почти, что не работает- «…тошнит её сердешшшную…». Дело «Автора» выполнить все указания заказчика WM-ма, а дело WM-ма указать в задании то количество обязательных ключевых слов так, чтобы поисковиков не тошнило.

Так, что с точки зрения «Автора» этот параметр полностью на «совести» заказчика WM-ма и, если он более 7-ми, значит надо либо менять параметры заказа (указывать другое количество ключевых слов), либо оставлять как есть ибо, как говорят «SEO- шники»: «…большая тошнота сопровождается высокой контрастностью ключевого слова. при прочих равных, страница с большей тошнотой и с большей контрастностью должна быть более релевантной, чем с меньшей тошнотой и меньшей контрастностью.» (цитата с "форума настоящих SEO - шников").

Всем удачи.

                
DELETED
За  0  /  Против  0
DELETED  написал  25.07.2009 в 11:41  в ответ на #10
"Каким должен быть процент этих тошнот, чтобы не вырвать?" - читайте , там все понятно написано. [ссылки видны только авторизованным пользователям]

                
DELETED
За  1  /  Против  1
DELETED  написал  16.08.2009 в 17:34  в ответ на #5
Очень интересно:)

                
6xMama
За  0  /  Против  0
6xMama  написала  24.07.2009 в 22:05
О, вот это дело! Опробуем-с. :)
Спасибо

                
DELETED
За  0  /  Против  0
DELETED  написал  24.07.2009 в 23:08
Очепятка ))

Надеемся, Что данный инструмент будет полезен в вашей работе.

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  24.07.2009 в 23:09  в ответ на #6
Спасибо, поправил. )

                
DELETED
За  0  /  Против  0
DELETED  написал  25.07.2009 в 01:24
Как расчитывается вода?

                
DELETED
За  0  /  Против  0
DELETED  написал  25.07.2009 в 07:24
Здравствуйте!
Администрация сервиса как всегда по уровню заботы по отношению к пользователям сервиса на высоте, спасибо!

Уважаемый, Сергей (advego), у меня небольшая просьба, по возможности Вы или Ваши коллеги сообшите в этой теме следующие данные:

1) К каким средним цифрам желательно стремиться по показателю - "вода" : до 10%, до 30% или до 50%, а может и более или , наоборот, менее?
2) То же самое по показателям "классическая тошнота" и "академичечская тошнота" ?

Пример (с моей точки зрения текст в этом примере вполне на должном уровне и "плагиатус" даёт 100% уникальности)

Я проверил "технический" текст в 5000 знаков без пробелов с помощью вашего нового сервиса, получилось:

- вода 41,7% (я понимаю, что меньше сделать не возможно, так как по условиям заказа обязан писать строго на определённую тему и включать необходимое количество "ключевиков", а поймёт ли это заказчик?)

Они же (WM-мы) у нас здесь разные: есть вполне нормальные которые поймут, что при подобной "водности" текст читается очень даже не надоедливо и легко, при меньшей сухо, а 0% водности - это простое перечисление через запятую каких то неповторяющихся данных.
А другой заказчик (скажем так - "капризный WM") вспылит: "... да этот "Автор", мне "воду льёт..." и т.д.;

- классическая тошнота 6, 08%;

- академическая тошнота 9,1%.

К орфографическим ошибкам сервис отнёс абревиатуру "МДФ" и слово "шпонированный" (подсказывает замену на "лакированный", что есть не совсем правильно).
Все остальные показатели вполне понятны и находятся в норме.

Если кратко, то желательно "показать" к каким средним цифровым показателям должен стремиться "Автор" по доработке своих статей с использованием вашего нового и очень полезного дополнения к "Advego".

Ещё раз спасибо и всего доброго.
Коллегам творческих удач.

                
DELETED
За  1  /  Против  0
DELETED  написала  25.07.2009 в 09:05  в ответ на #11
Спасибо Вам, Сергей! Очень востребованный инструмент будет.Но a5, поддерживаю во всех пунктах! По незнанию, от двух видов тошноты и энного количества воды не по себе как-то...

                
DELETED
За  0  /  Против  0
DELETED  написала  25.07.2009 в 07:56
Спасибо за очень полезное нововведение! Можно сделать так, чтобы программа открывалась в новом окне, поверх карточки работы?

                
DELETED
За  0  /  Против  0
DELETED  написала  25.07.2009 в 08:30
спасибо большое, дорогим Админам!!! Очень удобный сервис! подсчет слов-отличненько работает. единственный минус-все падежи одного слова считает отдельно. неплохо было бы и вместе подсчитать(иногда ключевики разрешается склонять).
присоединюсь к вопросу в посте 11.

                
DELETED
За  0  /  Против  0
DELETED  написал  10.08.2009 в 16:24  в ответ на #16
Сергей, галочку "вкл/выкл" морфо сделайте ;)
просто и эффективно.

                
DELETED
За  0  /  Против  0
DELETED  написала  10.08.2009 в 16:28  в ответ на #101
хм.. это вы мне?

                
DELETED
За  0  /  Против  0
DELETED  написал  11.08.2009 в 15:39  в ответ на #102
Сергею :)

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  10.08.2009 в 21:12  в ответ на #101
Да, надо бы, спасибо.

                
Mertana
За  0  /  Против  0
Mertana  написала  25.07.2009 в 08:34
О, Боже и тут спам! :))
Благодарю за полезный сервис. Программка нашла пару опечаток, в отличие от Word-а, который посчитал это нормальными словами. Хотелось бы знать о приемлемых параметрах текста: проценте воды, тошнотворностей и прочих показателей. Спасибо.

                
DELETED
За  0  /  Против  0
DELETED  написал  25.07.2009 в 10:24
Адвего как всегда лучшие ! Спасибо большое!
Встраивайте же в Плагиатус поскорей!!!!

                
DELETED
За  0  /  Против  0
DELETED  написала  25.07.2009 в 11:29
Приятно видеть, как любимая биржа развивается)

                
DELETED
За  0  /  Против  0
DELETED  написал  25.07.2009 в 11:40
[ссылки видны только авторизованным пользователям] - самый лучший, на мой взгляд, топик о "тошноте". Там есть неявные ответы уважаемых людей, на основе которых можно составить достаточно четкую картинку о "тошноте".

                
6xMama
За  1  /  Против  0
6xMama  написала  25.07.2009 в 12:16
Всё это ужасно интересно. Только вот мне кажется, что оптимизаторы разрабатывают различные методы, просчитывают необходимые показатели, мы пишем специально оптимизированные тексты, а поисковики всё равно следуют какой-то своей, непонятной нам логике. Ну, смотрите... Все оптимизаторы заказывают тексты с разными параметрами: кто-то требует плотность ключевиков 5-7%, кто-то вообще плотность не считает, а требует ввести каждый ключевик определённое количество раз независимо от количества символов в тексте, причём, у кого-то это 2-3 раза, а у кого-то аж 10. И я полагаю, что все они добиваются результата с такими противоречивыми требованиями. Ну вот пример из жизни. Есть у меня заказчик, который ведёт несколько проектов, для которых я пишу тексты. Так вот все сайты у него успешно продвигаются, а один застрял на тридцать какой-то позиции и ни с места. В конце концов, он просит меня написать текст, в который надо напихать ключевик под завязку. Благо, ключевик там приятный, поэтому я без особого ущерба для читабельности сделала там... больше 15% плотность. Даже сама испугалась :))) Я честно говоря, думала, что такое поисковик уж точно посчитает поисковым спамом, ан нет. По этому запросу сайт быстренько попал в десятку.
Я, конечно, не отношу себя к оптимизаторам, но мне было интересно посмотреть, как же это всё работает, и я создала блог. Тексты, размещаемые там, я пишу вообще совершенно с разными показателями, вообще-то без всякой системы. Но через месяц блог поселился на второй позиции в региональной выдаче Гугла и так там и живёт уже месяц почти, время от времени перемещаясь то на первую позицию, то на третью. В Яндексе блог тоже по ключевому запросу в сотне. Да и запрос никак не низкочастотный.
Вот не вижу я вообще никаких закономерностей в работе поисковиков. А, причём, Гугл начал индексировать страницы уже через несколько дней, Яндекс раскачивался недели две. Рамблер меня вообще игнорирует до сих пор.
Я ничего не понимаю, хотя написала уже кучу статей с умным видом на тему оптимизации :)))))))
О Боже! Это ж ещё одна статья получилась нечаянно :))))))))))!

                
new_i
За  0  /  Против  0
new_i  написал  29.07.2009 в 22:08  в ответ на #28
5-7% - это нормальная плотность ключевых слов, для статьи на своём сайте.
2-3 ключевика на статью, это когда статья пишется для статейного продвижения, и устанавливается на другом сайте с интерактивными ключевыми ссылками на свой сайт.
С Яндексом, просто повезло. Бывает, что не индексирует до 4 месяцев.
А Рамблер и будет игнорировать, потому, что у блога домен в *.com зоне. Он считает эту зону буржуйской, и без письма в администрацию с просьбой принять сайт к индексации, выдавать его не будет :)

                
DELETED
За  0  /  Против  0
DELETED  написала  25.07.2009 в 14:13
Я уже скоро совсем разленюсь. Орфографию проверяют, тошноту считают... Еще бы пунктуацию конролировали - и все, можно по клаве бить, не сильно заботясь о правилах, есть программа - она поправит. :)
Спасибо, действительно очень интересные и полезные нововведения пошли на Адвего.
Взрослеем, однако! :)

                
Сергей (advego)
За  1  /  Против  0
Сергей (advego)  написал  25.07.2009 в 17:34  в ответ на #32
Пунктуация будет. Чуть позже.

                
DELETED
За  0  /  Против  0
DELETED  написала  25.07.2009 в 18:28  в ответ на #33
Аго, я вообще-то пошутила!:)))
Ну, мой Вам искренний респект!

                
DELETED
За  0  /  Против  0
DELETED  написала  25.07.2009 в 19:58
Отличный сервис!!!
Спасибоньки!!!

                
Margarita
За  0  /  Против  1
Margarita  написала  25.07.2009 в 21:52
Я вот все понять не могу значение термина "тошнота", что касаемо текста.
Да еще "классическая" и "академическая". Сережа, разъясните, плиз.

                
Margarita
За  0  /  Против  0
Margarita  написала  25.07.2009 в 21:53
Спасибо за новый инструмент.
Адвего - самый лучший сервис!!!

                
Gretchen
За  0  /  Против  0
Gretchen  написала  26.07.2009 в 07:57
Инструмент прекрасный, сразу видно. Всё очень подробно. Однако может поэтому чего-то недопонимаю...
Как узнать плотность ключевиков, требуемую заказчиком? Вот например - "интернет магазин косметики" - количество - 15 - частота % - 3.45 / 10.34
Это и есть плотность ключевиков в процентном отношении? Или нет? А что означает косая черта?

                
DELETED
За  0  /  Против  0
DELETED  написала  26.07.2009 в 08:41  в ответ на #38
Я думаю, что частота % - 3,4 , но поскольку слов в ключевике 3, то процент - 10,34. Скорее всего, заказчика интересует второй вариант. Но нужно уточнять

                
DELETED
За  0  /  Против  0
DELETED  написала  26.07.2009 в 22:04
Здорово! Спасибо большое!
Но, интересно, что значит фраза/слово: "иза", "длить", "материть", "антитело", - таких слов у меня в статье точно нет, но во вкладке семантическое ядро они присутствуют.

                
DELETED
За  0  /  Против  0
DELETED  написал  27.07.2009 в 17:38  в ответ на #40
ошибки морфологии :)
к примеру опечатка слова "материал" == "материл", которая распознается как "материть", т.е. типа "он ее материл".
В оригинальном сервисе с которого этот был слизан тоже есть эта ошибка :)

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  27.07.2009 в 18:16  в ответ на #41
Что вы подразумеваете под "оригинальным сервисом"? Лемматизатор, как таковой?

                
DELETED
За  1  /  Против  0
DELETED  написал  27.07.2009 в 19:59  в ответ на #42
Под оригинальным сервисом я подразумеваю тот сервис с которого была взята идея, и структура.
Глупо утверждать что мол идея разрешения омонимии "пальцем в небо" была вынута обратным инжинерингом и т.п., но также само глупо говорить, что сервис не писался глядя на оригинал, с учетом ошибок и наоброт удачных идей оригинала. Каждый кто видел оригинал видит в усовершенствованном клоне именно то чем он является. :)

                
DELETED
За  0  /  Против  0
DELETED  написал  28.07.2009 в 18:35  в ответ на #58
))))))))))))))))))))
Спасибо, посмешили))))
Ну а если по сути, то факты остаются фактами, и от того знаете ли вы с кого вы копировали свой сервис или нет ничего не меняется :)
Если вам приятнее считать, что за основу брались сотни англо/франко/и прочее-язычных сайтов с различной функциональностью смутно похожей на вашу, а не русскоязычный сервис который где-то на 80% схож с Вашим вариантом, то я в принципе не против.
Мало того, могу сказать, что не все "болячки" перешли вам "по наследству", и в среднем Ваш вариант ЛУЧШЕ оригинала. Лично я не вижу ничего плохого в том, что Вы взяли чужие идеи, немного доработали их и воспроизвели у себя. :)

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  28.07.2009 в 19:14  в ответ на #59
Я знаю ваш сервис, я его видел, я его тестировал. Но мы никак не ориентировались на него, когда делали свой. Единственно сходство, которое я вижу - это слово "тошнота", но ваш сервис к этому слову не имеет отношения.

Я ни вижу ни в вашем ни в нашем сервисе никаких новых идей, все это реализовано в том или ином виде сотни раз. И в онлайне и в оффлайне. (В оффлайне - тысячи раз)

Если вы хотите считать, что за основу взят ваш сервис - можете считать так )

                
DELETED
За  1  /  Против  0
DELETED  написал  29.07.2009 в 10:25  в ответ на #60
тошнота? :)
А почему не водность тогда уже? :)
Ладно, завязываем с этим спором. Думаю пользователям он точно не нужен, а мы с Вами все равно останемся при своем мнении.
В любом случае сервис хорош, и желаю Вам его развивать и поддерживать.

                
Сергей (advego)
За  1  /  Против  0
Сергей (advego)  написал  29.07.2009 в 21:00  в ответ на #61
О! Тут спорить не буду. Термин "вода" взяли у вас.

                
Marchiko
За  0  /  Против  0
Marchiko  написала  27.07.2009 в 20:01  в ответ на #42
Не знаю что значит очень умное слово "Лемматизатор", которое наверное сказано с целью ввести в заблуждение столь же неосведомленных в терминологии, как и я...
Но очевидно, что Mendel имел в виду тот сервис, откуда вы *программисты и администрация Адвего* взяли идеи проверки семантического анализа текста.

                
DELETED
За  0  /  Против  0
DELETED  написал  27.07.2009 в 20:06  в ответ на #49
Марчико, примерно так :)
только одна поправка - в оригинале это просто анализ текста, а не семантический.

                
DELETED
За  0  /  Против  0
DELETED  написала  27.07.2009 в 18:51  в ответ на #41
Mendel, что-то ничего не поняла, опечатки в системе или где? :). Статья была про герпес и беременность)))) за "ошибки" были приняты слова "Зовиракс", "рецидивирующим", откуда взялись "длить", "материть", "антитело", "иза" - я так и не поняла, можно предположить: "длить" от "продлить", "материть" - может быть, это "от матери к ребенку"?? не знаю

                
DELETED
За  0  /  Против  0
DELETED  написал  27.07.2009 в 19:50  в ответ на #44
Есть такое понятие как морфологическая омонимия.
Это когда глядя на одно слово, вырваное из контекста, нельзя сказать что это за слово.
К примеру "потом".
ПОТОМ он сказал, что она его предала...
А может быть: В такой жаре он истекал ПОТОМ...
также и с матери:
Он материт тебя? МАТЕРИ и ты его!
или: от МАТЕРИ к ребенку....
Анализировать контекст это значит действительно реализовывать семантику, а не использовать ее в названии :)
Я не стал этого делать. Адвего тоже не стали...
Разрешать морфологическую омонимию статистическими методами (словарь частых слов) или тот же триграм (или как его АОТ0шная технология) это тоже не особо целесообразно. Проще просто когда несколько вариантов взять первый попавшийся, как правило он правильный...

                
DELETED
За  0  /  Против  0
DELETED  написала  27.07.2009 в 22:01  в ответ на #47
Спасибо, теперь ясно :)

                
jpetrik
За  0  /  Против  0
jpetrik  написала  27.07.2009 в 18:42
Сервис очень полезный, большое спасибо!
Единственная просьба, если возможно - разместить русский язык
в таблице языков первым, а не в алфавитном порядке (или добавить его второй раз в начало) и второе - сделать
так, чтобы при переходе от проверки орфографии к семантическому анализу текста уже размещенный текст не исчезал из
формы. Это заметно облегчило бы проверку, особенно когда неоднократно редактируешь текст для правильного
количества ключей или иного показателя.
А так - все очень замечательно, еще раз спасибо!

                
Antonov
PRO
За  0  /  Против  0
Antonov  написал  27.07.2009 в 19:45  в ответ на #43
Так по дефолту же и так русский

                
DELETED
За  0  /  Против  0
DELETED  написал  27.07.2009 в 20:23  в ответ на #46
вроде как "автовыбор" по умолчанию. Да и то неочевидно это.
Лучше бы сделать по умолчанию русский.

                
DELETED
За  0  /  Против  0
DELETED  написал  27.07.2009 в 20:26  в ответ на #52
упс.... не прочитал меленьким-сереньким надпись. :)
таки русский а не автовыбор.
Но вообще по эргономики надо в селекте прописать дефолт русский а не так как сделано.

                
DELETED
За  0  /  Против  0
DELETED  написала  27.07.2009 в 18:58
Скажите, а если так:
классическая тошнота документа -2,45
академическая тошнота документа -6,9%
это сильно тошнотворный текст?

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  06.08.2009 в 21:52  в ответ на #45
Вообще не тошнотворный

                
Sanyich
За  0  /  Против  0
Sanyich  написал  28.07.2009 в 07:47
А можно сделать так что бы по дефолту сразу предлагался русский язык? А то он в самой середине, и мотать долго. Предлагаю расположить сверху - Русский, Украинский, как самые часто используемые

                
DELETED
За  0  /  Против  0
DELETED  написал  28.07.2009 в 09:14  в ответ на #55
)))))
читайте обсуждение.
Он и так по умолчанию.
2Сергей, сделайте чтобы вместо "Выберите язык" писалось "Русский" как того и требуют принципы эргономики. ;)

                
DELETED
За  0  /  Против  0
DELETED  написал  28.07.2009 в 17:39
Спасибо за новый классный сервис.

                
DELETED
За  1  /  Против  0
DELETED  написал  30.07.2009 в 23:48
Бедный, бедный Пушкин. Его стихотворение "Бесы" получило следующую оценку программы:

Вода 43.1 %
Количество грамматических ошибок 3
Классическая тошнота документа 2.65
Академическая тошнота документа 10.2 %

А вот Толстой со своей "Войной и миром" (разговор Пьера и Андрея в Лысых горах о смысле жизни):
Вода 21.1 %
Количество грамматических ошибок 7
Классическая тошнота документа 5.00
Академическая тошнота документа 9.8 %

Таким образом, Пушкин тошнее академически, а Толстой - классически.:))
И все, все пишут с грамматическими ошибками (с точки зрения программы)!
:)))))))))))

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  31.07.2009 в 02:00  в ответ на #64
Классическая тошнота - цифра ни о чем.
Академическая тошнота у обоих авторов в пределах нормы, даже ниже среднего.
В стихах воды априори больше.
))

                
DELETED
За  1  /  Против  0
DELETED  написала  05.08.2009 в 13:06  в ответ на #65
Вот спасибо Вам за сервис! Просто чудо, как нужен! :)
Особенно прекрасен в поиске слов-сорняков:)
Искренне благодарю!

                
DELETED
За  0  /  Против  0
DELETED  написала  05.08.2009 в 13:12
у меня есть еще вопрос, а не планируется ли стоп-слова (сорняки), как, например, вот, который, наверное и т.д. каким-нибудь цветом выделять или подчеркивать?
Это я спрашиваю из любви к искусству :)

                
DELETED
За  0  /  Против  0
DELETED  написал  05.08.2009 в 14:50  в ответ на #67
Пардоньте, это Вы все союзы и предлоги сорняками называете?! А сорняки, как я понимаю, нужно беспощадно искоренять? Иначе зачем же их "цветом выделять или подчеркивать". По этой логике от фразы "Вот Карлсон, который наверное живёт на крыше." останется лишь "Карлсон наверное крыше.", а это абсурд, поскольку вдруг кто-то другой окажется "крыше" Карлсона. :)

                
DELETED
За  0  /  Против  0
DELETED  написал  05.08.2009 в 15:05  в ответ на #72
С приведённым аргументом не спорю, тем более, мне эта штуковина очень понравилась самому. Считаю её полезной (правда, более для заказчиков) и занимательной (для авторов).
Просто, я не могу понять, как можно уменьшить или удалить "(сорняки), как, например, вот, который, наверное и т.д." (цитата), если это предлоги и союзы. Ну иначе, зачем человеку хочется, чтобы их выделяли?

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  05.08.2009 в 18:37  в ответ на #73
Так никто не говорил об удалении. Речь идет о выделении. Дабы смотреть на тест максимально близко глазами поисковой системы.

                
DELETED
За  0  /  Против  0
DELETED  написал  10.08.2009 в 16:30  в ответ на #73
Я после того как у себя стал выделять водность и стопслова, стал автоматом сокращать количество "сорняков" когда пишу более-менее важные письма или тексты...
За редкими исключениями в компреде фраза "Предлагаем услуги по хххх" или даже "предлагаем услуги ххх" будет лучше чем "Мы предлагаем вам самое лучшее качество услуг направленных на выполнение ххх". Человек может и не дочитать до конца :)

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  06.08.2009 в 21:53  в ответ на #67
Сделаем много всякого чуть позже...

                
DELETED
За  0  /  Против  0
DELETED  написал  10.08.2009 в 16:31  в ответ на #83
Сорцы "карты" дать?
Все равно буду скоро выкладывать весь сервис в сырцах.
или проще самим чем в моем разбираться?

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  10.08.2009 в 21:14  в ответ на #104
Да проще, конечно, самим, спасибо )

                
DELETED
За  0  /  Против  0
DELETED  написала  05.08.2009 в 13:47
Обалдеваю! Стоп- слово "и", грамматическая ошибка в слове "чат" и "жлобство". Можно, конечно , вместо "еще" написать "истчо", но как еще можно написать слово "чат"??
Воды в тексте, написанном практически ни о чем,(писала как-то зарисовочку для дамского форума) 24%, хотя, как на мой взгляд, там вообще 80% воды. Нет там информации,это был комплимент форуму. про тошноту - молчу, ее там 2% .Только что это? там 2700 знаов, следовательно 2% - 54 знака, примерно 7 слов. От каких эту хрень тошнит? Ну,"жлобство", я понимаю, а остальные 4 тошнотворных слова?
с Плагиатусом еще смешнее. Никогда не пользовалась. Стало любопытно. Сунула туда давно ОПУБЛИКОВАННЫЙ текст. 69% уникальности. Сейчас еще один эксперимент сделаю. Проверю рерайт сказки про репку. что еще умного системка скажет??

                
DELETED
За  0  /  Против  0
DELETED  написал  08.08.2009 в 20:41  в ответ на #68
Слова "чат" нет в словарях системы, поэтому и неправильно считает :)
Для проверки текстов это неважно, ибо оно лишь обращает наше внимание на то или иное слово, а вот при приеме текстов как заказчик....
напрягает когда 80% нормальных работ автомат забраковывает как тексты с ошибками которых нет... ну да об этом я писал администрации... :)
Если считаете "жлобство" с "чатом" правильными словами - проверьте их в ворде....

Что же касается уникальности, то думаю проблема в том, что яндекс некоторые запросы игнорирует... типа статья находится в яше по другим запросам, а вот по некоторым присутствующим в тексте запросам не находит... бывает еще, что статья опубликована но не в индексе... ну и по моему опыту 80% статей дешевых котроые писались на заказ для сателитов и были в индексе спустя год уже не находятся...
так что если опубликовано не на вашем сайте, то всякое может быть... :)

                
DELETED
За  0  /  Против  0
DELETED  написала  08.08.2009 в 22:00  в ответ на #94
хоть кто-то объяснил нормально) Мне, по большому счету, все равно. у меня один раз была проблема с уникальностью, да и то, три разных программы исполнили каждая свою песнь. с грамматическими ошибками я борюсь путем вычитывания текста не сразу, а после того,как он хотя бы полчаса "отлежится", то же касается и стилистики. Слова "чат" и "жлобство" из песни, увы! не выкинешь, так как язык их уже воспринял, так что мое мнение ничего уже не изменит.
в тот момент,когда я стану доверять "ворду" проверку правописания,а тем более считать его истиной в последней инстанции, я повешусь на мышьем шнуре.
Но Ваши объяснения,конечно, очень полезны, я,кстати выясняла,что такое пресловутая "тошнота" на Вашем сайте))

                
DELETED
За  0  /  Против  0
DELETED  написал  09.08.2009 в 13:38  в ответ на #95
Ну ВОРД не истина в последней инстанции, а лишь метод обратить внимание :)
Что касается тошноты, то вы более любознательны чем я.... я все никак не заставлю себя прочитать что такое "академическая" тошонта... ну и перенять у Адвего ее себе :) а то вроде как на первый взгляд она более симпотична :)

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  10.08.2009 в 21:27  в ответ на #98
http://advego.ru/blog/read/news/35422#comment3

Ну просто смотрим, что в документе слишком много различных повторяющихся (тошнотных) фраз (ну, к примеру, если 2 раза появилась фраза, то уже тошнит от нее). Вот и тошнит от всего этого дела :) Ну а там как угодно можно считать. Можно по экспоненте - чем больше фраз, тем сильнее тошнит по экспоненте, можно линейно, можно так, можно сяк... Тут простора много.

                
DELETED
За  0  /  Против  0
DELETED  написал  02.10.2009 в 21:17  в ответ на #68
Так и должно быть! Не обращайте внимания! Ворд еще не то показывает, пора бы привыкнуть.

                
DELETED
За  0  /  Против  0
DELETED  написала  02.10.2009 в 21:36  в ответ на #145
Увы, но вынуждена повториться. В тот момент, когда я поверю Ворду, я повешусь на мышьем шнуре)).
Поэтому и привыкать к нему не буду.

                
DELETED
За  0  /  Против  0
DELETED  написала  05.08.2009 в 14:11
А это результат эксперимента))

одни нестарые, но интересные времена, в одной затерянной вологодской деревеньке, в избушке-развалюшке жил-был дедко.Да не один, а с бабкой, Дашуткой-внучкой, собачкой Жучкой, кошкой Муськой и целой оравой мышей в подполье.
Жили они дружно, но голодно. У мышей в подполе в животах марш играл, Муська на них, костлявых давно лапой махнула, Жучка пропитывалась, чем придется, да и внучка с бабкой и дедком на голодном пайке сидели.
Дедко, конечно, в собес ходил, насчет прибавки к пенсии хлопотал, но там ему про какой-то страшный "крызис" разъобъяснили. Вот с тем он, несолоно хлебавши, и вернулся. А тут еще знахарка из соседней деревни масла-то в огонь подлила. - Тут, говорит,- такая диспозиция: аль опять супостат на нас войной пойдет, аль снова все смирно, как при батюшке Царе Горохе, будет. В общем, надвое сказала.
Призадумался дедко. Но, однако, надумал. Вскопал он грядку, да посадил репу, а бабку с внучкой припахал полоть-поливать.
Скоро сказка сказывается, а репа еще спорее растет. Вот и выросла она большая-пребольшая. Надо урожай собирать.
Пошел дедко на грядку, ухватил репку. Тянет-потянет, а вытянуть не может.
Ну, тащил он эту репку, тащил, гряду истоптал, полпачки "Примы" искурил, а толку - ноль. Бабка-то сначала советы полезные давала, потом кругами запохаживала, да тоже взялась вместе с дедкой за эту репку.
Тянут-потянут, ан нет, фиг вам, а не корнеплод! Стали они внучку Дашутку звать на помощь. Теперь уж втроем тянут репку. Результат тот же: око видит, а зуб неймет.
Дедко матерится, бабка блажит, внучка визжит - ну, прям, кошмар и истинное светопреставление.
Жучке это дело сразу понравилось, отродясь в такие веселые игры никто не играл. Ну и решила поучаствовать. Ухватила Дашутку-внучку за подол давай тянуть. Тянут-потянут... (смотри выше)
Тут и Муська, что на солнышке грелась, решила присоединиться, тем более что у главной ее врагини зубы-то заняты. Да и под такое благое дело можно будет хоть в хвост
Жучкин побольнее вцепиться.
Вот они всем коллективом и тянут репку. А репке хоть бы хны, как сидела в гряде, так и сидит сиднем.
А тут мышь брела по своим мышачим делам. Как увидела эту катавасию, чуть со смеху животики не надорвала, ладно, бдительность не потеряла.
Как увидела Муська мышку, так в ней тигр голодный и проснулся. Изо всех своих сил рванулась она к добыче. А в зубах- то Жучкин хвост! Дернулась отчаянно Жучка, оступилась и шлепнулась на нее внучка и потащила за собой бабку. В общем: внучка - на Жучку, бабка - на внучку, дедко на бабку, а репка - на дедку. И репка-то и впрямь большая-пребольшая.

оличество стоп-слов 156
Вода 39.5 %
Количество грамматических ошибок 17
Классическая тошнота документа 2.65
Академическая тошнота документа 7.1 %

озможно, ошибки в словах: Дедко, Жучкин, Жучкой, Муська, Муськой, блажит, дедко, дедкой, дедком, дедку, крызис, мышачим, полпачки, припахал, разъобъяснили, спорее, хлебавши
У меня началась классическая тошнота. для чего сесь сыр-бор? И как, простите, писать слова,которорые имеются в словаре Даля "блажит", "споро", "хлебать"? Почему в этой бессмыслице всего 40% воды? чем не угодили "Муська" с "Жучкой"? как обойтись без служебных слов?
Так что - не жили хорошо,неча и начинать. И пусть семантический анализ меня поправит)

И я там был, самогонку пил и пареной репой закусывал.

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  05.08.2009 в 14:52  в ответ на #69
Данный сервис предназначен для SEO, а не для литературных изысков.

                
DELETED
За  1  /  Против  1
DELETED  написала  05.08.2009 в 16:11  в ответ на #71
Это не литературные изыски, это просто не нужные мне работы. Вообще-то мои работы оценивает заказчик, а не программа. Я не вижу смысла в этой программе. Мало проблем с русским языком и пресловутой уникальностью, так теперь еще и новая фишка - количество воды, служебные слова и тошнотворность текста.
Сео-копирайтинг и так является издевательством, как над языком, так и над райтерами, вынужденными выполнять акробатически трюки, и балансировать между требованями заказчика и требованиями как русского многострадального, так и здравого смысла. Я не претендую на правоту и ни в коем случае не желаю кого-нибудь обидеть, но мне, зачастую, все это представляется игрой взрослых людей в детские игры, но на взрослый лад.

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  05.08.2009 в 18:27  в ответ на #75
Этот инструмент нужен seo-специалистам. Они знают что такое тошнота текста и зачем она нужна.

                
DELETED
За  0  /  Против  0
DELETED  написал  07.08.2009 в 16:09  в ответ на #76
т.е. проще говоря, SEO- оптимизм ( :) ) вкупе с семантическим анализом не нужен никому, кроме самих оптимизаторов? И к русскому языку данный анализ имеет такое же отношение, как черный ящик самолета к безопасности полетов. Короче, сам по себе русский язык тут ни причем, важно лишь составить ПРАВИЛЬНЫЙ набор слов, который позволит неким компьютерным программам (поисковым системам) некие ресурсы поместить в список на первое место, а другие-на последнее.... в интересах бизнеса, естественно, т.е. грубо говоря, переставить слова, чтоб они приносили БОЛЬШЕ бабок.

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  08.08.2009 в 12:32  в ответ на #85
Отчасти вы правы. Однако семантика языка интересна сама по себе и без денег.

                
DELETED
За  0  /  Против  0
DELETED  написал  10.08.2009 в 16:08  в ответ на #87
Сергей, а где тут семантика?
без ехидства спрашиваю.
Ведь вы же под этим что-то подразумевали когда писали...
я вот в упор не вижу семантики в Вашем анализаторе.
Может конечно это от того, что я знаком немного с семантическим анализом текстов, и вижу разницу между морфологией синтаксисом и семантикой, но Вы то ведь тоже не хуже меня разбираетесь в терминологии....
Хотя к слову сказать мой юрист на подобный мой вопрос сказал, что "Семантический анализ" определение понятное для него как для гуманитария... так что может Вы и правы... в общем раз уж подвернулся повод спросить, то спрашиваю :)

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  10.08.2009 в 21:16  в ответ на #99
Я подразумевал в своем посте, что подход к текстам с математической точки зрения - очень интересное занятие.

                
Сергей (advego)
За  2  /  Против  0
Сергей (advego)  написал  10.08.2009 в 21:18  в ответ на #99
Я, кстати, не особо силен в терминах и не особо силен в программировании (хотя специальность моя - разработка асу и по) и уж тем более не особо силен в семантике. А вот порассуждать и поумничать - в этом я силен )

                
DELETED
За  0  /  Против  0
DELETED  написал  11.08.2009 в 15:45  в ответ на #111
Ну поумничать это и мне не чуждо :)

                
DELETED
За  1  /  Против  1
DELETED  написал  02.10.2009 в 21:21  в ответ на #69
Сказочка замечательная, но претензии ни к чему

                
DELETED
За  0  /  Против  0
DELETED  написала  02.10.2009 в 21:31  в ответ на #146
Ой, я уже и забыла про сказочку. а вот претензии к сервису остались ( к сожалению). А лучше бы - наоборот((.

                
DELETED
За  0  /  Против  0
DELETED  написал  04.10.2009 в 15:58  в ответ на #147
какие претензии?

                
DELETED
За  0  /  Против  0
DELETED  написала  05.08.2009 в 16:07
И всё же, пожалуйста, дайте по каждому пункту, где указаны проценты, какая должна быть общепринятая норма. Мне надо знать к каким показателям стремиться.
Заранее благодарю за ответ.

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  05.08.2009 в 18:34  в ответ на #74
Нет никакой общепринятой нормы.

Возьмите запрос "пластиковые окна", введите его в яндексе, откройте сайт из топ-10, возьмите текст с сайта и сделайте анализ этого текста. Вы получите "общепринятую норму" по запросу "пластиковые окна". Для яндекса. Для вашего региона.

                
DELETED
За  0  /  Против  0
DELETED  написал  08.08.2009 в 18:21  в ответ на #77
Не находите, что это симптоматично? Может, Вам и "семантика языка интересна сама по себе", но всякорайтерам, как видите, после проги, выдающей некие параметры текста, сразу нужно и точные значения этих параметров - стремиться к "совершенству"! Проще это, чем прочитать томик Пушкина и Унитазова Сортир-Сортирыча. И сравнить. И поразмыслить...
К чему такие напряги? Ведь чукча - не читатель, чукча - писатель...

                
DELETED
За  0  /  Против  0
DELETED  написал  10.08.2009 в 16:34  в ответ на #93
да нет идеала, ну почему вы спорите? :)
идеал меняется в зависимости от задачи.
Как заказчик скажет, мол ему надо тошноту в пределах 5-7, так вы и считайте его идеалом :)
НЧ, ВЧ, СЧ, статья под ссылки, под траф... размер "облака" кеев, колво "облак" в статье... да мало ли еще каких критериев может быть которые влияют на "идеал" :)

                
DELETED
За  0  /  Против  0
DELETED  написал  05.08.2009 в 18:43
А я вот и Плагиатус еще не пробовал. И сие нововведение не собираюсь.:)
И без них можно писать уникально, читабельно, грамотно, интересно. Без воды, тошноты и т.п.
А за тексты, где требуется 10% ключевика "сайдинг доставка Москва купить" в точном вхождении, просто не берусь...
Короче, 100% согласен с Черным Величеством. Только в одном ОНО не право (а прав ответивший Сергей):
не надо путать художника с маляром. СЕО-писанина имеет с Литературой не больше общего, чем паровозный гудок с музыкой:)))
Так что, пусть их... Не переймайся!
Уже есть поколение, не умеющее считать без калькулятора. Будут и писатели, не умеющие писать без программ... Вернее, это не писатели, а всяко-райтеры. Опять же не надо путать!

                
Zuram
За  0  /  Против  0
Zuram  написала  05.08.2009 в 22:58
Замечательный сервис для начинающего автора. Проводит не только анализ текста, но и чистит извилины, заставляя самосовершенствоваться. Спасибо!

                
DELETED
За  0  /  Против  0
DELETED  написал  08.08.2009 в 15:35  в ответ на #80
Все равно, что сказать, будто калькулятор развивает математические способности!:)))

                
DELETED
За  0  /  Против  0
DELETED  написал  10.08.2009 в 16:35  в ответ на #90
Да, тут согласен :)
но все равно калькулятор вещь полезная :)

                
DELETED
За  1  /  Против  0
DELETED  написала  11.08.2009 в 17:02  в ответ на #106
правда, при долгом пользовании, разучиваешься считать)

                
DELETED
За  0  /  Против  0
DELETED  написал  06.08.2009 в 14:03
Интересно проследить как будет производится поиск Воды??

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  06.08.2009 в 21:54  в ответ на #81
Вода - отношение значимых слов к незначимым

                
DELETED
За  0  /  Против  0
DELETED  написал  07.08.2009 в 16:14  в ответ на #84
Что понимается под "значимыми", и под "незначимыми" словами? Для меня незначимые - это предлоги, междометия и пр., которые семантическим анализом относятся к "стоп-словам". А я-то думал, что стоп-слова - это те, на которых надо остановить свое внимание...

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  08.08.2009 в 12:42  в ответ на #86
Незначимые - это очень часто употребляемые слова. Например слова "красный", "люди", "земля" и т.п.

                
DELETED
За  0  /  Против  0
DELETED  написал  08.08.2009 в 15:33  в ответ на #88
Боже, чушь какая! Они потому и часто употребляемые, что самые важные! Это все равно, что в английском неправильные глаголы считать незначимыми. Они же - основные. Это все прочие можно откинуть и прекрасно общаться!

                
DELETED
За  0  /  Против  0
DELETED  написал  10.08.2009 в 16:18  в ответ на #89
Стоп-слова не только самые частые, они еще и в основной своей массе служебные.
Союзы отражают СТРУКТУРУ предложения, но никак не смысл.
Поясню на примере:
"Самый лучший сайт для копирайтеров и рерайтеров"
Мысленно распределите процент важности слов для понимания сути... в каких словах больше сути?
На самом деле слова не разделяются на значимые и незначимые, граница условна, и зависит от контекста, плюс она не бинарна, т.е. можно значимость отразить неким числом, а не да/нет...
Но очевидно, что "самый" "лучший" "для" "и" несут минимум информации, в сравнении с "копирайтеров, рерайтеров" и даже с "сайт"...
оставив только "сайт копирайтеров рерайтеров" мы хоть и получим несколько корявую фразу, но читаемую. А вот "Самый лучший для и" - вообще бесполезно.....
еще один пример - если забить эту фразу в поисковик, то очевидно, что важность наличия тех или иных искомых слов на находимых сайтах различна.
Если в найденной странице не будет слова "и", то пользователь это простит поисковику... а вот если не будет "копирайтеров", то скорее всего оно не будет соответствовать ожиданиям пользователя.
В общем так, на пальцах....
Надеюсь понятно объяснил :)

                
DELETED
За  1  /  Против  0
DELETED  написала  11.08.2009 в 08:26  в ответ на #100
А как насчет классического примеры "казнить нельзя помиловать"?

                
Сергей (advego)
За  0  /  Против  1
Сергей (advego)  написал  11.08.2009 в 09:45  в ответ на #114
В контексте давайте рассматривать. Мы же не больные принцессы.

                
DELETED
За  0  /  Против  0
DELETED  написал  11.08.2009 в 15:47  в ответ на #114
Эту фразу не возьмет ни статистический анализ, ни даже полноценный семантический... мало того - ее не поймет даже человек. ;)

                
DELETED
За  0  /  Против  0
DELETED  написал  08.08.2009 в 15:55
Короче, кто писать умеет (не ухмыляйтесь такой скромности, я же не обязательно про себя), тому эти костыли не нужны. Одно пугает. Ведь уже сейчас нередки споры между автором и ВМ об уникальности. НОРМАЛЬНЫЙ ВМ потом извиняется: "Глюк. Перепроверил вручную. Все нормально."
А если будет ПО, оценивающее тексты ПОЛНОСТЬЮ - и удобочитаемость, и понятность для определенной аудитории, и остроумие, и тошноту и т.д., и т.п., заказчик (хотя бы из экономии времени) при проверке их вообще читать перестанет! Вот тогда на коне как раз окажутся всякорайтеры, пишущие с помощью программ, специально подогнанных под программы проверяющие...
Это уже не то что НЕ ЛИТЕРАТУРА будет, но даже и не копирайт... Вообще названия пока нет.
Была раньше шутка, что если 1000 мартышек усадитиь за печатные машинки на 1000 лет, они напишут "Войну и мир". А поскольку ПК уже способен ту же работу выполнить за секунды, мы явно движемся к этой светлой цели...
Только не хотелось бы, чтоб внуки вынуждены были ТАКУЮ "Войну и мир" читать...

                
DELETED
За  0  /  Против  0
DELETED  написала  08.08.2009 в 17:48  в ответ на #91
А что - не помню уже, в каком фантастическом рассказе читала: засыпал,что под руку попало, потряс - получи, фашист, гранату! насыпал ключевиков, протряс в программе - воду выжал, стоп-слова сократил, и - пошла читать губерния! а потом жалобы на мастеров идут, написанные на таком "грамотном" русском, что удивительно, как монитор не краснеет. Лучше курсы русского языка открыли бы, может и программы не были бы так востребованы.
А всякорайтеры и так уже на коне. Иногда заказчики просят рерайтить такое,что сами не понимают смысла самими же заказанного когда-то и оплаченного текста. И не надо мне про поисковик,что ему, мол, все равно. Было бы все равно - не просили бы мастера читабельности. А ведь эти исходники - после вашего же плагиатуса и проверочных программ. Лучше бы на наличие смысла проверяли . И мастера бы довольны были, и всякорайтерам бы пришлось или учиться и качественно работать,или уходить и дать спокойно работать другим. Ешкин кот, вчера целый час вдвоем пытались понять, что именно написано в тексте. Конечно, уникальность будет! Китайский текст - русскими буквами и только иногда знакомое, до счастья, слово Nokia.

                
DELETED
За  0  /  Против  0
DELETED  написала  08.08.2009 в 22:11  в ответ на #92
:) Nokia - смешно:) Но вмешалась не поэтому только. О литературных талантах наслышана, отношусь с почтением. Наш рерайт отношения к литературе художественной не имеет вообще. И, наверное, не должен. Адвего не ставил цель развития русского языка или классической русской речи.Совсем другие цели и у ВМ. Мы пишем с ключевиками некоторым образом "зомбирующие" тексты,а это совсем другая наука. И все эти анализаторы не для того, чтобы нас научить говорить или писать правильно, а чтобы показать, что нужно заказчикам, которые платят. Если развивать и совершенствовать великий и могучий - это в другой очереди. Здесь другие задачи.
Не знаю, насколько внятно мне удалось передать свою мысль, но я в последнее время замечаю всё возрастающую агрессию авторов по отношению к ВМ и админам сайта. ВМы, с которыми работаю, мне нравятся.(было два неприятных - из бс ушла сама).Администрация сайта, насколько это видно, всячески пытается нам жизнь упростить. Скажу честно - пока вчера три существительных без изменений в И.п. в текст вложила,думала поседею,но...Если хочется языка и литературы, беру томик Пастернака или Бунина.

                
DELETED
За  0  /  Против  0
DELETED  написала  08.08.2009 в 22:34  в ответ на #96
Согласна и несогласна с Вами. Конечно, и рерайт и копирайт имеют к литературе весьма и весьма далекое отношение. Не первый раз упоминаю про акробатические этюды, выделываемые райтерами на "сео"-проволоке. Развивать язык - дело вообще невыполнимое, ибо он развивается, не обращая внимание на экспансию жаргона или англицизмов. Он все переживет, подомнет,переделает по-своему. так что всякорайтеры ему не страшны). Но тем не менее, даже самый глупый текст должен быть написан грамотно,хотя бы из уважения к самому себе. Я,как и Вы,терпеть ненавижу писать статьи с ключами, но мне легче,так как я - "вольный стрелок", пишу под заказ и могу отказаться от тех работ,которые мне не нравятся. Я поддерживаю Вас в том, что агрессия к мастерам и админам во многом необоснована, но пенять на зеркало ведь гораздо легче).
Приятно встретить поклонника Бунина. Я очень люблю Лескова и,как и Вы, с удовольствием отдыхаю за чтением хорошей литературы. Жаль,только что времени на это мало)

                
DELETED
За  0  /  Против  0
DELETED  написал  10.08.2009 в 16:37  в ответ на #92
Проверка на наличие смысла? :)
Возможно, но ресурсоемко...
если не ошибаюсь полноценный семантический анализ текста требует примерно в 1000 раз больше ресурсов чем статистический. Хотя это смертельно в масштабах Яндекса, но не так смертельно в масштабах того же адвего...

                
Сергей (advego)
За  0  /  Против  0
Сергей (advego)  написал  10.08.2009 в 21:23  в ответ на #107
Проверять остроумие? Ох не знаю... По шаблонам?..

Настроение как-то еще представляется как определить. Остроумие - не уверен я что-то...

                
DELETED
За  1  /  Против  0
DELETED  написала  11.08.2009 в 08:37  в ответ на #112
Уважаемые Мастера! Не надо проверять остроумие,хотя,конечно, можно развить эту тему до абсурда и представить,как отклоняют текст по бетону,за то,что в нем мал процент остроумия.) Но на наличие смысла проверить - при мысли о таких возможностях, душа начинает петь колоратурным сопраном)). вчера расшифровывала исходник до поного обалдения,в результате ничего не поняла и написала отсебятину. А может в этой невнятице что-то умное было зашифровано, и Сеть потеряла возможность причаститься к гениальным мыслям бедного перерерайченого мною автора? А так бы его еще в исходнике придушили. И мне хорошо - и он бы не мучился)

                
DELETED
За  0  /  Против  0
DELETED  написал  11.08.2009 в 16:13  в ответ на #115
теоретически можно.... :)
строим семантическое дерево...
смотрим насколько нам удалось его собрать единым, без отдельных кустов..
раздаем веса узлам графа, исходя из частотности слова/словосочетания....
делаем из графа синтез... хоть какой синтез, пусть и слабочитаемый...
синтезированное резюме и его размер дают нам более объективный критерий "воды".
Смотрим длину путей между самыми весомыми узлами. Чем они короче, тем текст "связнее".
Смотрим насколько веса узлов соизмеримы с законом Зипфа...
Слишком "связный" текст спамовит и тавтологичен...слишком несвязный, бессмысленный.
Дорвейный текст как правило представляет из себя набор вырванных из контекста слов и фраз, связанных по разумным правилам. Значит будем иметь слишком много "ключевых узлов", вокруг которых будут висеть много узлов "второго уровня" которые очень слабо связанны между собою...
Может еще какие эвристики можно придумать...
Да только долго это все писать... нужна команда из кодеров.
Так что вряд ли это будет реализовано в ближайшее время.
По крайней мере я не стану финансировать такую разработку до конца кризиса :)

                
DELETED
За  0  /  Против  0
DELETED  написала  11.08.2009 в 17:00  в ответ на #120
Ну вот, как всегда - на самом интересном месте.. я теперь умру от любопытства. Поэтому, если можно (мне и так неудобно отнимать у Вас время), что такое закон Зипфа? Остальное я худо-бедно но поняла. Вы доходчиво объясняете).

                
DELETED
За  0  /  Против  0
DELETED  написал  11.08.2009 в 19:56  в ответ на #121
Небольшое статистическое наблюдение, из которого было сделано множество интересных методик...
кратко, но доходчиво об этом можно почитать здесь: [ссылки видны только авторизованным пользователям]
Статья не совсем об этом, но во многом про Зипфа... сразу так сказать и теория и практика.

                
DELETED
За  0  /  Против  0
DELETED  написала  11.08.2009 в 23:19  в ответ на #123
Спасибо, прочту обязательно.

                
DELETED
За  0  /  Против  0
DELETED  написала  13.08.2009 в 18:04  в ответ на #123
Еще раз спасибо, очень интересная статья. Не думала,что меня настолько заинтересует подобная тема).

                
DELETED
За  0  /  Против  0
DELETED  написал  11.08.2009 в 23:38
Cемантический анализ текста и плагиату очень полезные програмы.подробно разписана вся информация о тексте.
Я доволен проэктом.

                
DELETED
За  0  /  Против  0
DELETED  написала  12.08.2009 в 22:14  в ответ на #125
Вам, простите, еще бы программку по проверке орфографии задействовать...

                
DELETED
За  0  /  Против  0
DELETED  написала  13.08.2009 в 04:05  в ответ на #126
:):):) Да уж! С орфографией программа, пожалуй, может и не справиться :)

                
DELETED
За  0  /  Против  0
DELETED  написала  13.08.2009 в 07:27  в ответ на #127
Особено, если заодно проводить и семантический анализ плагиату.) Вот про это я и бубню, с упорством достойным австралийского сумчатого дятла). Кстати, я нашла применение программе. Хорошо проверять некоторые "гениальные" источники, после предъявления результатов проверки исходника,удалось доказать, что это шедевр надо не рерайтить,а создавать принципиально новый текст, а именно - писать копирайт, а это уже совсем другие деньги.))

                
DELETED
За  0  /  Против  0
DELETED  написала  13.08.2009 в 12:40  в ответ на #128
Браво Вашему упорству! А что до исходников, то порой это такие "перлы" - уму непостижимо, как их разместить могли , разве что не читая. А плагиатус показывает приличный процент. Я для себя решила, что это происходит из-за множества ошибок в тексте(несогласованные члены предложения, в частности) Чем не 100% уникальность - так и вправду никто не писал, с ошибками-то.:)

                
DELETED
За  0  /  Против  0
DELETED  написала  13.08.2009 в 13:04  в ответ на #129
Я, вообще, предложила бы завести раздел: "Нарочно не придумаешь". Прислала мне мой постоянный мастер исходник на редактирование, причем, хохотала по аське до упаду.
Я, как прочла, тоже хохотать начала. Рерайтер, хитрец, через каждые три слова вставлял первое попавшееся слово из этого же исходника.
Как додумался? бог весть, но уникальность - то 100%.))
И удобно - зашел, почитал, задумался - а оно мне надо, с этим человеком работать?...

                
DELETED
За  0  /  Против  0
DELETED  написал  16.08.2009 в 17:38
Тошнота... вода... очень интересно!

                
DELETED
За  0  /  Против  0
DELETED  написал  16.08.2009 в 21:15
такс) надо осмотреться получше))))

                
colors
За  0  /  Против  0
colors  написал  03.09.2009 в 13:50
Вопрос конфиденциальности. Кому кроме меня могут быть доступны тексты, которые мы здесь проверяем? Странно, что никто в ветке еще этим не поинтересовался, неужели никого этот вопрос не заботит? Вот детские сказки про репку дедку и внучку очень видимо актуально.., как ни странно. Разъясните пожалуйста вопрос, а-то рука не поднимается работать здесь со своими документами.

                
DELETED
За  0  /  Против  0
DELETED  написал  21.09.2009 в 00:23  в ответ на #137
Как говорится, обратитесь к системному администратору:)
Если Вы входите в паутинку через прокси с недобросовестным админом, то даже пароли, набираемые Вами на клаве для чисто внутренних файлов, могут быть доступны ВСЕМ. Просто смешно переживать про удаленные ресурсы! Двум смертям не бывать... Никто не съест Ваши документы. Лично я уже знаю (хоть специально не интересовался) десятки людей, на Адвего не работающих, но СПЕЦИАЛЬНО сюда ходячих за "Плагиатусом"!
Так что пусть у Вас все поднимается!

                
colors
За  0  /  Против  0
colors  написал  22.09.2009 в 22:07  в ответ на #139
Чего за ним ходить? Скачал и поставил. Я не о плагиатусе, с ним все понятно, а про сервис: семантический анализ текста. Здесь проверяется текст, которого как правило в Инете еще нет. А админы тут не причем, если бы мои тексты, над которыми я работаю, и тем более пароли были бы доступны, как Вы говорите ВСЕМ, то я бы имел очень очень много проблем, в том числе с заказчиками. В инет я хожу из asp linux через шлюз с аппаратным фаерволом, чего и всем советую..

                
DELETED
За  0  /  Против  0
DELETED  написал  22.09.2009 в 22:34  в ответ на #142
Ну, тады - ой! Тогда вам к доктору, а мы тут красим, белим...
Древненанайская мудрость гласит:
"Если у вас параноя, это еще не значит, что в действительности за вами не следят враги!"
Так что, на фаервола надейся, а презерватив не снимай!:)

                
colors
За  0  /  Против  0
colors  написал  24.09.2009 в 20:19  в ответ на #143
Это мнение быстро меняется, когда обнаруживаете кучу текстов, над которыми Вы работали на левых сайтах без реальной контактной информации с китайским ip. Еще неплохо отрезвляет, когда с компа уходят пароли к ftp сайтов и вся Ваша сетка из 50 штук летит за час в Ж...

                
DELETED
За  0  /  Против  0
DELETED  написала  16.09.2009 в 16:30
Нуждаюсь в рекомендации по экстренному "отжатию" лишней воды. Помогите, кто чем может!

                
DELETED
За  0  /  Против  0
DELETED  написал  21.09.2009 в 00:26  в ответ на #138
В отжимательные автоматы надо монетку кидать! И сразу будет масса предложений:)))

                
DELETED
За  0  /  Против  0
DELETED  написал  21.09.2009 в 00:28  в ответ на #138
А "кто чем может" - это возле метро или церкви)))

                
DELETED
За  0  /  Против  0
DELETED  написал  17.11.2009 в 13:50
Далеко мы зашли: и все и про все. Может с другой стороны на семантический анализ текста посмотреть. По "Современному толковому словарю русского языка" СЕМАНТИКА - значение, смысл...Так, давайте и подходить к тексту: соответствует-ли он теме, названию статьи и доводит-ли коротко и ясно значение и смысл написанного до читателя. А то нас самих затошнит от запрограммированных в анализаторе показателей.

                
DELETED
За  0  /  Против  0
DELETED  написала  30.09.2010 в 21:06
а что означают все эти показатели при проверке - Количество уникальных слов,Количество значимых слов,Количество стоп-слов, Вода,Классическая тошнота документа, Академическая тошнота документа?
а каковы их допустимый и идеальный уровни?

                
DELETED
За  0  /  Против  0
DELETED  написал  26.02.2011 в 23:08
прочла коментарии #151 Вот и мне интересно какой же средний показатель всех строчных проверок и допустимость в процентах
заранее спасибо

                
DELETED
За  0  /  Против  0
DELETED  написала  10.05.2011 в 23:19
Пожалуйста, ответьте, что такое Вода 38%.

                
DELETED
За  0  /  Против  0
DELETED  написал  15.07.2011 в 18:05
Давненько здесь не отвечают... Но все же рискну задать вопрос: "Какой допустимый процент классической и академической тошноты?"
Жду ответ. Заранее, спасибо.

                
DELETED
За  0  /  Против  0
DELETED  написала  20.09.2011 в 23:02  в ответ на #155
Нашла в гугле: "Что такое тошнота текста, ясно из одного названия. Если текст читать неприятно или неловкая тавтология постоянно режет глаз, значит, показатель тошноты будет повышенным. Различают понятие классической тошноты (из суммы навязчиво повторяющихся слов извлекается квадратный корень) и академической (сумма всех однокоренных слов в процентном отношении). Показатели тошноты должны быть в пределах 6 и 10% соответственно."
Там еще много чего полезного написано, но я не знаю можно ли тут давать ссылки...Напишите текст выше в гугл и найдёте всю статью.

                
DELETED
За  0  /  Против  0
DELETED  написал  16.07.2011 в 00:43
Отлично.

                
DELETED
За  0  /  Против  0
DELETED  написал  14.08.2011 в 18:54
А что за "вода"?

                
DELETED
За  0  /  Против  0
DELETED  написал  14.08.2011 в 19:07
А что такое "вода"?

                
DELETED
За  1  /  Против  0
DELETED  написал  15.08.2011 в 11:26  в ответ на #158
Вода - это жидкость такая)
Экспериментальным путем выяснил, что в этом анализе она - чуть ли не взятый с потолка параметр, по большому счету. Итак:

отличный оригинальный текст в котором не будет повторяться ни одно слово я стараюсь установить точное значение воды тошноты и других параметров

в этом тексте воды - 28,6%

Путем отбрасывания предлогов и перебором удалось разбить этот текст на два следующих:

отличный текст котором будет слово стараюсь установить точное значение других
вода 0%

оригинальный повторяться одно воды тошноты параметров
вода 100%

И к чему же надо стремиться?.. Уж точно не к механическому показателю воды.

                
DELETED
За  0  /  Против  0
DELETED  написал  11.12.2011 в 13:15
Подскажите, семантический анализ, вкладка семантическое ядро - частота - 3.33 / 10.00% что это значит?

                
DELETED
За  0  /  Против  0
DELETED  написал  11.12.2011 в 13:16  в ответ на #161
Очень нужно

                
DELETED
За  0  /  Против  0
DELETED  написала  19.01.2017 в 22:39
Уважаемые коллеги! Подскажите, пожалуйста, как понизить классическую тошноту. Статья кулинарной тематики. В тексте 5 рецептов приготовления теста с перечислением компонентов и коротким описанием замеса. Частота слов - максимум 2, 28%. Убираю предлоги и однокоренные слова, понижается вода и академическая тошнота (6,6%). Классическая практически без изменений (5,39%), а заказчик просит не более 3%. Самые повторяемые слова: тесто, кефир, мука, в, на. Заранее спасибо за помощь!

                
Василий (advego)
За  0  /  Против  0
Василий (advego)  написал  20.01.2017 в 11:03  в ответ на #163
Добрый день. Классическая тошнота - это коэффициент, показывающий заспамленность текста самым повторяющимся словом. Чтобы снизить этот процент, необходимо либо заменить это слово (слова) синонимами, либо, если такой возможности нет, изменить структуру предложений, в котором оно встречается, уменьшив количество повторений этого слова.

                
Lisa-Lena
За  0  /  Против  0
Lisa-Lena  написала  23.05.2022 в 17:07
Тема начата в 2010 году, последний пост 2017, а вопрос так и не прояснен. Все лежит на виду, не стоит секретить известные всему свету алгоритмы. Академическая частота считается на раз, по вкладке СЛОВА сео-адвего, вкладка СТОП_СЛОВА не учитываются. Классическая частота термин вредный, поскольку не учитывает объем текста, про то и на адвего не единожды говорилось, зачем тогда его считать, если это прямая функция первого слова вкладки СЛОВА. Только вводит зхаков в заблуждение, некотоыре фанатеют и требуют на текст 10 кзн класс. тошн. 4. Попробуй сделай, когда в ключах больше вхождений. Это пример, просьба не требовать с меня указания на лицу, но ситуация распространенная. Если меняются алгоритмы поисковиков, отчего тут все без изменений? И нету в мире никаких тошнот, есть keyword density, а это совсем иное. Неужто наши сеошники впереди всего мира?

                
Белоусов (advego)
За  0  /  Против  0
Белоусов (advego)  написал  24.05.2022 в 09:44  в ответ на #165
Здравствуйте, пользователям нужен сервис, академическая тошнота и другие характеристики активно используются при анализе и заказе текстов. Поэтому отменить это просто так нельзя. Но конечно время не должно стоять на месте, работа над улучшение работы сервиса ведется. Благодарим за замечание.

                
Максим Сергеев (advego)
За  0  /  Против  0
Максим Сергеев (advego)  написал  24.05.2022 в 11:55  в ответ на #165
Здравствуйте, алгоритмы расчета основных показателей SEO-анализа приведены в помощи Адвего, это не секрет: https://advego.com/v2/support/services/seo

Классическая тошнота - узкоприменимый показатель, верно, поэтому в SEO-анализе Адвего был добавлен еще один - академическая тошнота, алгоритм расчета которой был создан специалистами Адвего.

Плотность ключевых слов - показатель, касающийся только отдельных слов и фраз, а академическая тошнота оценивает текст в общем, поэтому они не заменяют, а дополняют друг друга.

Ваша претензия, судя по всему, касается не SEO-анализа, а заказчиков, которые выставляют не совсем корректные ограничения, верно?

                
Lisa-Lena
За  0  /  Против  0
Lisa-Lena  написала  24.05.2022 в 13:35  в ответ на #167
Да, Вы правы. Вынуждена была отказать заказчику, который в тексте 8.500 зн требовал одновременно понизить КТ с 4,2 до 4 а АТ поднять (!) с 5,4 до 6. При этом еще и зачем то приводил требование по слову 2,5%. Так АТ 4 уже даст 8500 зн=1200 слов 1,3 по слову. Т.е. в ТЗ ряд требований избыточные, а ряд несовместимые. Но заки ведь с тестами не работают, они копируют ТЗ не вдумываясь в смысл. Вот последняя статья от гугла, никаких формальных показателей, смысл таков, что пишите красиво и гугл оценит

[ссылки видны только авторизованным пользователям]

А акад. тошнотность считается вот алгоритм, все верно, без стоп-слов, по всем вхождениям которых больше 1. Слова которые 1 - это богатство языка и автора, за них не наказывают.

[ссылки видны только авторизованным пользователям]

                
Максим Сергеев (advego)
За  0  /  Против  0
Максим Сергеев (advego)  написал  24.05.2022 в 14:24  в ответ на #168
Да, Вы правы. Вынуждена была отказать заказчику, который в тексте 8.500 зн требовал одновременно понизить КТ с 4,2 до 4 а АТ поднять (!) с 5,4 до 6. При этом еще и зачем то приводил требование по слову 2,5%. Так АТ 4 уже даст 8500 зн=1200 слов 1,3 по слову. Т.е. в ТЗ ряд требований избыточные, а ряд несовместимые.ЦитатаВ таком случае, наверное, претензии стоит предъявлять заказчикам, не находите?

В указанной статье на Яндекс.Дзене в начале приведена картинка с какими-то "рекомендациями" по значениями параметров - откуда она?

Радует, конечно, что выводы, сделанные в статье, повторяют рекомендации администрации Адвего:

https://advego.com/v2/support/services/seo/1450
https://advego.com/v2/support/services/seo/1451

Но повторю вопрос - какие претензии к сервису SEO-анализа?

                
Lisa-Lena
За  0  /  Против  0
Lisa-Lena  написала  24.05.2022 в 14:43  в ответ на #169
сорри, никаких, это форум, тема свободный полет, к адвего полный респект
откуда же знать, откуда картинка на дзене, сервис поможет найти первоисточник, таких много ходит
что касается рекомендаций, меня вполне устраивает адвего АТ = 5-15%
проблема в том, что заказчики на свое усмотрение сужают до неприемлемых вилок
повторяюсь: накипело, когда потребовали на вполне доброкачественной статье поднять АТ с 5,4 до 6%. Поднять можно было только за счет увеличения частотности первых слов, что поднимало КТ, которую одновременно требовалось снизить до 4. Проблема в том, что до заков не доведены разумные требования, а суппорт всегда на стороне заков, и в том есть резон: раз принят заказ, соглашаешься с ТЗ. Но не окунувшись в работу, всего не охватишь. Над заками должен быть внешний контроль, нельзя позволять делать сборную солянку из разных требований.

                
Максим Сергеев (advego)
За  0  /  Против  0
Максим Сергеев (advego)  написал  24.05.2022 в 15:05  в ответ на #170
откуда же знать, откуда картинка на дзене, сервис поможет найти первоисточник, таких много ходитЦитатаПодумал, что статья - ваша, решил уточнить.
Проблема в том, что до заков не доведены разумные требования, а суппорт всегда на стороне заков, и в том есть резон: раз принят заказ, соглашаешься с ТЗ.ЦитатаСаппорт всегда на стороне объективности и выполнимости. Если условия заказа невыполнимы, так заказчику и сообщаем, просто этого никто не видит. Если возникают споры такого рода, рекомендуем обращаться в ЛПА, при необходимости администрация даст разъяснения заказчику, это не проблема.

                
Отправка жалобы...
Спасибо, ваша жалоба принята
Вы уже жаловались
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено.
Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186
Жаловаться можно только на чужой комментарий
Избранное
Добавить в избранное
Имя
URL
https://advego.com/blog/read/news/35422/all/