Академическая тошнота больших текстов - не могу скорректировать, нужна помощь в теоретических моментах
Добрый день, помогите разобраться. Есть заказ на 15 тыс знаков с параметрами классическая тошнота - 3.5-4.9 и академическая 6-10. классическая - квадртный корень из максимального запроса. Итого самое частое слово - 24 раза. всего около 1980 слов. академическая сейчас 4,5. как ее повысить, если 1. уменьшение числа не значимых слов не оказывает эффекта ( предлоги, союзы) -или они не учитываются в расчете? 2. знаю, что необходимо увеличить слова в тексте из семантического ядра - первые 5? 7? я пыталась их просто вставить в текст ради проверки - нет эффекта, нужно вписывать?
У меня в тексте на 7700 академическая тошнота повышается, если увеличиваю количество часто встречающихся слов. У заказчика свои требования (частота вхождения основного слова должна быть 1,8-2,3%, для остальных тоже прописаны нормы: до 1,5, до 1, до 0,8), так вот, в тексте, который я сдала (7630 знаков), академ.тошн. - 6,0 (основное слово 2,04%, второе - 1,12, третье - 1,02, четверьое - 0,82). Сейчас для эксперимента добавила вхождения часто встречающихся слов - теперь академ.тошн. 6,3 (первое слово 2,13, второе - 1,21, третье - 1,11)
Посмотрите вхождения наиболее часто встречающихся слов у себя в тексте и добавьте их - должна академ.тошнота подрасти.
странная проблема. наоборот тошноту все понижают. может, пойти таким путём: начать вставлять ключевые слова в порядке снижения частотности, по очереди доводя до 3,% -4 процента. у меня при таких показателях академка обычно около десяти.
А вы следите за процентами по каждому слову, а не за количеством вхождений слов. В моем первом комменте это видно: процент вхождения слова (а не количество) влияет на академ.тошноту.
"1. уменьшение числа не значимых слов не оказывает эффекта ( предлоги, союзы) -или они не учитываются в расчете?" - в расчете академической тошноты не учитываются.
"2. знаю, что необходимо увеличить слова в тексте из семантического ядра - первые 5? 7? я пыталась их просто вставить в текст ради проверки - нет эффекта, нужно вписывать?" - все ровно наоборот, причем в другом смысле - академическая тошнота по сути отражает степень заспамленности текста, деленную на степень разнообразности семантики, то есть чем больше в тексте повторяемых слов и меньше разнообразие значимых слов, тем выше академическая тошнота.
Может показаться несколько запутанно, поясню на примерах.
В вашей работе 5 очень часто встречающихся слов и 150 других слов, встречающихся значительно реже. Для повышения академической тошноты есть два пути:
1. Повышать еще количество вхождений ТОП-5 слов, но при этом значительно повысится и классическая тошнота, да и вхождений понадобится в несколько раз больше, чтобы значимо повысить академическую тошноту, так как в тексте очень большой "хвост" маловстречаемых слов. 2. Уменьшить разнообразие семантики текста, тем самым уменьшив хвост - академическая тошнота повысится, а классическая останется прежней.
На примере вашей работы - попробуйте заменить слова "турист" и "ценитель" словом "гость", которое уже есть в тексте. То есть вместо 150 слов в хвосте вы получите 148.
Это грубый пример, нужно сделать все красивее, но принцип, надеюсь, понятен.
Сразу скажу, что вы тем самым ухудшите текст, обычно стоит обратная задача - снизить академическую тошноту, то есть разнообразить текст, но если так нужно заказчику - пожалуйста.
Спасибо, именно путем замены синонимов я и шла,зафиксировав классическую тошноту по главному запросу. что несколько обидно, учитывая их предыдущий подбор. Почистить текст от союзов и предлогов просто его улучшило. Скажу честно, 6 часов коррекции дали мне прирост в 0.6 и я получила 5.2.
Пробуйте два подхода параллельно - уменьшайте количество слов с небольшим количеством вхождений, заменяя их словами из ТОП-30, не трогая самое частотное слово. И еще третье - самое правильное, но сложное: еще сильнее разнообразить семантику, разбавив по максимуму все слова в нижней половине списка и одновременно повысив плотность ТОПа.
ТОП-30 - навскидку, это не константа. Это чтобы совсем текст не испортить.
А можно встречный вопрос, как снизить классическую тошноту и от чего она вообще зависит. Постоянно сражаюсь с ней, в частности на больших текстах (от 5 тыс и выше). Банальная чистка от союзов и других стоп-слов почти не помогает. При замене часто повторяющихся слов снижается академическая, а классическая практически стоит на месте. Правильно ли я думаю, что нужно писать так, чтобы ни одно слово не было употреблено больше 1-2 раз, за исключением нескольких ключевых?
Нужно всего лишь уменьшить количество вхождений самого частотного слова - по определению: классическая тошнота равна корню квадратному из числа вхождений самого частотного слова.
Например, если самое частотное слово встречается в тексте 16 раз, классическая тошнота будет равна 4. Если уменьшить число вхождений до 9, классическая тошнота уменьшиться до 3 и т. д. Естественно, нужно следить и за другими словами, которые могут стать более частотными, пока будете уменьшать количество вхождений самого частого.
Вся проблема в том, что как раз уменьшить то и нельзя, для них прописана точная частота. Я думала, может есть какой другой волшебный способ?) За определение спасибо, никак не могла понять из чего вообще строится этот показатель.
В таком случае доносите до заказчика невыполнимость требований, поскольку чем больше объем текста, тем выше "нормальная" классическая тошнота.
В тексте от 10 000 знаков классическая тошнота может легко доходит до 6-7 и более высоких показателей. Вот пример: [ссылки видны только авторизованным пользователям] - 30 000 знаков и классическая тошнота более 10. Это качественная статья, одна из избранных статей русскоязычной Википедии, ее оценили люди, как одну из лучших.
Та не, с заказчиком все в порядке. Это я лично для себя пытаюсь понять.)) Но вы меня успокоили, что в больших текстах этот показатель может быть высоким. А то я думала, что у меня просто мозгов не хватает.))
В таком случае доносите до заказчика невыполнимость требований, поскольку чем больше объем текста, тем выше "нормальная" классическая тошнота.
В тексте от 10 000 знаков классическая тошнота может легко доходит до 6-7 и более высоких показателей. Вот пример: [ссылки видны только авторизованным пользователям] - 30 000 знаков и классическая тошнота более 10. Это качественная статья, одна из избранных статей русскоязычной Википедии, ее оценили люди, как одну из лучших.
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186