Какие слова чаще всего используют в посланиях Путин и другие президенты?

История России в запросах на федерализм, майских указах и ракетах «Сармат»

21 апреля президент России Владимир Путин обратиться к Федеральному Собранию с посланиями о положении в стране и основных направлениях внутренней и внешней политики. С 1994 года президенты страны выступали перед парламентом 27 раз. Sntat проанализировали эти тексты, применив методы современных социальных наук, чтобы понять, чем характеризуются послания всех президентов - общие и уникальные для них темы, ключевые слова, смысловую связанность друг с другом посланий и так далее (о методике в справке). 


Самые частые слова посланий 

Для начала представим более простые показатели, например, наиболее частотные слова всего корпуса текстов (Рисунки 1 и 2). Результаты ожидаемы. Российские президенты в своих посланиях используют чаще всего такие слова, как “государственный”, “власть”, “государство”, “система”, “развитие”, “экономический” и так далее.

Рисунок 1. Наиболее частотные слова в посланиях Президента Федеральному Собранию России (1994 - 2020)

То же самое, но в форме облака слов. 

Рисунок 2. Облако наиболее употребительных слов в посланиях Президента России Федеральному Собранию (1994 - 2020)

Теперь можем детализировать картину. Рисунок 3 представляет собой комбинацию наиболее частотных слов трех российских президентов. В этом случае ключевые слова в посланиях парламентариям существенно отличаются. 

  • “Власть”, “государство”, “федеральный” у Бориса Ельцина явно отражают тенденцию к децентрализации властного аппарата 1990-х годов. 
  • Блок, посвященный президентским посланиям Владимира Путина, характеризуется более технократическим подходом, который служит свидетельством консолидации власти. 
  • В случае с президентством Медведева выделяется главная идеологема его срока - “модернизация”.  


Рисунок 3. Облако слов в разрезе президентов

 Еще более детализированная картина представлена на Рисунке 4. Ельцинский первый срок - это про “государство”, “право”, “СССР”, “СНГ”, тогда как второй был посвящен “закону”, “рынку” и так далее. 

В рамках своего первого президентского срока Владимир Путин уделял значительное место экономическому росту и месту России в мировой экономике. Второй срок ознаменовался социальными вопросами, в частности, строительство жилья, армия (как социальный институт, для которого 1990-е годы были не самым лучшим временем). Примерно то же самое можно сказать и про третий срок, который, кроме присоединения Крыма, запомнился еще и “майскими указами”, задача которых улучшить в регионах жизнь людей, работающих, прежде всего, в бюджетной сфере. Четвертый срок президентства Владимира Путина, согласно алгоритму нахождения ключевых частотных слов, характеризуется темами, охватывающими положение национальной валюты, международных отношений и вызовами, стоящими перед страной. 

Медведев в рамках своего президентского срока, как показало и предыдущее облако слов, затрагивал темы модернизации, развития институтов, судов, - все то, что связывают с системными либералами в правительстве России. 

Рисунок 4. Облако слов в разрезе президентских сроков


 «Выучить топики»

Следующий этап текстового анализа (латентное распределение Дирихле (LDA) посвящен определению наиболее общих тем (топиков) во всех посланиях Федеральному Собранию. Результаты отражены на Рисунке 5. Ряд топиков весьма точно схватывают смыслы. Например, топик 1 посвящен вопросам государственной власти. Топик 2 - про демократические институты. Топик 4 выхватывает слова, посвященные целостности страны. Топик 5 посвящен экономике (“банки”, “кредитование”, “экспорт” и т.д.). Топик 9 - социальная тематика, посвященная качеству жизни людей. Топик 12 - трудовые отношения и пенсии. Топик 13 - военно-технологический комплекс и так далее. 

Рисунок 5. Результат моделирования топиков президентских посланий 

Теперь мы можем включить дополнительные параметры, которые позволяют увидеть картину более детально. 

Рисунок 6. Темы президентских посланий (8 тем)

В Таблице 1 представлены темы и президентские сроки, которые статистически связаны друг с другом. 

Таблица 1. Темы, статистически коррелированные с президентскими сроками

Мы выбрали четыре темы, общие для всех трех президентов. 

Рисунок 7. Темы президентских посланий (4 топика)

Статистическая связь президентских сроков и обнаруженных тем представлена в Таблице 2. 

Таблица 2. Темы и президентские сроки, значимо, со статистической точки зрения, коррелированные с ними

Тот факт, что некоторые слова кочуют из темы в тему, говорит о формализованности посланий президентов. Иными словами, маловероятно, что документы каждый год будут разными по своей подаче и стилистике. 

Начнем с темы федерализма - она больше ассоциируется с правлением Бориса Ельцина (Рисунок 8). Федерализм в рамках его первого срока, ожидаемо, был связан с вопросами государственного строительства, наведения порядка в правовом массиве на разных этажах государства. Далее риторика в этом вопросе становится все более “централизирующей” - “власть”, “орган”, “решение”, “система”. 

Рисунок 8. Федерализм в президентских посланиях Бориса Ельцина 

Тема внешних и внутренних вызовов коррелирует с третьим и четвертым президентскими сроками Владимира Путина. Эволюция этой темы за последние 8 лет представлена на Рисунке 9.

Рисунок 9. Внешние и внутренние вызовы в президентских посланиях третьего и четвертого сроков Владимира Путина 

Консолидация социально-экономической и политической системы ассоциируются с главной идеологемой нулевых (1 и 2 президентские сроки Владимира Путина) - стабильностью (Рисунок 10). 

Рисунок 10. Консолидация и первые два президентских срока Владимира Путина

 Наконец, четвертая тема - инновации и модернизация. Эта тема оказалась актуальной для всех президентских сроков. Визуализируем только некоторые - наиболее информативные - из них. Например, для ельцинских посланий указанная тема проходит сквозь призму государственного правления, тогда как в рамках четвертого срока Владимира Путина инновации и модернизация выражаются через более близкие к человеку слова - “семья”, “доход”, “гражданин”.

Рисунок 11. Инновации и модернизация в президентских посланиях Бориса Ельцина (2 срок) и Владимира Путина (4 срок)

Технократический подход медведевского президентства находит свое подтверждение и в этом случае. 

Рисунок 12. Инновации и модернизация в президентских посланиях Дмитрия Медведева и Владимира Путина (1 срок)

Наконец, третий и четвертый президентские сроки Владимира Путина по теме инновации и модернизации представляют, скорее, переход от общего к частному - от более абстрактных понятий “развитие”, “экономика” к конкретному - “семья”.

Рисунок 13. Инновации и модернизация в президентских посланиях Владимира Путина (3 и 4 срок)

Сетевой анализ. Послания по смыслу объединяются в отдельные кластеры. Очевидно, что исторический контекст сближает идеи, заложенные в ежегодных посланиях президента. Ельцинские послания и первый срок Владимира Путина выступают отдельным кластером (Рисунок 14). Медведевские послания - это промежуточное звено, ведущее ко второму и последующим президентствам Владимира Путина. Размер узлов демонстрирует смысловую значимость документа в обозначенном кластере. На Рисунке 17, где узлы одинаковы, это различие не учитывается, но эта иллюстрация позволяет посмотреть на общую картину схематично. 

Рисунок 14. Сетевой текстовый анализ президентских посланий (с учетом весов документов)

Рисунок 15. Сетевой текстовый анализ президентских посланий (без учета весов документов)

В целом, представленный анализ отражает те наблюдения, которые делали исследователи российской политики на протяжении последних 27 лет. 


СПРАВКА 

Методика исследования 

Для начала техническое отступление, объясняющее, что эти методы позволяют сделать. Не вдаваясь в детали, отметим, что структурное моделирование тем (STM) выявляет скрытые темы (топики) в текстах, учитывая дополнительные сведения о документе, например, контекст событий, в которых он принимался. Так, каждый президентский срок имеет свои особенности, связанные с историческим периодом, поэтому в качестве дополнительной - фоновой - переменной может выступать этот показатель (2 президентских срока Бориса Ельцина, 4 президентских срока Владимира Путина и 4-летнее правление Дмитрия Медведева). 

Латентное распределение Дирихле (LDA) упрощенная версия структурного моделирования тем (топиков) без учета каких-то дополнительных параметров.

Wordfish (в честь французского математика Симеона Дени Пуассона, который ввел одноименное распределение; его фамилия переводится с французского как “рыба”) является методом ранжирования документов на основе частоты встречаемости слов, применяемый активно для определения позиций политических акторов, прежде всего, партий.

Текстовый сетевой анализ позволяет вычленять семантические кластеры различных текстов и выявлять связь между ними.

Слова в посланиях приведены к начальной форме, под которой подразумевается именительный падеж единственного числа для существительных. В случае с прилагательными добавляется форма мужского рода. Глаголы, причастия и деепричастия приводятся к форме инфинитива глагола. Также были удалены малоинформативные стоп-слова, числа, знаки пунктуации.

Перед презентацией результатов следует сделать важную методологическую оговорку. В социальных науках достигнут четкий консенсус относительно вспомогательного характера анализа текстов посредством компьютеризированных методов. Иными словами, человек должен проверять адекватность результатов “глазами” - самостоятельно или через привлечение добровольцев.